使用文档
了解如何充分利用 Web2MD 的所有功能
快速开始
Web2MD 让你在 3 步之内将任意网页转换为干净的 Markdown 格式。无论是喂给 AI 助手、存入笔记应用,还是预处理 RAG pipeline 数据,整个过程不超过 10 秒。
安装扩展
从 Chrome 网上应用店安装 Web2MD 扩展,免费且 5 秒内完成安装。
打开任意网页
打开任何你想转换的文章、博客、文档页面或论坛帖子。
点击转换
点击工具栏中的 Web2MD 图标,或按下 Control+M(Mac)/ Alt+M(Windows),完成!
转换后的 Markdown 会自动复制到剪贴板,可以直接粘贴到 ChatGPT、Claude、Obsidian、Notion 或任何支持 Markdown 的工具中。
功能概览
Web2MD 专为 AI 时代设计,不仅仅是简单的 HTML to Markdown 转换器。它通过智能提取算法去除广告、导航栏和侧边栏干扰,输出优化后的 Markdown 内容,平均可节省 60% 以上的 token 用量。以下是主要功能一览:
一键转换
一键将任意网页转换为干净的 Markdown,无需手动复制粘贴或排版。
AI 优化输出
智能提取去除噪声,输出 AI 友好的 Markdown 格式,在 AI workflow 中节省 60% 以上 token。
21+ 个专用提取器
为 Medium、Substack、Reddit、GitHub、YouTube 等平台专门优化的提取器,每个都调优至最佳精度。
代码块保留
语法高亮代码块被完美保留,包括语言标签、缩进和格式。
表格支持
HTML 表格被转换为标准 Markdown 表格语法,保持正确的对齐和列格式。
Token 计数
即时查看 GPT-4、Claude 等模型的 token 计数——这对 AI token optimization 至关重要。所有主流分词器准确率超过 95%。
批量转换
同时转换多个 URL 或已打开的标签页,非常适合研究和竞品分析。
多语言界面
扩展支持 11 种语言,包括英语、中文、日语、韩语、西班牙语等。
Obsidian 导出
前提条件
此功能通过 obsidian:// 协议与本地 Obsidian 应用通信,需要在您的电脑上安装并运行 Obsidian 桌面版。移动端或未安装 Obsidian 的设备无法使用此功能。
将任意网页转换后一键存入 Obsidian 笔记库,自动创建新笔记并填入内容。这对于构建个人知识库、收集研究资料或归档重要文章特别有用。转换后的 Markdown 保留完整的标题层级、链接和格式,在 Obsidian 中可以直接使用双向链接和标签功能。
使用步骤
- 打开扩展 → 切换到 Settings 标签页
- 在 Obsidian 区域,打开"启用 Obsidian 导出"开关
- (可选)填写仓库名称,留空则使用 Obsidian 默认仓库
- 切换到 Convert 标签页,转换当前网页
- 转换完成后点击"保存到 Obsidian",Obsidian 会自动打开并创建新笔记
注意:单个笔记内容上限为 2MB。超出时内容会自动截断,末尾会显示提示说明。
发送至 AI
将转换后的 Markdown 内容一键发送到 Claude、ChatGPT、Gemini、Perplexity、Grok 或 DeepSeek。Web2MD 的智能提取确保发送给 AI 的内容是干净的、结构化的,避免浪费 token 在广告和导航栏等无关内容上。Pro 用户平均每月节省约 200 万 token,相当于约 $17 的 API 成本。
- 在 Settings 中选择偏好的 AI 平台
- 转换页面后,点击弹出菜单中的 AI 平台按钮
- 内容会自动粘贴到 AI 对话框中,可选择开启"自动发送"省去手动粘贴
提示:搭配 Prompt 模板使用效果更佳。例如,选择"总结"模板后发送到 Claude,可以自动在内容前添加摘要指令。
批量转换
同时转换多个 URL 或浏览器中已打开的标签页。批量转换功能非常适合需要一次性处理大量网页的场景,例如竞品研究、文献调研或内容归档。所有结果可以合并下载为单个 Markdown 文件,也可以逐个复制。
- 切换到扩展中的 Batch 标签页
- 粘贴多个 URL(每行一个),或点击"添加已打开标签页"自动导入当前浏览器中所有打开的页面
- 点击"开始转换",进度实时显示,每个 URL 的状态独立追踪
- 完成后可一次性复制或下载所有结果,也可将全部内容合并发送至 AI
Prompt 模板
在内容前添加自定义指令,发送至 AI 时自动应用。这在 AI workflow 中特别有用——你可以为不同任务预设不同的 prompt,一键完成"转换网页 + 添加指令 + 发送至 AI"的完整流程。内置 4 个模板:
- •总结 — 生成内容摘要,快速获取文章要点
- •翻译 — 翻译为目标语言,支持任意语种
- •要点提取 — 列出核心观点,适合会议记录和研究报告
- •通俗解释 — 用简单语言解释复杂内容,适合学习新领域
也可在 Settings → Prompt Templates 中创建、编辑和删除自定义模板。例如,你可以创建一个"代码审查"模板,让 AI 自动分析转换后的技术文档中的代码示例。
支持的平台
Web2MD 可以将几乎所有公开网页转换为 Markdown。除了通用的 HTML 提取算法外,我们还为以下类别的热门网站开发了 21+ 个专用提取器,确保最佳的转换质量。无论你想 convert webpage to markdown 的内容来源是什么,Web2MD 都能胜任。
新闻与媒体
New York Times、BBC、Reuters、卫报、Bloomberg、TechCrunch、The Verge、Ars Technica
文章、社论和长篇报道。如果你已通过 Chrome 扩展登录,付费墙内容也可以访问。
技术文档
MDN Web Docs、React 文档、Next.js 文档、Python 文档、Stack Overflow、GitHub README 和 Issues
代码块以正确的语言标签和缩进保留。表格和 API 参考保持其结构。
博客平台
Medium、Substack、WordPress、Ghost、Hashnode、dev.to、Blogger
Medium 和 Substack 的专用提取器会自动移除会员提示、点赞 UI 和邮件注册表单。
社交媒体与论坛
Reddit 帖子、Twitter/X 推文串、Hacker News、Discourse 论坛、Quora
Reddit 提取器捕获原始帖子和热门评论,保持正确的线程结构。Twitter/X 推文串按顺序拼接。
学术与研究
arXiv(HTML 版本)、PubMed、Google Scholar、ResearchGate、维基百科、大英百科全书
尽可能保留引用、脚注和数学符号。维基百科信息框被转换为 Markdown 表格。
视频与多媒体
YouTube(描述、字幕)、Vimeo、播客节目说明
YouTube 提取器以结构化 Markdown 格式捕获视频元数据、描述和字幕(如有)。
中文平台
微信公众号、知乎、小红书、Bilibili(B 站)、飞书文档
AI 搜索引擎(ChatGPT、Perplexity、Gemini)因反爬限制无法抓取这些平台;Web2MD 在你的浏览器内部读取,所以能在所有服务端抓取失败的地方成功。
AI 对话导出
ChatGPT、Claude、Gemini、DeepSeek、Perplexity
专用提取器将完整多轮对话导出为带 `## User` / `## Assistant` 标题的 Markdown。批量队列让你跨平台收集多个对话,合并下载为一个 .md 文件——适用于在 AI 提供商之间迁移,或将研究归档到 Obsidian/Notion。
以上仅列出部分代表性网站。Web2MD 的通用提取算法支持任何标准 HTML 网页。如果你发现某个网站的转换质量不佳,请通过 support@web2md.org 告诉我们,我们会评估是否需要开发专用提取器。
键盘快捷键
无需打开弹出窗口,直接将当前页面转换为 Markdown 并复制到剪贴板。对于高频使用者来说,键盘快捷键可以大幅提升效率——只需按下快捷键,即可在后台完成 web to markdown 的转换,一个通知提示你内容已就绪。
Mac
Control + MWindows / Linux
Alt + M右键菜单
除了键盘快捷键,你还可以右键点击任意网页或选中的文本,在上下文菜单中选择"复制为 Markdown"。如果你选中了页面的一部分文本,只有选中的内容会被转换——这对于只需要文章中某个段落或代码块时非常有用。
使用场景
Web2MD 适用于各种需要将网页内容转换为结构化文本的场景。以下是用户最常见的使用方式:
RAG Pipeline 数据预处理
构建检索增强生成(RAG)系统?Web2MD 输出的干净、结构化 Markdown 非常适合分块和嵌入处理。通过去除 HTML 噪声、广告和导航元素,Web2MD 将文档大小减少 60-80%,这意味着更快的索引速度、更低的存储成本,以及 RAG pipeline 中更相关的检索结果。
Obsidian 和 Notion 笔记
将网页文章直接剪藏到 Obsidian 笔记库,或将干净的 Markdown 粘贴到 Notion 页面中。Web2MD 保留标题、链接、图片、代码块和表格,确保你的笔记看起来和原始内容一样——但没有杂乱信息。无需手动排版即可从网页构建可搜索的个人知识库。
喂给 AI 助手
将清理后的网页内容发送到 ChatGPT、Claude、Gemini 或其他 AI 助手进行摘要、翻译、分析或问答。Web2MD 的 token 节省意味着你可以向 AI 发送更长的文章而不会触及上下文窗口限制。一键发送至 AI 功能让整个流程无缝衔接。
内容归档
以面向未来的格式归档重要网页内容。与书签不同(页面下架时书签就失效了),Markdown 文件是可移植的、可搜索的,几十年后仍然可以阅读。使用批量转换功能可以一次性归档整个文章集合。
开发文档整理
将技术文档、API 参考和 Stack Overflow 答案转换为 Markdown,用于离线阅读、团队分享或喂给 GitHub Copilot、Claude 等编程助手。代码块以正确的语法高亮标签保留,输出内容可以直接使用。
查看我们的 博客 了解更多用户案例和使用技巧。
API 与集成
Web2MD 目前提供两种主要的使用方式来满足不同用户的需求:
Chrome 浏览器扩展
我们的核心产品。在浏览器中直接完成 HTML to Markdown 的转换,所有处理都在本地进行,无需上传任何数据到服务器。支持一键转换、发送至 AI、Obsidian 导出、批量处理等全部功能。适合日常浏览和内容收集。
Web 在线版
通过网页端输入 URL 进行转换,无需安装扩展。适合临时使用、移动端用户、或在无法安装扩展的环境中使用。登录后可享受与扩展相同的转换配额。
API 访问(Pro 功能)
Pro 用户可通过 API 集成 Web2MD 的转换能力到自己的应用和工作流中。API 提供与扩展相同的智能提取和 Markdown 输出质量,适合自动化 RAG pipeline、内容监控系统和自定义 AI workflow 等场景。查看 定价页面 了解 Pro 计划详情。
Agent Bridge(AI 代理桥接)
Agent Bridge 让 AI 代理(Claude Code、Cursor、Cowork 等)通过 MCP 协议远程控制 Web2MD 浏览器扩展,自动批量转换 URL——尤其适用于 Reddit、JS 渲染页面和需要登录的网站。
工作原理
AI Agent ←MCP→ MCP Server ←TCP→ Native Host ←NM→ Chrome Extension → Reddit/Any Site
AI 代理调用 MCP 工具 → MCP Server 通过 TCP 连接本地 Native Host → Native Host 通过 Chrome Native Messaging 协议转发给扩展 → 扩展在后台打开页面、提取内容、转换为 Markdown → 结果返回给 AI 代理,同时保存到 Dashboard History。
安装步骤
第 1 步:安装 Native Messaging Host
cd packages/mcp-server pnpm build ./install.sh <your-extension-id>
在 chrome://extensions 开启开发者模式,找到 Web2MD 的 Extension ID。安装后需 完全退出 Chrome(Cmd+Q)再重新打开。
第 2 步:配置 MCP
添加到 Claude Code / Cursor 的 MCP 配置中:
{
"mcpServers": {
"web2md": {
"command": "npx",
"args": [
"web2md-mcp-server"
],
"env": {
"WEB2MD_API_KEY": "w2m_your_api_key"
}
}
}
}第 3 步:验证连接
在 Chrome 扩展的 Service Worker 控制台中,你应该看到:Connected to native host 和 TCP relay ready on port 12315。
MCP 工具
agent_convert
转换单个 URL。传入 URL,返回 Markdown + 标题 + 元数据。
agent_batch_convert
批量转换最多 50 个 URL。逐个处理,结果流式返回。所有成功转换自动保存到 Dashboard History。
使用示例
在 Claude Code 中直接说:
帮我批量转换这 5 个 Reddit URL,并总结关键观点
Claude 会自动调用 agent_batch_convert → 扩展后台逐个打开页面 → 提取内容 → 返回 Markdown → Claude 进行分析总结。
为什么 Reddit 需要 Agent Bridge?
Reddit 屏蔽了来自云服务商的服务端 API 访问,直接调用 API 会失败。Agent Bridge 使用你的真实浏览器——带有登录状态和 Cookie——所以 Reddit 会正常提供完整页面内容,就像你平时浏览一样。
常见问题
Web2MD 可以转换哪些类型的网页?
作为一款功能全面的 markdown converter,Web2MD 可以处理几乎所有公开可访问的网页,包括新闻文章、博客帖子、技术文档、论坛帖子、产品页面和学术论文。我们有 21+ 个专用提取器,针对 Medium、Substack、Reddit、GitHub、YouTube 和 WordPress 等流行平台进行了优化。对于标准网站,我们的通用提取算法能处理大多数 HTML 结构,格式准确率超过 97%。登录墙后面的页面或需要 JavaScript 交互的页面可能有限制——详情请参阅下方的故障排除部分。
使用 Web2MD 时我的数据安全吗?
绝对安全。通过 Chrome 扩展进行的所有转换都完全在你的本地设备上进行——我们从不上传或存储任何网页内容到服务器。转换引擎在浏览器的沙盒环境中运行,你的数据永远不会离开你的电脑。对于 Web 在线版,URL 在服务器端获取进行转换,但内容仅在内存中处理,不会持久化存储。我们对所有通信使用 SSL 加密,并遵循标准的数据保护实践。你可以查看我们的完整隐私政策了解更多细节。
Token 计数功能有多准确?
Web2MD 的 token 计数使用与 GPT-4 和 Claude 所用分词器类似的算法,在所有主流模型上准确率超过 95%。由于分词器之间存在细微差异(例如 GPT-4 使用 cl100k_base,Claude 使用自己的分词器),我们建议在规划 prompt 时预留 5-10% 的余量。每次转换后 token 计数会即时显示,帮助你估算 API 成本并确保内容在模型的上下文窗口范围内。Pro 用户通过我们的优化提取平均每月节省约 200 万 token。
免费版和 Pro 版有什么区别?
免费版第一天包含 10 次转换,之后每天 3 次,支持智能内容提取和基本 Markdown 输出。Pro 版($9/月或 $49.99/年)解锁无限转换、转换历史、精确 token 计数、智能内容分割、AI 自动标签和摘要、Markdown 文件下载、自动平台分类和 API 访问。Pro 还包括优先支持和新功能提前体验。如果你经常为 AI workflow 或研究转换网页,仅通过 token 节省 Pro 就能回本——Pro 用户平均每月节省约 $17 的 API 成本。
查看 定价页面 了解完整的功能对比和计划详情。
故障排除
大多数网页都可以顺利转换,但某些特殊情况可能需要额外注意。以下是常见问题和解决方案:
某些页面转换结果为空或不完整
这通常发生在依赖客户端 JavaScript 渲染内容的单页应用(SPA)上,例如某些 React/Vue/Angular 应用。Web2MD 读取的是页面当前 DOM 状态,如果内容尚未完全加载,可能无法捕获全部内容。
解决方案:等待页面完全加载后再点击转换。如果页面使用无限滚动,先向下滚动加载所需内容,然后再进行转换。
付费墙或登录墙后的内容
如果网页内容需要登录或付费才能查看,Web2MD 的 Chrome 扩展只能转换你在浏览器中实际能看到的内容。如果你已经登录并能看到完整文章,扩展可以正常转换。但 Web 在线版通过 URL 获取页面时,无法使用你的登录凭证,因此只能获取公开可见的部分。
解决方案:对于付费内容,请使用 Chrome 扩展(不要用 Web 在线版)。确保你已登录并能在浏览器中看到完整内容后再转换。
格式丢失或排版异常
少数网站使用非标准的 HTML 结构或依赖 CSS 来呈现内容结构(例如使用 div 而非语义化标签来表示标题),这可能导致转换后的 Markdown 缺少某些格式。此外,使用图片嵌入文字的页面(如某些营销页面或 PDF 截图)无法被提取为文本。
解决方案:如果遇到特定网站的转换问题,请通过 support@web2md.org 报告,我们会评估是否需要添加专用提取器。
扩展图标灰色或不可用
Chrome 限制扩展在某些特殊页面上运行,包括 chrome:// 内部页面、Chrome Web Store 页面和 PDF 查看器。在这些页面上,Web2MD 扩展图标会显示为灰色且无法点击。
解决方案:这是 Chrome 浏览器的安全限制,非 Web2MD 的问题。请导航到常规网页后再使用扩展。对于 PDF 文件,可以先将其上传到在线 PDF 查看器,然后再转换。
社区与支持
关注我们获取最新动态,或联系我们获取帮助。我们通常在 24 小时内回复所有支持请求。你也可以访问我们的更新日志了解新功能和改进。