使用文档
了解如何充分利用 Web2MD 的所有功能
快速开始
Web2MD 让你在 3 步之内将任意网页转换为干净的 Markdown 格式。无论是喂给 AI 助手、存入笔记应用,还是预处理 RAG pipeline 数据,整个过程不超过 10 秒。
安装扩展
从 Chrome 网上应用店安装 Web2MD 扩展,免费且 5 秒内完成安装。
打开任意网页
打开任何你想转换的文章、博客、文档页面或论坛帖子。
点击转换
点击工具栏中的 Web2MD 图标,或按下 Control+M(Mac)/ Alt+M(Windows),完成!
转换后的 Markdown 会自动复制到剪贴板,可以直接粘贴到 ChatGPT、Claude、Obsidian、Notion 或任何支持 Markdown 的工具中。
功能概览
Web2MD 专为 AI 时代设计,不仅仅是简单的 HTML to Markdown 转换器。它通过智能提取算法去除广告、导航栏和侧边栏干扰,输出优化后的 Markdown 内容,平均可节省 60% 以上的 token 用量。以下是主要功能一览:
一键转换
一键将任意网页转换为干净的 Markdown,无需手动复制粘贴或排版。
AI 优化输出
智能提取去除噪声,输出 AI 友好的 Markdown 格式,在 AI workflow 中节省 60% 以上 token。
14 个专用提取器
为 Medium、Substack、Reddit、GitHub、YouTube 等平台专门优化的提取器,每个都调优至最佳精度。
代码块保留
语法高亮代码块被完美保留,包括语言标签、缩进和格式。
表格支持
HTML 表格被转换为标准 Markdown 表格语法,保持正确的对齐和列格式。
Token 计数
即时查看 GPT-4、Claude 等模型的 token 计数——这对 AI token optimization 至关重要。所有主流分词器准确率超过 95%。
批量转换
同时转换多个 URL 或已打开的标签页,非常适合研究和竞品分析。
多语言界面
扩展支持 11 种语言,包括英语、中文、日语、韩语、西班牙语等。
Obsidian 导出
前提条件
此功能通过 obsidian:// 协议与本地 Obsidian 应用通信,需要在您的电脑上安装并运行 Obsidian 桌面版。移动端或未安装 Obsidian 的设备无法使用此功能。
将任意网页转换后一键存入 Obsidian 笔记库,自动创建新笔记并填入内容。这对于构建个人知识库、收集研究资料或归档重要文章特别有用。转换后的 Markdown 保留完整的标题层级、链接和格式,在 Obsidian 中可以直接使用双向链接和标签功能。
使用步骤
- 打开扩展 → 切换到 Settings 标签页
- 在 Obsidian 区域,打开"启用 Obsidian 导出"开关
- (可选)填写仓库名称,留空则使用 Obsidian 默认仓库
- 切换到 Convert 标签页,转换当前网页
- 转换完成后点击"保存到 Obsidian",Obsidian 会自动打开并创建新笔记
注意:单个笔记内容上限为 2MB。超出时内容会自动截断,末尾会显示提示说明。
发送至 AI
将转换后的 Markdown 内容一键发送到 Claude、ChatGPT、Gemini、Perplexity、Grok 或 DeepSeek。Web2MD 的智能提取确保发送给 AI 的内容是干净的、结构化的,避免浪费 token 在广告和导航栏等无关内容上。Pro 用户平均每月节省约 200 万 token,相当于约 $17 的 API 成本。
- 在 Settings 中选择偏好的 AI 平台
- 转换页面后,点击弹出菜单中的 AI 平台按钮
- 内容会自动粘贴到 AI 对话框中,可选择开启"自动发送"省去手动粘贴
提示:搭配 Prompt 模板使用效果更佳。例如,选择"总结"模板后发送到 Claude,可以自动在内容前添加摘要指令。
批量转换
同时转换多个 URL 或浏览器中已打开的标签页。批量转换功能非常适合需要一次性处理大量网页的场景,例如竞品研究、文献调研或内容归档。所有结果可以合并下载为单个 Markdown 文件,也可以逐个复制。
- 切换到扩展中的 Batch 标签页
- 粘贴多个 URL(每行一个),或点击"添加已打开标签页"自动导入当前浏览器中所有打开的页面
- 点击"开始转换",进度实时显示,每个 URL 的状态独立追踪
- 完成后可一次性复制或下载所有结果,也可将全部内容合并发送至 AI
Prompt 模板
在内容前添加自定义指令,发送至 AI 时自动应用。这在 AI workflow 中特别有用——你可以为不同任务预设不同的 prompt,一键完成"转换网页 + 添加指令 + 发送至 AI"的完整流程。内置 4 个模板:
- •总结 — 生成内容摘要,快速获取文章要点
- •翻译 — 翻译为目标语言,支持任意语种
- •要点提取 — 列出核心观点,适合会议记录和研究报告
- •通俗解释 — 用简单语言解释复杂内容,适合学习新领域
也可在 Settings → Prompt Templates 中创建、编辑和删除自定义模板。例如,你可以创建一个"代码审查"模板,让 AI 自动分析转换后的技术文档中的代码示例。
支持的平台
Web2MD 可以将几乎所有公开网页转换为 Markdown。除了通用的 HTML 提取算法外,我们还为以下类别的热门网站开发了 14 个专用提取器,确保最佳的转换质量。无论你想 convert webpage to markdown 的内容来源是什么,Web2MD 都能胜任。
新闻与媒体
New York Times、BBC、Reuters、卫报、Bloomberg、TechCrunch、The Verge、Ars Technica
文章、社论和长篇报道。如果你已通过 Chrome 扩展登录,付费墙内容也可以访问。
技术文档
MDN Web Docs、React 文档、Next.js 文档、Python 文档、Stack Overflow、GitHub README 和 Issues
代码块以正确的语言标签和缩进保留。表格和 API 参考保持其结构。
博客平台
Medium、Substack、WordPress、Ghost、Hashnode、dev.to、Blogger
Medium 和 Substack 的专用提取器会自动移除会员提示、点赞 UI 和邮件注册表单。
社交媒体与论坛
Reddit 帖子、Twitter/X 推文串、Hacker News、Discourse 论坛、Quora
Reddit 提取器捕获原始帖子和热门评论,保持正确的线程结构。Twitter/X 推文串按顺序拼接。
学术与研究
arXiv(HTML 版本)、PubMed、Google Scholar、ResearchGate、维基百科、大英百科全书
尽可能保留引用、脚注和数学符号。维基百科信息框被转换为 Markdown 表格。
视频与多媒体
YouTube(描述、字幕)、Vimeo、播客节目说明
YouTube 提取器以结构化 Markdown 格式捕获视频元数据、描述和字幕(如有)。
以上仅列出部分代表性网站。Web2MD 的通用提取算法支持任何标准 HTML 网页。如果你发现某个网站的转换质量不佳,请通过 support@web2md.org 告诉我们,我们会评估是否需要开发专用提取器。
键盘快捷键
无需打开弹出窗口,直接将当前页面转换为 Markdown 并复制到剪贴板。对于高频使用者来说,键盘快捷键可以大幅提升效率——只需按下快捷键,即可在后台完成 web to markdown 的转换,一个通知提示你内容已就绪。
Mac
Control + MWindows / Linux
Alt + M右键菜单
除了键盘快捷键,你还可以右键点击任意网页或选中的文本,在上下文菜单中选择"复制为 Markdown"。如果你选中了页面的一部分文本,只有选中的内容会被转换——这对于只需要文章中某个段落或代码块时非常有用。
使用场景
Web2MD 适用于各种需要将网页内容转换为结构化文本的场景。以下是用户最常见的使用方式:
RAG Pipeline 数据预处理
构建检索增强生成(RAG)系统?Web2MD 输出的干净、结构化 Markdown 非常适合分块和嵌入处理。通过去除 HTML 噪声、广告和导航元素,Web2MD 将文档大小减少 60-80%,这意味着更快的索引速度、更低的存储成本,以及 RAG pipeline 中更相关的检索结果。
Obsidian 和 Notion 笔记
将网页文章直接剪藏到 Obsidian 笔记库,或将干净的 Markdown 粘贴到 Notion 页面中。Web2MD 保留标题、链接、图片、代码块和表格,确保你的笔记看起来和原始内容一样——但没有杂乱信息。无需手动排版即可从网页构建可搜索的个人知识库。
喂给 AI 助手
将清理后的网页内容发送到 ChatGPT、Claude、Gemini 或其他 AI 助手进行摘要、翻译、分析或问答。Web2MD 的 token 节省意味着你可以向 AI 发送更长的文章而不会触及上下文窗口限制。一键发送至 AI 功能让整个流程无缝衔接。
内容归档
以面向未来的格式归档重要网页内容。与书签不同(页面下架时书签就失效了),Markdown 文件是可移植的、可搜索的,几十年后仍然可以阅读。使用批量转换功能可以一次性归档整个文章集合。
开发文档整理
将技术文档、API 参考和 Stack Overflow 答案转换为 Markdown,用于离线阅读、团队分享或喂给 GitHub Copilot、Claude 等编程助手。代码块以正确的语法高亮标签保留,输出内容可以直接使用。
查看我们的 博客 了解更多用户案例和使用技巧。
API 与集成
Web2MD 目前提供两种主要的使用方式来满足不同用户的需求:
Chrome 浏览器扩展
我们的核心产品。在浏览器中直接完成 HTML to Markdown 的转换,所有处理都在本地进行,无需上传任何数据到服务器。支持一键转换、发送至 AI、Obsidian 导出、批量处理等全部功能。适合日常浏览和内容收集。
Web 在线版
通过网页端输入 URL 进行转换,无需安装扩展。适合临时使用、移动端用户、或在无法安装扩展的环境中使用。登录后可享受与扩展相同的转换配额。
API 访问(Pro 功能)
Pro 用户可通过 API 集成 Web2MD 的转换能力到自己的应用和工作流中。API 提供与扩展相同的智能提取和 Markdown 输出质量,适合自动化 RAG pipeline、内容监控系统和自定义 AI workflow 等场景。查看 定价页面 了解 Pro 计划详情。
常见问题
Web2MD 可以转换哪些类型的网页?
作为一款功能全面的 markdown converter,Web2MD 可以处理几乎所有公开可访问的网页,包括新闻文章、博客帖子、技术文档、论坛帖子、产品页面和学术论文。我们有 14 个专用提取器,针对 Medium、Substack、Reddit、GitHub、YouTube 和 WordPress 等流行平台进行了优化。对于标准网站,我们的通用提取算法能处理大多数 HTML 结构,格式准确率超过 97%。登录墙后面的页面或需要 JavaScript 交互的页面可能有限制——详情请参阅下方的故障排除部分。
使用 Web2MD 时我的数据安全吗?
绝对安全。通过 Chrome 扩展进行的所有转换都完全在你的本地设备上进行——我们从不上传或存储任何网页内容到服务器。转换引擎在浏览器的沙盒环境中运行,你的数据永远不会离开你的电脑。对于 Web 在线版,URL 在服务器端获取进行转换,但内容仅在内存中处理,不会持久化存储。我们对所有通信使用 SSL 加密,并遵循标准的数据保护实践。你可以查看我们的完整隐私政策了解更多细节。
Token 计数功能有多准确?
Web2MD 的 token 计数使用与 GPT-4 和 Claude 所用分词器类似的算法,在所有主流模型上准确率超过 95%。由于分词器之间存在细微差异(例如 GPT-4 使用 cl100k_base,Claude 使用自己的分词器),我们建议在规划 prompt 时预留 5-10% 的余量。每次转换后 token 计数会即时显示,帮助你估算 API 成本并确保内容在模型的上下文窗口范围内。Pro 用户通过我们的优化提取平均每月节省约 200 万 token。
免费版和 Pro 版有什么区别?
免费版每天包含 3 次转换,支持智能内容提取和基本 Markdown 输出。Pro 版($9/月或 $49.99/年)解锁无限转换、转换历史、精确 token 计数、智能内容分割、AI 自动标签和摘要、Markdown 文件下载、自动平台分类和 API 访问。Pro 还包括优先支持和新功能提前体验。如果你经常为 AI workflow 或研究转换网页,仅通过 token 节省 Pro 就能回本——Pro 用户平均每月节省约 $17 的 API 成本。
查看 定价页面 了解完整的功能对比和计划详情。
故障排除
大多数网页都可以顺利转换,但某些特殊情况可能需要额外注意。以下是常见问题和解决方案:
某些页面转换结果为空或不完整
这通常发生在依赖客户端 JavaScript 渲染内容的单页应用(SPA)上,例如某些 React/Vue/Angular 应用。Web2MD 读取的是页面当前 DOM 状态,如果内容尚未完全加载,可能无法捕获全部内容。
解决方案:等待页面完全加载后再点击转换。如果页面使用无限滚动,先向下滚动加载所需内容,然后再进行转换。
付费墙或登录墙后的内容
如果网页内容需要登录或付费才能查看,Web2MD 的 Chrome 扩展只能转换你在浏览器中实际能看到的内容。如果你已经登录并能看到完整文章,扩展可以正常转换。但 Web 在线版通过 URL 获取页面时,无法使用你的登录凭证,因此只能获取公开可见的部分。
解决方案:对于付费内容,请使用 Chrome 扩展(不要用 Web 在线版)。确保你已登录并能在浏览器中看到完整内容后再转换。
格式丢失或排版异常
少数网站使用非标准的 HTML 结构或依赖 CSS 来呈现内容结构(例如使用 div 而非语义化标签来表示标题),这可能导致转换后的 Markdown 缺少某些格式。此外,使用图片嵌入文字的页面(如某些营销页面或 PDF 截图)无法被提取为文本。
解决方案:如果遇到特定网站的转换问题,请通过 support@web2md.org 报告,我们会评估是否需要添加专用提取器。
扩展图标灰色或不可用
Chrome 限制扩展在某些特殊页面上运行,包括 chrome:// 内部页面、Chrome Web Store 页面和 PDF 查看器。在这些页面上,Web2MD 扩展图标会显示为灰色且无法点击。
解决方案:这是 Chrome 浏览器的安全限制,非 Web2MD 的问题。请导航到常规网页后再使用扩展。对于 PDF 文件,可以先将其上传到在线 PDF 查看器,然后再转换。
社区与支持
关注我们获取最新动态,或联系我们获取帮助。我们通常在 24 小时内回复所有支持请求。你也可以访问我们的更新日志了解新功能和改进。