Markdown 简史:从电子邮件约定到 AI 的原生语言
Markdown 简史:从电子邮件约定到 AI 的原生语言
2004 年,一位名叫 John Gruber 的博主遇到了一个简单的问题:他想为网络写作,却不想手动输入 HTML。他与程序员 Aaron Swartz 合作,创造了 Markdown——一种将纯文本转换为简洁 HTML 的轻量级语法。他们当时都没有想到,它将成为 AI 时代的默认语言。
Markdown 解决的问题
在 Markdown 出现之前,网络写作意味着要么使用生成臃肿 HTML 的所见即所得编辑器,要么手工编写原始 HTML。两种方式都不够自然。写作者希望专注于文字,而不是标签。
Gruber 的洞察在于:纯文本电子邮件早已有了非正式的约定——人们用 **粗体** 表示加粗,用连字符制作列表,用星号标注重要词汇。Markdown 只是将这些习惯正式化为一致的语法,并添加了一个将其转换为 HTML 的转换器。
Markdown 的原始规范于 2004 年 3 月 19 日发布在 Daring Fireball。第一个转换器是一个 Perl 脚本。
早期采用:博客与开发者工具
几年之内,Markdown 在开发者社区迅速传播。它简洁、原始形式可读,且易于与 Git 进行版本控制。Jekyll(2008 年)等博客平台将 Markdown 设为静态网站的默认写作格式。
GitHub 于 2008 年将 Markdown 用于 README、Issues、Pull Requests 和评论。这是一个转折点。数以百万计的开发者每天阅读和编写 Markdown,却并不将其视为一种"标记语言"——那只是在 GitHub 上写作的方式。
Stack Overflow、Reddit 以及数十个其他高流量平台也相继添加了 Markdown 支持。但每个平台的实现方式略有不同,造成了兼容性困扰。
CommonMark 标准(2014 年)
到 2012 年,至少有十几种不同的 Markdown 实现,每种对边缘情况的处理行为各异。Stack Overflow 联合创始人 Jeff Atwood 发表了一篇题为"Markdown 的未来"的文章,呼吁制定标准化规范。
2014 年,一批研究人员和开发者发布了 CommonMark——一套严格、明确的 Markdown 规范,附带完整的测试套件。Pandoc 的作者 John MacFarlane、Jeff Atwood 等人参与了贡献。CommonMark 成为大多数现代 Markdown 解析器的基础。
GitHub Flavored Markdown(GFM) 于 2017 年跟进,在 CommonMark 基础上扩展了表格、任务列表和删除线——这些都是开发者社区最需要的功能。
笔记革命
2010 年代涌现出一批以 Markdown 为原生格式的笔记应用:Obsidian、Notion、Bear、Typora、Logseq 等。Markdown 对这些应用的吸引力在于:
- 笔记具有可移植性——纯
.md文件在任何地方都能使用 - 笔记具有持久性——无需担心专有格式锁定
- 笔记原始可读——无需渲染,在任意文本编辑器中都能阅读
2020 年发布的 Obsidian 在纯 Markdown 文件之上构建了完整的知识图谱系统,成为有史以来增长最快的生产力工具之一。
Markdown 遇见 AI
2020 年代初的 AI 革命为 Markdown 带来了意想不到的新角色。当用户开始向 ChatGPT、Claude、Gemini 等大型语言模型输入内容时,一个规律显现出来:Markdown 输入产生的输出质量远优于 HTML。
原因在于结构。LLM 对文本进行分词,而 Markdown 相比 HTML 几乎没有额外开销。一个 HTML 页面可能需要 8,000 个 token,而 Markdown 版本可能只需 2,800 个——减少了 65%。更重要的是,LLM 在大量 Markdown 内容(GitHub、文档网站、Reddit)上进行了训练,能够原生理解它。
如今,Markdown 是 AI 工作流的事实输入格式:
- Claude 和 ChatGPT 等 AI 工具在回复中渲染 Markdown
- 开发者在系统提示和少样本示例中使用 Markdown
- Web2MD 等网页剪辑工具专门将页面转换为 Markdown 以供 AI 使用
- 新兴的
llm.txt规范要求网站为 AI 爬虫发布 Markdown 摘要
关键时间节点
| 年份 | 事件 |
|------|------|
| 2004 | John Gruber 和 Aaron Swartz 创建 Markdown |
| 2008 | GitHub 将 Markdown 用于 README |
| 2012 | Jeff Atwood 呼吁标准化 |
| 2014 | CommonMark 规范发布 |
| 2017 | GitHub Flavored Markdown(GFM)规范发布 |
| 2020 | Obsidian 发布,Markdown 成为 PKM 标准 |
| 2022 | ChatGPT 发布;Markdown 成为 AI 输入格式 |
| 2024 | llm.txt 提案出现;Markdown 成为 GEO 标准 |
为何 Markdown 经久不衰
创建二十年后,Markdown 依然占据主导地位,原因很简单:它尊重写作者。它添加了恰到好处的结构,既实用又不碍事。你可以在记事本中写 Markdown,可以不渲染就直接阅读,还可以将其转换为 HTML、PDF、Word 或十几种其他格式。
在软件日趋复杂的世界中,Markdown 的简洁是一种特性,而非局限。
想要即时将任意网页转换为简洁的 Markdown?试试 Web2MD——一键将任何文章转换为 AI 就绪的 Markdown。