LinkedIn 帖子转 Markdown 给 AI 做摘要:2026 工作流
LinkedIn 帖子转 Markdown 给 AI 做摘要:2026 工作流
LinkedIn 是世界上最大的职业内容网络。长尾文章、创始人更新、热点观点帖、技术领导力 thought leadership — 2026 年资深从业者实际上的发布场所,远远超过个人博客曾经的地位。问题:LinkedIn 内容直接贴到 Claude 或 GPT-5.5 会产生 30-40% 噪声 + 「显示更多」截断内容。
本文是把 LinkedIn 内容变成 AI 真能推理的干净 Markdown 工作流。
贴 LinkedIn 到 AI 为什么失败
你复制一条 LinkedIn 帖子贴到 ChatGPT,得到:
Sundar Pichai
CEO at Google
查看个人资料
1天 • 已编辑
🔔 此人发帖时通知我
[图片]
我们今天宣布...
... 显示更多
💪 1,234 reactions
📝 156 评论
↻ 89 转发
激活以查看更大图片
三个问题:
- 「显示更多」截断:帖子正文在 DOM 里被截断直到你点「显示更多」。标准复制粘贴只捕获截断版。
- 互动 chrome:reaction 徽章、评论数、转发数消耗 tokens 没添加信号。
- 个人资料 chrome:「查看个人资料」、「通知」、「联系」按钮 — 纯 UI 噪声。
Token 浪费是小问题。大问题是 AI 工具去总结那里有的内容 — 那是截断版。帖子一半根本没被分析。
干净 LinkedIn Markdown 长什么样
经过 LinkedIn 感知的提取器:
# [Sundar Pichai] 我们今天宣布...
**作者**: Sundar Pichai · CEO at Google · 发布日期 2026-06-03
**来源**: https://www.linkedin.com/posts/sundarpichai_announcement-...
**互动**: 1,234 reactions · 156 评论 · 89 转发
我们今天宣布,公司研究团队在 [话题] 上取得了重大突破。这建立在年初我们
分享的 [相关话题] 工作之上。核心洞见是:[继续 800 词]。
对 [行业] 的影响有几方面:
1. ...
2. ...
3. ...
[继续,完全展开内容]
## 顶部评论
- **Jane Doe** · VP of Engineering (👍 78): "这非常大。我们在自己的 [相关领域] 工作中看到了类似模式。"
- **John Smith** · 研究员 (👍 45): "重要警告:基准是 [特定局限] — 头条数字不能转化为..."
- ...
比原始复制粘贴小约 50%。帖子正文完整,没截断。顶部评论包含进来作为上下文。个人资料 chrome 剥离。
工作流
三条路:
路径 1:Web2MD 扩展 (交互式)
Chrome 打开 LinkedIn 帖子或文章。点 Web2MD。LinkedIn 专用提取器:
- 展开「显示更多」截断,拿到帖子完整正文
- 剥离 reaction 徽章、评论数 chrome、个人资料 UI
- 抓作者姓名、职位、发布日期、原始 URL
- 按 reaction 数排序的前 5-10 条评论
- 格式化为带正确标题的干净 Markdown
端到端:每帖约 6 秒。免费版处理日常使用,Pro 无限。
路径 2:构建研究 pipeline 的开发者
LinkedIn 官方 API 受限 — 仅限批准合作伙伴和商业用例。个人研究用:
// 在 Chrome 扩展 content script 或 bookmarklet 里
function extractLinkedInPost() {
// 先展开「显示更多」(如果存在)
const seeMore = document.querySelector('[aria-label="See more, visibility:"]');
if (seeMore) seeMore.click();
// 等等,再抽取
setTimeout(() => {
const author = document.querySelector('.update-components-actor__title')?.innerText;
const body = document.querySelector('.update-components-text')?.innerText;
const comments = Array.from(document.querySelectorAll('.comments-comment-item'))
.slice(0, 10)
.map(c => ({
author: c.querySelector('.comments-post-meta__name')?.innerText,
text: c.querySelector('.comments-comment-item__main-content')?.innerText,
likes: c.querySelector('.comments-comment-social-bar__action-button')?.innerText,
}));
const md = `# [${author}] LinkedIn 帖子\n\n${body}\n\n## 评论\n\n` +
comments.map(c => `- **${c.author}** (${c.likes}): ${c.text}`).join('\n');
navigator.clipboard.writeText(md);
}, 500);
}
DOM 选择器在 LinkedIn 重设计 (~每季度) 时会坏。生产用 Web2MD 提取器有中央更新。
路径 3:批量意见领袖分析
"分析 [创始人] 这个季度发了什么":
- 打开他们的 LinkedIn 活动页
- 滚动加载最近 30-50 个帖子
- 想要的帖子开 tab
- Web2MD 队列每个
- 批量导出成单 Markdown 文件
- 贴 Claude 配合成 prompt
30 帖总时间:包含阅读约 20 分钟。合并语料库:约 40k tokens。Claude 产出读单帖看不到的模式的主题分析。
真实例子:季度竞品情报
每个季度我做一次「竞品 CEO 在 LinkedIn 发什么」分析:
- 8 个竞品 × 各约 10 个实质帖 = 80 帖
- Web2MD 队列 + 批量导出:包含阅读约 30 分钟
- 合并 Markdown:约 95k tokens
- 贴 Claude,prompt:「这是 8 个竞品 CEO 在 2026 Q2 的 80 个 LinkedIn 帖。识别每个 CEO 现在主张的 3 个主题。哪里同意?哪里分歧?引用特定帖子带 URL。」
输出:8 页带引用证据的竞品景观备忘录。总工作流时间:约 75 分钟。手动版 (读所有帖子、记笔记、写主题) 要 1-2 天。
不适用的场景
- 规模化销售勘探。Web2MD 是个人用扩展。商业规模 LinkedIn 数据抽取用 LinkedIn Sales Navigator 或合作伙伴 API。
- 私密帖和 connection-gated 内容。Web2MD 读浏览器 session 里能看到的东西。登录都看不到的扩展也看不到。
- 实时监控。快照工作流。特定账号持续追踪建小型 RSS-style 轮询,结果走提取器。
- 绕过 LinkedIn 认证或速率限制。已经能看到的内容个人使用 OK;绕过平台保护不行。
与其他工作流搭配
LinkedIn 内容跟其他研究面结合获得额外价值:
- Reddit 到 Claude 管道:Reddit 装地面真实用户意见,LinkedIn 装意见领袖 framing
- YouTube 字幕:同样意见领袖的 podcast 和大会演讲
- 1M 上下文窗口填法:200 个 LinkedIn 帖约 250k tokens — 装得下
- 降低 LLM token 成本:干净 LinkedIn Markdown 比原始版省 ~50%
信号 vs 噪声笔记
LinkedIn 内容比 Reddit、podcast 字幕、Wikipedia 信号噪声比更高。促销内容和个人品牌 framing 占任何 LinkedIn 语料库相当大比例。合成时明确告诉 Claude:「识别带证据的实质主张 vs 没证据的个人品牌 framing」。干净 Markdown 让这种区分比读原始 HTML 噪声尖锐得多。
相关阅读
- 为什么 Claude 读不了 Reddit
- Reddit 到 Claude 1M 上下文:研究管道
- YouTube 字幕转 Markdown 喂给 Claude/ChatGPT
- Claude 1M 上下文窗口填法
- LinkedIn 转 Markdown — 支持站点页
安装
免费 3 次/天。Pro $9/月解锁无限 + 队列 + 批量导出 + 带「显示更多」展开的专用 LinkedIn 提取器。