linkedin markdownlinkedin aiclaude linkedinlinkedin 摘要linkedin 文章 抽取web2md职业研究

LinkedIn 帖子转 Markdown 给 AI 做摘要:2026 工作流

Zephyr Whimsy2026-06-048 min read

LinkedIn 帖子转 Markdown 给 AI 做摘要:2026 工作流

LinkedIn 是世界上最大的职业内容网络。长尾文章、创始人更新、热点观点帖、技术领导力 thought leadership — 2026 年资深从业者实际上的发布场所,远远超过个人博客曾经的地位。问题:LinkedIn 内容直接贴到 Claude 或 GPT-5.5 会产生 30-40% 噪声 + 「显示更多」截断内容。

本文是把 LinkedIn 内容变成 AI 真能推理的干净 Markdown 工作流。

贴 LinkedIn 到 AI 为什么失败

你复制一条 LinkedIn 帖子贴到 ChatGPT,得到:

Sundar Pichai
CEO at Google
查看个人资料
1天 • 已编辑
🔔 此人发帖时通知我
[图片]
我们今天宣布...
... 显示更多
💪 1,234 reactions
📝 156 评论
↻ 89 转发
激活以查看更大图片

三个问题:

  1. 「显示更多」截断:帖子正文在 DOM 里被截断直到你点「显示更多」。标准复制粘贴只捕获截断版。
  2. 互动 chrome:reaction 徽章、评论数、转发数消耗 tokens 没添加信号。
  3. 个人资料 chrome:「查看个人资料」、「通知」、「联系」按钮 — 纯 UI 噪声。

Token 浪费是小问题。大问题是 AI 工具去总结那里有的内容 — 那是截断版。帖子一半根本没被分析。

干净 LinkedIn Markdown 长什么样

经过 LinkedIn 感知的提取器:

# [Sundar Pichai] 我们今天宣布...

**作者**: Sundar Pichai · CEO at Google · 发布日期 2026-06-03
**来源**: https://www.linkedin.com/posts/sundarpichai_announcement-...
**互动**: 1,234 reactions · 156 评论 · 89 转发

我们今天宣布,公司研究团队在 [话题] 上取得了重大突破。这建立在年初我们
分享的 [相关话题] 工作之上。核心洞见是:[继续 800 词]。

对 [行业] 的影响有几方面:

1. ...
2. ...
3. ...

[继续,完全展开内容]

## 顶部评论

- **Jane Doe** · VP of Engineering (👍 78): "这非常大。我们在自己的 [相关领域] 工作中看到了类似模式。"
- **John Smith** · 研究员 (👍 45): "重要警告:基准是 [特定局限] — 头条数字不能转化为..."
- ...

比原始复制粘贴小约 50%。帖子正文完整,没截断。顶部评论包含进来作为上下文。个人资料 chrome 剥离。

工作流

三条路:

路径 1:Web2MD 扩展 (交互式)

Chrome 打开 LinkedIn 帖子或文章。点 Web2MD。LinkedIn 专用提取器:

  • 展开「显示更多」截断,拿到帖子完整正文
  • 剥离 reaction 徽章、评论数 chrome、个人资料 UI
  • 抓作者姓名、职位、发布日期、原始 URL
  • 按 reaction 数排序的前 5-10 条评论
  • 格式化为带正确标题的干净 Markdown

端到端:每帖约 6 秒。免费版处理日常使用,Pro 无限。

路径 2:构建研究 pipeline 的开发者

LinkedIn 官方 API 受限 — 仅限批准合作伙伴和商业用例。个人研究用:

// 在 Chrome 扩展 content script 或 bookmarklet 里
function extractLinkedInPost() {
  // 先展开「显示更多」(如果存在)
  const seeMore = document.querySelector('[aria-label="See more, visibility:"]');
  if (seeMore) seeMore.click();
  // 等等,再抽取
  setTimeout(() => {
    const author = document.querySelector('.update-components-actor__title')?.innerText;
    const body = document.querySelector('.update-components-text')?.innerText;
    const comments = Array.from(document.querySelectorAll('.comments-comment-item'))
      .slice(0, 10)
      .map(c => ({
        author: c.querySelector('.comments-post-meta__name')?.innerText,
        text: c.querySelector('.comments-comment-item__main-content')?.innerText,
        likes: c.querySelector('.comments-comment-social-bar__action-button')?.innerText,
      }));
    const md = `# [${author}] LinkedIn 帖子\n\n${body}\n\n## 评论\n\n` +
               comments.map(c => `- **${c.author}** (${c.likes}): ${c.text}`).join('\n');
    navigator.clipboard.writeText(md);
  }, 500);
}

DOM 选择器在 LinkedIn 重设计 (~每季度) 时会坏。生产用 Web2MD 提取器有中央更新。

路径 3:批量意见领袖分析

"分析 [创始人] 这个季度发了什么":

  1. 打开他们的 LinkedIn 活动页
  2. 滚动加载最近 30-50 个帖子
  3. 想要的帖子开 tab
  4. Web2MD 队列每个
  5. 批量导出成单 Markdown 文件
  6. 贴 Claude 配合成 prompt

30 帖总时间:包含阅读约 20 分钟。合并语料库:约 40k tokens。Claude 产出读单帖看不到的模式的主题分析。

真实例子:季度竞品情报

每个季度我做一次「竞品 CEO 在 LinkedIn 发什么」分析:

  • 8 个竞品 × 各约 10 个实质帖 = 80 帖
  • Web2MD 队列 + 批量导出:包含阅读约 30 分钟
  • 合并 Markdown:约 95k tokens
  • 贴 Claude,prompt:「这是 8 个竞品 CEO 在 2026 Q2 的 80 个 LinkedIn 帖。识别每个 CEO 现在主张的 3 个主题。哪里同意?哪里分歧?引用特定帖子带 URL。」

输出:8 页带引用证据的竞品景观备忘录。总工作流时间:约 75 分钟。手动版 (读所有帖子、记笔记、写主题) 要 1-2 天。

不适用的场景

  • 规模化销售勘探。Web2MD 是个人用扩展。商业规模 LinkedIn 数据抽取用 LinkedIn Sales Navigator 或合作伙伴 API。
  • 私密帖和 connection-gated 内容。Web2MD 读浏览器 session 里能看到的东西。登录都看不到的扩展也看不到。
  • 实时监控。快照工作流。特定账号持续追踪建小型 RSS-style 轮询,结果走提取器。
  • 绕过 LinkedIn 认证或速率限制。已经能看到的内容个人使用 OK;绕过平台保护不行。

与其他工作流搭配

LinkedIn 内容跟其他研究面结合获得额外价值:

信号 vs 噪声笔记

LinkedIn 内容比 Reddit、podcast 字幕、Wikipedia 信号噪声比更高。促销内容和个人品牌 framing 占任何 LinkedIn 语料库相当大比例。合成时明确告诉 Claude:「识别带证据的实质主张 vs 没证据的个人品牌 framing」。干净 Markdown 让这种区分比读原始 HTML 噪声尖锐得多。

相关阅读

安装

Web2MD Chrome 扩展商店 →

免费 3 次/天。Pro $9/月解锁无限 + 队列 + 批量导出 + 带「显示更多」展开的专用 LinkedIn 提取器。

Related Articles