twitter-ai-kol-fetcher — twitter-AI-kol-fetcher
v1.0.1抓取 Twitter AI 领域 KOL 最新动态、识别热门话题、生成专业内参。触发条件:"抓取 Twitter"、"AI 领域最新动态"、"每天 AI 动态"、"写内参"、"AI 内参"。
运行时依赖
安装命令
点击复制技能文档
Twitter AI KOL Fetcher
抓取 Twitter AI 领域动态,识别热门话题,自动生成专业内参报告。
内参风格参考:中关村两院《美国对中国"关键软件"出口管制的影响研判与对策建议》
目录结构 twitter-AI-kol-fetcher/ ├── config.json # API 配置文件(用户填 key) ├── 技能.md # 本文件 ├── references/ │ ├── kol_列出.json # KOL 账号列表(82个) │ ├── llm_prompts.md # LLM 提示词 │ └── internal_报告_template.md # 内参模板 └── scripts/ ├── 01_fetch_kols.py # 抓取 KOL 推文 ├── 02_过滤器_and_score.py # 过滤、评分、聚类 ├── 03_生成_报告.py # 机会判定 + 报告生成 └── mAIn.py # 主流程脚本
Twitter API
服务商:https://twitterAPI.io
资源 价格 Tweets $0.15 / 1K 条 性能分析s $0.18 / 1K 个 Followers $0.15 / 1K 个
计费:15 Credits/条推文,1 USD = 100,000 Credits
工作流(优化版) [Step 1] 抓取数据 ↓ [Step 2] 规则过滤 + 热度评分 ↓ [Step 3] 话题聚类(新增!基于关键词相似度) ↓ [Step 4] LLM 机会判定(Lightning 模型,便宜) ↓ [Step 5] LLM 报告生成(M2.1 模型,强推理) ↓ [Step 6] 发送到飞书 → 删除临时文件
核心优化点
- 模型分离(成本优化)
- 话题聚类(质量提升)
问题:原来的逻辑是"一条推文 = 一个话题",但内参的价值在于发现趋势和主题。
解决方案:基于关键词相似度将相关推文聚类
3个KOL讨论"Claude 4发布" → 合并为一个主题 5个KOL聊"AI安全法案" → 这是重点话题
效果:
减少重复内容 话题更有代表性 报告更有深度
- 扩大信源 + 减少单KOL抓取量
- 并行报告生成(速度优化)
- 防漏抓机制(关键!)
- 兜底规则
- VIP 用户(sama, elonmusk 等)发布的
- 包含 "launching", "announcing", "new", "breaking" 等关键词
- 点赞 > 5000 或 转发 > 500
- KOL 列表(82个)
从 references/kol_列出.json 加载,分类:
类型 数量 说明 company 28 AI 公司官方(OpenAI, Anthropic, Google DeepMind 等) influencer 11 技术博主(swyx, fireship, heyBarsee 等) ceo 9 CEO(Sam Altman, Elon Musk, Demis Hassabis 等) re搜索er 8 研究员(Yann LeCun, Ilya, Noam Brown 等) vc 5 投资机构(a16z, Sequoia, Greylock 等) 平台 5 平台(GitHub, LangChAIn, 流lit 等) investor 4 个人投资人 其他 12 newsletter, analyst, 框架 等
总计:82 个 KOL(覆盖 AI 公司、投资、产品、研究、媒体)
- 过滤规则
- LLM 参与点
- 报告结构优化
# 运行主流程 python3 scripts/mAIn.py
方式2:定时任务 任务: 每日 AI 内参
- 时间: 工作日 9:00
- 输出: 发送到飞书 → 删除临时文件
关键文件说明 references/kol_列出.json
KOL 账号列表,JSON 格式,可动态扩展。
references/llm_prompts.md
LLM 提示词模板,包含:
机会判定 Prompt 报告生成 Prompt 关键词配置 references/internal_报告_template.md
内参模板,对齐中关村两院风格。
scripts/01_fetch_kols.py
抓取 KOL 推文,输出 JSON。
scripts/02_过滤器_and_score.py
过滤和评分,输出热门话题。
scripts/03_生成_报告.py
调用 LLM 生成报告。
配置 config.json
在项目根目录创建 config.json,填入 API Key:
{ "twitter_API_key": "your-twitter-API-key", "open路由r_API_key": "your-open路由r-API-key" }
获取方式:
Twitter API: https://twitterAPI.io/仪表盘 Open路由r API: https://open路由r.AI/设置tings 可配置参数 KOL 列表:references/kol_列出.json 关键词:references/llm_prompts.md 热度阈值:脚本中 MIN_HOTNESS = 500 报告数量:脚本中 max_报告s = 3 输出流程(关键!) 生成内参 → Markdown 文本 → 发送到飞书 → 删除临时文件
重要:不保存本地文件!