Cnbc Geopolitics Fetcher — CNBC 地缘政治数据抓取器
v2.0自动化的地缘政治情报代理,负责从CNBC过去24小时的新闻中获取5篇最热门的文章,提取结构化数据(标题、URL、市场影响、...)
运行时依赖
安装命令
点击复制技能文档
CNBC 地缘政治新闻获取器技能目的 获取最新的CNBC地缘政治新闻文章,提取完整的事实数据(不截断),并将每篇文章单独发布到Discord,附带增强的分析师/Polymarket相关上下文。
此技能的功能 抓取5篇最新的CNBC地缘政治文章(伊朗,中东,石油市场,能源政策) 提取完整的句子 - 不截断或总结 识别分析师预测和Polymarket相关数据(赔率,概率,市场定价) 将每篇文章作为单独的Discord消息发布(一一发布,不批量发布) 自动拆分长消息以适应Discord的2000字符限制
快速开始(一条命令) 在工作空间根目录运行:python "C:\Users\Legion 5i Pro\.openclaw\workspace\skills\cnbc-geopolitics-fetcher\scripts\fetch_cnbc_geopolitics.py" --webhook "YOUR_DISCORD_WEBHOOK_URL" --verbose
必需参数 --webhook:Discord webhook URL(必需) --config:包含webhook的配置文件路径(可替代--webhook) --count:要抓取的文章数量(默认:5) --verbose:显示详细的提取输出
示例(完整命令) python "C:\Users\Legion 5i Pro\.openclaw\workspace\skills\cnbc-geopolitics-fetcher\scripts\fetch_cnbc_geopolitics.py" --webhook "https://discord.com/api/webhooks/1482043765471445333/-cHOLCqBtvU_Wua8STfoINes7J0pFNFsXB27EJ3f8F7BklC5P_OkIGAx2HQLDPZe1bNJ" --count 5 --verbose
配置选项 1:命令行Webhook 直接传递webhook URL:python fetch_cnbc_geopolitics.py --webhook "https://discord.com/api/webhooks/..." 2:配置文件 创建references/config.md文件,内容为:## Discord Webhook https://discord.com/api/webhooks/1482043765471445333/-cHOLCqBtvU_Wua8STfoINes7J0pFNFsXB27EJ3f8F7BklC5P_OkIGAx2HQLDPZe1bNJ 然后运行:python fetch_cnbc_geopolitics.py --config "C:\Users\Legion 5i Pro\.openclaw\workspace\skills\cnbc-geopolitics-fetcher\references\config.md"
输出格式(Discord消息) 每篇文章发布为:### 文章 [完整文章标题] URL: https://www.cnbc.com/2026/03/13/... 市场影响: 能源:[完整句子关于石油/能源];股票:[完整句子关于市场];分析师:[预测/预测] 硬性事实: - 官方:[完整引用的官方声明] - 行动:[完整句子描述军事/外交行动] - 数据:[完整句子包含数字/统计] - 时间线:[完整句子包含日期/截止日期] - 分析师:[完整句子包含预测/市场预测] (原始数据 - 无编辑分析)
关键特性 完整句子 - 不截断(移除了所有长度限制) 分析师/Polymarket数据 - 提取预测,赔率,概率,市场定价 一一发布 - 每篇文章都是单独的Discord消息 自动拆分 - 消息超过2000个字符自动拆分为多个部分
工作原理(架构) 1:文章发现 搜索CNBC HTML以查找匹配模式的文章链接:https://www.cnbc.com/YYYY/MM/... 过滤掉视频,高级,专业,标签,部分,直播URL 返回最多25个唯一的地缘政治文章URL 2:文章抓取 使用Scrapling(隐身无头浏览器)绕过反爬虫保护 提取:标题,完整文章文本,描述元数据 如果Scrapling失败,回退到正则表达式提取 3:事实提取(不截断) 将文章文本拆分为完整句子 扫描6个事实类别:官方:引用的声明(说/说/宣布) 行动:军事/外交/经济行动(打击/发射/制裁) 数据:带单位的数字(百万/十亿/百分比/桶/美元) 时间线:日期/截止日期(在/之前/之后/直到/预期) 分析师:预测/预测(预测/预计/项目/可能/衰退) 市场:Polymarket/预测市场语言(赔率/概率/投注) 返回每篇文章最多5个完整事实 4:市场影响提取 扫描能源,股票,货币,分析师,Polymarket句子 返回完整句子(不限制长度) 类别:能源,股票,货币,分析师,Polymarket 5:Discord发布 格式化每篇文章为markdown 检查消息长度与2000字符Discord限制 如果太长:拆分为标题+URL+市场,事实,免责声明部分 发布每篇文章单独(不批量发布) 小延迟(0.3秒)之间拆分部分
文件结构 skills/cnbc-geopolitics-fetcher/ ├── SKILL.md # 本文档 ├── scripts/ │ └── fetch_cnbc_geopolitics.py # 主抓取脚本 └── references/ └── config.md # Discord webhook配置
依赖项 Python 3.x scrapling(隐身网页抓取) beautifulsoup4(HTML解析) requests(HTTP客户端) 安装依赖项:pip install scrapling beautifulsoup4 requests
自定义提示 更改文章数量 python fetch_cnbc_geopolitics.py --webhook "..." --count 10 输出到文件而不是Discord python fetch_cnbc_geopolitics.py --output "output.md" --count 5 禁用详细输出 移除--verbose标志以获得更干净的控制台输出。 故障排除