Wechat Fetch Publish

v3.0

微信公众号文章抓取工具 v3.0 - Lite轻量版 + Playwright版，支持免登录、批量抓取、图片下载、多格式输出

0· 349·0 当前·0 累计

by @jackyfan01 (JackyFan)·MIT-0

微信生态即时通讯

使用场景：发微信消息管理微信联系人微信支付微信机器人

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install wechat-fetch

镜像加速npx clawhub@latest install wechat-fetch --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Wechat Fetch Publish 安装说明：安装命令：["openclaw skills install wechat-fetch"] 该技能用于微信相关操作，可能需要相应的平台账号或API密钥

需要定制？告诉我你的需求 →

技能文档

WeChat Fetch v3.0 - 微信文章抓取工具

微信公众号文章抓取工具 v3.0，在 v2.0 基础上新增：免登录模式、批量抓取、图片下载、多格式输出。

新增特性 (v3.0) 特性说明 ✅ 免登录模式无需扫码登录，直接抓取公开文章 ✅ 批量抓取支持从文件读取多个 URL 批量下载 ✅ 图片下载自动下载文章图片到本地 ✅ 多格式输出 Markdown/HTML/JSON/TXT 四种格式使用方法版本选择版本适用场景资源需求批量抓取 Lite 版快速抓取、低内存环境低（无需浏览器） ✅ 支持 Playwright 版需要 Cookie 登录、复杂页面高（需 Chromium） ✅ 支持

Lite 版（推荐）

# 基本用法 python3 scripts/wechat_fetch_lite.py "https://mp.weixin.qq.com/s/xxxxx"

# 指定输出格式 python3 scripts/wechat_fetch_lite.py "https://mp.weixin.qq.com/s/xxxxx" \ --格式化 html --输出 article.html

# 下载图片 python3 scripts/wechat_fetch_lite.py "https://mp.weixin.qq.com/s/xxxxx" \ --下载-images --输出 article.md

# 批量抓取 python3 scripts/wechat_fetch_lite.py --batch urls.txt --输出 ./articles \ --格式化 markdown --delay 3

Playwright 版（需 Cookie 登录时）

# 免登录模式 python3 scripts/wechat_fetch_v3.py "https://mp.weixin.qq.com/s/xxxxx" --no-记录in

# Cookie 模式（需预先登录） python3 scripts/wechat_fetch_v3.py "https://mp.weixin.qq.com/s/xxxxx"

# 批量抓取（带重试） python3 scripts/wechat_fetch_v3.py --batch urls.txt --输出 ./articles \ --no-记录in --max-retries 3 --retry-delay 5

批量抓取

# 创建 URL 列表文件 urls.txt echo "https://mp.weixin.qq.com/s/xxx1" > urls.txt echo "https://mp.weixin.qq.com/s/xxx2" >> urls.txt echo "https://mp.weixin.qq.com/s/xxx3" >> urls.txt

# 批量抓取 python3 scripts/wechat_fetch_v3.py --batch urls.txt --输出 ./articles \ --no-记录in --下载-images --格式化 markdown

Python API

Lite 版（推荐）:

from scripts.wechat_fetch_lite 导入 WeChatFetcherLite

fetcher = WeChatFetcherLite()

# 单篇抓取结果 = fetcher.fetch_single( url="https://mp.weixin.qq.com/s/xxxxx", 下载_images=True, 输出_格式化="markdown" )

Playwright 版:

from scripts.wechat_fetch_v3 导入 WeChatFetcher

fetcher = WeChatFetcher()

# 单篇抓取结果 = fetcher.fetch_single( url="https://mp.weixin.qq.com/s/xxxxx", no_记录in=True, 下载_images=True, 输出_格式化="markdown" )

# 批量抓取结果s = fetcher.fetch_batch( urls=["url1", "url2", "url3"], 输出_dir="./articles", no_记录in=True, 下载_images=True, 输出_格式化="json" )

参数说明 Lite 版参数参数说明默认值 url 微信文章 URL - -o, --输出输出文件路径 - --batch 批量抓取文件（每行一个URL） - --下载-images 下载图片到本地 False --格式化输出格式 (markdown/html/json/txt) markdown --timeout 超时时间（秒） 30 --delay 请求间隔（秒） 2 Playwright 版参数参数说明默认值 url 微信文章 URL - -o, --输出输出文件/目录路径 - --batch 批量抓取文件路径 - --no-记录in 免登录模式 False --下载-images 下载图片到本地 False --格式化输出格式 (markdown/html/json/txt) markdown --headless 无头模式 True --timeout 超时时间（秒） 30 --max-retries 最大重试次数（批量模式） 3 --retry-delay 重试间隔（秒） 5 输出格式对比格式说明适用场景 Markdown 标准 Markdown，含元数据通用，推荐 HTML 完整 HTML 页面网页展示 JSON 结构化数据程序处理 TXT 纯文本简单阅读版本对比特性 Lite 版 Playwright 版 (v3) Cookie 模式 (v2) 资源需求低高高速度快中等中等稳定性高中高 Cookie 登录 ❌ ✅ ✅ 批量抓取 ✅ ✅ ❌ 图片下载 ✅ ✅ ✅ 多格式输出 ✅ ✅ ✅ 重试机制 ❌ ✅ ❌ 推荐场景日常使用复杂需求私密文章批量抓取示例 # 1. 准备 URL 文件 cat > urls.txt << 'EOF' https://mp.weixin.qq.com/s/article1 https://mp.weixin.qq.com/s/article2 https://mp.weixin.qq.com/s/article3 EOF

# 2. 执行批量抓取 python3 scripts/wechat_fetch_v3.py \ --batch urls.txt \ --输出 ./articles \ --no-记录in \ --下载-images \ --格式化 markdown

# 3. 查看结果 ls ./articles/ # article_001.md article_002.md article_003.md images/ batch_报告.json

图片下载说明

使用 --下载-images 参数时：

图片会下载到 images/ 子目录 Markdown 中的图片链接会替换为本地相对路径支持常见格式：jpg, png, gif, 网页p articles/ ├── article_001.md ├── article_002.md └── images/ ├── image_001.jpg ├── image_002.png └── image_003.gif

故障排除免登录模式抓取失败

可能原因：

文章需要登录才能查看触发微信反爬机制页面结构变化

解决：

尝试使用 Cookie 模式增加 --timeout 时间添加延迟避免频繁请求图片下载失败

可能原因：

图片 URL 过期网络问题图片需要登录权限

解决：

使用 Cookie 模式检查网络连接手动下载缺失图片批量抓取中断

解决：

查看 batch_报告.json 了解失败详情从失败位置继续抓取调整请求间隔时间更新日志 v3.0.0 (2026-03-23) ✅ 新增 Lite 轻量版（无需浏览器） ✅ 新增免登录模式 ✅ 新增批量抓取功能（Lite + Playwright） ✅ 新增图片下载功能 ✅ 新增多格式输出（HTML/JSON/TXT） ✅ 优化代码结构，更易扩展 ✅ 添加批量抓取报告 ✅ 添加重试机制（Playwright 版） v2.0.1 (2026-03-20) ✅ 使用持久化浏览器上下文 ✅ 复用已登录 Cookie ✅ 添加 Cookie 自动监控 ✅ 支持无头模式依赖 pip 安装 playwright beautifulsoup4 请求s playwright 安装 chromium

许可证

MIT-0 · Free to use, modify, and redistribute. No attribution required.

License

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐