WeChat MP Reader FZX

v1.0.0

抓取微信公众号文章并转换为 Markdown 格式。支持提取标题、作者、发布时间、封面图、正文内容（含图片、视频链接）。当用户提到以下场景时触发： - 读取/抓取/下载微信公众号文章 - 将公众号文章转为 Markdown - 提取 mp.weixin.qq.com 链接内容 - 保存公众号文章到本地 - 微信文章备份、存档关键词：微信公众号、公众号文章、mp.weixin.qq.com、微信文章抓取、微信文章转 Markdown

0· 161·0 当前·0 累计

by @limingfa (fzx)·MIT-0

文档工具即时通讯微信

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install wechat-mp-reader-fzx

镜像加速npx clawhub@latest install wechat-mp-reader-fzx --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

WeChat MP Reader — 微信公众号文章抓取工具功能

抓取微信公众号文章（mp.weixin.qq.com 链接），提取完整内容并转换为 Markdown 格式保存到本地。

支持提取的信息标题 — 文章标题公众号名称 — 作者/来源发布时间 — 文章发布日期封面图 — 文章封面图片链接正文内容 — 完整的文章正文，包含：文本段落、标题层级图片（保留原图链接）视频链接超链接列表、引用、加粗/斜体等格式使用方法命令行方式 python scripts/fetch_wechat_article.py <文章链接> [选项]

参数：

url — 微信公众号文章链接（必需） -o, --输出 — 输出目录（默认：当前目录） --images — 下载图片到本地（开发中） --json — 以 JSON 格式输出元数据

示例：

# 基本用法 python scripts/fetch_wechat_article.py "https://mp.weixin.qq.com/s/xxxxx"

# 指定输出目录 python scripts/fetch_wechat_article.py "https://mp.weixin.qq.com/s/xxxxx" -o ./articles

# 只输出 JSON 元数据 python scripts/fetch_wechat_article.py "https://mp.weixin.qq.com/s/xxxxx" --json

Python API 方式 from scripts.fetch_wechat_article 导入 fetch_article

结果 = fetch_article( url="https://mp.weixin.qq.com/s/xxxxx", 输出_dir="./articles" )

print(结果['title']) # 文章标题 print(结果['author']) # 公众号名称 print(结果['content']) # Markdown 正文 print(结果['filepath']) # 保存的文件路径

输出格式

生成的 Markdown 文件结构：

# 文章标题

公众号: 公众号名称 发布时间: 2024-01-01 封面: !封面 原文链接: https://mp.weixin.qq.com/s/xxxxx

正文内容...

!图片

视频

依赖 Python 3.8+ 请求s 库（用于 HTTP 请求）

安装依赖：

pip 安装请求s

注意事项网络要求 — 需要能访问 mp.weixin.qq.com 反爬机制 — 频繁抓取可能触发微信的反爬机制，建议适当控制请求频率链接有效性 — 确保文章链接未过期或被删除图片链接 — 生成的 Markdown 中图片使用微信 CDN 原链接，长期有效性取决于微信策略故障排查问题可能原因解决方案无法提取正文页面结构变化检查微信是否更新了页面结构返回 403 被反爬拦截稍后再试，或更换 IP 标题为空文章被删除/受限确认链接可在浏览器正常打开图片不显示微信 CDN 链接过期使用 --images 下载到本地

License

运行时依赖

安装命令

技能文档

相关技能推荐