安全扫描
OpenClaw
安全
high confidence该技能的代码、说明及要求均基于 Playwright 的微博备份工具,未索取无关凭据或特权系统访问。
评估建议
此技能用于使用 Playwright 备份个人 Weibo,逻辑清晰。安装前请注意:在本地运行并自行检查所含 Python 文件;工具会在本地保存 cookies 或浏览器配置文件(cookies.json 或 browser_data),内含会话凭据,请妥善保管;勿使用他人 cookies;遵守 Weibo 服务条款与速率限制(工具会下载大量图片/视频,占用磁盘空间);禁止大规模商业抓取。若在共享机器运行,请在受限环境(container 或 VM)中执行,并确保磁盘与带宽充足。...详细分析 ▾
✓ 用途与能力
名称/描述(Weibo 数据备份)与 SKILL.md 及 Python 脚本一致:使用 Playwright 自动化浏览器,保存 cookies 或使用 user-data-dir,滚动页面,提取图片/视频/文章,并写入 Markdown 文件。未请求无关的凭据、二进制文件或配置路径。
✓ 指令范围
运行时指令的范围仅限于:打开浏览器、必要时提示用户登录、读写 cookies.json 或浏览器用户数据目录、抓取微博页面、下载媒体文件,并将文件写入输出目录。SKILL.md 明确要求先让用户登录,首次登录时不要使用 headless 模式。它未指示代理读取任意系统文件、环境密钥,也未要求向远程端点传输数据,仅获取预期的媒体资源。
✓ 安装机制
没有自动安装规范;README 和 SKILL.md 建议通过 pip 安装 Playwright 并运行 'playwright install chromium',这对 Playwright 脚本是合适的。README 提到一个基于 npx 的外部技能安装器作为安装便利,但技能包本身已包含脚本和文档。
✓ 凭证需求
该技能未声明任何必需的环境变量或主要凭据。它使用本地的 cookies.json 或浏览器用户数据目录进行身份验证,适用于自动化已登录的浏览器会话。未请求任何无关的密钥或系统级凭据。
✓ 持久化与权限
该技能未标记 always:true,也不会尝试更改其他技能或全局代理配置。它会将输出文件(index.md、帖子 markdown、媒体)写入自己的输出目录,并可更新同一目录下的 index.md,这是该工具的预期行为。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/4/21
weibo-downloader(weibo-backup)技能首发: - 自动备份微博收藏、个人微博或他人微博,含图片、视频及长文。 - 支持基于 Playwright 的无头操作;可灵活选择下载项(图片尺寸、视频、文章提取)。 - 内容以 Markdown 保存,内置双向导航链接,便于浏览。 - 提供详细使用说明、命令示例、参数释义及故障排查。 - 首次使用需登录,引导用户安全完成登录与数据提取。
● 可疑
安装命令
点击复制官方npx clawhub@latest install weibo-backup
镜像加速npx clawhub@latest install weibo-backup --registry https://cn.longxiaskill.com镜像同步中
技能文档
概述
此工具使用 Playwright 自动化浏览器来下载微博内容,包括:
- 支持下载微博收藏、本人微博、他人微博
- 图片(支持九宫格排列,支持多种尺寸:360px、480px、690px、2000px、原图 large)
- 视频(可选下载, 默认最高质量)
- 长文章(可选下载)
- Markdown 双向链接 - 在保存的 Markdown 文件中添加"前一条"和"下一条"导航链接,方便浏览
请正确使用本技能,用于微博收藏、个人数据备份或者关注博主的内容备份保存。不能用于大规模的商业数据采集。
前置要求
- Python 环境:需要 Python 3.8+
- 依赖安装:
pip 安装 playwright
playwright 安装 chromium
Script Directory
Determine this 技能.md directory as {baseDir}.
| Script | Purpose |
|---|---|
weibo_favorites_4技能.py | MAIn python script entry point |
使用流程
- 检查 {baseDir}/cookies.json 文件是否存在, 或 {baseDir}/user_data_dir or user 输入 user_data_dir 是否存在且包含有效的用户数据
- 如果用户cookies数据不存在,或者用户没有提供 tar获取 url, 则提示用户: 我将运行script以打开浏览器,请在60秒内完成登录,并进入需要下载的页面:收藏页 / 本人主页 / 他人主页。
- 完成提示后再使用命令脚本下载微博收藏内容, 第一次下载可以用无参数运行快速得到预览结果。
- 如果用户提供--url参数, 且用户cookies数据存在,则参照日常使用命令示例,不提示用户直接运行下载脚本。
- 运行完成后,提示用户输出目录的具体位置
注意 : 如果不存在/cookies.json,或者用户没有提供 tar获取 url, 一定不能直接运行下载脚本, 你要分两步, 先提示用户再运行。
常用命令示例
首先提示用户在60秒内完成登录,并进入需要下载的页面:收藏页 / 本人主页 / 他人主页。 完成提示后再使用命令脚本下载微博收藏内容, 第一次下载可以用无参数运行快速得到预览结果。 如果用户提供--url参数, 且{baseDir}/cookies.json 文件存在,则推荐使用headless 模式。
基础使用(下载10条记录,360px图片, 不下载视频, 推荐给用户首次使用,可以快速得到预览结果)
python {baseDir}/weibo_favorites_4技能.py
注: 不提供输出-dir参数,默认输出到技能脚本所在目录下的输出目录。日常使用(推荐配置, 推荐给用户后续的日常使用,headless 模式,下载600条记录包括高清图片,视频,长文章, 跳过已存在的记录 )
python {baseDir}/weibo_favorites_4技能.py \
--image-size large \
--下载-video \
--下载-article \
--max-下载 600 \
--skip-existing \
--headless
参数说明
| 参数 | 说明 | 默认值 |
|---|---|---|
--url | 目标微博用户主页或收藏页面URL | https://weibo.com |
--max-下载 | 最大下载数量 | 10 |
--skip-existing | 跳过已存在的记录 | False |
--image-size | 图片尺寸:360/480/690/2000/large | 360 |
--下载-video | 下载视频到本地 | 开关参数,不需要指定值,无此参数则只保留视频链接 |
--下载-article | 下载长文章到本地 | 开关参数,不需要指定值,无此参数则只保留文章链接 |
--batch-size | 分批次每次下载记录数 | 20 |
--headless | 无头模式(不显示浏览器) | 开关参数,不需要指定值,无此参数则显示浏览器窗口 |
--user-data-dir | 浏览器用户数据目录 | 无此参数默认使用 cookies.json |
--输出-dir | 自定义输出目录 | python脚本所在目录下的输出目录 |
输出目录结构
输出/
├── pictures/ # 图片目录
│ └── {record_id}/ # 每条微博的图片
├── videos/ # 视频目录
├── articles/ # 长文章目录
│ └── pictures/ # 文章中的图片
└── {author}_{date}_{id}.md # 微博内容Markdown文件
工作流程
- 启动浏览器:根据参数选择启动方式
- 检查登录状态:如需要登录,提示用户手动登录
- 滚动页面:自动滚动加载更多微博
- 提取数据:解析微博内容、图片、视频链接
- 下载资源:下载图片、视频到本地
- 生成 Markdown:保存微博文本和图片引用
注意事项
- 首次登录:不能使用 headless 模式,需要看到浏览器窗口进行登录
- 登录状态:建议定期更新 cookies 或用户数据目录,避免登录过期
- 下载限制:微博可能有反爬限制,建议合理设置下载数量
- 网络环境:确保网络可以正常访问微博
- 存储空间:下载大量高清图片和视频需要足够的磁盘空间
故障排除
登录问题
- 检查网络连接
- 尝试删除 cookies.json 或 browser_data 目录重新登录
- 确保没有开启 VPN 或代理导致访问异常
下载失败
- 检查磁盘空间
- 检查目录权限
- 尝试降低
--max-下载数量
浏览器启动失败
- 确保已运行
playwright 安装 chromium - 检查系统是否支持 Chromium 运行