安全扫描
OpenClaw
安全
high confidence该技能的代码和说明与其声明的目的(提取抖音文本并生成 .docx)一致;未请求凭据或可疑网络地址,但技能未声明所需的 Python 依赖,且会在未询问用户的情况下自动发送生成的文件。
评估建议
此技能如其所述:抓取抖音短链页面,提取 _ROUTER_DATA JSON,将提取的文本转为 .docx 并发送文件。安装前请注意:
(1)Python 脚本依赖 python-docx 包(元数据未声明);请在安全环境安装 python-docx,勿用 `--break-system-packages`。
(2)技能会自动交付生成文件(“先交文件再说话”)——若觉不妥,可要求修改,在发送前提示确认。
(3)SKILL.md 未详述 _ROUTER_DATA 提取步骤,若抖音需 JS 渲染可能失败;此为功能限制,非安全问题。
(4)请确保信任发送文件的 agent 上下文(若不想自动上传,勿发送敏感链接/内容)。...详细分析 ▾
✓ 用途与能力
名称/描述(提取抖音文本并生成 Word)符合附带说明与脚本:用 curl 抓取页面,提取 _ROUTER_DATA JSON,调用 scripts/create_docx.py 生成 .docx。不索取无关凭据、二进制文件或配置。
ℹ 指令范围
指令严格限定于任务范围(下载抖音短链 HTML、提取 JSON、生成并发送 Word 文件)。两点注意:(1)SKILL.md 使用占位短链,未给出提取 _ROUTER_DATA 的确切命令/正则(功能缺口,未必恶意);(2)核心规则“先交文件再说话”涉及隐私/用户体验问题,因 agent 会自动发送文件。
ℹ 安装机制
无安装规范(仅指令)、无外部下载——风险低。但脚本依赖 python-docx,技能元数据未声明该依赖;脚本会打印 pip 安装建议(含罕见的 '--break-system-packages' 标志),此为使用者应留意的运维细节。
✓ 凭证需求
该 skill 不请求任何环境变量、凭据或配置文件路径。脚本仅读取命令行传入的输入,并将 .docx 写入文件系统(/tmp 或指定路径)。不请求或使用任何机密信息。
✓ 持久化与权限
始终为 false,该 skill 不会请求持久或提升的权限,也不会修改其他 skill 或系统级配置。它仅将生成的 .docx 文件写入指定路径,并通过 agent 的 message 动作发送。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/4/22
首版:抖音链接 → 完整文案提取 → Word 文件生成交付
● 无害
安装命令
点击复制官方npx clawhub@latest install douyin-text-grab
镜像加速npx clawhub@latest install douyin-text-grab --registry https://cn.longxiaskill.com
技能文档
触发条件
用户发送抖音链接(https://v.douyin.com/xxx 或分享口令)+ 提取/抓取/文案/内容/文件 相关意图。 工作流程
Step 1: 解析短链获取数据
``bash
curl -s -L -o /tmp/douyin_page.html \
-w "%{http_code}" \
"https://v.douyin.com/xxx/" \
-H "User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 16_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.0 Mobile/15E148 Safari/604.1" \
--connect-timeout 10
` Step 2: 提取 _ROUTER_DATA
从 HTML 中提取 _ROUTER_DATA JSON,关键字段:
item_list[0].desc— 完整文案(核心,一个字不改)item_list[0].author.nickname— 作者昵称item_list[0].statistics— 点赞/评论/转发/收藏item_list[0].create_time— 发布时间戳
Step 3: 生成 Word 文件
使用 scripts/create_docx.py:
`bash
python3 scripts/create_docx.py --title "标题" --author "作者" --content "完整文案" --output /tmp/output.docx
` Step 4: 投递文件
`
message action=send filePath=/tmp/output.docx
`` 核心规则
- 原文案完整提取,不总结不改写
- 先交文件再说话 — 不问"要不要做"
- 按原文结构排版:识别"第X组""复制这句"等结构化内容
- 文件名包含作者名便于识别