📦 Douyin Text Grab — 抖音文字提取

v1.0.0

7分钟前

0· 2·0 当前·0 累计
下载技能包
最后更新
2026/4/22
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的代码和说明与其声明的目的(提取抖音文本并生成 .docx)一致;未请求凭据或可疑网络地址,但技能未声明所需的 Python 依赖,且会在未询问用户的情况下自动发送生成的文件。
评估建议
此技能如其所述:抓取抖音短链页面,提取 _ROUTER_DATA JSON,将提取的文本转为 .docx 并发送文件。安装前请注意: (1)Python 脚本依赖 python-docx 包(元数据未声明);请在安全环境安装 python-docx,勿用 `--break-system-packages`。 (2)技能会自动交付生成文件(“先交文件再说话”)——若觉不妥,可要求修改,在发送前提示确认。 (3)SKILL.md 未详述 _ROUTER_DATA 提取步骤,若抖音需 JS 渲染可能失败;此为功能限制,非安全问题。 (4)请确保信任发送文件的 agent 上下文(若不想自动上传,勿发送敏感链接/内容)。...
详细分析 ▾
用途与能力
名称/描述(提取抖音文本并生成 Word)符合附带说明与脚本:用 curl 抓取页面,提取 _ROUTER_DATA JSON,调用 scripts/create_docx.py 生成 .docx。不索取无关凭据、二进制文件或配置。
指令范围
指令严格限定于任务范围(下载抖音短链 HTML、提取 JSON、生成并发送 Word 文件)。两点注意:(1)SKILL.md 使用占位短链,未给出提取 _ROUTER_DATA 的确切命令/正则(功能缺口,未必恶意);(2)核心规则“先交文件再说话”涉及隐私/用户体验问题,因 agent 会自动发送文件。
安装机制
无安装规范(仅指令)、无外部下载——风险低。但脚本依赖 python-docx,技能元数据未声明该依赖;脚本会打印 pip 安装建议(含罕见的 '--break-system-packages' 标志),此为使用者应留意的运维细节。
凭证需求
该 skill 不请求任何环境变量、凭据或配置文件路径。脚本仅读取命令行传入的输入,并将 .docx 写入文件系统(/tmp 或指定路径)。不请求或使用任何机密信息。
持久化与权限
始终为 false,该 skill 不会请求持久或提升的权限,也不会修改其他 skill 或系统级配置。它仅将生成的 .docx 文件写入指定路径,并通过 agent 的 message 动作发送。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/22

首版:抖音链接 → 完整文案提取 → Word 文件生成交付

无害

安装命令

点击复制
官方npx clawhub@latest install douyin-text-grab
镜像加速npx clawhub@latest install douyin-text-grab --registry https://cn.longxiaskill.com

技能文档

触发条件

用户发送抖音链接(https://v.douyin.com/xxx 或分享口令)+ 提取/抓取/文案/内容/文件 相关意图。

工作流程

Step 1: 解析短链获取数据

``bash curl -s -L -o /tmp/douyin_page.html \ -w "%{http_code}" \ "https://v.douyin.com/xxx/" \ -H "User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 16_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.0 Mobile/15E148 Safari/604.1" \ --connect-timeout 10 `

Step 2: 提取 _ROUTER_DATA

从 HTML 中提取
_ROUTER_DATA JSON,关键字段:
  • item_list[0].desc完整文案(核心,一个字不改)
  • item_list[0].author.nickname — 作者昵称
  • item_list[0].statistics — 点赞/评论/转发/收藏
  • item_list[0].create_time — 发布时间戳

Step 3: 生成 Word 文件

使用 scripts/create_docx.py`bash python3 scripts/create_docx.py --title "标题" --author "作者" --content "完整文案" --output /tmp/output.docx `

Step 4: 投递文件

` message action=send filePath=/tmp/output.docx ``

核心规则

  • 原文案完整提取,不总结不改写
  • 先交文件再说话 — 不问"要不要做"
  • 按原文结构排版:识别"第X组""复制这句"等结构化内容
  • 文件名包含作者名便于识别
数据来源ClawHub ↗ · 中文优化:龙虾技能库