Video Intelligence — 视频智能
v1从 YouTube、TikTok、Instagram 和 X(Twitter)下载视频,并获取视频的字幕、摘要或元数据。当用户分享视频 URL 并希望获取视频的字幕、摘要、关键点、引用或下载视频时使用。触发短语如“为此视频制作字幕”、“总结此 YouTube 视频”、“此视频说什么”、“下载此 TikTok”、“从中获取字幕”或来自 youtube.com、youtu.be、tiktok.com、instagram.com、x.com、twitter.com 的任何视频 URL。要求:yt-dlp、python3、curl。可选:ffmpeg(用于 TikTok/Instagram/X 音频)、OPENAI_API_KEY(Whisper 回退 — 上传音频到 OpenAI)。
运行时依赖
安装命令
点击复制技能文档
视频智能(video-intel)下载视频并使用yt-dlp(字幕)提取转录文本,若无字幕则使用OpenAI Whisper作为备选。 所需依赖 依赖目的 是否必需 yt-dlp 获取字幕和下载音频/视频 ✅ 总是 python3 解析VTT/SRT字幕文件 ✅ 总是 curl 调用OpenAI Whisper API ✅ 仅用于Whisper备选 ffmpeg 从TikTok/Instagram/X中提取音频 ⚠️ 仅非YouTube OPENAI_API_KEY 验证OpenAI Whisper API ⚠️ 仅当字幕不可用时 安装二进制文件: # yt-dlp curl -L https://github.com/yt-dlp/yt-dlp/releases/latest/download/yt-dlp -o ~/bin/yt-dlp && chmod +x ~/bin/yt-dlp # ffmpeg(Debian/Ubuntu) sudo apt install ffmpeg ⚠️ 隐私声明 — OpenAI音频上传 当字幕不可用(TikTok、Instagram、X等常见情况)时,脚本下载音频并上传到OpenAI的转录API(https://api.openai.com/v1/audio/transcriptions)。这意味着: 音频内容离开您的机器并发送到OpenAI 需要设置OPENAI_API_KEY 如果您不想进行外部传输:不设置OPENAI_API_KEY,或使用本地转录模型 YouTube视频几乎总是有字幕,因此不会触发上传。 脚本 ~/.openclaw/skills/video-intel/scripts/video-intel.sh 工作流程 获取转录文本 ~/.openclaw/skills/video-intel/scripts/video-intel.sh transcript YouTube:使用内置字幕/自动字幕(快速,无音频下载或外部上传) TikTok/Instagram/X:下载音频 → 上传到OpenAI Whisper进行转录 首选语言:--lang pt 为葡萄牙语 获取视频信息 ~/.openclaw/skills/video-intel/scripts/video-intel.sh info 列出可用字幕轨道 ~/.openclaw/skills/video-intel/scripts/video-intel.sh captions 下载视频 ~/.openclaw/skills/video-intel/scripts/video-intel.sh download [--format audio|720p|best] 获取转录文本后 摘要:总结3-5个要点 关键语录:提取最值得注意的语录 全摘要:写一个带有上下文的段落摘要 翻译:如果语言不同,则翻译为用户的语言 注意 YouTube自动字幕通常即使没有ffmpeg也可用 TikTok/Instagram/X需要ffmpeg进行音频提取 大视频(>25MB音频)可能会达到OpenAI的文件大小限制 — 使用--format audio获取较小的mp3 输出缓存在 /tmp/video-intel/ 中,默认情况下