Video Transcribe - 视频转文字
v1.0.3本地视频转文字 - 使用 OpenAI Whisper 进行语音识别,完全免费、离线运行、保护隐私
运行时依赖
安装命令
点击复制技能文档
Video Transcribe - 视频转文字
🎬 一键转录本地视频/音频为文字稿
使用 OpenAI Whisper 进行本地语音识别,完全免费、离线运行、保护隐私。
✨ 功能特点 ✅ 完全免费 - 无需 API 密钥,无使用限制 ✅ 本地运行 - 视频不上传,保护隐私 ✅ 支持多格式 - mp4, mov, avi, mkv, mp3, wav, m4a 等 ✅ 自动语言检测 - 支持中文、英文等 90+ 语言 ✅ 带时间戳 - 输出 SRT 字幕格式 ✅ 多模型选择 - 从快速到高精度任选 ✅ AI 内容总结 - 转录后自动生成 200-300 字摘要 + 关键要点 📦 安装依赖
v1.0.3+ 无需手动安装! 首次运行时会自动检测并安装 Whisper 引擎(约 300MB,一次性)。
如果自动安装失败,可手动安装:
pip3 安装 openAI-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
💡 安装大小:约 200-300 MB ⏱️ 安装时间:5-10 分钟(首次需下载模型)
🚀 使用方法 方式 1:直接用命令 # 基础用法(自动检测语言) python transcribe.py /path/to/video.mp4
# 指定中文 python transcribe.py /path/to/video.mp4 base zh
# 转录 + AI 总结 python transcribe.py /path/to/video.mp4 --summarize
# 输出到指定目录 + 总结 python transcribe.py /path/to/video.mp4 base zh --summarize
方式 2:在 OpenClaw 中调用 /transcribe /path/to/video.mp4 --summarize
📁 输出文件
转录完成后会生成以下文件(在同一目录):
文件 格式 说明 视频名.txt 纯文本 无时间戳的文字稿 视频名.srt SRT 字幕 带时间戳,可导入剪映/PR 视频名.vtt 网页VTT 网页字幕格式 视频名_summary.json JSON AI 内容总结(使用 --summarize 时生成) 🔧 高级选项 # 只输出文字,不生成字幕 whisper video.mp4 --输出_格式化 txt
# 指定输出语言(翻译为英文) whisper video.mp4 --task translate
# 调整温度(越高越随机,0 最确定) whisper video.mp4 --temperature 0
# 显示详细日志 whisper video.mp4 --verbose True
完整选项:whisper --help
📝 注意事项 首次运行会下载模型(一次性,约 100-800 MB) 视频文件路径不要有空格,或用引号括起来 长视频需要耐心等待(5 分钟视频约 5-10 分钟转录时间) 背景噪音会影响准确率,安静环境效果更好 🙏 致谢 核心引擎:OpenAI Whisper 开源协议:MIT 📮 反馈
遇到问题或有建议?欢迎反馈!
作者: Seven 版本: 1.0.3 更新时间: 2026-03-18
📋 更新日志 v1.0.3 (2026-03-18) ✨ 新增:首次运行时自动安装 Whisper 依赖,无需手动执行 pip 命令 🔧 优化:使用清华镜像源自动安装,国内用户更快 📝 更新:技能.md 说明文档,告知用户自动安装行为 v1.0.2 (2026-03-16) 🐛 修复:添加 YAML front matter 到 技能.md,修复技能在 OpenClaw 中无法显示的问题 📦 更新元数据格式,确保与 ClawHub 规范兼容 v1.0.0 (2026-03-13) ✨ 初始版本发布 🎬 支持本地视频/音频转录 🤖 集成 OpenAI Whisper 引擎 📄 输出 TXT 和 SRT 格式 📊 支持 AI 内容总结