Video to Notes
v1.0.0将视频内容(课程/讲座/教程/纪录片/会议/演讲等)自动转为高质量结构化学习笔记。核心价值:看视频容易忘、看一遍记不住 → 转成笔记随时回看。支持本地视频文件、YouTube/B站等网络链接。流程:提取音轨 → Whisper 语音转文字 → AI 生成结构化笔记。适用场景:任何想从视频中高效学习的人——自学程序员、学生、职场进修者、知识爱好者。触发条件:用户提供视频路径/链接,或说"把这个视频整理成笔记"、"帮我记笔记"、"转成学习笔记"。支持中英文,一次 1-3 个文件。
运行时依赖
安装命令
点击复制本土化适配说明
Video to Notes 安装说明: 安装命令:["openclaw skills install video-to-notes"]
技能文档
Video to Notes — 视频转学习笔记
看视频 ≠ 学会。笔记才是真正属于你的知识。
这个 技能 把任何视频内容变成结构化学习笔记,让你不用反复回看、随时复习重点。
核心价值 视频(1小时)→ 转写稿 → AI 笔记(5分钟读完) ↓ ↓ 看过就忘 随时回看、复习、检索
快速上手 本地视频 python3 scripts/transcribe.py ~/下载s/课程.mp4
在同目录生成 .txt 转写稿 → AI 读完直接产出笔记
网络视频(需要 yt-dlp) python3 scripts/下载_video.py "https://youtu.be/xxx" python3 scripts/transcribe.py ./下载的文件.mp4
指定质量和语言 python3 scripts/transcribe.py 讲座.mp4 --模型 turbo --language zh
批量处理 python3 scripts/transcribe.py p1.mp4 p2.mp4 p3.mp4
长视频(>2小时):自动建议只处理单个文件,保证质量。
完整工作流
详细步骤、模型选择、故障排查 → 📖 完整工作流指南
三步流程 ① 获取视频 ── 本地路径 或 URL下载 ↓ ② 语音转文字 ── transcribe.py(whisper) ↓ ③ AI 生成笔记 ── 读转写稿 → 结构化学习笔记
脚本说明 scripts/transcribe.py — 语音转文字(核心) python3 scripts/transcribe.py 视频.mp4 [选项]
关键参数:
参数 默认 说明 --模型 base tiny → 极速 / base → 推荐 / turbo → 长视频首选 / large → 最高精度 --language 自动 指定语言提升准确率:zh / en / ja 等 --max-files 3 一次最多处理文件数
模型选择指南:
tiny — 最快,预览用(5分钟出) base — 日常推荐,速度与精度平衡 👍 small/medium — 精度优先场景 turbo — ⭐ 长视频推荐,速度与 large 级精度 large — 极致精度,慢 scripts/下载_video.py — 网络视频下载 pip3 安装 yt-dlp # 先安装 python3 scripts/下载_video.py --输出-dir <目录>
支持 YouTube、B站等 yt-dlp 支持的所有平台。
笔记生成 — 核心差异化 ✨
这是本 技能 区别于纯转写/摘要工具的核心价值。
转写完成后,AI 读取 .txt 文件,主动分析内容、提取知识、结构化整理成学习笔记。
笔记风格选择
AI 根据视频内容类型 自动选择 最合适的笔记风格。用户也可以手动指定。
📚 标准学习笔记(默认)
适合:课程、讲座、技术教程
# 标题
视频信息
- 时长 / 主题 / 来源
内容概览
- 2-3句核心总结
知识要点
1. 核心概念
- 定义、原理、关键点
2. 重点分析
- 深入解释、对比、案例
3. ...(按内容自然展开)
实战/代码/案例
- 具体操作、代码片段、公式
总结 & 思维导图
- 逻辑结构梳理、要点回顾
延伸思考
- 值得深挖的点、关联知识、实践建议
🎓 课堂笔记风格
适合:学生网课、公开课、应试培训
# 课程笔记
课程基本信息
重点知识点(按章节)
考点/核心公式/定义
例题解析
易错点提醒
课后思考题
复习要点速览
🏢 会议/演讲笔记风格
适合:内部会议、TED演讲、行业分享
# 演讲/会议笔记
基本信息(主讲人、时间、背景)
核心观点
关键数据 / 案例
启发 & 行动项
金句摘录
📰 纪录片/科普笔记风格
适合:纪录片、科普视频、深度分析
# 纪录片笔记
背景介绍
时间线/发展脉络
核心发现/论点
数据 & 证据
个人思考 & 批判
笔记语言 默认:使用当前对话语言 用户指定:按用户要求(如"用英文写笔记") 双语视频:保留原文术语,注释说明 质量准则 🎯 原则 说明 详细准确 覆盖关键信息,不遗漏 结构化 层级清晰,便于后续查阅/搜索 高信息密度 去废话,保留干货 忠实原文 不编造、不歪曲原内容 可复习 笔记设计本身就是为了回头看的 适用场景(谁会用?)
任何人需要从视频中学习的人:
角色 场景 👨💻 程序员 技术教程 → 笔记带代码、架构图说明 👩🎓 学生 网课/公开课 → 复习笔记、考点整理 👔 职场人 行业会议/培训 → 核心观点 + 行动项 📚 终身学习者 纪录片/科普/播客 → 知识结构化 🎤 内容创作者 自己的视频 → 快速出文案/摘要 🧓 银发族 养生/技能视频 → 清晰步骤笔记 👪 家长 育儿/教育视频 → 要点速查 ... 任何想看视频记东西的人
核心场景: "这个视频很重要,但我没时间/不想再看一遍。帮我把内容整理成笔记。"
示例对话
用户: "帮我看下这个视频整理成笔记" → 下载/转写 → 自动生成标准学习笔记
用户: "把我桌面上这三个课程视频都处理了,用英文写笔记" → 批量转写 → 生成三份英文笔记
用户: "这个 TED 演讲帮我记一下重点" → AI 自动识别为演讲风格 → 生成演讲笔记
用户: "刚才那个视频太长了,主要记第二部分的内容,第一个部分太水了跳过" → AI 选择性笔记,只处理有效内容
资源结构 video-to-notes/ ├── 技能.md ← 主入口(本文件) ├── scripts/ │ ├── transcribe.py ← 语音转文字 │ └── 下载_video.py ← 网络视频下载 └── references/ ├── 工作流.md ← 详细工作流 └── note-templates.md ← 笔记模板 & 示例