Video Notes — 视频笔记
v1.0.0将任何 YouTube 视频转换为一份精美的结构化笔记。自动提取字幕、识别关键时刻并截图、生成核心论点总结和 SVG 图表,输出带侧边导航和全文搜索的单文件 HTML 文档。适用于技术演讲、公开课、播客、产品发布会等场景。本技能适用于用户提供 YouTube URL 并要求做笔记、总结视频或从视频内容创建学习文档时使用。
运行时依赖
安装命令
点击复制技能文档
视频笔记技能 将任何 YouTube 视频转换为精致的、自成体系的 HTML 笔记文档,包含:
行政摘要(约 300 字)- 捕获核心论点 AI 生成的结构化笔记,包含 SVG 图表 关键帧画廊 - 自动在关键时刻截取的屏幕截图,每个都链接回 YouTube 固定侧边栏导航,带有滚动侦测 可搜索的原始字幕面板(单击任意行 → 跳转到该时间戳)
工作流程 步骤 1:提取字幕 python3 ~/.claude/skills/video-notes/scripts/extract_subtitles.py --output /tmp/subs.json 默认语言:en。传递 --lang zh 或 --lang zh-Hans 以获取中文。 在 HTTP 429 错误时,几秒后重试或尝试不同的语言。 如果视频没有自动生成的字幕,通知用户并停止。 输出:[{"t": "mm:ss", "s": 123.4, "text": "..."}]
步骤 2:捕获关键帧(需要 ffmpeg) 运行关键帧脚本。它使用启发式方法评分字幕,选择最重要的时刻(间隔 ≥60s),仅下载这些短视频部分,并提取帧: python3 ~/.claude/skills/video-notes/scripts/capture_keyframes.py \ /tmp/subs.json \ --max-frames 8 \ --output-json /tmp/keyframes.json 输出:[{"t": "mm:ss", "s": 123.4, "text": "...", "score": 0.5, "image_b64": "..."}] 如果 ffmpeg 没有安装,跳过此步骤并在模板中将 {{KEYFRAMES_JSON}} 设置为 [] - 画廊部分将自动隐藏。 默认 --max-frames 为 8;减少以加快生成速度或增加以适应更长的视频。
步骤 3:阅读和理解内容 阅读字幕文本以了解: 视频的主要主题和整体结构 关键概念、论点、框架和术语 任何值得注意的引语或难忘的台词 自然的章节边界(主题转换)
步骤 4:生成 HTML 笔记 使用 assets/note-template.html 作为基础。填充每个占位符: 占位符 内容 {{TITLE}} 页面