article-to-science-video — 文章转科学视频
v1.0.0将文章、论文、报告等文本内容自动转换为科普视频脚本的完整工作流。整合文章解析、脚本生成、分镜设计三步,支持短视频(抖音/TikTok 30-60s)和长视频(B站知识区 8-15min)两种模式,提供真人出镜和纯AI制作两种分镜方案。输出包含视频脚本、逐镜分镜表、画面提示词、字幕标注、剪辑指南,供用户在剪映等工具中自行合成。当用户说“把这篇文章做成科普视频脚本”、“将文章转为视频脚本”、“基于这篇文章生成视频脚本”、“文章生成视频脚本”等需求时触发。
运行时依赖
安装命令
点击复制技能文档
文章转科普视频脚本工作流 将任意文章/论文/报告自动转化为完整科普视频脚本的三步工作流:文章解析 → 视频脚本 → 分镜设计。 本工作流只生成视频脚本和分镜方案,不生成实际的视频/图片/音频素材。用户可根据脚本自行在剪映等工具中完成最终合成。 支持两种制作模式: 真人出镜模式:真人讲解为主,画面提示词侧重辅助素材 纯AI制作模式:无真人出镜,画面提示词侧重信息可视化(图形/表格/动画)
快速开始 用户只需提供: 文章来源:文章链接、本地文件路径,或粘贴文章内容 视频平台:短视频(抖音/TikTok/视频号)或长视频(B站知识区/科技区) 制作模式(可选):真人出镜(默认)或纯AI制作 目标时长(可选):短视频默认 45s,B站长视频默认 10min 若用户要求"不用真人"、"AI配音"、"不要实拍"、"纯动画/图表"等,自动切换为纯AI制作模式。
制作模式选择 在 Phase 2 开始前,确认用户的制作模式偏好: 模式 特点 适用场景 画面构成建议 真人出镜(默认) 真人讲解 + 辅助素材 需要人设/IP/信任感 主讲人 60% + 信息可视化 40% 纯AI制作 纯信息可视化 + AI配音 追求效率/无人设需求 信息可视化 100%(动画/图表/图形) 纯AI模式触发条件:用户提及"不要真人"、"AI配音"、"不用出镜"、"纯动画"、"图表视频"、"信息可视化"等。
纯AI制作模式要点 配音:建议使用 AI TTS 生成旁白,替代真人录音 画面:以信息可视化为主,包括: 动态信息图表(数据可视化动画) 3D概念演示/过程动画 科学示意图(细胞/大脑/分子等) 抽象几何动画表达概念 纯文字排版动画(大字报风格) 无真人元素:画面中不出现任何真人面部/身体/手势
Phase 1: 文章解析 — 提取核心知识点 1.1 读取文章内容 根据用户提供的方式选择读取方法: 输入方式 读取方法 文章链接 使用 browser_visit 打开并提取正文 本地文件 使用 read_file 读取(支持 PDF/Word/Markdown/TXT) 直接粘贴 直接使用用户提供的内容 1.2 内容提取与结构化 对文章内容进行深度解析,提取以下要素: 文章解析报告 - 文章标题:[原标题]
- 核心主题:[一句话概括]
- 目标受众:[适合的知识水平群体]
- 核心知识点(3-7个):
- [知识点1] — [一句话解释]
- [知识点2] — [一句话解释]
- 关键数据/案例:[列出文章中可视觉化的数据或案例]
- 有趣冷知识/反常识点:[适合作为 Hook 的亮点]
- 难度评级:[简单/中等/硬核]
Phase 2: 视频策划 — 平台选择与脚本生成 2.1 平台选择 根据用户需求确定输出格式: 平台 时长 触发词 参考模板 短视频 30-60s 抖音、TikTok、视频号、短视频 references/short-video-template.md 长视频 8-15min B站、知识区、科技区、长视频 references/bili-long-video-template.md 如果用户未指定,询问其目标平台。若用户不确定,默认推荐短视频模式。 2.2 生成视频脚本 读取对应参考模板后,按模板结构生成完整脚本。脚本必须基于 Phase 1 提取的核心知识点,不能脱离原文内容凭空创作。 脚本生成原则: 短视频:单点突破,一个核心知识点讲透,追求"啊哈"时刻 长视频:体系化梳理,3-5个知识点递进,追求"看完就懂"的满足感 所有口播文案必须标注预估时长,总时长误差控制在 ±10% 以内 中文口播语速:正常 4-5字/秒,快速 5-7字/秒,慢速 3-4字/秒
Phase 3: 分镜设计 — 逐镜画面规划与提示词 3.1 生成分镜表 基于脚本,为每个镜头生成详细分镜描述。分镜表必须包含: 字段 说明 镜号 镜头序号 时间 起止时间区间 段落 Hook/铺垫/知识点/高潮/CTA 景别 特写/近景/中景/全景 画面内容 详细画面描述 配音文案 对应口播文字 字幕标注 需显示的字幕内容 画面提示词 用于后续素材制作的英文描述 分镜设计原则: Hook 镜头:视觉冲击或概念动画特写,前3秒必须有强吸引力 知识讲解镜头:数据可视化、动画演示、图文排版 过渡镜头:平滑转场,保持节奏感 结尾镜头:总结画面 + 互动引导元素 纯AI模式分镜原则: 以信息可视化为核心:动态图表、3D演示、概念动画、数据可视化 禁止出现任何真人形象:无面部、无身体、无手势 每个镜头必须配有英文画面生成提示词,供用户后续生成素材时参考
3.2 素材建议(不实际生成) 根据分镜表,为每个镜头提供素材获取建议: 素材类型 获取方式 适用场景 动态视频 AI文生视频工具(如可灵、即梦、Vidu等) 粒子动画、流体运动、过程演示 静态图片 AI文生图工具(如 Midjourney、即梦等) 数据图表、概念图解、封面 网络素材 免费图库(Unsplash、Pexels、Pixabay) 真实照片、场景图片 配音音频 AI TTS 工具(如 ElevenLabs、剪映朗读) 旁白配音 画面提示词撰写规范: 使用英文描述,包含:主体、动作、场景、风格、镜头角度 科普视频风格:干净、明亮、教育感 纯AI模式:不含任何人物面部/身体,以物体、图表、粒子、几何图形为主 示例:Abstract particle animation forming human brain connections, neural network visualization, blue and white color scheme, clean scientific aesthetic, smooth fluid motion, educational documentary style
3.3 输出完整脚本包 将以下所有内容打包输出(不含实际素材文件): 科普视频脚本包 ├── 01-文章解析报告.md ├── 02-视频脚本.md(完整脚本含时长标注) └── 03-制作备忘.md ├── 分镜表(逐镜分镜 + 画面提示词) ├── 字幕标注(时间点/内容/样式) ├── 素材获取建议(各镜头推荐获取方式) ├── BGM分段推荐 ├── 配音文案汇总 └── 剪映合成指南
Phase 4: 后期合成参考(用户自行完成) 脚本包中包含剪映合成参考指南,用户可根据此指南在剪映(CapCut)中完成最终视频。详见 references/post-production-guide.md。
输出规范 脚本必须包含 每段口播标注时间区