LH Video Gen — 从 Markdown 生成竖版短视频

Name: LH Video Gen — 从 Markdown 生成竖版短视频
Rating: 1 (3 reviews)
Author: liuhedev

liuhedev

LH Video Gen — 从 Markdown 生成竖版短视频

v1.0.0

该技能从 Markdown 脚本生成 9:16 竖版短视频，支持 TTS 音频生成、字幕卡片渲染和 MP4 合成。适用于快速制作短视频内容。

3· 1,800·0 当前·0 累计

by @liuhedev·MIT-0

文档工具代码生成系统工具

下载技能包

License

MIT-0

最后更新

2026/3/4

安全扫描

VirusTotal

可疑

查看报告

OpenClaw

安全

high confidence

该技能的代码和指令与其声明的目的相符，没有发现意外的凭据、下载或隐藏的网络端点。

评估建议

该技能看起来连贯，仅执行本地操作。安装或运行前，请确保 FFmpeg 和 Chrome 从可信来源安装。如果依赖自动检测的 ../lh-edge-tts 脚本，请验证其可信。自定义 --tts-command 时，请谨慎使用可信的 TTS 命令。提供的 HTML 模板包含硬编码的品牌和 SEO 指导；如果不需要，请编辑模板。技能读取输入 Markdown 并在 tmp 文件夹下写入音频/图像/视频文件，请避免在脚本内容中包含机密信息。总体而言，技术上与其声明的目的一致。主要的操作风险是执行本地的 TTS 脚本和运行用户提供的 shell 命令；请在使用前验证这些组件的可信度。...

详细分析 ▾

✓ 用途与能力

名称/描述与提供的代码一致：generate.py 解析 Markdown，通过本地 TTS 工具或用户提供的 TTS 命令生成 TTS 音频，使用 headless Chrome 渲染 HTML 滑动并使用 FFmpeg 组合视频。没有请求无关的环境变量或服务。

ℹ 指令范围

SKILL.md 指示代理运行提供的脚本，并可选地设置 CHROME_PATH 或 EDGE_TTS_PATH；这些是相关的。一个非安全注意事项：模板和脚本鼓励/包含硬编码的品牌和 SEO 指导（例如，需要核心关键词和促进 "关注刘贺同学" 和 '龙虾哥' 品牌的短语）。这对于内容来说是范围蔓延（不是技术不匹配），可能不被一些用户所期望。

✓ 安装机制

没有安装规范或外部下载；这是一个指令+代码技能，依赖于本地安装的 FFmpeg 和 Chrome。没有从任意 URL 提取内容或自动安装。

✓ 凭证需求

该技能不请求任何机密信息或特殊环境变量。它可选地读取 CHROME_PATH 和 EDGE_TTS_PATH 来定位本地二进制文件/脚本；这些是合理的并且已记录。如果存在，脚本可能会检测并调用同级 ../lh-edge-tts 脚本；这种行为对于可选集成是预期的，但引用的脚本应被信任。

✓ 持久化与权限

always 为 false，该技能不请求持久的平台权限。它在输出路径附近的 tmp 目录下写入临时文件并清理一些临时文件；它不修改其他技能或系统范围的设置。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/4

● 可疑

安装命令点击复制

官方npx clawhub@latest install lh-video-gen

镜像加速npx clawhub@latest install lh-video-gen --registry https://cn.clawhub-mirror.com

技能文档

从视频脚本 Markdown 文件一键生成竖版短视频（9:16）。

核心思路：以图定音

每段脚本的画面说明 -> 字幕卡片图
每段口播文案 -> TTS 配音
每张图展示时长 = 对应音频时长，音画天然同步

快速开始

python3 generate.py script.md -o output.mp4

使用预制图片（跳过 Chrome 截图）

python3 generate.py script.md --images-dir ./my-slides -o output.mp4

图片命名规则：slide_01.png, slide_02.png...，与脚本分段一一对应。

自定义 TTS 命令

python3 generate.py script.md --tts-command "my-tts {text} -o {output} -v {voice} -r {rate}"

占位符：{text} 口播文案、{output} 输出路径、{voice} 音色、{rate} 语速。

参数说明

python3 generate.py <脚本路径> [选项]
选项：
  -o, --output 输出 MP4 路径（默认：tmp/video-output.mp4）
  -v, --voice TTS 音色（默认：zh-CN-YunxiNeural）
  -r, --rate 语速（默认：+0%，如 +10%、-10%）
  -w, --width 视频宽度（默认：1080）
  --height 视频高度（默认：1920，9:16）
  --images-dir 使用已有图片目录，跳过 Chrome 截图
  --tts-command 自定义 TTS 命令模板（占位符：{text} {output} {voice} {rate})
  --keep-temp 保留临时文件（图片、音频、片段）
  --no-subs 不烧录字幕

依赖

系统依赖

FFmpeg：视频合成（brew install ffmpeg）
Chrome：HTML 截图（仅在未使用 --images-dir 时需要）
自动检测 macOS/Linux 常见路径，或通过 CHROME_PATH 环境变量指定

脚本格式

用 --- 分隔各段，每段包含 口播、字幕、画面 字段：

# 视频标题

开场
画面：场景描述
口播：TTS 配音文案
字幕：屏幕显示文字
支持换行

结尾
画面：场景描述
口播：TTS 配音文案
字幕：屏幕显示文字

完整模板：templates/script-template.md

工作流程

解析脚本 Markdown，提取各分段
每段口播 -> TTS 生成 mp3
每段字幕 -> HTML 模板截图生成 9:16 图片（或从 --images-dir 加载）
每张图 + 对应音频 -> FFmpeg 合成视频片段
拼接所有片段 -> 输出 MP4

从视频脚本 Markdown 文件一键生成竖版短视频（9:16）。

核心思路：以图定音

每段脚本的画面说明 -> 字幕卡片图
每段口播文案 -> TTS 配音
每张图展示时长 = 对应音频时长，音画天然同步

快速开始

python3 generate.py script.md -o output.mp4

使用预制图片（跳过 Chrome 截图）

python3 generate.py script.md --images-dir ./my-slides -o output.mp4

图片命名规则：slide_01.png, slide_02.png...，与脚本分段一一对应。

自定义 TTS 命令

python3 generate.py script.md --tts-command "my-tts {text} -o {output} -v {voice} -r {rate}"

占位符：{text} 口播文案、{output} 输出路径、{voice} 音色、{rate} 语速。

参数说明

python3 generate.py <脚本路径> [选项]

选项： -o, --output 输出 MP4 路径（默认：tmp/video-output.mp4） -v, --voice TTS 音色（默认：zh-CN-YunxiNeural） -r, --rate 语速（默认：+0%，如 +10%、-10%） -w, --width 视频宽度（默认：1080） --height 视频高度（默认：1920，9:16） --images-dir 使用已有图片目录，跳过 Chrome 截图 --tts-command 自定义 TTS 命令模板（占位符：{text} {output} {voice} {rate}） --keep-temp 保留临时文件（图片、音频、片段） --no-subs 不烧录字幕

依赖

系统依赖

FFmpeg：视频合成（brew install ffmpeg）
Chrome：HTML 截图（仅在未使用 --images-dir 时需要）

- 自动检测 macOS/Linux 常见路径，或通过 CHROME_PATH 环境变量指定

脚本格式

用 --- 分隔各段，每段包含 口播、字幕、画面 字段：

# 视频标题
开场
画面：场景描述
口播：TTS 配音文案
字幕：屏幕显示文字\n支持换行
结尾
画面：场景描述
口播：TTS 配音文案
字幕：屏幕显示文字

完整模板：templates/script-template.md

工作流程

解析脚本 Markdown，提取各分段
每段口播 -> TTS 生成 mp3
每段字幕 -> HTML 模板截图生成 9:16 图片（或从 --images-dir 加载）
每张图 + 对应音频 -> FFmpeg 合成视频片段
拼接所有片段 -> 输出 MP4

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

LH Video Gen — 从 Markdown 生成竖版短视频

License

运行时依赖

版本

安装命令点击复制

技能文档

快速开始

使用预制图片（跳过 Chrome 截图）

自定义 TTS 命令

参数说明

依赖

系统依赖

推荐搭配的 Skill

脚本格式

开场

结尾

工作流程

快速开始

使用预制图片（跳过 Chrome 截图）

自定义 TTS 命令

参数说明

依赖

系统依赖

推荐搭配的 Skill

脚本格式

开场

结尾

工作流程

License

运行时依赖

版本

安装命令 点击复制

技能文档

快速开始

使用预制图片（跳过 Chrome 截图）

自定义 TTS 命令

参数说明

依赖

系统依赖

推荐搭配的 Skill

脚本格式

开场

结尾

工作流程

快速开始

使用预制图片（跳过 Chrome 截图）

自定义 TTS 命令

参数说明

依赖

系统依赖

推荐搭配的 Skill

脚本格式

开场

结尾

工作流程

安装命令点击复制