首页龙虾技能列表 › LH Video Gen — 从 Markdown 生成竖版短视频

LH Video Gen — 从 Markdown 生成竖版短视频

v1.0.0

该技能从 Markdown 脚本生成 9:16 竖版短视频,支持 TTS 音频生成、字幕卡片渲染和 MP4 合成。适用于快速制作短视频内容。

3· 1,800·0 当前·0 累计
by @liuhedev·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/4
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
安全
high confidence
该技能的代码和指令与其声明的目的相符,没有发现意外的凭据、下载或隐藏的网络端点。
评估建议
该技能看起来连贯,仅执行本地操作。安装或运行前,请确保 FFmpeg 和 Chrome 从可信来源安装。如果依赖自动检测的 ../lh-edge-tts 脚本,请验证其可信。自定义 --tts-command 时,请谨慎使用可信的 TTS 命令。提供的 HTML 模板包含硬编码的品牌和 SEO 指导;如果不需要,请编辑模板。技能读取输入 Markdown 并在 tmp 文件夹下写入音频/图像/视频文件,请避免在脚本内容中包含机密信息。总体而言,技术上与其声明的目的一致。主要的操作风险是执行本地的 TTS 脚本和运行用户提供的 shell 命令;请在使用前验证这些组件的可信度。...
详细分析 ▾
用途与能力
名称/描述与提供的代码一致:generate.py 解析 Markdown,通过本地 TTS 工具或用户提供的 TTS 命令生成 TTS 音频,使用 headless Chrome 渲染 HTML 滑动并使用 FFmpeg 组合视频。没有请求无关的环境变量或服务。
指令范围
SKILL.md 指示代理运行提供的脚本,并可选地设置 CHROME_PATH 或 EDGE_TTS_PATH;这些是相关的。一个非安全注意事项:模板和脚本鼓励/包含硬编码的品牌和 SEO 指导(例如,需要核心关键词和促进 "关注刘贺同学" 和 '龙虾哥' 品牌的短语)。这对于内容来说是范围蔓延(不是技术不匹配),可能不被一些用户所期望。
安装机制
没有安装规范或外部下载;这是一个指令+代码技能,依赖于本地安装的 FFmpeg 和 Chrome。没有从任意 URL 提取内容或自动安装。
凭证需求
该技能不请求任何机密信息或特殊环境变量。它可选地读取 CHROME_PATH 和 EDGE_TTS_PATH 来定位本地二进制文件/脚本;这些是合理的并且已记录。如果存在,脚本可能会检测并调用同级 ../lh-edge-tts 脚本;这种行为对于可选集成是预期的,但引用的脚本应被信任。
持久化与权限
always 为 false,该技能不请求持久的平台权限。它在输出路径附近的 tmp 目录下写入临时文件并清理一些临时文件;它不修改其他技能或系统范围的设置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/4
● 可疑

安装命令 点击复制

官方npx clawhub@latest install lh-video-gen
镜像加速npx clawhub@latest install lh-video-gen --registry https://cn.clawhub-mirror.com

技能文档

从视频脚本 Markdown 文件一键生成竖版短视频(9:16)。

核心思路:以图定音

  • 每段脚本的画面说明 -> 字幕卡片图
  • 每段口播文案 -> TTS 配音
  • 每张图展示时长 = 对应音频时长,音画天然同步

快速开始

python3 generate.py script.md -o output.mp4

使用预制图片(跳过 Chrome 截图)

python3 generate.py script.md --images-dir ./my-slides -o output.mp4
图片命名规则:slide_01.png, slide_02.png...,与脚本分段一一对应。

自定义 TTS 命令

python3 generate.py script.md --tts-command "my-tts {text} -o {output} -v {voice} -r {rate}"
占位符:{text} 口播文案、{output} 输出路径、{voice} 音色、{rate} 语速。

参数说明

python3 generate.py <脚本路径> [选项]
选项:
  -o, --output 输出 MP4 路径(默认:tmp/video-output.mp4)
  -v, --voice TTS 音色(默认:zh-CN-YunxiNeural)
  -r, --rate 语速(默认:+0%,如 +10%、-10%)
  -w, --width 视频宽度(默认:1080)
  --height 视频高度(默认:1920,9:16)
  --images-dir 使用已有图片目录,跳过 Chrome 截图
  --tts-command 自定义 TTS 命令模板(占位符:{text} {output} {voice} {rate})
  --keep-temp 保留临时文件(图片、音频、片段)
  --no-subs 不烧录字幕

依赖

系统依赖

  • FFmpeg:视频合成(brew install ffmpeg
  • Chrome:HTML 截图(仅在未使用 --images-dir 时需要)
  • 自动检测 macOS/Linux 常见路径,或通过 CHROME_PATH 环境变量指定

推荐搭配的 Skill

以下 Skill 非必需,但搭配使用效果更佳:
  • lh-edge-tts:TTS 配音生成。自动检测同级目录 ../lh-edge-tts/scripts/tts_converter.py,或通过 EDGE_TTS_PATH 环境变量指定,或用 --tts-command 替换为任意 TTS 工具
  • lh-html-to-image:如需自定义更复杂的字幕卡片,可用此 Skill 生成图片后通过 --images-dir 传入

脚本格式

--- 分隔各段,每段包含 口播字幕画面 字段:
# 视频标题

开场

画面:场景描述 口播:TTS 配音文案 字幕:屏幕显示文字 支持换行

结尾

画面:场景描述 口播:TTS 配音文案 字幕:屏幕显示文字
完整模板:templates/script-template.md

工作流程

  • 解析脚本 Markdown,提取各分段
  • 每段口播 -> TTS 生成 mp3
  • 每段字幕 -> HTML 模板截图生成 9:16 图片(或从 --images-dir 加载)
  • 每张图 + 对应音频 -> FFmpeg 合成视频片段
  • 拼接所有片段 -> 输出 MP4
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务