🎬 Text To Video Explainer Ai — 文本转视频解说

v1.0.0

跳过专业视频编辑软件的学习曲线。只需描述你的需求，将脚本转化为带配音和字幕的动画解说视频，1-2分钟即可获得可下载的MP4文件。支持上传TXT、DOCX、PDF、SRT文件（最大50MB），AI自动处理视频生成。非常适合营销人员、教育工作者和创业者快速制作专业解说视频。

0· 21·0 当前·0 累计

by @peand-rover (peandrover adam)·MIT-0

AI模型访问学习教育

下载技能包

License

MIT-0

最后更新

2026/4/16

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

medium confidence

技能声明的目的（将文本/脚本转换为解说视频）与其指令功能相符；它只与单个后端服务通信，并且只请求单个服务令牌，但在安装前需要注意一些小的元数据/指令不一致之处。

评估建议

该技能实现了其声称的功能：将用户的脚本/媒体上传到 nemovideo.ai 后端，创建临时会话并返回渲染视频。安装前请考虑：(1) 你的文本和上传的文件将被发送到 mega-api-prod.nemovideo.ai — 请确认你愿意分享这些内容，并查看该服务的隐私/数据保留政策。(2) 注册表元数据和 SKILL.md 存在轻微差异：注册表将 NEMO_TOKEN 标记为必填，但技能可以自动获取匿名令牌；请决定是设置自己的令牌还是允许技能请求匿名令牌。(3) 前端部分提到本地配置路径 (~/.config/nemovideo/) 并要求读取 YAML 前端部分以获取归属信息——这很有限且风险不高，但请注意该技能可能会读取自己的元数据并检测安装路径字符串。如需更强保障，请向技能作者请求隐私政策或服务条款链接，并澄清是否会访问任何本地文件。...

详细分析 ▾

✓ 用途与能力

名称/描述（文本转视频解说）与所需凭据（NEMO_TOKEN）和 mega-api-prod.nemovideo.ai 上记录的 API 端点相符。技能的网络活动（上传脚本/媒体、渲染/导出端点、积分检查）对于此功能是预期的。

ℹ 指令范围

SKILL.md 指示代理获取或使用 NEMO_TOKEN、创建会话、上传文件、流式传输 SSE 响应和轮询渲染状态——所有这些都与云渲染管道一致。它还指示代理读取自己的 YAML 前端部分以获取归属信息，并检测安装路径字符串以获取标头。这些操作仅限于技能本身和记录的后端；没有读取不相关系统文件或不相关环境变量的指令。前端部分还提到本地配置路径 (~/.config/nemovideo/)，但运行时步骤并未明确说明检查或使用该目录的理由。

✓ 安装机制

这是纯指令式安装，没有安装规范或第三方下载，因此安装程序不会向磁盘写入任何内容——安装机制风险最低。

ℹ 凭证需求

只有一个凭据（NEMO_TOKEN）被声明为主要凭据，这对于单一服务集成是合理的。然而，SKILL.md 还解释了如何在未设置 NEMO_TOKEN 时自动获取匿名令牌——这使得凭据实际上成为可选的，尽管注册表元数据将其列为必填。前端部分引用了一个配置路径 (~/.config/nemovideo/)，该路径未在注册表的必填配置路径中声明，造成了小的元数据不一致。

✓ 持久化与权限

该技能未标记为 always:true，也不请求系统级权限。它请求存储 session_id 以进行后续 API 调用（正常的会话状态），但不请求长期或跨技能的配置更改。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/16

初始版本：即时将脚本转换为云端AI驱动的动画解说视频。支持上传TXT、DOCX、PDF、SRT文件（最大50MB）生成带配音和字幕的解说视频。无需视频编辑经验——描述你的需求，即可在1-2分钟内收到可下载的MP4文件。包含自动会话管理、免费令牌生成和简单的积分系统（新用户免费100积分）。支持导出、积分检查、文件上传、时间线预览和云端渲染——所有功能均通过清晰、自动化的流程管理。非常适合营销人员、教育工作者和创业者快速制作专业解说视频，无需手动编辑。

● 无害

安装命令

点击复制

官方npx clawhub@latest install text-to-video-explainer-ai

镜像加速npx clawhub@latest install text-to-video-explainer-ai --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

入门

分享你的文本脚本，我就会开始AI视频创作。或者直接告诉我你的想法。

试试这样说：

"convert my text script"
"export 1080p MP4"
"turn this script into an animated"

首次连接

当用户首次打开此技能时，自动连接到处理后端。简要告知他们（例如"正在设置..."）。

认证：检查环境是否设置了 NEMO_TOKEN。如果已设置，跳到步骤2。

获取免费令牌：生成随机 UUID 作为客户端标识符。使用 header X-Client-Id 设置为该 UUID，POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token。响应中的 data.token 就是你的 NEMO_TOKEN — 100 免费积分，有效期 7 天。

创建会话：使用 Authorization: Bearer 、Content-Type: application/json，body 为 {"task_name":"project","language":""}，POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。存储返回的 session_id 用于所有后续请求。保持设置通信简洁。不要向用户显示原始 API 响应或令牌值。

# Text to Video Explainer AI — 将脚本转换为解说视频

发送你的文本脚本并描述你想要的结果。AI视频创作在远程GPU节点上运行——你的机器上无需安装任何东西。一个快速示例：上传一个200字的产品解说脚本，输入"将这个脚本转化为带配音和字幕的动画解说视频"，大约1-2分钟后你会收到一个1080p MP4。所有渲染都在服务端进行。

值得注意的是：150字以下的较短脚本会产生更紧凑、更聚焦的解说视频。

将输入匹配到操作

引用文本转视频解说AI、宽高比、文本叠加或音轨的用户提示通过关键词和意图分类路由到相应的操作。

用户说...	操作	跳过SSE?
"export" / "导出" / "download" / "send me the video"	→ §3.5 导出	✅
"credits" / "积分" / "balance" / "余额"	→ §3.3 积分	✅
"status" / "状态" / "show tracks"	→ §3.4 状态	✅
"upload" / "上传" / 用户发送文件	→ §3.2 上传	✅
其他一切（生成、编辑、添加BGM…）	→ §3.1 SSE	❌

云渲染管道详情

每个导出作业在云GPU节点上排队，合成视频层，应用平台特定压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成前关闭标签页会使作业孤立。

基础URL：https://mega-api-prod.nemovideo.ai

| 端点 | 方法 | 用途 | |----------|--------|---------| | /api/tasks/me/with-session/nemo_agent | POST | 开始新编辑会话。Body: {"task_name":"project","language":""}。返回 session_id。 | | /run_sse | POST | 发送用户消息。Body包含 app_name、session_id、new_message。使用 Accept: text/event-stream 流式传输响应。超时：15分钟。 | | /api/upload-video/nemo_agent/me/ | POST | 上传文件（multipart）或URL。 | | /api/credits/balance/simple | GET | 检查剩余积分（available、frozen、total）。 | | /api/state/nemo_agent/me//latest | GET | 获取当前时间线状态（draft、video_infos、generated_media）。 | | /api/render/proxy/lambda | POST | 开始导出。Body: {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态。 |

支持的文件类型：mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。

技能归属 — 运行时从此文件的YAML前端部分读取：

X-Skill-Source: text-to-video-explainer-ai
X-Skill-Version: 来自前端部分 version
X-Skill-Platform: 从安装路径检测（~/.clawhub/ → clawhub, ~/.cursor/skills/ → cursor, 否则 unknown）

每个API调用都需要 Authorization: Bearer 加上上面三个归属header。如果任何header缺失，导出返回402。

错误代码

0 — 成功，正常继续
1001 — 令牌过期或无效；通过 /api/auth/anonymous-token 重新获取
1002 — 会话未找到；创建新会话
2001 — 积分不足；匿名用户收到带 ?bind= 的注册链接，注册用户充值
4001 — 不支持的文件类型；显示接受的格式
4002 — 文件太大；建议压缩或裁剪
400 — 缺少 X-Client-Id；生成一个并重试
402 — 免费计划导出被阻止；不是积分问题，是订阅等级
429 — 速率限制；等待30秒并重试一次

SSE事件处理

事件	操作
文本响应	应用GUI翻译（第4节），呈现给用户
工具调用/结果	内部处理，不转发
`heartbeat` / 空的 `data:`	继续等待。每2分钟："⏳ 仍在工作中..."
流关闭	处理最终响应

约30%的编辑操作在SSE流中不返回文本。发生这种情况时：轮询会话状态以验证编辑已应用，然后向用户总结更改。

翻译GUI指令

后端响应就像有一个可视化界面。将其指令映射到API调用：

"click" 或 "点击" → 通过相关端点执行操作
"open" 或 "打开" → 查询会话状态以获取数据
"drag/drop" 或 "拖拽" → 通过SSE发送编辑命令
"preview in timeline" → 显示当前轨道的文本摘要
"Export" 或 "导出" → 运行导出工作流

Draft字段映射：t=轨道，tt=轨道类型（0=视频，1=音频，7=文本），sg=片段，d=时长(毫秒)，m=元数据。

时间线（3个轨道）：
视频：城市延时（0-10秒）
BGM：Lo-fi（0-10秒，35%）
标题："Urban Dreams"（0-3秒）

技巧和窍门

后端在您更具体时处理得更快。不要说"让它看起来更好"，而是尝试"将这个脚本转化为带配音和字幕的动画解说视频"——具体说明会得到更好的结果。

最大文件大小为50MB。坚持使用TXT、DOCX、PDF、SRT以获得最流畅的体验。导出为MP4以获得YouTube、LinkedIn和演示文稿的最大兼容性。

常见工作流

快速编辑：上传 → "将这个脚本转化为带配音和字幕的动画解说视频" → 下载MP4。30秒片段需要1-2分钟。

批量风格：在一个会话中上传多个文件。使用不同的指令逐个处理。每个都有自己的渲染。

迭代：从粗剪开始，预览结果，然后细化。会话保持你的时间线状态，这样你就可以继续调整。

License

运行时依赖

版本

安装命令

技能文档

入门

首次连接

将输入匹配到操作

云渲染管道详情

错误代码

SSE事件处理

翻译GUI指令

技巧和窍门

常见工作流

相关技能推荐