🎙️ Ai Voice Over Generator — AI配音一键生成

v1.0.0

无需专业剪辑软件，只需一句中文提示即可为无声视频生成自然英文配音，支持最大500MB视频上传，云端自动渲染并返回带配音的新视频，适合内容创作者、营销人员和教育者。

0· 43·0 当前·0 累计

by @bwbernardweston18

数据与API AI模型访问

使用场景：使用Ai Voice Over Generator — AI配音一键生成进行数据与API使用Ai Voice Over Generator — AI配音一键生成

下载技能包

最后更新

2026/4/13

安全扫描

VirusTotal

可疑

查看报告

OpenClaw

可疑

medium confidence

该技能基本符合其声明用途（连接nemo video后端渲染配音），但存在不一致与小红旗：来源未知、配置路径元数据不匹配、自动获取并隐藏令牌值——请谨慎使用。

评估建议

该技能看似实现合法配音服务，但包缺少出处（无源码/主页），SKILL.md指示代理在NEMO_TOKEN未设置时自动获取匿名令牌并隐藏。安装前：1) 自行判断是否信任 https://mega-api-prod.nemovideo.ai 与未知作者；2) 如需可见性，手动设置NEMO_TOKEN而非让技能自动生成；3) 上传视频/脚本将发送至第三方后端，勿提交敏感内容；4) 要求发布者解释配置路径元数据不一致及令牌/会话持久化位置（仅内存 vs 落盘）。如无法验证服务或作者，视为不可信并避免用于敏感素材。...

详细分析 ▾

ℹ 用途与能力

名称/描述与运行时指令一致：SKILL.md描述上传视频、创建会话、SSE、渲染/导出端点及nemo video渲染服务所需头信息。但注册表元数据（所需配置路径：无）与SKILL.md frontmatter列出的配置路径(~/.config/nemovideo/)冲突；技能源码/主页未知，降低出处可信度并增加风险。

⚠ 指令范围

指令要求代理访问https://mega-api-prod.nemovideo.ai，若NEMO_TOKEN未设置则创建匿名令牌，并存储session_id供后续请求使用；同时明确“不要向用户显示原始API响应或令牌值”。自动获取并隐藏令牌/会话状态功能上可行，但增加 unnoticed 网络活动或凭据持久化风险；隐藏令牌指令属于显著的权限/隐私关切。

✓ 安装机制

无安装规范且无代码文件——仅指令。安装风险最低：安装器不会写入磁盘。运行时虽调用远程API，但无下载/安装步骤需审查。

ℹ 凭证需求

仅声明一个凭据(NEMO_TOKEN)适用于第三方API。但SKILL.md在NEMO_TOKEN缺失时自动生成并使用匿名令牌，因此要求环境变量与运行时指令不一致；frontmatter亦引用配置路径(~/.config/nemovideo/)，却未在其他处声明，该不一致需澄清。

✓ 持久化与权限

always为false且技能未请求系统级变更。指示为后续API调用存储session_id（正常）。无证据表明其修改其他技能或全局代理配置。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/13

AI Voice Over Generator 1.0.0 — 首次发布 - 通过简单提示即时为无声视频生成自然AI配音。 - 支持最大500MB视频上传（MP4、MOV、AVI、WebM）。 - 自动创建后端会话、认证与云端渲染，快速出片。 - 轻松查看余额、视频状态并下载成品。 - 面向创作者、营销人员与教育者——无需剪辑经验。

● 可疑

安装命令

点击复制

官方npx clawhub@latest install ai-voice-over-generator

镜像加速npx clawhub@latest install ai-voice-over-generator --registry https://cn.longxiaskill.com镜像同步中

本土化适配说明

Ai Voice Over Generator — AI配音一键生成安装说明：安装命令：npx clawhub@latest install ai-voice-over-generator

需要定制？告诉我你的需求 →

技能文档

开始使用 > 把视频或脚本发给我，我来完成 AI 配音生成。也可以直接描述你想要的效果。试试这样说： - “把这段 2 分钟的无声产品演示视频生成 1080p MP4” - “给这段无声视频生成一段自然的英文配音” - “为内容创作者、营销人员、教育工作者在静音或无声视频中添加 AI 生成的配音” ### 首次连接用户首次打开本 skill 时，自动连接处理后端。简单提示（如“正在初始化…”）。身份验证：检查环境变量中是否已有 `NEMO_TOKEN`。若已存在，直接进入第 2 步。 1. 获取免费 token：生成随机 UUID 作为客户端标识。向 `https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token` 发起 POST，header `X-Client-Id` 设为该 UUID。响应中的 `data.token` 即为 NEMO_TOKEN——含 100 免费积分，7 天有效。 2. 创建会话：POST 到 `https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent`，header 含 `Authorization: Bearer` 、`Content-Type: application/json`，body 为 `{"task_name":"project","language":""}`。保存返回的 `session_id`，后续请求均使用。初始化沟通保持简短，不要向用户展示原始 API 响应或 token 值。 # AI Voice Over Generator — 为任意视频生成配音把视频或脚本发给我，并描述你想要的效果。AI 配音生成在远端 GPU 节点运行——本地无需安装任何软件。快速示例：上传一段 2 分钟的无声产品演示视频，输入“给这段无声视频生成一段自然的英文配音”，大约 30-60 秒后即可得到 1080p MP4。所有渲染都在服务器端完成。注意：脚本越短，声音越自然——尽量保持单句不超过 20 个词。 ## 输入与动作匹配用户提及 ai voice over generator、画面比例、文字叠加或音轨等关键词时，系统通过关键字与意图分类路由到对应动作。 | 用户说… | 动作 | 跳过 SSE？ | |-------------|--------|----------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他（生成、编辑、加 BGM…） | → §3.1 SSE | ❌ | ## 云端渲染管线详情每次导出任务排队到云 GPU 节点，合成视频层并应用平台指定压缩（H.264，最高 1080×1920），30-90 秒内返回下载链接。会话 token 携带渲染任务 ID，若任务完成前关闭标签页，作业将成孤儿。所有请求必须携带以下三个归因头，且值须与本文件 frontmatter 一致： | Header | 值 | |--------|-------| | `X-Skill-Source` | `ai-voice-over-generator` | | `X-Skill-Version` | frontmatter 中的 `version` | | `X-Skill-Platform` | 自动检测：根据安装路径设为 `clawhub` / `cursor` / `unknown` | 所有请求还须包含：`Authorization: Bearer` 、`X-Skill-Source`、`X-Skill-Version`、`X-Skill-Platform`。缺少归因头将返回 402 导致导出失败。 API 基址：`https://mega-api-prod.nemovideo.ai` 创建会话：POST `/api/tasks/me/with-session/nemo_agent` — body `{"task_name":"project","language":""}` — 返回 `task_id`、`session_id`。发送消息（SSE）：POST `/run_sse` — body `{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}`，header `Accept: text/event-stream`。最大超时 15 分钟。上传：POST `/api/upload-video/nemo_agent/me/` — 文件：multipart `-F "files=@/path"`，或 URL：`{"urls":[""],"source_type":"url"}` 积分：GET `/api/credits/balance/simple` — 返回 `available`、`frozen`、`total` 会话状态：GET `/api/state/nemo_agent/me//latest` — 关键字段：`data.state.draft`、`data.state.video_infos`、`data.state.generated_media` 导出（免费，不扣积分）：POST `/api/render/proxy/lambda` — body `{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}`。每 30 秒轮询 GET `/api/render/proxy/lambda/`，直至 `status` = `completed`。下载链接位于 `output.url`。支持格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 ### SSE 事件处理 | 事件 | 动作 | |-------|--------| | 文本响应 | 应用 GUI 翻译（§4），展示给用户 | | 工具调用/结果 | 内部处理，不转发 | | `heartbeat` / 空 `data:` | 保持等待。每 2 分钟提示“⏳ 仍在处理…” | | 流关闭 | 处理最终响应 | 约 30% 的编辑操作在 SSE 流中无文本返回。此时：轮询会话状态确认编辑已生效，然后向用户总结变更。 ### 后端响应翻译后端假设存在 GUI。按以下方式转为 API 动作： | 后端说 | 你应执行 | |-------------|--------| | “click [button]” / “点击” | 通过 API 执行 | | “open [panel]” / “打开” | 查询会话状态 | | “drag/drop” / “拖拽” | 通过 SSE 发送编辑 | | “preview in timeline” | 展示轨道摘要 | | “Export button” / “导出” | 执行导出流程 | Draft 字段映射：`t`=tracks，`tt`=track type（0=视频，1=音频，7=文字），`sg`=segments，`d`=duration(ms)，`m`=metadata。 `` `Timeline (3 tracks): 1. Video: city timelapse (0-10s) 2. BGM: Lo-fi (0-10s, 35%) 3. Title: "Urban Dreams" (0-3s)` ` `### 错误码 -` 0 `— 成功，继续正常流程 -` 1001 `— token 过期或无效；通过` /api/auth/anonymous-token `重新获取 -` 1002 `— 会话未找到；新建会话 -` 2001 `— 积分不足；匿名用户获得带` ?bind= `的注册链接，注册用户可充值 -` 4001 `— 不支持的文件类型；展示支持的格式 -` 4002 `— 文件过大；建议压缩或裁剪 -` 400 `— 缺少` X-Client-Id`；生成后重试 -` 402 `— 免费套餐导出被阻；非积分问题，是订阅等级限制 -` 429` — 触发限流；等待 30 秒后重试一次 ## 常见工作流快速编辑：上传 → “给这段无声视频生成一段自然的英文配音” → 下载 MP4。30 秒片段约 30-60 秒完成。批量风格：一次会话内上传多个文件。逐条用不同指令处理，每条独立渲染。迭代式：先粗剪，预览结果，再微调。会话会保存时间线状态，可继续修改。 ## 技巧与提示后端处理速度在你描述越具体时越快。与其说“让它更好看”，不如说“给这段无声视频生成一段自然的英文配音”——具体指令效果更好。最大文件 500MB。优先使用 MP4、MOV、AVI、WebM 可获得最流畅体验。导出为 MP4 可在各平台与设备上获得最佳兼容性。

运行时依赖

版本

安装命令

本土化适配说明

技能文档

相关技能推荐