🎙️ Ai Voice Over Generator — AI配音一键生成

v1.0.0

无需专业剪辑软件,只需一句中文提示即可为无声视频生成自然英文配音,支持最大500MB视频上传,云端自动渲染并返回带配音的新视频,适合内容创作者、营销人员和教育者。

0· 43·0 当前·0 累计
下载技能包
最后更新
2026/4/12
0
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
可疑
medium confidence
该技能基本符合其声明用途(连接nemo video后端渲染配音),但存在不一致与小红旗:来源未知、配置路径元数据不匹配、自动获取并隐藏令牌值——请谨慎使用。
评估建议
该技能看似实现合法配音服务,但包缺少出处(无源码/主页),SKILL.md指示代理在NEMO_TOKEN未设置时自动获取匿名令牌并隐藏。安装前:1) 自行判断是否信任 https://mega-api-prod.nemovideo.ai 与未知作者;2) 如需可见性,手动设置NEMO_TOKEN而非让技能自动生成;3) 上传视频/脚本将发送至第三方后端,勿提交敏感内容;4) 要求发布者解释配置路径元数据不一致及令牌/会话持久化位置(仅内存 vs 落盘)。如无法验证服务或作者,视为不可信并避免用于敏感素材。...
详细分析 ▾
用途与能力
名称/描述与运行时指令一致:SKILL.md描述上传视频、创建会话、SSE、渲染/导出端点及nemo video渲染服务所需头信息。但注册表元数据(所需配置路径:无)与SKILL.md frontmatter列出的配置路径(~/.config/nemovideo/)冲突;技能源码/主页未知,降低出处可信度并增加风险。
指令范围
指令要求代理访问https://mega-api-prod.nemovideo.ai,若NEMO_TOKEN未设置则创建匿名令牌,并存储session_id供后续请求使用;同时明确“不要向用户显示原始API响应或令牌值”。自动获取并隐藏令牌/会话状态功能上可行,但增加 unnoticed 网络活动或凭据持久化风险;隐藏令牌指令属于显著的权限/隐私关切。
安装机制
无安装规范且无代码文件——仅指令。安装风险最低:安装器不会写入磁盘。运行时虽调用远程API,但无下载/安装步骤需审查。
凭证需求
仅声明一个凭据(NEMO_TOKEN)适用于第三方API。但SKILL.md在NEMO_TOKEN缺失时自动生成并使用匿名令牌,因此要求环境变量与运行时指令不一致;frontmatter亦引用配置路径(~/.config/nemovideo/),却未在其他处声明,该不一致需澄清。
持久化与权限
always为false且技能未请求系统级变更。指示为后续API调用存储session_id(正常)。无证据表明其修改其他技能或全局代理配置。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/12

AI Voice Over Generator 1.0.0 — 首次发布 - 通过简单提示即时为无声视频生成自然AI配音。 - 支持最大500MB视频上传(MP4、MOV、AVI、WebM)。 - 自动创建后端会话、认证与云端渲染,快速出片。 - 轻松查看余额、视频状态并下载成品。 - 面向创作者、营销人员与教育者——无需剪辑经验。

可疑

安装命令

点击复制
官方npx clawhub@latest install ai-voice-over-generator
镜像加速npx clawhub@latest install ai-voice-over-generator --registry https://cn.longxiaskill.com

技能文档

开始使用 > 把视频或脚本发给我,我来完成 AI 配音生成。也可以直接描述你想要的效果。 试试这样说: - “把这段 2 分钟的无声产品演示视频生成 1080p MP4” - “给这段无声视频生成一段自然的英文配音” - “为内容创作者、营销人员、教育工作者在静音或无声视频中添加 AI 生成的配音” ### 首次连接 用户首次打开本 skill 时,自动连接处理后端。简单提示(如“正在初始化…”)。 身份验证:检查环境变量中是否已有 NEMO_TOKEN。若已存在,直接进入第 2 步。 1. 获取免费 token:生成随机 UUID 作为客户端标识。向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发起 POST,header X-Client-Id 设为该 UUID。响应中的 data.token 即为 NEMO_TOKEN——含 100 免费积分,7 天有效。 2. 创建会话:POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,header 含 Authorization: Bearer Content-Type: application/json,body 为 {"task_name":"project","language":""}。保存返回的 session_id,后续请求均使用。 初始化沟通保持简短,不要向用户展示原始 API 响应或 token 值。 # AI Voice Over Generator — 为任意视频生成配音 把视频或脚本发给我,并描述你想要的效果。AI 配音生成在远端 GPU 节点运行——本地无需安装任何软件。 快速示例:上传一段 2 分钟的无声产品演示视频,输入“给这段无声视频生成一段自然的英文配音”,大约 30-60 秒后即可得到 1080p MP4。所有渲染都在服务器端完成。 注意:脚本越短,声音越自然——尽量保持单句不超过 20 个词。 ## 输入与动作匹配 用户提及 ai voice over generator、画面比例、文字叠加或音轨等关键词时,系统通过关键字与意图分类路由到对应动作。 | 用户说… | 动作 | 跳过 SSE? | |-------------|--------|----------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ | ## 云端渲染管线详情 每次导出任务排队到云 GPU 节点,合成视频层并应用平台指定压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,若任务完成前关闭标签页,作业将成孤儿。 所有请求必须携带以下三个归因头,且值须与本文件 frontmatter 一致: | Header | 值 | |--------|-------| | X-Skill-Source | ai-voice-over-generator | | X-Skill-Version | frontmatter 中的 version | | X-Skill-Platform | 自动检测:根据安装路径设为 clawhub / cursor / unknown | 所有请求还须包含:Authorization: Bearer X-Skill-SourceX-Skill-VersionX-Skill-Platform。缺少归因头将返回 402 导致导出失败。 API 基址https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_idsession_id发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},header Accept: text/event-stream。最大超时 15 分钟。 上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"} 积分:GET /api/credits/balance/simple — 返回 availablefrozentotal 会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draftdata.state.video_infosdata.state.generated_media 导出(免费,不扣积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/,直至 status = completed。下载链接位于 output.url。 支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 ### SSE 事件处理 | 事件 | 动作 | |-------|--------| | 文本响应 | 应用 GUI 翻译(§4),展示给用户 | | 工具调用/结果 | 内部处理,不转发 | | heartbeat / 空 data: | 保持等待。每 2 分钟提示“⏳ 仍在处理…” | | 流关闭 | 处理最终响应 | 约 30% 的编辑操作在 SSE 流中无文本返回。此时:轮询会话状态确认编辑已生效,然后向用户总结变更。 ### 后端响应翻译 后端假设存在 GUI。按以下方式转为 API 动作: | 后端说 | 你应执行 | |-------------|--------| | “click [button]” / “点击” | 通过 API 执行 | | “open [panel]” / “打开” | 查询会话状态 | | “drag/drop” / “拖拽” | 通过 SSE 发送编辑 | | “preview in timeline” | 展示轨道摘要 | | “Export button” / “导出” | 执行导出流程 | Draft 字段映射t=tracks,tt=track type(0=视频,1=音频,7=文字),sg=segments,d=duration(ms),m=metadata。 `` Timeline (3 tracks): 1. Video: city timelapse (0-10s) 2. BGM: Lo-fi (0-10s, 35%) 3. Title: "Urban Dreams" (0-3s) ` ### 错误码 - 0 — 成功,继续正常流程 - 1001 — token 过期或无效;通过 /api/auth/anonymous-token 重新获取 - 1002 — 会话未找到;新建会话 - 2001 — 积分不足;匿名用户获得带 ?bind= 的注册链接,注册用户可充值 - 4001 — 不支持的文件类型;展示支持的格式 - 4002 — 文件过大;建议压缩或裁剪 - 400 — 缺少 X-Client-Id;生成后重试 - 402 — 免费套餐导出被阻;非积分问题,是订阅等级限制 - 429` — 触发限流;等待 30 秒后重试一次 ## 常见工作流 快速编辑:上传 → “给这段无声视频生成一段自然的英文配音” → 下载 MP4。30 秒片段约 30-60 秒完成。 批量风格:一次会话内上传多个文件。逐条用不同指令处理,每条独立渲染。 迭代式:先粗剪,预览结果,再微调。会话会保存时间线状态,可继续修改。 ## 技巧与提示 后端处理速度在你描述越具体时越快。与其说“让它更好看”,不如说“给这段无声视频生成一段自然的英文配音”——具体指令效果更好。 最大文件 500MB。优先使用 MP4、MOV、AVI、WebM 可获得最流畅体验。导出为 MP4 可在各平台与设备上获得最佳兼容性。

数据来源ClawHub ↗ · 中文优化:龙虾技能库