🎙️ Ai Voiceover Generator Free — AI配音生成

v1.0.0

上传MP4/MOV/TXT/DOCX（≤200MB），20–40秒云端渲染成1080p配音视频，无需注册即可免费使用，适合内容创作者、营销人员和学生快速生成语音解说。

0· 57·0 当前·0 累计

by @francemichaell-15

AI模型访问

使用场景：使用Ai Voiceover Generator Free — AI配音生成进行AI模型访问使用Ai Voiceover Generator Free — AI配音生成

下载技能包

最后更新

2026/4/13

安全扫描

VirusTotal

无害

查看报告

OpenClaw

可疑

high confidence

技能声明的云端配音渲染目的与指令中的网络调用一致，但包元数据与运行时指令在所需凭证/配置路径上互相矛盾，且要求读取本地安装/配置目录（非核心任务所需）——这些不一致需警惕。

评估建议

该技能通过调用 mega-api-prod.nemovideo.ai 实现所宣传的云端配音渲染，需 NEMO_TOKEN 或匿名令牌。安装或启用前请考虑：1) 注册表称必须 NEMO_TOKEN，但运行时文档支持匿名令牌，要求作者修正矛盾；2) SKILL.md 要求检测安装路径并引用本地配置路径（~/.config/nemovideo/），应说明为何需读取本地安装/配置，并确保任何本地读取最小化且有文档；3) 上传文件将发送至远程服务，需验证域名及隐私/数据保留政策，避免上传敏感内容；4) 优先使用临时/受限令牌，若必须使用 NEMO_TOKEN，先创建限定范围/测试账户。若开发者无法解释配置/元数据不匹配及文件系统读取，应视为不可信并勿启用。...

详细分析 ▾

ℹ 用途与能力

名称与描述（AI配音渲染）与 SKILL.md 使用远程 NEMO API（上传文件、启动作业）一致。但注册表将 NEMO_TOKEN 列为必需环境变量，而 SKILL.md 描述若未提供 NEMO_TOKEN 可使用匿名令牌——声明需求与运行时指令不一致。同时 SKILL.md 前言包含注册表未列出的 configPaths 条目（~/.config/nemovideo/），亦为不匹配。

⚠ 指令范围

指令指导用户文件上传（预期）及多次调用 mega-api-prod.nemovideo.ai（云渲染预期）。但还要求代理通过检查安装路径（~/.clawhub/、~/.cursor/skills/）推导 X-Skill-Platform，意味着读取与配音无关的本地文件系统/安装上下文。读取本地技能安装路径或用户配置并非内容渲染所需，扩大了技能范围。

✓ 安装机制

无安装规范及代码文件；技能仅为指令，因此安装程序不会写入磁盘，属于最低风险安装机制。

⚠ 凭证需求

唯一声明凭证为 NEMO_TOKEN（适合第三方 API）。但 SKILL.md 提供匿名令牌回退，故 NEMO_TOKEN 不应为硬性必需变量——注册表将其列为必需存在不一致。前言的 configPaths 条目（~/.config/nemovideo/）若被实际读取，将授予访问本地配置目录权限，除非仅用于查找缓存 API 令牌，否则行为未充分说明。

ℹ 持久化与权限

技能未请求 always:true 亦未请求提升平台权限。然而，检测安装路径及读取 YAML 前言以设置归因标头的指令意味着技能可能检查本地安装上下文；虽非高权限，但超出渲染严格所需范围，应予以澄清。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/13

AI Voiceover Generator Free 初始发布。 - 文本或脚本生成配音，20–40 秒输出 1080p MP4 文件。 - 支持 MP4、MOV、TXT、DOCX 上传，最大 200MB。 - 自动免费会话与额度设置——无需手动注册。 - 云端 GPU 渲染；全部处理通过远程 API 完成。 - 包含错误处理、状态更新与导出工作流。

● 无害

安装命令

点击复制

官方npx clawhub@latest install ai-voiceover-generator-free

镜像加速npx clawhub@latest install ai-voiceover-generator-free --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Ai Voiceover Generator Free — AI配音生成安装说明：安装命令：npx clawhub@latest install ai-voiceover-generator-free

需要定制？告诉我你的需求 →

技能文档

入门指南 > 把你的文本或脚本发给我，我会立即开始生成 AI 配音。也可以直接告诉我你的想法。试试这样说： - “生成我的文本或脚本” - “导出 1080p MP4” - “为我的内容生成一段自然语音配音” ### 自动初始化首次交互时，先连接到处理 API，再进行任何操作。显示简短状态，如“正在初始化…”。 Token：若环境变量 `NEMO_TOKEN` 已存在，则直接使用，并跳转到下方会话步骤。免费 token：生成一个 UUID 作为客户端标识，随后向 `https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token` 发起 POST 请求，并附带请求头 `X-Client-Id:` 。响应中的 `data.token` 即为你的 NEMO_TOKEN（100 积分，7 天有效期）。会话：向 `https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent` 发起 POST，使用 Bearer 鉴权，请求体为 `{"task_name":"project"}`。保存响应中的 `session_id`。向用户确认已连接并准备就绪。不要打印 token 或原始 JSON。 # AI Voiceover Generator Free — Generate Voiceovers for Videos 把文本或脚本发给我，并描述想要的效果。AI 配音生成在远程 GPU 节点上完成——本地无需安装任何软件。快速示例：上传一段 200 字的产品描述脚本，输入“用美式英语女声为我的脚本生成一段自然语音配音”，大约 20–40 秒后你将收到 1080p MP4 文件。所有渲染都在服务器端完成。提示：150 词以内的短脚本听起来最自然。 ## 将输入匹配到操作用户提及 ai voiceover generator free、画面比例、文字层或音轨等关键词时，通过关键字和意图分类路由到对应操作。 | 用户说… | 动作 | 跳过 SSE？ | |-------------|--------|----------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他（生成、编辑、添加背景乐…） | → §3.1 SSE | ❌ | ## 云端渲染流程说明每次导出任务会在云 GPU 节点排队，合成视频层并应用平台专用压缩（H.264，最高 1080×1920），30–90 秒内返回下载链接。会话 token 携带渲染任务 ID，若在完成前关闭标签页，作业将成孤儿。基础 URL：`https://mega-api-prod.nemovideo.ai` | 端点 | 方法 | 用途 | |----------|--------|---------| | `/api/tasks/me/with-session/nemo_agent` | POST | 开启新编辑会话。请求体：`{"task_name":"project","language":""}`。返回 `session_id`。 | | `/run_sse` | POST | 发送用户消息。请求体含 `app_name`、`session_id`、`new_message`。流式响应，`Accept: text/event-stream`。超时 15 分钟。 | | `/api/upload-video/nemo_agent/me/` | POST | 上传文件（multipart）或 URL。 | | `/api/credits/balance/simple` | GET | 查询剩余积分（`available`、`frozen`、`total`）。 | | `/api/state/nemo_agent/me//latest` | GET | 获取当前时间线状态（`draft`、`video_infos`、`generated_media`）。 | | `/api/render/proxy/lambda` | POST | 开始导出。请求体：`{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}`。每 30 秒轮询状态。 | 支持的文件类型：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 Skill 归因——运行时读取本文件 YAML frontmatter： - `X-Skill-Source`: `ai-voiceover-generator-free` - `X-Skill-Version`: 来自 frontmatter 的 `version` - `X-Skill-Platform`: 根据安装路径检测（`~/.clawhub/` → `clawhub`，`~/.cursor/skills/` → `cursor`，否则 `unknown`）所有请求必须包含：`Authorization: Bearer` 、`X-Skill-Source`、`X-Skill-Version`、`X-Skill-Platform`。缺少归因头将返回 402，导致导出失败。 ### 错误处理 | 代码 | 含义 | 操作 | |------|---------|--------| | 0 | 成功 | 继续 | | 1001 | token 无效/过期 | 通过 anonymous-token 重新鉴权（token 7 天过期） | | 1002 | 会话不存在 | 新建会话 §3.0 | | 2001 | 积分不足 | 匿名用户：显示带 `?bind=` 的注册链接（来自 create-session 或 state 响应）。已注册用户：“请在账户中充值积分” | | 4001 | 不支持的文件 | 展示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少 X-Client-Id | 生成 Client-Id 并重试（见 §1） | | 402 | 免费套餐导出受限 | 订阅层级问题，非积分。“注册或升级套餐以解锁导出。” | | 429 | 限流（1 token/客户端/7 天） | 30 秒后重试一次 | ### 读取 SSE 流文本事件直接展示给用户（经 GUI 翻译后）。工具调用保持内部。心跳与空 `data:` 行表示后端仍在工作——每 2 分钟显示“⏳ 仍在处理…”。约 30% 的编辑操作会无文本关闭流，此时轮询 `/api/state` 确认时间线已变更，再告知用户更新内容。 ### 翻译 GUI 指令后端按可视界面风格返回指令。将其映射为 API 调用： - “click” 或 “点击” → 通过对应端点执行操作 - “open” 或 “打开” → 查询会话状态获取数据 - “drag/drop” 或 “拖拽” → 经 SSE 发送编辑命令 - “preview in timeline” → 文字摘要当前轨道 - “Export” 或 “导出” → 运行导出流程 Draft 字段映射：`t`=tracks，`tt`=track type（0=视频，1=音频，7=文字），`sg`=segments，`d`=duration(ms)，`m`=metadata。 `` `Timeline (3 tracks): 1. Video: city timelapse (0-10s) 2. BGM: Lo-fi (0-10s, 35%) 3. Title: "Urban Dreams" (0-3s)` `` ## 常见工作流快速编辑：上传 → “用美式英语女声为我的脚本生成一段自然语音配音” → 下载 MP4。30 秒片段约 20–40 秒完成。批量处理：一次会话上传多个文件，逐条用不同指令处理，每条独立渲染。迭代优化：先粗剪，预览结果，再微调。会话保存时间线状态，可反复修改。 ## 技巧提示后端在指令具体时处理更快。与其说“让它更好看”，不如说“用美式英语女声为我的脚本生成一段自然语音配音”——明确指令效果更佳。文件上限 200MB。优先使用 MP4、MOV、TXT、DOCX 以获得最佳体验。导出为 MP4 可在各平台设备获得最广兼容。

运行时依赖

版本

安装命令

本土化适配说明

技能文档

相关技能推荐