🎙️ Ai Voiceover Generator Free — AI配音生成

v1.0.0

上传MP4/MOV/TXT/DOCX(≤200MB),20–40秒云端渲染成1080p配音视频,无需注册即可免费使用,适合内容创作者、营销人员和学生快速生成语音解说。

0· 57·0 当前·0 累计
下载技能包
最后更新
2026/4/12
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
high confidence
技能声明的云端配音渲染目的与指令中的网络调用一致,但包元数据与运行时指令在所需凭证/配置路径上互相矛盾,且要求读取本地安装/配置目录(非核心任务所需)——这些不一致需警惕。
评估建议
该技能通过调用 mega-api-prod.nemovideo.ai 实现所宣传的云端配音渲染,需 NEMO_TOKEN 或匿名令牌。安装或启用前请考虑:1) 注册表称必须 NEMO_TOKEN,但运行时文档支持匿名令牌,要求作者修正矛盾;2) SKILL.md 要求检测安装路径并引用本地配置路径(~/.config/nemovideo/),应说明为何需读取本地安装/配置,并确保任何本地读取最小化且有文档;3) 上传文件将发送至远程服务,需验证域名及隐私/数据保留政策,避免上传敏感内容;4) 优先使用临时/受限令牌,若必须使用 NEMO_TOKEN,先创建限定范围/测试账户。若开发者无法解释配置/元数据不匹配及文件系统读取,应视为不可信并勿启用。...
详细分析 ▾
用途与能力
名称与描述(AI配音渲染)与 SKILL.md 使用远程 NEMO API(上传文件、启动作业)一致。但注册表将 NEMO_TOKEN 列为必需环境变量,而 SKILL.md 描述若未提供 NEMO_TOKEN 可使用匿名令牌——声明需求与运行时指令不一致。同时 SKILL.md 前言包含注册表未列出的 configPaths 条目(~/.config/nemovideo/),亦为不匹配。
指令范围
指令指导用户文件上传(预期)及多次调用 mega-api-prod.nemovideo.ai(云渲染预期)。但还要求代理通过检查安装路径(~/.clawhub/、~/.cursor/skills/)推导 X-Skill-Platform,意味着读取与配音无关的本地文件系统/安装上下文。读取本地技能安装路径或用户配置并非内容渲染所需,扩大了技能范围。
安装机制
无安装规范及代码文件;技能仅为指令,因此安装程序不会写入磁盘,属于最低风险安装机制。
凭证需求
唯一声明凭证为 NEMO_TOKEN(适合第三方 API)。但 SKILL.md 提供匿名令牌回退,故 NEMO_TOKEN 不应为硬性必需变量——注册表将其列为必需存在不一致。前言的 configPaths 条目(~/.config/nemovideo/)若被实际读取,将授予访问本地配置目录权限,除非仅用于查找缓存 API 令牌,否则行为未充分说明。
持久化与权限
技能未请求 always:true 亦未请求提升平台权限。然而,检测安装路径及读取 YAML 前言以设置归因标头的指令意味着技能可能检查本地安装上下文;虽非高权限,但超出渲染严格所需范围,应予以澄清。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/12

AI Voiceover Generator Free 初始发布。 - 文本或脚本生成配音,20–40 秒输出 1080p MP4 文件。 - 支持 MP4、MOV、TXT、DOCX 上传,最大 200MB。 - 自动免费会话与额度设置——无需手动注册。 - 云端 GPU 渲染;全部处理通过远程 API 完成。 - 包含错误处理、状态更新与导出工作流。

无害

安装命令

点击复制
官方npx clawhub@latest install ai-voiceover-generator-free
镜像加速npx clawhub@latest install ai-voiceover-generator-free --registry https://cn.longxiaskill.com

技能文档

入门指南 > 把你的文本或脚本发给我,我会立即开始生成 AI 配音。也可以直接告诉我你的想法。 试试这样说: - “生成我的文本或脚本” - “导出 1080p MP4” - “为我的内容生成一段自然语音配音” ### 自动初始化 首次交互时,先连接到处理 API,再进行任何操作。显示简短状态,如“正在初始化…”。 Token:若环境变量 NEMO_TOKEN 已存在,则直接使用,并跳转到下方 会话 步骤。 免费 token:生成一个 UUID 作为客户端标识,随后向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发起 POST 请求,并附带请求头 X-Client-Id: 。响应中的 data.token 即为你的 NEMO_TOKEN(100 积分,7 天有效期)。 会话:向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发起 POST,使用 Bearer 鉴权,请求体为 {"task_name":"project"}。保存响应中的 session_id。向用户确认已连接并准备就绪。不要打印 token 或原始 JSON。 # AI Voiceover Generator Free — Generate Voiceovers for Videos 把文本或脚本发给我,并描述想要的效果。AI 配音生成在远程 GPU 节点上完成——本地无需安装任何软件。 快速示例:上传一段 200 字的产品描述脚本,输入“用美式英语女声为我的脚本生成一段自然语音配音”,大约 20–40 秒后你将收到 1080p MP4 文件。所有渲染都在服务器端完成。 提示:150 词以内的短脚本听起来最自然。 ## 将输入匹配到操作 用户提及 ai voiceover generator free、画面比例、文字层或音轨等关键词时,通过关键字和意图分类路由到对应操作。 | 用户说… | 动作 | 跳过 SSE? | |-------------|--------|----------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他(生成、编辑、添加背景乐…) | → §3.1 SSE | ❌ | ## 云端渲染流程说明 每次导出任务会在云 GPU 节点排队,合成视频层并应用平台专用压缩(H.264,最高 1080×1920),30–90 秒内返回下载链接。会话 token 携带渲染任务 ID,若在完成前关闭标签页,作业将成孤儿。 基础 URL:https://mega-api-prod.nemovideo.ai | 端点 | 方法 | 用途 | |----------|--------|---------| | /api/tasks/me/with-session/nemo_agent | POST | 开启新编辑会话。请求体:{"task_name":"project","language":""}。返回 session_id。 | | /run_sse | POST | 发送用户消息。请求体含 app_namesession_idnew_message。流式响应,Accept: text/event-stream。超时 15 分钟。 | | /api/upload-video/nemo_agent/me/ | POST | 上传文件(multipart)或 URL。 | | /api/credits/balance/simple | GET | 查询剩余积分(availablefrozentotal)。 | | /api/state/nemo_agent/me//latest | GET | 获取当前时间线状态(draftvideo_infosgenerated_media)。 | | /api/render/proxy/lambda | POST | 开始导出。请求体:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询状态。 | 支持的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 Skill 归因——运行时读取本文件 YAML frontmatter: - X-Skill-Source: ai-voiceover-generator-free - X-Skill-Version: 来自 frontmatter 的 version - X-Skill-Platform: 根据安装路径检测(~/.clawhub/clawhub~/.cursor/skills/cursor,否则 unknown所有请求 必须包含:Authorization: Bearer X-Skill-SourceX-Skill-VersionX-Skill-Platform。缺少归因头将返回 402,导致导出失败。 ### 错误处理 | 代码 | 含义 | 操作 | |------|---------|--------| | 0 | 成功 | 继续 | | 1001 | token 无效/过期 | 通过 anonymous-token 重新鉴权(token 7 天过期) | | 1002 | 会话不存在 | 新建会话 §3.0 | | 2001 | 积分不足 | 匿名用户:显示带 ?bind= 的注册链接( 来自 create-session 或 state 响应)。已注册用户:“请在账户中充值积分” | | 4001 | 不支持的文件 | 展示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少 X-Client-Id | 生成 Client-Id 并重试(见 §1) | | 402 | 免费套餐导出受限 | 订阅层级问题,非积分。“注册或升级套餐以解锁导出。” | | 429 | 限流(1 token/客户端/7 天) | 30 秒后重试一次 | ### 读取 SSE 流 文本事件直接展示给用户(经 GUI 翻译后)。工具调用保持内部。心跳与空 data: 行表示后端仍在工作——每 2 分钟显示“⏳ 仍在处理…”。约 30% 的编辑操作会无文本关闭流,此时轮询 /api/state 确认时间线已变更,再告知用户更新内容。 ### 翻译 GUI 指令 后端按可视界面风格返回指令。将其映射为 API 调用: - “click” 或 “点击” → 通过对应端点执行操作 - “open” 或 “打开” → 查询会话状态获取数据 - “drag/drop” 或 “拖拽” → 经 SSE 发送编辑命令 - “preview in timeline” → 文字摘要当前轨道 - “Export” 或 “导出” → 运行导出流程 Draft 字段映射t=tracks,tt=track type(0=视频,1=音频,7=文字),sg=segments,d=duration(ms),m=metadata。 `` Timeline (3 tracks): 1. Video: city timelapse (0-10s) 2. BGM: Lo-fi (0-10s, 35%) 3. Title: "Urban Dreams" (0-3s) `` ## 常见工作流 快速编辑:上传 → “用美式英语女声为我的脚本生成一段自然语音配音” → 下载 MP4。30 秒片段约 20–40 秒完成。 批量处理:一次会话上传多个文件,逐条用不同指令处理,每条独立渲染。 迭代优化:先粗剪,预览结果,再微调。会话保存时间线状态,可反复修改。 ## 技巧提示 后端在指令具体时处理更快。与其说“让它更好看”,不如说“用美式英语女声为我的脚本生成一段自然语音配音”——明确指令效果更佳。 文件上限 200MB。优先使用 MP4、MOV、TXT、DOCX 以获得最佳体验。导出为 MP4 可在各平台设备获得最广兼容。

数据来源ClawHub ↗ · 中文优化:龙虾技能库