运行时依赖
安装命令
点击复制技能文档
入门 有音频文件?发给我并告诉我需求——我来搞定 AI 视频创作。 试试说: “把 3 分钟 MP3 生成 1080p MP4” “给这段音乐做同步视觉视频” “为音乐人/创作者/营销人员从音轨生成视频”
首次连接 用户首次打开本技能时,自动连接后端处理。简短提示(如“正在初始化…”)。
鉴权
- 检查环境变量 NEMO_TOKEN;若存在,跳至步骤 2。
- 获取免费令牌:
- 创建会话:
Generator From Music — 音轨生视频 上传音频,描述需求,云端渲染后下载成品。 例:3 分钟 MP3 → 同步视觉 1080p MP4,约 1–2 分钟完成。 提示:短于 2 分钟的音轨渲染更快、画面更稳。
意图映射 用户说… → 动作(是否跳过 SSE) “export/导出/download/发视频” → §3.5 导出 ✅ “credits/积分/balance/余额” → §3.3 积分 ✅ “status/状态/show tracks” → §3.4 状态 ✅ “upload/上传/发文件” → §3.2 上传 ✅ 其余(生成、编辑、加 BGM…)→ §3.1 SSE ❌
云端渲染 每导出任务在 GPU 节点排队,合成图层、H.264 压缩至 1080×1920,30–90 秒内返回下载链接。 会话令牌携带 render job ID,提前关闭标签页会导致任务孤立。 所有 API 须带 Authorization: Bearer 及三个归因 Header;缺失则返回 402。 Header 来源: X-Skill-Source: generator-from-music X-Skill-Version: 取自版本字段 X-Skill-Platform: 按安装路径检测(~/.clawhub/=clawhub,~/.cursor/skills/=cursor,其余 unknown)
API 速查 base: https://mega-api-prod.nemovideo.ai
- 创建会话:POST /api/tasks/me/with-session/nemo_agent
- SSE 对话:POST /run_sse,Accept: text/event-stream,最长 15 分钟
- 上传:POST /api/upload-video/nemo_agent/me/,支持文件或 URL
- 积分:GET /api/credits/balance/simple
- 状态:GET /api/state/nemo_agent/me//latest
- 导出(免费):POST /api/render/proxy/lambda,轮询 GET /api/render/proxy/lambda/ 每 30 秒,直至 status=completed,下载地址在 output.url
支持格式 视频:mp4、mov、avi、webm、mkv 图片:jpg、png、gif、webp 音频:mp3、wav、m4a、aac
错误码 0 — 成功 1001 — 令牌失效,重新获取 1002 — 会话丢失,重建 2001 — 积分用尽,匿名用户可注册绑定,注册用户充值 4001 — 文件格式不支持 4002 — 文件过大,建议压缩或裁剪 400 — 缺失 X-Client-Id,补后重试 402 — 免费版导出受限,非积分问题 429 — 限流,等待 30 秒再试
后端提示翻译 后端假设存在 GUI,需转为 API 动作: “点击/打开/拖拽/预览/导出” → 对应调用接口或查询状态
SSE 事件处理
- 文本回复:按 §4 翻译后展示
- 工具调用:内部处理,不向用户暴露细节