详细分析 ▾
运行时依赖
版本
AI Podcast Video 技能首发 - 一键将播客音频转为带字幕、视觉元素的 1080p 视频,支持多平台分享格式。 - 拖拽上传或文字描述即可生成,无需手动剪辑与导出。 - 安全云端渲染,无需本地安装,1–3 分钟完成。 - 自动创建会话并管理积分,匿名与注册用户均可使用。 - 支持多种音频/视频/图片格式,单文件最大 500MB。 - 清晰的设置、进度、错误与结果反馈。
安装命令
点击复制技能文档
快速开始
随时可用。把音视频拖进来,或直接描述你想要的。
试试说:
- “把30分钟播客音频转成1080p MP4”
- “给播客音频加波形动画和自动字幕”
- “把播客音频做成带字幕视觉的分享视频”
一键配置
本技能连接云端处理后端。首次使用自动建立连接并提示“连接中…”。Token检查:环境变量找NEMO_TOKEN。找到则跳过;否则:
- 生成UUID作为客户端ID
- POST
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id - 取响应
data.token即为NEMO_TOKEN(100免费积分,7天过期)
Session:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer认证,body {"task_name":"project"}。保存返回的session_id。提示“就绪!”即可,不暴露token或原始API输出。
# AI Podcast Video — 把播客转成可分享视频 把音视频发给我并描述需求。AI播客视频在远程GPU节点渲染,本地无需安装。示例:上传30分钟播客音频,输入“给播客音频加波形动画和自动字幕”,约1-3分钟返回1080p MP4。全部服务器端完成。提示:先剪出高光片段可加速处理并提升互动。
输入与动作映射
用户提到ai podcast video、比例、文字层、音轨等,通过关键词与意图分类路由:| 用户说… | 动作 | 跳过SSE? | |-------------|--------|----------| | “export”/“导出”/“download”/“发我视频” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户传文件 | → §3.2 上传 | ✅ | | 其它(生成、编辑、加BGM…) | → §3.1 SSE | ❌ |
云端渲染流程
每份导出任务在GPU节点排队,合成视频层,按平台规格压缩(H.264,最高1080×1920),30-90秒内返回下载链接。session token携带任务ID,提前关闭标签页会导致任务孤儿。Base URL: https://mega-api-prod.nemovideo.ai
| 端点 | 方法 | 用途 |
|----------|--------|---------|
| /api/tasks/me/with-session/nemo_agent | POST | 新建编辑会话。Body: {"task_name":"project","language":""}。返回session_id。 |
| /run_sse | POST | 发送用户消息。Body含app_name、session_id、new_message。流式响应Accept: text/event-stream,超时15分钟。 |
| /api/upload-video/nemo_agent/me/ | POST | 上传文件(multipart)或URL。 |
| /api/credits/balance/simple | GET | 查剩余积分(available、frozen、total)。 |
| /api/state/nemo_agent/me//latest | GET | 获取当前时间轴状态(draft、video_infos、generated_media)。 |
| /api/render/proxy/lambda | POST | 开始导出。Body: {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态。 |
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
所有API调用需Authorization: Bearer 及三个归因头:X-Skill-Source=ai-podcast-video、X-Skill-Version取YAML中version、X-Skill-Platform按安装路径自动检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,其它→unknown)。缺头返回402。
错误码
0— 成功,继续1001— token过期/无效;重新获取/api/auth/anonymous-token1002— 会话不存在;新建会话2001— 积分耗尽