📦 Free Music Video Ai Generator — 免费音乐视频Ai生成器
v1.0.0只需输入您的需求,就可以将3分钟的MP3音轨转换为1080p同步音乐视频。无论是从音频轨道生成视觉音乐视频还是快速...
运行时依赖
安装命令
点击复制技能文档
开始使用 分享您的音频文件,我将开始创建AI音乐视频。或者,只需告诉我您在想什么。尝试说:“生成我的音频文件”、“导出1080p MP4”、“生成带有视觉效果的音乐视频”
连接 在处理任何用户请求之前,建立与后端API的连接。显示简短的状态,如“连接中...”。如果环境中有NEMO_TOKEN,则直接使用它并创建会话。否则,获取一个免费的启动令牌:生成一个UUID作为客户端标识符,POST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带有X-Client-Id头部。响应包括一个有效期为7天的100个免费积分的令牌——将其用作NEMO_TOKEN。然后,通过POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带有Bearer授权和正文{"task_name":"project","language":"en"},创建一个会话。响应中的session_id对于所有后续请求都是必需的。告诉用户您已经准备好。
免费音乐视频AI生成器——将音频转换为音乐视频 该工具获取您的音频文件,并通过云渲染管道运行AI音乐视频创建。您上传,描述您想要的内容,然后下载结果。假设您有一个3分钟的MP3音轨,并希望生成一个带有视觉效果的音乐视频,匹配歌曲的节奏和情绪——后端处理大约需要1-2分钟,并提供一个1080p MP4文件。提示:短于2分钟的音轨处理速度明显更快,适合预览样式。
匹配输入到操作 用户提示引用免费音乐视频AI生成器、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示音轨”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。每个API调用都需要Authorization:Bearer ,以及上述三个属性标头。如果缺少任何标头,导出将返回402。
技能归属——从此文件的YAML前置内容中读取: X-Skill-Source:free-music-video-ai-generator X-Skill-Version:从前置内容版本中获取 X-Skill-Platform:从安装路径中检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为未知)
API基地址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent —正文{"task_name":"project","language":""} —返回task_id,session_id。 发送消息(SSE):POST /run_sse —正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},带有Accept:text/event-stream。 最大超时时间:15分钟。 上传:POST /api/upload-video/nemo_agent/me/ —文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。 积分:GET /api/credits/balance/simple —返回可用、冻结、总积分。 会话状态:GET /api/state/nemo_agent/me//latest —关键字段:data.state.draft,data.state.video_infos,data.state.generated_media。 导出(免费,无需积分):POST /api/render/proxy/lambda —正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/,直到状态=完成。下载URL在output.url中。 支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
错误代码 0 —成功,正常继续 1001 —令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 —会话未找到;创建一个新会话 2001 —积分不足;匿名用户获取一个注册链接,注册用户补充积分 4001 —不支持的文件类型;显示接受的格式 4002 —文件太大;建议压缩或修剪 400 —缺少X-Client-Id;生成一个并重试 402 —免费计划导出被阻塞;不是积分问题,而是订阅层 429 —速率限制;等待30秒并重试一次
翻译GUI指令 后端响应就像有一个视觉界面一样。将其指令映射到API调用: “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽”或“拖拽”→通过SSE发送编辑命令 “预览时间线”→显示当前音轨的文本摘要 “导出”或“导出”→运行导出工作流
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据:保持唤醒