运行时依赖
安装命令
点击复制技能文档
开始 分享您的文本提示,我将开始使用AI生成视频。或者,只需告诉我您在想什么。尝试说:“生成我的文本提示”、“导出1080p MP4”、“从此生成30秒视频” 连接 在处理任何用户请求之前,建立与后端API的连接。显示简短的状态,如“连接中...”。如果环境中有NEMO_TOKEN,则直接使用它并创建一个会话。否则,获取一个免费的启动令牌: 生成UUID作为客户端标识符 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,包含X-Client-Id头 响应包含一个有效期为7天的100个免费积分的令牌 —— 将其用作NEMO_TOKEN 然后,通过向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,创建一个会话,包含Bearer授权和{"task_name":"project","language":"en"}的正文。 响应中的session_id对于所有后续请求都是必要的。 告诉用户您已经准备好。 将技术细节保留在聊天之外。 视频生成器 免费API密钥 —— 通过免费API生成视频 将您的文本提示发送给我,并描述您期望的结果。 AI视频生成在远程GPU节点上运行 —— 您的机器上无需安装任何内容。 一个快速示例:上传一个产品演示场景的简短文本描述,输入“使用免费API密钥从此脚本生成30秒视频”,您将在大约1-2分钟内以1080p MP4格式获得结果。 所有渲染都发生在服务器端。 值得注意的是,具有清晰场景描述的较短提示会产生更准确的结果。 输入与操作的匹配 引用视频生成器免费API密钥、长宽比、文本叠加或音频轨道的用户提示通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用特定于平台的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。 基础URL:https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。 正文:{"task_name":"project","language":""}}。 返回session_id。 /run_sse POST 发送用户消息。 正文包含app_name、session_id和new_message。 使用Accept:text/event-stream流式响应。 超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、视频信息、生成的媒体)。 /api/render/proxy/lambda POST 开始导出。 正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。 每30秒轮询一次状态。 接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 头部来自此文件的YAML前置内容。 X-Skill-Source是video-generator-free-api-key,X-Skill-Version来自版本字段,X-Skill-Platform从安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则为未知)。 每个API调用都需要Authorization:Bearer ,以及上述三个归属头。 如果缺少任何头部,导出将返回402。 错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取一个带有?bind=的注册链接,注册用户补充积分 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个并重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅层 429 —— 限速;等待30秒并重试一次 读取SSE流 文本事件直接发送给用户(在GUI翻译后)。 工具调用保持内部。 心跳和空数据:行意味着后端仍在工作 —— 每2分钟显示“⏳仍在工作...”。 大约30%的编辑操作在没有任何文本的情况下关闭流。 当这种情况发生时,轮询/api/state以确认时间线已更改,然后告诉用户什么已更新。 后端响应翻译 后端假设存在GUI。 将这些翻译为API操作: 后端说 您做 “点击[按钮]”/“点击” 执行通过API “打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “预览时间线” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流 草稿字段映射:t=tra