运行时依赖
安装命令
点击复制技能文档
开始 分享您的图像或剪辑,我将开始创建AI视频。或者,只需告诉我您在想什么。尝试说:“创建我的图像或剪辑”、“导出1080p MP4”、“将这些图像组合成30秒的视频”
连接 在处理任何用户请求之前,建立与后端API的连接。显示简短的状态,如“连接中...”。如果环境中存在NEMO_TOKEN,则直接使用它并创建一个会话。否则,获取一个免费的启动令牌:生成一个UUID作为客户端标识符,POST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带有X-Client-Id头。响应包含一个有效期为7天的100免费积分的令牌——将其用作NEMO_TOKEN。然后,通过POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带有Bearer授权和{"task_name":"project","language":"en"}的正文,创建一个会话。响应中的session_id对于所有后续请求都是必要的。告诉用户您已经准备好了。保持技术细节在聊天之外。
视频制作 免费Google — 创建和导出视频 将您的图像或剪辑放入聊天中,并告诉我您需要什么。我将处理基于云GPU的AI视频创建——您不需要在本地安装任何内容。典型的用法是:您发送五张产品照片和一个logo文件,要求将这些图像组合成一个带有音乐和文本叠加的30秒视频,大约30-60秒后,您将得到一个可以下载的MP4文件。整个过程默认以1080p运行。值得注意的一件事是,使用少于10张图像可以将渲染时间控制在一分钟以内。
匹配输入到操作 用户提示中引用的视频制作免费Google、长宽比、文本叠加或音频轨道通过关键字和意图分类被路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。基本URL:https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。正文:{"task_name":"project","language":"" }。返回session_id。 /run_sse POST 发送用户消息。正文包括app_name、session_id、new_message。流响应,Accept:text/event-stream。超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询一次状态。接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
三个属性头在每个请求中都是必需的,并且必须与此文件的前置内容匹配: 头值 X-Skill-Source video-maker-free-google X-Skill-Version frontmatter版本 X-Skill-Platform auto-detect:clawhub / cursor / unknown from install path 在每个请求中包含Authorization:Bearer 和所有属性头——省略它们会在导出时触发402。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 会话未找到;创建一个新会话 2001 — 积分不足;匿名用户获取一个带有?bind=的注册链接,注册用户补充积分 4001 — 不支持的文件类型;显示接受的格式 4002 — 文件太大;建议压缩或修剪 400 — 缺少X-Client-Id;生成一个并重试 402 — 免费计划导出被阻止;不是积分问题,订阅级别 429 — 限速;等待30秒并重试一次
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中没有返回文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
后端响应翻译 后端假设存在GUI。将这些翻译为API操作: 后端说 您执行 “点击[按钮]”/“点击” 执行API “打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “预览在时间线中” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流 草稿JSON