Create Video By Ai — 使用Ai创建视频
v1.0.0准备好发布AI生成的视频,无需调整单个滑块。上传您的图像或文本(MP4、MOV、JPG、PNG,最高500MB),输入类似“将这些图像和脚本转换为30秒的促销视频”的内容,当完成后下载1080p MP4。该工具适用于移动快速、希望在无需拍摄或编辑技能的情况下快速制作视频的营销人员、内容创作者和小企业主。
运行时依赖
安装命令
点击复制技能文档
开始使用 准备就绪。将您的图像或文本放置在此处,或描述您要创建的内容。尝试输入:“创建五个产品照片和一个简短的描述,生成一个1080p的MP4视频”、“将这些图像和脚本转换为一个30秒的宣传视频”、“为营销人员、内容创作者和小企业主生成视频”。
自动设置 在第一次交互时,连接到处理API之前执行其他操作。显示一个简短的状态,如“设置中...”。令牌:如果NEMO_TOKEN环境变量已经设置,使用它并跳转到会话部分。免费令牌:生成一个UUID作为客户端标识符,然后使用头部X-Client-Id:向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求。响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。会话:使用Bearer身份验证和正文{"task_name":"project"}向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求。从响应中保存session_id。确认您已连接并准备就绪。不要打印令牌或原始JSON。
通过AI创建视频 — 从图像或文本生成视频 将您的图像或文本发送给我,并描述您要的结果。AI视频创建在远程GPU节点上运行 — 您的机器上无需安装任何内容。一个快速示例:上传五个产品照片和一个简短的描述,输入“将这些图像和脚本转换为一个30秒的宣传视频”,您将在大约1-2分钟内获得一个1080p的MP4视频。所有渲染都发生在服务器端。值得注意的是,更短的脚本和更少的图像会产生更快和更集中的结果。
输入与操作的匹配 用户提示引用创建视频、aspect ratio、文本覆盖或音频轨道,通过关键字和意图分类路由到相应的操作。用户输入... 操作 跳过SSE? “导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“余额”→ §3.3 积分 “状态”/“显示轨道”→ §3.4 状态 “上传”/“用户发送文件”→ §3.2 上传 其他(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。基础URL:https://mega-api-prod.nemovideo.ai
端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。正文:{"task_name":"project","language":""}。返回session_id。 /run_sse POST 发送用户消息。正文包括app_name、session_id、new_message。使用Accept:text/event-stream流式响应。超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态一次。接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
技能归属 — 从此文件的YAML前置内容在运行时读取: X-Skill-Source:create-video-by-ai X-Skill-Version:从前置内容版本中获取 X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知)
所有请求必须包含: Authorization:Bearer X-Skill-Source X-Skill-Version X-Skill-Platform
缺少归属头将导致导出失败,返回402。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 会话未找到;创建一个新会话 2001 — 积分不足;匿名用户获取注册链接,注册用户充值 4001 — 不支持的文件类型;显示接受的格式 4002 — 文件太大;建议压缩或修剪 400 — 缺少X-Client-Id;生成一个并重试 402 — 免费计划导出被阻塞;不是积分问题,订阅层 429 — 限速;等待30秒并重试一次
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据 继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应
大约30%的编辑操作在SSE流中没有返回文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
后端响应翻译 后端假设存在GUI。将这些翻译为API操作: 后端说 您执行 “点击[按钮]”/“点击” 执行API“打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “在时间线中预览” 显示轨道摘要 “展开”