Remaker Ai — Remaker AI
v1.0.0利用此技能重新制作现有的视频片段,生成新的视频文件。支持MP4、MOV、AVI、WebM格式,文件大小最多500MB。内容创作者使用它来重新制作或重新设计现有的视频,使用AI处理,云端GPU处理时间为1-2分钟,输出1080p MP4文件。
运行时依赖
安装命令
点击复制技能文档
开始 分享您的现有视频片段,我将开始使用AI视频重制。或者,只需告诉我您在想什么。尝试说:“重制我的现有视频片段”、“导出1080p MP4”、“用不同的风格重制这个视频” 连接 在处理任何用户请求之前,建立与后端API的连接。显示一个简短的状态,如“连接中...”。如果环境中有NEMO_TOKEN,则直接使用它并创建一个会话。否则,获取一个免费的启动令牌: 生成一个UUID作为客户端标识符 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,包含X-Client-Id头 响应中包含一个有效期为7天的100个免费积分的令牌——将其用作NEMO_TOKEN 然后,通过向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,创建一个会话,包含Bearer授权和{"task_name":"project","language":"en"}的正文。 响应中的session_id对于所有后续请求都是必要的。 告诉用户您已经准备好。 保持技术细节在聊天之外。 Remaker AI — 重制和导出风格化视频 该工具获取您的现有视频片段,并通过云渲染管道运行AI视频重制。您上传、描述您想要的内容,然后下载结果。 假设您有一个2分钟的YouTube视频片段,并希望用不同的风格或更新的视觉效果重制这个视频——后端处理大约需要1-2分钟,然后提供一个1080p MP4。 提示:短于60秒的源片段可以产生更快和更一致的重制结果。 输入与操作匹配 用户提示引用remaker ai、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。 所有调用都发送到https://mega-api-prod.nemovideo.ai。 主要端点: 会话 — 使用{"task_name":"project","language":""}的正文向/api/tasks/me/with-session/nemo_agent发送POST请求。 聊天(SSE)— 使用session_id和您的消息在new_message.parts[0].text中向/run_sse发送POST请求。 上传 — 向/api/upload-video/nemo_agent/me/发送POST请求,包含多部分文件或JSON URL。 积分 — 向/api/credits/balance/simple发送GET请求,返回可用、冻结和总积分。 状态 — 向/api/state/nemo_agent/me//latest发送GET请求,返回当前草稿和媒体信息。 导出 — 向/api/render/proxy/lambda发送POST请求,包含渲染ID和草稿JSON。 轮询GET /api/render/proxy/lambda/每30秒以获取完成状态和下载URL。 格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 技能归属 — 在运行时从此文件的YAML前置内容中读取: X-Skill-Source:remaker-ai X-Skill-Version:从前置内容版本中获取 X-Skill-Platform:从安装路径中检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为未知) 所有请求必须包含: Authorization:Bearer X-Skill-Source X-Skill-Version X-Skill-Platform 缺少归属头将导致导出失败,返回402。 草稿JSON使用短键: t:轨道 tt:轨道类型(0=视频,1=音频,7=文本) sg:段 d:持续时间(毫秒) m:元数据 时间线摘要示例: 时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦想”(0-3秒)