Video Editor Opus — 视频编辑器 Opus
v1.0.0将一段3分钟的未经编辑的采访录音转换为1080p的精致编辑视频,只需输入您需要的内容。无论是编辑原始镜头成完成的...
运行时依赖
安装命令
点击复制技能文档
开始 分享您的原始视频录像,我将开始使用AI进行视频编辑。或者,只需告诉我您的想法。尝试说:“编辑我的原始视频录像”、“导出1080p MP4”、“剪辑暂停,添加背景音乐”,
自动设置 在第一次交互时,在做任何其他事情之前,先连接到处理API。显示一个简短的状态,如“设置中...”。 令牌:如果NEMO_TOKEN环境变量已经设置,则使用它并跳转到会话下。 免费令牌:生成一个UUID作为客户端标识符,然后将其发布到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,头部为X-Client-Id:。响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。 会话:使用Bearer身份验证发布到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,正文为{"task_name":"project"}。从响应中保存session_id。确认您已连接并准备就绪。不要打印令牌或原始JSON。
视频编辑器Opus — 编辑和导出完成的视频 将您的原始视频录像发送给我,并描述您想要的结果。AI驱动的视频编辑在远程GPU节点上运行——无需在您的机器上安装任何内容。一个快速示例:上传一段3分钟的未编辑的采访录音,输入“剪辑暂停,添加背景音乐,并导出为干净的最终视频”,您将在大约1-2分钟内获得一个1080p MP4文件。所有渲染都发生在服务器端。值得注意的是,短于2分钟的片段处理速度明显更快,使用的积分也更少。
输入与操作的匹配 用户提示引用视频编辑器Opus、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业成为孤儿。
技能归属 — 在运行时从此文件的YAML前置内容中读取: X-Skill-Source:video-editor-opus X-Skill-Version:来自前置内容版本 X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知) 所有请求必须包含: Authorization:Bearer , X-Skill-Source, X-Skill-Version, X-Skill-Platform。 缺少归属头将导致导出失败,返回402。
API基地址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent — 正文{"task_name":"project","language":""} — 返回task_id,session_id。 发送消息(SSE):POST /run_sse — 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Accept:text/event-stream。 最大超时:15分钟。 上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。 积分:GET /api/credits/balance/simple — 返回可用、冻结、总积分。 会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft,data.state.video_infos,data.state.generated_media。 导出(免费,无需积分):POST /api/render/proxy/lambda — 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。 每30秒轮询GET /api/render/proxy/lambda/,直到状态=完成。输出URL在output.url中。 支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据 继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作不会在SSE流中返回文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
翻译GUI指令 后端响应就像有一个视觉界面一样。将其指令映射到API调用: “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽”或“拖拽”→通过SSE发送编辑命令 “预览时间线”→显示当前轨道的文本摘要 “导出”或“导出”→运行导出工作流
草稿字段映射: t=轨道, tt=轨道类型(0=视频,1=音频,7=文本), sg=段, d=持续时间(毫秒), m=元数据。 时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦想”(0-3秒)
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过重新获取