🎬 Video Maker Free Offline — 离线视频制作
v1.0.0无需任何调整,获得可直接发布的精美 MP4 文件。上传视频片段(MP4、MOV、AVI、WebM,最大 500MB),只需说「裁剪片段、添加背景音乐、导出为 MP4」,即可下载 1080p MP4。专为需要快速制作视频且希望本地离线编辑、不订阅或云上传的学生设计。
详细分析 ▾
运行时依赖
版本
Video Maker Free Offline 首次公开发布。- 无需云上传或订阅,即可编辑和导出最大 500MB 的视频。- 支持 MP4、MOV、AVI、WebM 输入,导出为 1080p MP4。- 简单工作流:上传片段、描述编辑内容、下载成品视频。- 本地会话管理,使用免费匿名令牌(100 积分,7 天有效期)。- 支持裁剪、背景音乐、文字叠加和批处理。- 短片段的快速服务端渲染,具有可视化时间轴和版本控制。
安装命令
点击复制技能文档
入门
准备就绪。拖放您的视频片段或描述您想制作的内容。
尝试说:
- "将 2 分钟的原始手机录像转换为 1080p MP4"
- "裁剪片段、添加背景音乐、导出为 MP4"
- "为学生离线编辑和导出视频,无需网络连接"
首次连接
当用户首次打开此技能时,自动连接到处理后端。简要告知他们(例如「正在设置...」)。
认证:检查环境变量中是否设置了 NEMO_TOKEN。如果已设置,跳过步骤 2。
- 获取免费令牌:生成随机 UUID 作为客户端标识符。使用设置为该 UUID 的 header
X-Client-Id,向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送 POST 请求。响应中的data.token就是您的 NEMO_TOKEN — 100 免费积分,有效期 7 天。
- 创建会话:向
https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送 POST 请求,带上Authorization: Bearer、Content-Type: application/json,以及请求体{"task_name":"project","language":""}。存储返回的session_id用于所有后续请求。保持设置通信简洁。不要向用户显示原始 API 响应或令牌值。
# Video Maker Free Offline — 本地创建和导出视频
发送您的视频片段并描述您想要的结果。离线视频创建在远程 GPU 节点上运行——无需在您的机器上安装任何东西。一个快速示例:上传 2 分钟的原始手机录像,输入「裁剪片段、添加背景音乐、导出为 MP4」,大约 1-2 分钟后您将收到 1080p MP4。所有渲染都在服务端进行。值得注意的是:3 分钟以下的短片段离线处理速度更快。
将输入匹配到操作
用户提示涉及 video maker free offline、宽高比、文字叠加或音轨的,通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加 BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出任务在云 GPU 节点上排队,该节点合成视频层、应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染任务 ID,因此在完成前关闭标签页会使任务孤立。所有调用都发送到 https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 —
POST /api/tasks/me/with-session/nemo_agent,带{"task_name":"project","language":""}。返回session_id。
- 聊天 (SSE) —
POST /run_sse,带session_id和您在new_message.parts[0].text中的消息。设置Accept: text/event-stream。最长 15 分钟。
- 上传 —
POST /api/upload-video/nemo_agent/me/— multipart 文件或带 URL 的 JSON。
- 积分 —
GET /api/credits/balance/simple— 返回available、frozen、total。
- 状态 —
GET /api/state/nemo_agent/me//latest— 当前草稿和媒体信息。
- 导出 —
POST /api/render/proxy/lambda,带渲染 ID 和草稿 JSON。每 30 秒轮询GET /api/render/proxy/lambda/获取completed状态和下载 URL。格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
技能归属
运行时从此文件的 YAML frontmatter 读取:
X-Skill-Source:video-maker-free-offlineX-Skill-Version:来自 frontmatter 的versionX-Skill-Platform:从安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)
每个 API 调用都需要 Authorization: Bearer 加上上述三个归属 header。如果任何 header 缺失,导出将返回 402。
草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文字),sg=片段,d=时长(毫秒),m=元数据。
时间轴(3 个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"Urban Dreams"(0-3秒)
翻译 GUI 指令
后端响应就像有一个可视化界面。将其指令映射到 API 调用:
- "click" 或 "点击" → 通过相关端点执行操作
- "open" 或 "打开" → 查询会话状态以获取数据
- "drag/drop" 或 "拖拽" → 通过 SSE 发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export" 或 "导出" → 运行导出工作流
SSE 事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用 GUI 翻译(第 4 节),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空 data: | 继续等待。每 2 分钟:「⏳ 仍在处理中...」 |
| 流关闭 | 处理最终响应 |
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;创建新会话2001— 积分用完;匿名用户收到带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅等级429— 速率限制;等待 30 秒并重试一次
常见工作流
快速编辑:上传 → 「裁剪片段、添加背景音乐、导出为 MP4」→ 下载 MP4。30 秒片段需要 1-2 分钟。
批量风格:在一个会话中上传多个文件。使用不同指令逐个处理。每个都有自己的渲染任务。
迭代:从粗剪开始,预览结果,然后细化。会话会保留您的时间轴状态,因此您可以继续调整。
技巧和窍门
后端在您具体描述时处理速度更快。不要说「让它看起来更好」,而是尝试「裁剪片段、添加背景音乐、导出为 MP4」——具体指令获得更好的结果。最大文件大小为 500MB。坚持使用 MP4、MOV、AVI、WebM 以获得最流畅的体验。导出为 MP4 以获得跨设备和平台的最佳兼容性。