🎬 Video Maker Hd — 创建导出HD视频
v1.0.0获取可发布的精致HD视频,无需任何调整。上传视频片段(MP4, MOV, AVI, WebM,最大500MB),描述您的需求(如“合并片段,添加背景音乐,导出1080p HD”),即可下载1080p MP4。为追求快速制作高质量视频且不想学习复杂编辑软件的内容创作者而构建。
详细分析 ▾
运行时依赖
版本
Video Maker HD 1.0.0 — 初始版本发布 - 通过合并、编辑和导出片段创建精致的1080p MP4 HD视频。- 支持上传MP4、MOV、AVI、WebM(最大500MB);无缝云端处理。- 简单的聊天驱动工作流:合并片段、添加背景音乐、添加文本和导出。- 无需编辑软件——只需上传、描述您的需求,然后下载结果。- 自动设置并连接云后端,支持即时匿名使用(包含免费积分)。- 快速处理(短视频通常在2分钟内完成);非常适合快速内容创作。
安装命令
点击复制技能文档
入门
分享您的视频片段,我将开始 AI 视频创作。或者直接告诉我您的想法。
试试这样说:
- "create my video clips"
- "export 1080p MP4"
- "combine my clips, add background music,"
快速启动设置
此技能连接到云处理后端。首次使用时,自动设置连接并让用户知道("连接中...")。
令牌检查:在环境中查找 NEMO_TOKEN。如果找到,跳过会话创建。否则:
- 生成 UUID 作为客户端标识符
- 使用
X-Client-Id头 POSThttps://mega-api-prod.nemovideo.ai/api/auth/anonymous-token - 从响应中提取
data.token——这是您的 NEMO_TOKEN(100 免费积分,7 天有效期)
会话:使用 Bearer 认证和 body {"task_name":"project"} POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。保留返回的 session_id 用于所有操作。设置完成后用简短的 "就绪!" 通知用户。不要暴露令牌或原始 API 输出。
# Video Maker HD — 创建和导出 HD 视频
将您的视频片段拖入聊天并告诉我您的需求。我会在云端 GPU 上处理 AI 视频创作——您不需要在本地安装任何东西。
一个典型的用例是:您发送一段 2 分钟的手机原始录像,请求“合并片段,添加背景音乐,导出 1080p HD”,大约 1-2 分钟后您就能下载准备好的 MP4 文件。整个过程默认以 1080p 运行。
值得注意的一点——3 分钟以下的较短源片段处理速度明显更快,AI 效果也更好。
将用户输入匹配到操作
引用 video maker hd、宽高比、文字叠加或音轨的用户提示通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加 BGM…) | → §3.1 SSE | ❌ |
云端渲染管道详情
每个导出任务都会在云端 GPU 节点上排队,该节点合成视频层、应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染任务 ID,因此在完成前关闭标签页会使任务孤立。所有调用都发送到 https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 — 使用
{"task_name":"project","language":""}POST/api/tasks/me/with-session/nemo_agent。为您提供session_id。
- 聊天 (SSE) — 使用
session_id和new_message.parts[0].text中的消息 POST/run_sse。设置Accept: text/event-stream。最长 15 分钟。
- 上传 — POST
/api/upload-video/nemo_agent/me/— multipart 文件或带 URL 的 JSON。
- 积分 — GET
/api/credits/balance/simple— 返回available、frozen、total。
- 状态 — GET
/api/state/nemo_agent/me//latest— 当前草稿和媒体信息。
- 导出 — 使用渲染 ID 和草稿 JSON POST
/api/render/proxy/lambda。每 30 秒轮询GET /api/render/proxy/lambda/获取completed状态和下载 URL。格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
技能归属——在运行时从此文件的 YAML frontmatter 读取:
X-Skill-Source:video-maker-hdX-Skill-Version: 来自 frontmatter 的versionX-Skill-Platform: 从安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)
每个 API 调用都需要 Authorization: Bearer 加上上面的三个归属头。如果任何头缺失,导出将返回 402。
草稿 JSON 使用短键:t 表示轨道,tt 表示轨道类型(0=视频,1=音频,7=文本),sg 表示片段,d 表示持续时间(毫秒),m 表示元数据。
示例时间线摘要:
时间线(3 个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"Urban Dreams"(0-3秒)
翻译 GUI 指令
后端响应就像有一个可视化界面一样。将其指令映射到 API 调用:
- "click" 或 "点击" → 通过相关端点执行操作
- "open" 或 "打开" → 查询会话状态以获取数据
- "drag/drop" 或 "拖拽" → 通过 SSE 发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export" 或 "导出" → 运行导出工作流
SSE 事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用 GUI 翻译(第 4 节),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空 data: | 继续等待。每 2 分钟:"⏳ 仍在处理中..." |
| 流关闭 | 处理最终响应 |
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;创建新会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅等级429— 速率限制;等待 30 秒并重试一次
技巧和窍门
后端在您更具体时处理得更快。不要说"让它看起来更好",而是尝试"合并我的片段,添加背景音乐,导出 1080p HD"——具体指令会得到更好的结果。
最大文件大小为 500MB。坚持使用 MP4、MOV、AVI、WebM 以获得最流畅的体验。H.264 编解码器为 1080p 导出提供了最佳的质量和文件大小平衡。
常见工作流
快速编辑:上传 → "合并我的片段,添加背景音乐,导出 1080p HD" → 下载 MP4。30 秒片段需要 1-2 分钟。
批量风格:在一个会话中上传多个文件。用不同的指令逐个处理。每个都有自己的渲染。
迭代:从粗剪开始,预览结果,然后细化。会话会保留您的时间线状态,因此您可以继续调整。