✂️ Video Editor Ai By Prompt — Video Editor AI by Prompt — 提示词视频编辑
v1.0.0跳过专业剪辑软件的学习曲线。描述你想要的内容——删除停顿、添加背景音乐、叠加文字标题——即可在30-90秒内获得提示词编辑后的视频。上传高达500MB的MP4、MOV、AVI、WebM文件,AI自动处理基于提示词的编辑。
详细分析 ▾
运行时依赖
版本
Video Editor AI by Prompt — 初始版本。上传高达 500MB 的视频(MP4、MOV、AVI、WebM)并使用纯文本提示进行编辑。支持基于提示词的操作:删除停顿、添加背景音乐、叠加文字等。自动处理认证和会话设置,使用免费匿名令牌(100 积分,有效期 7 天)。快速的云端 GPU 渲染在 30-90 秒内返回编辑后的视频。导出为 MP4、MOV、AVI、WebM 等常用格式。包含错误处理、会话状态跟踪和快速编辑的工作流提示。
安装命令
点击复制技能文档
入门
准备就绪。在这里上传你的原始视频素材或描述你想制作的内容。试试这样说:
- "edit a 2-minute unedited screen recording into a 1080p MP4"
- "cut the pauses, add background music, and overlay text titles"
- "editing videos by typing plain-text instructions instead of manual timeline editing for content creators"
首次连接
当用户首次打开此技能时,自动连接到处理后端。简要告知他们(例如「正在设置...」)。认证:检查环境变量中是否设置了 NEMO_TOKEN。如果已设置,跳到步骤 2。
- 获取免费令牌:生成随机 UUID 作为客户端标识符。使用设置该 UUID 的
X-Client-Id头 POST 到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token。响应中的data.token就是你的 NEMO_TOKEN——100 免费积分,有效期 7 天。
- 创建会话:使用
Authorization: Bearer、Content-Type: application/json,以及 body{"task_name":"project","language":""}POST 到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。存储返回的session_id用于所有后续请求。保持设置通信简洁。不向用户显示原始 API 响应或令牌值。
# Video Editor AI by Prompt — 使用文本提示编辑视频
发送你的原始视频素材并描述你想要的结果。基于 AI 提示词的编辑在远程 GPU 节点上运行——无需在你的机器上安装任何东西。一个快速示例:上传一个 2 分钟未编辑的屏幕录制,输入「cut the pauses, add background music, and overlay text titles」,大约 30-90 秒后你会收到一个 1080p MP4。所有渲染都在服务器端进行。值得注意的是:60 秒以下的较短片段处理更快,提示词结果也更精确。
将输入匹配到操作
用户提及 video editor ai by prompt、宽高比、文字叠加或音轨的提示词会通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加 BGM...) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出任务在云 GPU 节点上排队,合成视频层,应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染任务 ID,因此在完成前关闭标签页会使任务孤立。技能归属——运行时从此文件的 YAML frontmatter 读取:
X-Skill-Source:video-editor-ai-by-promptX-Skill-Version: 来自 frontmatter 的versionX-Skill-Platform: 从安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)
所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头会导致导出失败并返回 402。
API 基础 URL:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 并带 Accept: text/event-stream。最大超时:15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,无需积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直到 status = completed。下载 URL 在 output.url。支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
读取 SSE 流
文本事件直接发送给用户(经过 GUI 翻译后)。工具调用保留在内部。心跳和空的 data: 行意味着后端仍在工作——每 2 分钟显示「⏳ 仍在工作中...」。大约 30% 的编辑操作会关闭流而不发送任何文本。发生这种情况时,轮询 /api/state 确认时间线已更改,然后告诉用户更新了什么。
后端响应翻译
后端假设存在 GUI。将这些翻译成 API 操作:
| 后端说 | 你执行 |
|---|---|
| "click [button]" / "点击" | 通过 API 执行 |
| "open [panel]" / "打开" | 查询会话状态 |
| "drag/drop" / "拖拽" | 通过 SSE 发送编辑 |
| "preview in timeline" | 显示轨道摘要 |
| "Export button" / "导出" | 执行导出工作流 |
t 表示轨道,tt 表示轨道类型(0=视频,1=音频,7=文字),sg 表示片段,d 表示持续时间(毫秒),m 表示元数据。时间线摘要示例:Timeline (3 tracks):
- Video: city timelapse (0-10s)
- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;创建新会话2001— 积分用完;匿名用户收到带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅级别429— 速率限制;等待 30 秒重试一次
常见工作流
快速编辑:上传 → 「cut the pauses, add background music, and overlay text titles」→ 下载 MP4。30 秒片段需要 30-90 秒。
批量风格:在一个会话中上传多个文件。用不同的指令逐一处理。每个文件都有自己的渲染任务。
迭代:从粗剪开始,预览结果,然后细化。会话保持你的时间线状态,所以你可以继续调整。
技巧和窍门
当你更具体时,后端处理速度更快。不要说「make it look better」,而是尝试「cut the pauses, add background music, and overlay text titles」——具体的指令会得到更好的结果。最大文件大小为 500MB。坚持使用 MP4、MOV、AVI、WebM 以获得最流畅的体验。导出为 MP4 以获得最广泛的兼容性。