🎬 YouTube Video — AI剪片
v1.0.0上传原始素材,1-2分钟AI自动剪辑成1080p YouTube成片,支持MP4/MOV/AVI/WebM,最大500MB,自然语言指令即可裁剪静音、加字幕、调色导出。
详细分析 ▾
运行时依赖
版本
AI YouTube Video技能首次发布。 - 自动化将原始素材剪辑导出为YouTube成片(支持MP4、MOV、AVI、WebM,最大500MB)。 - 集成Nemo Video云端后端,1-2分钟AI处理,输出1080p MP4。 - 自动身份验证与会话建立;匿名访问送100免费额度。 - 通过自然语言指令完成常见剪辑(裁剪静音、加字幕、优化等)。 - 提供上传、剪辑、导出、状态查询等结构化API动作。 - 支持快速剪辑、批量处理与迭代优化工作流。
安装命令
点击复制技能文档
入门指南
上传你的原始视频素材,我立即开始 AI 视频优化。或者直接告诉我你的想法。试试这样说:
- “edit my raw video footage”
- “export 1080p MP4”
- “trim silences, add subtitles, and optimize”
首次连接
当用户首次打开此技能时,自动连接处理后端。简短提示(如“正在设置…”)。 身份验证:检查环境变量中是否已设置NEMO_TOKEN。若已设置,跳到第 2 步。
- 获取免费 token:生成随机 UUID 作为客户端标识。向
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发起 POST,HeaderX-Client-Id设为该 UUID。响应中的data.token即为 NEMO_TOKEN——赠送 100 积分,有效期 7 天。 - 创建会话:向
https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发起 POST,Header 包含Authorization: Bearer、Content-Type: application/json,Body 为{"task_name":"project","language":""}。保存返回的session_id用于后续请求。
# AI YouTube Video — Edit and Export YouTube Videos 本工具接收你的原始视频素材,通过云端渲染管线进行 AI 视频优化。上传、描述需求、下载成品。 比如你有一段 10 分钟的 YouTube vlog 原始素材,想剪掉静音、加字幕、并优化后上传——后端 1-2 分钟就能给你 1080p MP4。 提示:把片段控制在 5 分钟内,处理速度会明显加快。
输入与动作匹配
用户提及 ai youtube video、aspect ratio、text overlays 或 audio tracks 时,通过关键词和意图分类路由到对应动作。| 用户说… | 动作 | 跳过 SSE? | |---------|------|------------| | “export” / “导出” / “download” / “send me the video” | → §3.5 Export | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 Credits | ✅ | | “status” / “状态” / “show tracks” | → §3.4 State | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 Upload | ✅ | | 其他(generate、edit、add BGM…) | → §3.1 SSE | ❌ |
云端渲染管线详情
每次导出任务排队到云端 GPU 节点,合成视频层,应用平台专用压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,若完成前关闭标签页,任务将成孤儿。 Header 源自本文件 YAML frontmatter:X-Skill-Source 为 ai-youtube-video,X-Skill-Version 取自 version 字段,X-Skill-Platform 根据安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则 unknown)。
所有 API 调用需带 Authorization: Bearer 及上述三个归因 Header,缺失则返回 402。 API 基址:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — Body {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息(SSE):POST /run_sse — Body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Header Accept: text/event-stream。最大超时 15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不扣积分):POST /api/render/proxy/lambda — Body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。轮询 GET /api/render/proxy/lambda/ 每 30 秒一次,直到 status = completed。下载链接位于 output.url。
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
读取 SSE 流
文本事件直接展示给用户(经 GUI 翻译)。工具调用保持内部。心跳与空data: 行表示后端仍在运行——每 2 分钟显示“⏳ Still working...”。约 30% 的编辑操作无文本即结束流,此时轮询 /api/state 确认时间线变更,再告知用户更新内容。 翻译 GUI 指令
后端按可视化界面返回指令,将其映射为 API 调用:- “click” 或 “点击” → 通过对应端点执行动作
- “open” 或 “打开” → 查询会话状态获取数据
- “drag/drop” 或 “拖拽” → 通过 SSE 发送编辑命令
- “preview in timeline” → 以文字摘要展示当前轨道
- “Export” 或 “导出” → 运行导出工作流
Draft JSON 使用短键:t 表示 tracks,tt 表示 track type(0=video,1=audio,7=text),sg 表示 segments,d 表示 duration(毫秒),m 表示 metadata。
时间线摘要示例:
``
Timeline (3 tracks):
Video: city timelapse (0-10s)- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
错误码
0— 成功,继续正常流程1001— token 过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;新建会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户可充值4001— 不支持的文件类型;展示支持格式4002— 文件过大;建议压缩或裁剪400— 缺失X-Client-Id;生成后重试402— 免费套餐导出被阻;非积分问题,属订阅层级429` — 请求频率受限;等待 30 秒后重试一次