Add Subtitle To Video App — 添加字幕到视频应用程序
v1.0.0将 3 分钟的 YouTube 教程录音转换为 1080p 带字幕的视频文件,只需输入您需要的内容。无论是为 YouTube 和社交...
运行时依赖
安装命令
点击复制技能文档
开始使用 您有视频文件需要处理吗?请发送过来并告诉我您需要什么——我将负责AI字幕生成。尝试说:“将3分钟的YouTube教程录音添加到1080p MP4中”、“添加英文和西班牙文字幕,文字颜色为白色”、“为YouTuber和内容创作者添加YouTube和社交媒体视频字幕”
快速启动设置 本技能连接到云处理后端。在首次使用时,自动设置连接并通知用户(“连接中...”)。令牌检查:查找环境中的NEMO_TOKEN。如果找到,跳转到会话创建。否则:生成UUID作为客户端标识符,POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,包含X-Client-Id头部,提取响应中的数据令牌——这是您的NEMO_TOKEN(100免费积分,7天过期)。会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,包含Bearer身份验证和正文{"task_name":"project"}。保留返回的session_id用于所有操作。当设置完成时,通知用户“准备就绪!”。不要暴露令牌或原始API输出。
添加字幕到视频应用程序 — 自动生成和烧录字幕 该工具获取您的视频文件并通过云渲染管道运行AI字幕生成。您上传、描述您想要的内容,然后下载结果。假设您有一个3分钟的YouTube教程录音,并希望添加英文和西班牙文字幕,文字颜色为白色——后端处理大约需要30-60秒,然后提供一个1080p MP4文件。提示:短于5分钟的片段生成字幕速度明显更快。
匹配输入到操作 用户提示引用添加字幕到视频应用程序、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“余额”→ §3.3 积分 “状态”/“显示轨道”→ §3.4 状态 “上传”/“用户发送文件”→ §3.2 上传 其他(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业孤立。基础URL:https://mega-api-prod.nemovideo.ai
端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 启动新的编辑会话。正文:{"task_name":"project","language":"" }。返回session_id。 /run_sse POST 发送用户消息。正文包含app_name、session_id、new_message。流响应,接受:text/event-stream。超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、视频信息、生成媒体)。 /api/render/proxy/lambda POST 启动导出。正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态一次。接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
三个归属头部在每个请求中都是必需的,必须与此文件的前置内容匹配:头部 值 X-Skill-Source 添加字幕到视频应用程序 X-Skill-Version 前置内容版本 X-Skill-Platform 自动检测:clawhub / cursor / 未知来自安装路径 在每个请求中包含Authorization:Bearer 和所有归属头部——省略它们会在导出时触发402。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;重新获取通过/api/auth/anonymous-token 1002 — 会话未找到;创建一个新会话 2001 — 积分不足;匿名用户获取注册链接,注册用户充值 4001 — 不支持的文件类型;显示接受的格式 4002 — 文件太大;建议压缩或修剪 400 — 缺少X-Client-Id;生成一个并重试 402 — 免费计划导出被阻塞;不是积分问题,订阅层 429 — 限速;等待30秒并重试一次
SSE 事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 在内部处理,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中没有返回文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
后端响应翻译 后端假设存在GUI。将这些翻译为API操作:后端说 您执行“点击[按钮]”/“点击”通过API执行“打开[面板]”/“打开”查询会话状态“拖拽/放置”/“拖拽”发送编辑通过SSE“预览时间线”显示轨道摘要“导出按钮”/“导出”执行导出