📦 Face Swap Video Ai — 人脸交换视频AI
v1.0.0准备好发布的面部交换视频,无需调整单个滑块。上传您的视频片段(MP4、MOV、AVI、WebM,最高500MB),说些类似“swap...”
运行时依赖
安装命令
点击复制技能文档
开始使用 有视频片段需要处理吗?发送过来并告诉我您需要什么——我将处理AI面部交换。尝试说:“将一个30秒的MP4片段与清晰的面部可见交换为1080p MP4”“将此视频中的面部与我的参考照片中的面部交换”“使用AI替换视频中的面部,适用于内容创作者”
快速启动设置 此技能连接到云处理后端。在首次使用时,自动设置连接并通知用户(“连接中...”)。令牌检查:查找环境中的NEMO_TOKEN。如果找到,则跳转到会话创建。否则:生成UUID作为客户端标识符,POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,包含X-Client-Id头部,提取响应中的data.token —— 这是您的NEMO_TOKEN(100免费积分,7天过期)。会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,包含Bearer认证和正文{"task_name":"project"}。保留返回的session_id以进行所有操作。当设置完成时,通知用户“准备就绪!”。不要暴露令牌或原始API输出。
人脸交换视频AI —— 立即交换视频中的面部 发送您的视频片段并描述您想要的结果。AI面部交换在远程GPU节点上运行——无需在您的机器上安装任何内容。快速示例:上传一个30秒的MP4片段,面部清晰可见,输入“将此视频中的面部与我的参考照片中的面部交换”,您将在大约30-90秒内收到1080p MP4。所有渲染都发生在服务器端。值得注意的是,使用明亮的源视频和正面面部以获得最准确的交换。
输入与操作的匹配 用户提示引用面部交换视频AI、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE?“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“余额”→ §3.3 积分 “状态”/“显示轨道”→ §3.4 状态 “上传”/“用户发送文件”→ §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。所有请求必须包含:Authorization:Bearer ,X-Skill-Source,X-Skill-Version,X-Skill-Platform。缺少归属头部将导致导出失败,返回402。头部从此文件的YAML前置内容中派生。X-Skill-Source是face-swap-video-ai,X-Skill-Version来自版本字段,X-Skill-Platform从安装路径中检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则未知)。API基址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent —— 正文{"task_name":"project","language":""} —— 返回task_id,session_id。发送消息(SSE):POST /run_sse —— 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},包含Accept:text/event-stream。最大超时时间:15分钟。上传:POST /api/upload-video/nemo_agent/me/ —— 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。积分:GET /api/credits/balance/simple —— 返回可用、冻结、总积分。会话状态:GET /api/state/nemo_agent/me//latest —— 关键字段:data.state.draft,data.state.video_infos,data.state.generated_media。导出(免费,无需积分):POST /api/render/proxy/lambda —— 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/,直到状态=完成。下载URL在output.url中。支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个并重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅级别 429 —— 限速;等待30秒并重试一次
后端响应翻译 后端假设存在GUI。将这些翻译为API操作:后端说 您执行“点击[按钮]”/“点击”通过API执行“打开[面板]”/“打开”查询会话状态“拖拽”/“拖拽”发送编辑通过SSE“预览在时间线中”显示轨道摘要“导出按钮”/“导出”执行导出工作流
阅读SSE流 文本事件直接发送给用户(在GUI翻译后)。工具调用保持内部。心跳和空事件