Text To Video Automatic — 文本到视频自动化
v1.0.0只需输入所需内容,即可将100字的产品描述段落转换为1080p自动生成的视频。不论是自动为...
运行时依赖
安装命令
点击复制技能文档
准备开始。您可以在此处输入文本提示或描述您要创建的内容。尝试输入以下内容: "生成一个100字的产品描述段落到一个1080p MP4" "将这个脚本转换成一个30秒的视频,包含视觉和音乐" "为营销人员自动生成视频从书面脚本或提示"
快速开始设置 此技能连接到一个云处理后端。在第一次使用时,自动设置连接并通知用户("连接中...")。令牌检查:在环境中查找NEMO_TOKEN。如果找到,跳转到会话创建。否则: 生成一个UUID作为客户端标识符 POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,包含X-Client-Id头 从响应中提取数据.token —— 这是您的NEMO_TOKEN(100免费积分,7天过期) 会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,包含Bearer认证和body {"task_name":"project"}。保留返回的session_id用于所有操作。当设置完成时,通知用户“准备就绪!”。不要暴露令牌或原始API输出。
文本到视频自动 此工具从您的文本提示生成视频,通过云渲染管道。您上传、描述您要创建的内容,然后下载结果。例如,您有一个100字的产品描述段落,想要将其转换成一个30秒的视频,包含视觉和音乐 —— 后端处理大约1-2分钟,然后提供一个1080p MP4文件。提示:更短、更清晰的文本提示会产生更准确、更连贯的视频输出。
匹配输入到操作 用户提示引用文本到视频自动、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户输入... 操作 跳过SSE? "导出" / "导出" / "下载" / "发送给我视频" → §3.5 导出 "积分" / "积分" / "余额" / "余额" → §3.3 积分 "状态" / "状态" / "显示轨道" → §3.4 状态 "上传" / "上传" / 用户发送文件 → §3.2 上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭标签页会使作业孤立。每个API调用需要Authorization:Bearer 加上三个属性头。如果缺少任何头,导出返回402。技能属性 —— 从此文件的YAML前置内容读取运行时: X-Skill-Source:text-to-video-automatic X-Skill-Version:从前置内容版本 X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知) API基址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent —— body {"task_name":"project","language":""} —— 返回task_id、session_id。 发送消息(SSE):POST /run_sse —— body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},包含Accept:text/event-stream。 最大超时:15分钟。 上传:POST /api/upload-video/nemo_agent/me/ —— 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。 积分:GET /api/credits/balance/simple —— 返回可用、冻结、总积分。 会话状态:GET /api/state/nemo_agent/me//latest —— 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media。 导出(免费,无需积分):POST /api/render/proxy/lambda —— body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/,直到状态 = 完成。下载URL在输出.url中。 支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;重新获取通过/api/auth/anonymous-token 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取注册链接,注册用户充值 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个然后重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅级别 429 —— 限速;等待30秒然后重试一次
翻译GUI指令 后端响应就像有一个可视化界面。将其指令映射到API调用: "点击"或"点击" → 通过相关端点执行操作 "打开"或"打开" → 查询会话状态以获取数据 "拖拽"或"拖拽" → 通过SSE发送编辑命令 "预览在时间线中" → 显示当前轨道的文本摘要 "导出"或"导出" → 运行导出工作流
读取SSE流 文本事件直接传递给用户(在GUI翻译后)。工具调用保持内部。心跳