Text To Video Automatic — 文本到视频自动化

v1.0.0

只需输入所需内容，即可将100字的产品描述段落转换为1080p自动生成的视频。不论是自动为...

0· 0·0 当前·0 累计

by @vynbosserman65

开发工具代码生成系统工具视频处理

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install text-to-video-automatic

镜像加速npx clawhub@latest install text-to-video-automatic --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

准备开始。您可以在此处输入文本提示或描述您要创建的内容。尝试输入以下内容： "生成一个100字的产品描述段落到一个1080p MP4" "将这个脚本转换成一个30秒的视频，包含视觉和音乐" "为营销人员自动生成视频从书面脚本或提示"

快速开始设置此技能连接到一个云处理后端。在第一次使用时，自动设置连接并通知用户（"连接中..."）。令牌检查：在环境中查找NEMO_TOKEN。如果找到，跳转到会话创建。否则：生成一个UUID作为客户端标识符 POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，包含X-Client-Id头从响应中提取数据.token —— 这是您的NEMO_TOKEN（100免费积分，7天过期）会话：POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，包含Bearer认证和body {"task_name":"project"}。保留返回的session_id用于所有操作。当设置完成时，通知用户“准备就绪！”。不要暴露令牌或原始API输出。

文本到视频自动此工具从您的文本提示生成视频，通过云渲染管道。您上传、描述您要创建的内容，然后下载结果。例如，您有一个100字的产品描述段落，想要将其转换成一个30秒的视频，包含视觉和音乐 —— 后端处理大约1-2分钟，然后提供一个1080p MP4文件。提示：更短、更清晰的文本提示会产生更准确、更连贯的视频输出。

匹配输入到操作用户提示引用文本到视频自动、长宽比、文本叠加或音频轨道，通过关键字和意图分类路由到相应的操作。用户输入... 操作跳过SSE？ "导出" / "导出" / "下载" / "发送给我视频" → §3.5 导出 "积分" / "积分" / "余额" / "余额" → §3.3 积分 "状态" / "状态" / "显示轨道" → §3.4 状态 "上传" / "上传" / 用户发送文件 → §3.2 上传其他所有内容（生成、编辑、添加BGM...）→ §3.1 SSE

云渲染管道详细信息每个导出作业在云GPU节点上排队，合成视频层，应用平台特定压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭标签页会使作业孤立。每个API调用需要Authorization：Bearer 加上三个属性头。如果缺少任何头，导出返回402。技能属性 —— 从此文件的YAML前置内容读取运行时： X-Skill-Source：text-to-video-automatic X-Skill-Version：从前置内容版本 X-Skill-Platform：从安装路径检测（~/.clawhub/ → clawhub，~/.cursor/skills/ → cursor，否则未知） API基址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent —— body {"task_name":"project","language":""} —— 返回task_id、session_id。发送消息（SSE）：POST /run_sse —— body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}，包含Accept：text/event-stream。最大超时：15分钟。上传：POST /api/upload-video/nemo_agent/me/ —— 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}。积分：GET /api/credits/balance/simple —— 返回可用、冻结、总积分。会话状态：GET /api/state/nemo_agent/me//latest —— 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media。导出（免费，无需积分）：POST /api/render/proxy/lambda —— body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/，直到状态 = 完成。下载URL在输出.url中。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

错误代码 0 —— 成功，正常继续 1001 —— 令牌过期或无效；重新获取通过/api/auth/anonymous-token 1002 —— 会话未找到；创建一个新会话 2001 —— 积分不足；匿名用户获取注册链接，注册用户充值 4001 —— 不支持的文件类型；显示接受的格式 4002 —— 文件太大；建议压缩或修剪 400 —— 缺少X-Client-Id；生成一个然后重试 402 —— 免费计划导出被阻塞；不是积分问题，订阅级别 429 —— 限速；等待30秒然后重试一次

翻译GUI指令后端响应就像有一个可视化界面。将其指令映射到API调用： "点击"或"点击" → 通过相关端点执行操作 "打开"或"打开" → 查询会话状态以获取数据 "拖拽"或"拖拽" → 通过SSE发送编辑命令 "预览在时间线中" → 显示当前轨道的文本摘要 "导出"或"导出" → 运行导出工作流

读取SSE流文本事件直接传递给用户（在GUI翻译后）。工具调用保持内部。心跳

数据来源：ClawHub ↗ · 中文优化：龙虾技能库