Text To Video Google Flow — 文本转视频 Google 流程

v1.0.0

准备好通过AI生成的视频，无需调整单个滑块。上传您的文本提示（TXT、DOCX、PDF、纯文本，最高500MB），例如“从此文本描述生成10秒的电影视频片段”，然后在完成后下载1080p MP4。适用于快速行动的营销人员、内容创作者、教育者，他们希望在无需相机或编辑技能的情况下创建视频。

0· 0·0 当前·0 累计

by @francemichaell-15·MIT-0

开发工具代码生成文档工具文件处理 AI模型访问

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install text-to-video-google-flow

镜像加速npx clawhub@latest install text-to-video-google-flow --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

开始使用请发送您的文本提示，我将处理AI视频生成。或者，只需描述您想要的内容。尝试说：“生成一个关于日落在海洋上的两句描述到1080p MP4”、“从此文本描述生成一个10秒的电影视频片段”、“为营销人员、内容创作者、教育者生成短视频片段从书面文本描述” 快速启动设置此技能连接到云处理后端。在首次使用时，自动设置连接并通知用户（“连接中...”）。令牌检查：查找环境中的NEMO_TOKEN。如果找到，跳转到会话创建。否则：生成UUID作为客户端标识符 POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，带有X-Client-Id头部从响应中提取数据。令牌——这是您的NEMO_TOKEN（100免费积分，7天过期）会话： POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，带有Bearer认证和正文{"task_name":"project"}。保留返回的session_id用于所有操作。当设置完成时，通知用户“准备就绪！” 不要暴露令牌或原始API输出。文本到视频 Google Flow —— 从文本生成视频将您的文本提示放入聊天中并告诉我您需要什么。我将处理AI视频生成在云GPU上——您不需要在本地安装任何内容。这里有一个典型的用例：您发送一个关于日落在海洋上的两句描述，要求生成一个10秒的电影视频片段，从此文本描述，大约1-3分钟后，您将得到一个准备好下载的MP4文件。整个过程默认以1080p运行。一个值得注意的事情——更短、更具体的提示会产生更准确和一致的视频输出。匹配输入到操作用户提示引用文本到视频Google Flow、长宽比、文本叠加或音频轨道被路由到相应的操作通过关键字和意图分类。用户说... 操作跳过SSE？ “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示音轨”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传其他所有内容（生成、编辑、添加BGM...）→ §3.1 SSE 云渲染管道详细信息每个导出作业在云GPU节点上排队，合成视频层，应用平台规格压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭选项卡会使作业成为孤儿。基础URL：https://mega-api-prod.nemovideo.ai 端点方法目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。正文：{"task_name":"project","language":""》。返回session_id。 /run_sse POST 发送用户消息。正文包括app_name、session_id、new_message。流响应与Accept：text/event-stream。超时：15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件（multipart）或URL。 /api/credits/balance/simple GET 检查剩余积分（可用、冻结、总计）。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态（草稿、video_infos、generated_media）。 /api/render/proxy/lambda POST 开始导出。正文：{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态一次。接受的文件类型：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。头部来自此文件的YAML前置内容。X-Skill-Source是text-to-video-google-flow，X-Skill-Version来自版本字段，X-Skill-Platform从安装路径检测（~/.clawhub/ = clawhub，~/.cursor/skills/ = cursor，否则为未知）。在每个请求中包含Authorization：Bearer 和所有归属头部——省略它们会在导出时触发402。错误代码 0 —— 成功，正常继续 1001 —— 令牌过期或无效；通过/api/auth/anonymous-token重新获取 1002 —— 会话未找到；创建一个新会话 2001 —— 积分不足；匿名用户获取一个带有？bind=的注册链接，注册用户补充积分 4001 —— 不支持的文件类型；显示接受的格式 4002 —— 文件太大；建议压缩或修剪 400 —— 缺少X-Client-Id；生成一个并重试 402 —— 免费计划导出被阻止；不是积分问题，订阅层 429 —— 限速；等待30秒并重试一次读取SSE流文本事件直接传递给用户（在GUI翻译后）。工具调用保持内部。心跳和空数据：行意味着后端仍在工作——每2分钟显示“⏳仍在工作...” 大约30%的编辑操作在没有任何文本的情况下关闭流。当这种情况发生时，轮询/api/state以确认时间线已更改，然后告诉用户什么已更新。翻译GUI说明后端响应就像有一个可视化界面一样。将其指令映射到API调用： “点击”或“点击”→通过相关端点执行操作 “上传”或“上传”→上传文件 “导出”或“导出”→导出文件 “状态”或“状态”→获取状态 “生成”或“生成”→生成视频 “编辑”或“编辑”→编辑视频 “添加BGM”或“添加BGM”→添加背景音乐 “删除”或“删除”→删除视频 “保存”或“保存”→保存视频 “退出”或“退出”→退出编辑会话

License

运行时依赖

安装命令

技能文档

相关技能推荐