📦 Article To Video Ai — 文章转视频Ai

v1.0.0

准备好带有旁白的文章视频，不需要调整任何滑块。上传您的书面文章（TXT、DOCX、PDF、URL，最高200MB），说一些...

0· 0·0 当前·0 累计

by @francemichaell-15

开发工具代码生成文档工具文件处理 AI模型访问

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install article-to-video-ai

镜像加速npx clawhub@latest install article-to-video-ai --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

开始使用您有待处理的文章吗？请发送过来并告诉我您需要什么——我将负责AI视频创建。尝试说：“将一篇关于旅行技巧的600字博客文章转换为1080p MP4”“将这篇文章转换为带有视觉和语音的90秒视频”“将博客文章转换为内容营销人员可以分享的视频”

首次连接当用户首次打开此技能时，自动连接到处理后端。简要地让他们知道（例如“设置中...”）。

身份验证：检查环境中是否设置了NEMO_TOKEN。如果已设置，请跳转到步骤2。获取免费令牌：生成一个随机的UUID作为客户端标识符。向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求，头部X-Client-Id设置为该UUID。响应数据中的token是您的NEMO_TOKEN——100个免费积分，有效期7天。

创建会话：向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求，Authorization：Bearer ，Content-Type：application/json，正文{"task_name":"project","language":""}}。存储返回的session_id以供所有后续请求使用。保持设置通信简洁。不要向用户显示原始API响应或令牌值。

文章到视频AI —— 将文章转换为可分享的视频此工具获取您的书面文章并通过云渲染管道运行AI视频创建。您上传，描述您想要的内容，然后下载结果。假设您有关于旅行技巧的600字博客文章，并希望将此文章转换为带有视觉和语音的90秒视频——后端处理大约需要1-2分钟，并提供1080p MP4。提示：少于500字的较短文章会产生更紧凑、更易于观看的视频。

输入与操作的匹配用户提示引用文章到视频AI、长宽比、文本覆盖或音频轨道，通过关键字和意图分类路由到相应的操作。用户说... 操作跳过SSE？ “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传其他所有内容（生成、编辑、添加BGM...）→ §3.1 SSE

云渲染管道详细信息每个导出作业都在云GPU节点上排队，合成视频层，应用平台规格压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭标签页会使作业成为孤儿。每个请求都需要三个属性头，并且必须与此文件的前置内容匹配：头部值 X-Skill-Source article-to-video-ai X-Skill-Version 前置内容版本 X-Skill-Platform auto-detect：clawhub / cursor / unknown from install path 在每个请求中包含Authorization：Bearer 和所有属性头——省略它们会在导出时触发402。

API基地址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent —— 正文{"task_name":"project","language":""} —— 返回task_id、session_id。发送消息（SSE）：POST /run_sse —— 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}，Accept：text/event-stream。最大超时：15分钟。上传：POST /api/upload-video/nemo_agent/me/ —— 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}。积分：GET /api/credits/balance/simple —— 返回可用、冻结、总积分。会话状态：GET /api/state/nemo_agent/me//latest —— 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media。导出（免费，无需积分）：POST /api/render/proxy/lambda —— 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/，直到状态=完成。下载URL在output.url中。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

阅读SSE流文本事件直接发送给用户（在GUI翻译后）。工具调用保持内部。心跳和空数据：行意味着后端仍在工作——每2分钟显示“⏳仍在工作...”。大约30%的编辑操作在没有任何文本的情况下关闭流。当这种情况发生时，轮询/api/state以确认时间线已更改，然后告诉用户发生了什么变化。

后端响应翻译后端假设存在GUI。将这些翻译为API操作：后端说您执行 “点击[按钮]”/“点击” 执行API “打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “预览在时间线中” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流

草稿JSON使用短键： t用于轨道， tt用于轨道类型（0=视频，1=音频，7=文本）， sg用于段， d用于持续时间（毫秒）， m用于元数据。时间线摘要示例：时间线（3个轨道）：

视频：城市延时（0-10秒）
BGM：Lo-f

数据来源：ClawHub ↗ · 中文优化：龙虾技能库