🎬 Ai Image To Video Hailuo — 图片转动画
v1.0.0将 JPG/PNG/WEBP/HEIC 图片一键上传,云端 GPU 30-90 秒生成 1080p 动画短视频,自动管理会话与额度,适合内容创作者与社媒营销。
详细分析 ▾
运行时依赖
版本
- AI Image to Video Hailuo 技能首次发布。 - 使用云端 GPU 在 30–90 秒内将静态图片(JPG、PNG、WEBP、HEIC,最大 20MB)转换为 AI 动画 1080p MP4 视频片段。 - 支持用户上传、编辑、导出视频的工作流,包括自动会话管理与身份验证。 - 内置命令路由,支持常用操作:导出、额度查询、上传及视频编辑指令。 - 用户友好入门,自动后端配置,新用户享 7 天免费试用(100 额度)。 - 针对上传、额度、速率限制及会话状态提供清晰错误处理。
安装命令
点击复制技能文档
入门指南
上传你的静态图片,我立即开始 AI 视频生成。也可以直接告诉我你的想法。
试试这样说:
- “convert my still images”
- “export 1080p MP4”
- “animate this image into a smooth”
首次连接
用户第一次打开本技能时,自动连接到处理后端。简短提示(例如“Setting up...”)。身份验证:检查环境变量 NEMO_TOKEN 是否已存在。若已存在,直接进入第 2 步。
- 获取免费 token:生成随机 UUID 作为客户端标识。向
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发起 POST,HeaderX-Client-Id设为该 UUID。响应中的data.token即为 NEMO_TOKEN——含 100 免费积分,有效期 7 天。 - 创建会话:POST 到
https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Header 含Authorization: Bearer与Content-Type: application/json,Body 为{"task_name":"project","language":""}。保存返回的session_id供后续请求使用。
保持设置提示简洁。不要向用户展示原始 API 响应或 token 值。
# AI Image to Video Hailuo — Animate Images into Video Clips 把你的静态图片发给我,并描述想要的效果。AI 视频生成跑在远程 GPU 节点上——本地无需安装任何软件。
快速示例:上传一张产品照或人像,输入“animate this image into a smooth 5-second video clip using Hailuo AI”,大约 30-90 秒后即可收到 1080p MP4。所有渲染均在服务器端完成。
提示:高对比度、主体清晰的图片可产生更流畅的运动效果。
输入匹配到操作
用户提及 ai image to video hailuo、aspect ratio、text overlays 或 audio tracks 等内容时,系统通过关键词与意图分类将请求路由至对应操作。| 用户说... | 操作 | 跳过 SSE? | |-----------|------|------------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他(generate、edit、add BGM…) | → §3.1 SSE | ❌ |
云端渲染管线详情
每次导出任务在云端 GPU 节点排队,合成视频层并应用平台级压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染作业 ID,若关闭标签页会导致作业孤立。请求头来自本文件 YAML 头信息。X-Skill-Source 为 ai-image-to-video-hailuo,X-Skill-Version 取自 version 字段,X-Skill-Platform 根据安装路径判断(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则 unknown)。
所有请求必须包含:
Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺失归因头将返回 402 错误。
API 基地址:https://mega-api-prod.nemovideo.ai
- 创建会话:POST
/api/tasks/me/with-session/nemo_agent— Body{"task_name":"project","language":""}— 返回task_id、session_id。 - 发送消息(SSE):POST
/run_sse— Body{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},HeaderAccept: text/event-stream。最大超时 15 分钟。 - 上传:POST
/api/upload-video/nemo_agent/me/— 文件:multipart-F "files=@/path",或 URL:{"urls":[""],"source_type":"url"} - 积分:GET
/api/credits/balance/simple— 返回available、frozen、total - 会话状态:GET
/api/state/nemo_agent/me//latest— 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media - 导出(免费,不扣积分):POST
/api/render/proxy/lambda— Body{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET/api/render/proxy/lambda/直至status=completed。下载地址在output.url。
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
SSE 事件处理
| 事件 | 动作 |
|------|------|
| 文本响应 | 应用 GUI 翻译(§4),展示给用户 |
| 工具调用/结果 | 内部处理,不转发 |
| heartbeat / 空 data: | 保持等待。每 2 分钟提示“⏳ Still working...” |
| 流关闭 | 处理最终响应 |
约 30% 的编辑操作在 SSE 流中无文本返回。此时:轮询会话状态确认编辑已生效,再向用户总结变更。
GUI 指令翻译
后端按可视化界面语境返回指令。将其映射为 API 调用:- “click” 或 “点击” → 通过对应端点执行操作
- “open” 或 “打开” → 查询会话状态获取数据
- “drag/drop” 或 “拖拽” → 经 SSE 发送编辑命令
- “preview in timeline” → 以文字摘要展示当前轨道
- “Export” 或 “导出” → 运行导出工作流
Draft JSON 使用简写键:t 表示 tracks,tt 表示 track type(0=video,1=audio,7=text),sg 表示 segments,d 表示时长(毫秒),m 表示 metadata。
时间线摘要示例:
``
Timeline (3 tracks):
Video: city timelapse (0-10s)- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
错误码
0— 成功,继续正常流程1001— token 过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话不存在;新建会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户可充值4001— 不支持的文件类型;展示允许格式4002— 文件过大;建议压缩或裁剪400— 缺失X-Client-Id;生成后重试402— 免费套餐导出被阻;非积分问题,需升级订阅429` — 触发限流;等待 30 秒后重试一次
技巧与提示
后端在指令具体时处理更快。与其说“make it look better”,不如用“animate this image into a smooth 5-second video clip using Hailuo AI”——明确指令效果更优。文件最大 20MB,优先使用 JPG、PNG、WEBP、HEIC 以获得最佳体验。导出 MP4 可在各主流社交平台通用。
常见工作流
快速剪辑:上传 → “animate this image into a smooth 5-second video clip using Hailuo AI” → 下载 MP4。30 秒片段约需 30-90 秒。批量处理:一次会话上传多个文件,依次对不同文件下达不同指令,每个文件独立渲染。
迭代优化:先粗剪并预览,再细化调整。会话会保存时间线状态,可反复修改。