🎬 Ai Image To Video Hailuo — 图片转动画

v1.0.0

将 JPG/PNG/WEBP/HEIC 图片一键上传，云端 GPU 30-90 秒生成 1080p 动画短视频，自动管理会话与额度，适合内容创作者与社媒营销。

0· 57·0 当前·0 累计

by @mhogan2013-9

AI模型访问

使用场景：使用Ai Image To Video Hailuo — 图片转动画进行AI模型访问使用Ai Image To Video Hailuo — 图片转动画

下载技能包

最后更新

2026/4/13

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

medium confidence

该技能的请求与运行时指令与图像→视频云渲染集成一致；它仅请求单一服务令牌，API 调用与声明功能匹配，但会创建/缓存令牌并自动发起网络请求，请确认你信任此外部服务。

评估建议

此技能功能如描述：将图片上传至云端 GPU 服务并返回渲染 MP4。安装前请确认信任域名 mega-api-prod.nemovideo.ai，并接受图片及元数据将被上传至该服务。技能将自动获取并存储匿名 NEMO_TOKEN 与 session_id（可能写入 ~/.config/nemovideo/）；如需控制，请自行提供令牌而非允许匿名分配。避免上传敏感或私人图片，并查阅服务隐私/条款。若需更高保障，可向作者索要源码或公开主页以审计令牌与文件的存储/传输方式。...

详细分析 ▾

✓ 用途与能力

名称/描述（图像转视频）与请求的环境变量（NEMO_TOKEN）、描述的端点及 SKILL.md 中的操作一致，未请求无关凭据或二进制文件。

ℹ 指令范围

指令包含首次使用时自动连接、通过 POST 匿名获取令牌、存储 session_id/令牌以供后续请求、用户文件多部分上传、SSE 处理，并推断安装路径以设置 X-Skill-Platform。这些行为对云渲染技能合理，但会导致自动出站网络调用、文件上传及本地令牌/session ID 存储——请注意图片与元数据将发送至远程服务。

✓ 安装机制

仅指令型技能，无安装规范或下载代码；安装风险最低。无归档下载或第三方包安装。

ℹ 凭证需求

仅需一个环境凭据（NEMO_TOKEN），适用于托管 API。元数据亦引用配置路径（~/.config/nemovideo/）可能用于存储令牌/session 状态——合理但需注意机密可能写入磁盘。

✓ 持久化与权限

always:false 且默认自主性。技能表明将持久化 session_id 与令牌（可能位于声明的配置路径下），但未请求提升平台权限或修改其他技能。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/13

- AI Image to Video Hailuo 技能首次发布。 - 使用云端 GPU 在 30–90 秒内将静态图片（JPG、PNG、WEBP、HEIC，最大 20MB）转换为 AI 动画 1080p MP4 视频片段。 - 支持用户上传、编辑、导出视频的工作流，包括自动会话管理与身份验证。 - 内置命令路由，支持常用操作：导出、额度查询、上传及视频编辑指令。 - 用户友好入门，自动后端配置，新用户享 7 天免费试用（100 额度）。 - 针对上传、额度、速率限制及会话状态提供清晰错误处理。

● 无害

安装命令

点击复制

官方npx clawhub@latest install ai-image-to-video-hailuo

镜像加速npx clawhub@latest install ai-image-to-video-hailuo --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Ai Image To Video Hailuo — 图片转动画安装说明：安装命令：npx clawhub@latest install ai-image-to-video-hailuo

需要定制？告诉我你的需求 →

技能文档

入门指南

上传你的静态图片，我立即开始 AI 视频生成。也可以直接告诉我你的想法。

试试这样说：

“convert my still images”
“export 1080p MP4”
“animate this image into a smooth”

首次连接

用户第一次打开本技能时，自动连接到处理后端。简短提示（例如“Setting up...”）。

身份验证：检查环境变量 NEMO_TOKEN 是否已存在。若已存在，直接进入第 2 步。

获取免费 token：生成随机 UUID 作为客户端标识。向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发起 POST，Header X-Client-Id 设为该 UUID。响应中的 data.token 即为 NEMO_TOKEN——含 100 免费积分，有效期 7 天。
创建会话：POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，Header 含 Authorization: Bearer 与 Content-Type: application/json，Body 为 {"task_name":"project","language":""}。保存返回的 session_id 供后续请求使用。

保持设置提示简洁。不要向用户展示原始 API 响应或 token 值。

# AI Image to Video Hailuo — Animate Images into Video Clips 把你的静态图片发给我，并描述想要的效果。AI 视频生成跑在远程 GPU 节点上——本地无需安装任何软件。

快速示例：上传一张产品照或人像，输入“animate this image into a smooth 5-second video clip using Hailuo AI”，大约 30-90 秒后即可收到 1080p MP4。所有渲染均在服务器端完成。

提示：高对比度、主体清晰的图片可产生更流畅的运动效果。

输入匹配到操作

用户提及 ai image to video hailuo、aspect ratio、text overlays 或 audio tracks 等内容时，系统通过关键词与意图分类将请求路由至对应操作。

| 用户说... | 操作 | 跳过 SSE？ | |-----------|------|------------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他（generate、edit、add BGM…） | → §3.1 SSE | ❌ |

云端渲染管线详情

每次导出任务在云端 GPU 节点排队，合成视频层并应用平台级压缩（H.264，最高 1080×1920），30-90 秒内返回下载链接。会话 token 携带渲染作业 ID，若关闭标签页会导致作业孤立。

请求头来自本文件 YAML 头信息。X-Skill-Source 为 ai-image-to-video-hailuo，X-Skill-Version 取自 version 字段，X-Skill-Platform 根据安装路径判断（~/.clawhub/ → clawhub，~/.cursor/skills/ → cursor，否则 unknown）。

所有请求必须包含： Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺失归因头将返回 402 错误。

API 基地址：https://mega-api-prod.nemovideo.ai

创建会话：POST /api/tasks/me/with-session/nemo_agent — Body {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息（SSE）：POST /run_sse — Body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}，Header Accept: text/event-stream。最大超时 15 分钟。
上传：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或 URL：{"urls":[""],"source_type":"url"}
积分：GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态：GET /api/state/nemo_agent/me//latest — 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media
导出（免费，不扣积分）：POST /api/render/proxy/lambda — Body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直至 status = completed。下载地址在 output.url。

支持格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE 事件处理

| 事件 | 动作 | |------|------| | 文本响应 | 应用 GUI 翻译（§4），展示给用户 | | 工具调用/结果 | 内部处理，不转发 | | heartbeat / 空 data: | 保持等待。每 2 分钟提示“⏳ Still working...” | | 流关闭 | 处理最终响应 |

约 30% 的编辑操作在 SSE 流中无文本返回。此时：轮询会话状态确认编辑已生效，再向用户总结变更。

GUI 指令翻译

后端按可视化界面语境返回指令。将其映射为 API 调用：

“click” 或 “点击” → 通过对应端点执行操作
“open” 或 “打开” → 查询会话状态获取数据
“drag/drop” 或 “拖拽” → 经 SSE 发送编辑命令
“preview in timeline” → 以文字摘要展示当前轨道
“Export” 或 “导出” → 运行导出工作流

Draft JSON 使用简写键：t 表示 tracks，tt 表示 track type（0=video，1=audio，7=text），sg 表示 segments，d 表示时长（毫秒），m 表示 metadata。

时间线摘要示例： ``Timeline (3 tracks):

Video: city timelapse (0-10s)


BGM: Lo-fi (0-10s, 35%)  
Title: "Urban Dreams" (0-3s)

  
错误码

0 — 成功，继续正常流程

1001 — token 过期或无效；通过 /api/auth/anonymous-token 重新获取

1002 — 会话不存在；新建会话

2001 — 积分不足；匿名用户获得带 ?bind= 的注册链接，注册用户可充值

4001 — 不支持的文件类型；展示允许格式

4002 — 文件过大；建议压缩或裁剪

400 — 缺失 X-Client-Id；生成后重试

402 — 免费套餐导出被阻；非积分问题，需升级订阅

429` — 触发限流；等待 30 秒后重试一次

技巧与提示

后端在指令具体时处理更快。与其说“make it look better”，不如用“animate this image into a smooth 5-second video clip using Hailuo AI”——明确指令效果更优。

文件最大 20MB，优先使用 JPG、PNG、WEBP、HEIC 以获得最佳体验。导出 MP4 可在各主流社交平台通用。

常见工作流

快速剪辑：上传 → “animate this image into a smooth 5-second video clip using Hailuo AI” → 下载 MP4。30 秒片段约需 30-90 秒。

批量处理：一次会话上传多个文件，依次对不同文件下达不同指令，每个文件独立渲染。

迭代优化：先粗剪并预览，再细化调整。会话会保存时间线状态，可反复修改。