🎬 Ai Image To Video Hailuo — 图片转动画

v1.0.0

将 JPG/PNG/WEBP/HEIC 图片一键上传,云端 GPU 30-90 秒生成 1080p 动画短视频,自动管理会话与额度,适合内容创作者与社媒营销。

0· 57·0 当前·0 累计
下载技能包
最后更新
2026/4/13
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能的请求与运行时指令与图像→视频云渲染集成一致;它仅请求单一服务令牌,API 调用与声明功能匹配,但会创建/缓存令牌并自动发起网络请求,请确认你信任此外部服务。
评估建议
此技能功能如描述:将图片上传至云端 GPU 服务并返回渲染 MP4。安装前请确认信任域名 mega-api-prod.nemovideo.ai,并接受图片及元数据将被上传至该服务。技能将自动获取并存储匿名 NEMO_TOKEN 与 session_id(可能写入 ~/.config/nemovideo/);如需控制,请自行提供令牌而非允许匿名分配。避免上传敏感或私人图片,并查阅服务隐私/条款。若需更高保障,可向作者索要源码或公开主页以审计令牌与文件的存储/传输方式。...
详细分析 ▾
用途与能力
名称/描述(图像转视频)与请求的环境变量(NEMO_TOKEN)、描述的端点及 SKILL.md 中的操作一致,未请求无关凭据或二进制文件。
指令范围
指令包含首次使用时自动连接、通过 POST 匿名获取令牌、存储 session_id/令牌以供后续请求、用户文件多部分上传、SSE 处理,并推断安装路径以设置 X-Skill-Platform。这些行为对云渲染技能合理,但会导致自动出站网络调用、文件上传及本地令牌/session ID 存储——请注意图片与元数据将发送至远程服务。
安装机制
仅指令型技能,无安装规范或下载代码;安装风险最低。无归档下载或第三方包安装。
凭证需求
仅需一个环境凭据(NEMO_TOKEN),适用于托管 API。元数据亦引用配置路径(~/.config/nemovideo/)可能用于存储令牌/session 状态——合理但需注意机密可能写入磁盘。
持久化与权限
always:false 且默认自主性。技能表明将持久化 session_id 与令牌(可能位于声明的配置路径下),但未请求提升平台权限或修改其他技能。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/13

- AI Image to Video Hailuo 技能首次发布。 - 使用云端 GPU 在 30–90 秒内将静态图片(JPG、PNG、WEBP、HEIC,最大 20MB)转换为 AI 动画 1080p MP4 视频片段。 - 支持用户上传、编辑、导出视频的工作流,包括自动会话管理与身份验证。 - 内置命令路由,支持常用操作:导出、额度查询、上传及视频编辑指令。 - 用户友好入门,自动后端配置,新用户享 7 天免费试用(100 额度)。 - 针对上传、额度、速率限制及会话状态提供清晰错误处理。

无害

安装命令

点击复制
官方npx clawhub@latest install ai-image-to-video-hailuo
镜像加速npx clawhub@latest install ai-image-to-video-hailuo --registry https://cn.longxiaskill.com

技能文档

入门指南

上传你的静态图片,我立即开始 AI 视频生成。也可以直接告诉我你的想法。

试试这样说:

  • “convert my still images”
  • “export 1080p MP4”
  • “animate this image into a smooth”

首次连接

用户第一次打开本技能时,自动连接到处理后端。简短提示(例如“Setting up...”)。

身份验证:检查环境变量 NEMO_TOKEN 是否已存在。若已存在,直接进入第 2 步。

  • 获取免费 token:生成随机 UUID 作为客户端标识。向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发起 POST,Header X-Client-Id 设为该 UUID。响应中的 data.token 即为 NEMO_TOKEN——含 100 免费积分,有效期 7 天。
  • 创建会话:POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Header 含 Authorization: Bearer Content-Type: application/json,Body 为 {"task_name":"project","language":""}。保存返回的 session_id 供后续请求使用。

保持设置提示简洁。不要向用户展示原始 API 响应或 token 值。

# AI Image to Video Hailuo — Animate Images into Video Clips 把你的静态图片发给我,并描述想要的效果。AI 视频生成跑在远程 GPU 节点上——本地无需安装任何软件。

快速示例:上传一张产品照或人像,输入“animate this image into a smooth 5-second video clip using Hailuo AI”,大约 30-90 秒后即可收到 1080p MP4。所有渲染均在服务器端完成。

提示:高对比度、主体清晰的图片可产生更流畅的运动效果。

输入匹配到操作

用户提及 ai image to video hailuo、aspect ratio、text overlays 或 audio tracks 等内容时,系统通过关键词与意图分类将请求路由至对应操作。

| 用户说... | 操作 | 跳过 SSE? | |-----------|------|------------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他(generate、edit、add BGM…) | → §3.1 SSE | ❌ |

云端渲染管线详情

每次导出任务在云端 GPU 节点排队,合成视频层并应用平台级压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染作业 ID,若关闭标签页会导致作业孤立。

请求头来自本文件 YAML 头信息。X-Skill-Sourceai-image-to-video-hailuoX-Skill-Version 取自 version 字段,X-Skill-Platform 根据安装路径判断(~/.clawhub/clawhub~/.cursor/skills/cursor,否则 unknown)。

所有请求必须包含: Authorization: Bearer X-Skill-SourceX-Skill-VersionX-Skill-Platform。缺失归因头将返回 402 错误。

API 基地址https://mega-api-prod.nemovideo.ai

  • 创建会话:POST /api/tasks/me/with-session/nemo_agent — Body {"task_name":"project","language":""} — 返回 task_idsession_id
  • 发送消息(SSE):POST /run_sse — Body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Header Accept: text/event-stream。最大超时 15 分钟。
  • 上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
  • 积分:GET /api/credits/balance/simple — 返回 availablefrozentotal
  • 会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draftdata.state.video_infosdata.state.generated_media
  • 导出(免费,不扣积分):POST /api/render/proxy/lambda — Body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直至 status = completed。下载地址在 output.url

支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE 事件处理

| 事件 | 动作 | |------|------| | 文本响应 | 应用 GUI 翻译(§4),展示给用户 | | 工具调用/结果 | 内部处理,不转发 | | heartbeat / 空 data: | 保持等待。每 2 分钟提示“⏳ Still working...” | | 流关闭 | 处理最终响应 |

约 30% 的编辑操作在 SSE 流中无文本返回。此时:轮询会话状态确认编辑已生效,再向用户总结变更。

GUI 指令翻译

后端按可视化界面语境返回指令。将其映射为 API 调用:
  • “click” 或 “点击” → 通过对应端点执行操作
  • “open” 或 “打开” → 查询会话状态获取数据
  • “drag/drop” 或 “拖拽” → 经 SSE 发送编辑命令
  • “preview in timeline” → 以文字摘要展示当前轨道
  • “Export” 或 “导出” → 运行导出工作流

Draft JSON 使用简写键:t 表示 tracks,tt 表示 track type(0=video,1=audio,7=text),sg 表示 segments,d 表示时长(毫秒),m 表示 metadata。

时间线摘要示例: `` Timeline (3 tracks):

  • Video: city timelapse (0-10s)
  • BGM: Lo-fi (0-10s, 35%)
  • Title: "Urban Dreams" (0-3s)
`

错误码

  • 0 — 成功,继续正常流程
  • 1001 — token 过期或无效;通过 /api/auth/anonymous-token 重新获取
  • 1002 — 会话不存在;新建会话
  • 2001 — 积分不足;匿名用户获得带 ?bind= 的注册链接,注册用户可充值
  • 4001 — 不支持的文件类型;展示允许格式
  • 4002 — 文件过大;建议压缩或裁剪
  • 400 — 缺失 X-Client-Id;生成后重试
  • 402 — 免费套餐导出被阻;非积分问题,需升级订阅
  • 429` — 触发限流;等待 30 秒后重试一次

技巧与提示

后端在指令具体时处理更快。与其说“make it look better”,不如用“animate this image into a smooth 5-second video clip using Hailuo AI”——明确指令效果更优。

文件最大 20MB,优先使用 JPG、PNG、WEBP、HEIC 以获得最佳体验。导出 MP4 可在各主流社交平台通用。

常见工作流

快速剪辑:上传 → “animate this image into a smooth 5-second video clip using Hailuo AI” → 下载 MP4。30 秒片段约需 30-90 秒。

批量处理:一次会话上传多个文件,依次对不同文件下达不同指令,每个文件独立渲染。

迭代优化:先粗剪并预览,再细化调整。会话会保存时间线状态,可反复修改。

数据来源ClawHub ↗ · 中文优化:龙虾技能库