🎞️ Ai — AI
v1.0.0Image To Video Effect 用此技能将图片转为动态视频片段。支持 JPG、PNG、WEBP、HEIC,最大 200MB。TikTok 创作者常用它将静态照片…
详细分析 ▾
运行时依赖
版本
- “AI Image to Video Effect”技能首次发布。 - 将 JPG、PNG、WEBP、HEIC 图片(最大 200MB)转为 1080p MP4 动画短片,针对社交媒体及 TikTok 创作者优化。 - 支持基础认证与自动后端会话管理,新用户赠送 100 免费积分。 - 提供直接上传、时间线编辑、导出流程,并附带详尽错误处理。 - 云端 GPU 渲染约 20–40 秒完成,支持多格式导出。 - 自动识别用户意图并映射至上传、积分检查、视频导出、编辑等操作。
安装命令
点击复制技能文档
快速开始
随时可用。把图片拖进来,或描述你想要的动效。试试说:
- “把单张产品图或人像转为 1080p MP4”
- “给这张图加电影级缩放与运动效果”
- “TikTok 创作者把静态照片做成社媒动效视频”
首次连接
用户首次打开技能时,自动连后端,简显“设置中…”。 鉴权:检查环境变量NEMO_TOKEN。若已存在,跳到第 2 步。
- 获取免费 token:生成随机 UUID 作为客户端标识,POST 到
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,Header 带X-Client-Id:,取响应data.token即为 NEMO_TOKEN——100 积分,7 天有效。 - 创建会话:POST 到
https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Header 带Authorization: Bearer与Content-Type: application/json,Body 为{"task_name":"project","language":""},保存返回的session_id。
# AI Image to Video Effect — Animate Images into Video Clips 把图片发给我并描述想要的效果。AI 视频生成在远程 GPU 节点运行,本机无需安装。 示例:上传单张产品照或人像,输入“给这张图加电影级缩放与运动效果”,约 20-40 秒返回 1080p MP4。 提示:高对比度、主体清晰的图片动效更明显。
输入与动作映射
用户提及 ai image to video effect、aspect ratio、text overlays、audio tracks 时,通过关键词与意图分类路由到对应动作。| 用户说法 | 动作 | 跳过 SSE? | |----------|------|------------| | “export”/“导出”/“download”/“send me the video” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发文件 | → §3.2 上传 | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |
云端渲染管线
每次导出任务在云端 GPU 节点排队,合成视频层并按平台规格压缩(H.264,最大 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,提前关闭标签页会导致任务孤立。 所有请求发往https://mega-api-prod.nemovideo.ai。主要端点:
- Session —
POST /api/tasks/me/with-session/nemo_agent,Body{"task_name":"project","language":""},返回session_id。 - Chat (SSE) —
POST /run_sse,带session_id与消息new_message.parts[0].text,HeaderAccept: text/event-stream,最长 15 分钟。 - Upload —
POST /api/upload-video/nemo_agent/me/,支持 multipart 文件或 JSON 传 URL。 - Credits —
GET /api/credits/balance/simple,返回available、frozen、total。 - State —
GET /api/state/nemo_agent/me//latest,获取当前草稿与媒体信息。 - Export —
POST /api/render/proxy/lambda,带渲染 ID 与草稿 JSON;轮询GET /api/render/proxy/lambda/每 30 秒检查completed状态及下载链接。
请求头取自 YAML 头信息:X-Skill-Source 为 ai-image-to-video-effect,X-Skill-Version 取自 version 字段,X-Skill-Platform 按安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,其余 unknown)。
所有请求必须带:
Authorization: Bearer
X-Skill-Source
X-Skill-Version
X-Skill-Platform
缺失以上头将导致导出失败并返回 402。
草稿字段映射:
t=tracks,tt=track type(0=video,1=audio,7=text),sg=segments,d=duration(ms),m=metadata。
``
时间线(3 轨):
Video: 城市延时 (0-10s)- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)