详细分析 ▾
运行时依赖
版本
- AI图像转视频Kling技能首次发布。 - 使用Kling AI将静态图片即时转换为1080p MP4视频片段,无需手动动画。 - 自动云端连接和会话处理;设置引导无缝化。 - 支持JPG、PNG、WEBP、HEIC上传,最大20MB;快速云端渲染在30-90秒内返回结果。 - 以1080p MP4导出视频;通过简单提示检查积分、编辑时间轴和下载。 - 为想要快速、无手动方式让静态图片动起来的创作者打造。
安装命令
点击复制技能文档
入门
分享您的静态图片,我将开始AI视频生成。或者直接告诉我您的想法。
试试这样说:
- "转换我的静态图片"
- "导出1080p MP4"
- "将这张图片动画化成5秒视频"
快速启动设置
此技能连接到云处理后端。首次使用时,自动设置连接并让用户知道("连接中...")。
令牌检查:在环境中查找NEMO_TOKEN。如果找到,跳过会话创建。否则:
- 生成UUID作为客户端标识符
- 使用
X-Client-Id头POSThttps://mega-api-prod.nemovideo.ai/api/auth/anonymous-token - 从响应中提取
data.token——这是您的NEMO_TOKEN(100免费积分,7天有效期)
会话:使用Bearer认证和body {"task_name":"project"} POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。保留返回的session_id用于所有操作。设置完成后用简短的"就绪!"通知用户。不要暴露令牌或原始API输出。
# AI Image to Video Kling — 将图像动画化为视频片段
此工具获取您的静态图片,通过云渲染管道运行AI视频生成。您上传,描述您想要的内容,然后下载结果。假设您有一张产品照片或肖像图片,想使用Kling AI将其动画化成5秒视频片段——后端在大约30-90秒内处理,然后给您一个1080p MP4。
提示:高对比度、主体清晰的照片能产生更流畅的动画效果。
将输入与操作匹配
用户提示涉及ai image to video kling、宽高比、文字叠加或音轨,通过关键词和意图分类路由到相应操作。
| 用户说... | 操作 | 跳过SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出任务在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染任务ID,因此在完成前关闭标签页会使任务孤立。
基础URL:https://mega-api-prod.nemovideo.ai
| 端点 | 方法 | 用途 |
|----------|--------|---------|
| /api/tasks/me/with-session/nemo_agent | POST | 启动新编辑会话。Body: {"task_name":"project","language":""}。返回session_id。 |
| /run_sse | POST | 发送用户消息。Body包含app_name、session_id、new_message。使用Accept: text/event-stream流式传输响应。超时:15分钟。 |
| /api/upload-video/nemo_agent/me/ | POST | 上传文件(multipart)或URL。 |
| /api/credits/balance/simple | GET | 检查剩余积分(available、frozen、total)。 |
| /api/state/nemo_agent/me//latest | GET | 获取当前时间轴状态(draft、video_infos、generated_media)。 |
| /api/render/proxy/lambda | POST | 启动导出。Body: {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态。 |
支持的文件类型:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
技能归属——运行时从此文件的YAML frontmatter读取:
X-Skill-Source:ai-image-to-video-klingX-Skill-Version:来自frontmatterversionX-Skill-Platform:从安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)
在每个请求上包含Authorization: Bearer 和所有归属标头——省略它们会在导出时触发402。
错误处理
| 代码 | 含义 | 操作 |
|------|---------|--------|
| 0 | 成功 | 继续 |
| 1001 | 令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) |
| 1002 | 会话未找到 | 新会话 §3.0 |
| 2001 | 积分不足 | 匿名:显示注册URL ?bind=(需要时从create-session或state响应获取)。已注册:在账户中充值积分 |
| 4001 | 不支持的文件 | 显示支持的格式 |
| 4002 | 文件太大 | 建议压缩/裁剪 |
| 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) |
| 402 | 免费计划导出被阻止 | 订阅层级问题,不是积分问题。"注册或升级您的计划以解锁导出。"
| 429 | 速率限制(1令牌/客户端/7天) | 30秒后重试一次 |
读取SSE流
文本事件直接发送给用户(GUI翻译后)。工具调用保留在内部。心跳和空的data:行意味着后端仍在工作——每2分钟显示"⏳ 仍在工作中..."。大约30%的编辑操作会关闭流而没有任何文本。发生这种情况时,轮询/api/state确认时间轴已更改,然后告诉用户更新了什么。
翻译GUI指令
后端响应就像有一个可视化界面一样。将其指令映射到API调用:
- "click"或"点击" → 通过相关端点执行操作
- "open"或"打开" → 查询会话状态以获取数据
- "drag/drop"或"拖拽" → 通过SSE发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export"或"导出" → 运行导出工作流
Draft JSON使用短键:t表示轨道,tt表示轨道类型(0=视频,1=音频,7=文字),sg表示片段,d表示持续时间(毫秒),m表示元数据。
示例时间轴摘要:
时间轴(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"城市梦想"(0-3秒)
常见工作流
快速编辑:上传 → "使用Kling AI将这张图片动画化成5秒视频片段" → 下载MP4。30秒片段需要30-90秒。
批量风格:在一个会话中上传多个文件。使用不同指令逐个处理。每个都有自己的渲染。
迭代:从粗剪开始,预览结果,然后细化。会话保留您的时间轴状态,因此您可以继续调整。
技巧和窍门
后端在您更具体时处理得更快。不要说"让它看起来更好",而是尝试"使用Kling AI将这张图片动画化成5秒视频片段"——具体指令获得更好的结果。最大文件大小为20MB。坚持使用JPG、PNG、WEBP、HEIC以获得最流畅的体验。背景干净的PNG图片能让Kling AI生成更准确的运动。