🎞️ Image To Video Joypix — 图片转视频
v1.0.0无需学习专业剪辑软件,描述你想要的效果即可将静态图片转换为5秒视频片段,30-60秒内获得动画视频。支持JPG、PNG、WEBP、HEIC格式(最大200MB),AI自动处理视频生成,非常适合社交媒体创作者。
详细分析 ▾
运行时依赖
版本
Image to Video JoyPix 首次发布——轻松将图片转换为高质量视频片段。即时将静态图片(JPG、PNG、WEBP、HEIC,最大200MB)通过云端转换为1080p MP4视频片段。简单的入门体验:为新用户自动配置令牌和会话设置;无需手动注册。通过聊天命令全面支持积分余额、文件上传、会话状态和一键导出。响应式错误处理,解决文件大小、格式和订阅问题。专为寻求快速AI驱动图片动画的社交媒体创作者设计——无需编辑技能。
安装命令
点击复制技能文档
入门
准备就绪。在这里放下您的静态图片或描述您想要制作的内容。
可以尝试说:
- "将单张产品照片或肖像图片转换为1080p MP4"
- "将这张图片动画化为流畅的5秒视频片段"
- "将静态照片转换为社交媒体创作者的短视频动画片段"
首次连接
当用户首次打开此技能时,自动连接到处理后端。简要告知他们(例如“正在设置...”)。
身份验证:检查环境变量中是否设置了 NEMO_TOKEN。如果已设置,跳过步骤2。
- 获取免费令牌:生成随机UUID作为客户端标识符。使用设置为该UUID的header
X-Client-IdPOST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token。响应中的data.token就是您的NEMO_TOKEN——100免费积分,有效期7天。 - 创建会话:使用
Authorization: Bearer、Content-Type: application/json和body{"task_name":"project","language":""}POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。存储返回的session_id用于所有后续请求。保持设置通信简洁。不要向用户显示原始API响应或令牌值。
# Image to Video JoyPix — 将图片转换为视频片段
在聊天中放下您的静态图片,告诉我您的需求。我会在云GPU上处理AI视频创建——您不需要在本地安装任何东西。一个典型的使用场景是:您发送一张产品照片或肖像图片,请求“将这张图片动画化为流畅的5秒视频片段”,大约30-60秒后您就可以下载MP4文件了。整个过程默认以1080p运行。值得注意的是——高对比度、主体清晰的照片比复杂背景的视频动画更流畅。
将输入与操作匹配
用户提示中提及image to video joypix、宽高比、文字叠加或音频轨道会通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加BGM...) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出任务在云GPU节点上排队,该节点合成视频层、应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染任务ID,因此在完成前关闭标签页会使任务孤立。
基础URL:https://mega-api-prod.nemovideo.ai
| 端点 | 方法 | 用途 |
|---|---|---|
/api/tasks/me/with-session/nemo_agent | POST | 启动新编辑会话。Body: {"task_name":"project","language":""}。返回 session_id。 |
/run_sse | POST | 发送用户消息。Body包含 app_name、session_id、new_message。使用 Accept: text/event-stream 流式传输响应。超时:15分钟。 |
/api/upload-video/nemo_agent/me/ | POST | 上传文件(multipart)或URL。 |
/api/credits/balance/simple | GET | 检查剩余积分(available、frozen、total)。 |
/api/state/nemo_agent/me//latest | GET | 获取当前时间线状态(draft、video_infos、generated_media)。 |
/api/render/proxy/lambda | POST | 启动导出。Body: {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态。 |
每个请求需要三个归属标头,必须与此文件的frontmatter匹配:
| 标头 | 值 |
|---|---|
X-Skill-Source | image-to-video-joypix |
X-Skill-Version | frontmatter version |
X-Skill-Platform | 自动检测:从安装路径检测 clawhub / cursor / unknown |
Authorization: Bearer 加上上述三个归属标头。如果任何标头缺失,导出将返回402。错误处理
| 代码 | 含义 | 操作 |
|---|---|---|
| 0 | 成功 | 继续 |
| 1001 | 令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) |
| 1002 | 会话未找到 | 新建会话 §3.0 |
| 2001 | 积分不足 | 匿名用户:显示注册URL并带 ?bind=(需要时从创建会话或状态响应获取 )。已注册用户:“在您的账户中充值积分” |
| 4001 | 不支持的文件 | 显示支持的格式 |
| 4002 | 文件太大 | 建议压缩/裁剪 |
| 400 | 缺少 X-Client-Id | 生成Client-Id并重试(见§1) |
| 402 | 免费计划导出被阻止 | 订阅级别问题,不是积分问题。“注册或升级您的计划以解锁导出。” |
| 429 | 速率限制(每个令牌/客户端/7天) | 30秒后重试一次 |
SSE事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用GUI翻译(§4),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空 data: | 继续等待。每2分钟:“⏳ 仍在工作中...” |
| 流关闭 | 处理最终响应 |
翻译GUI指令
后端响应就像有一个可视化界面。将其指令映射到API调用:
- "click"或“点击” → 通过相关端点执行操作
- "open"或“打开” → 查询会话状态以获取数据
- "drag/drop"或“拖拽” → 通过SSE发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export"或“导出” → 运行导出工作流
Draft JSON使用短键:t 表示轨道,tt 表示轨道类型(0=视频,1=音频,7=文字),sg 表示片段,d 表示持续时间(毫秒),m 表示元数据。
示例时间线摘要:
时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦想”(0-3秒)
技巧和窍门
后端在您更具体时处理得更快。不要说“让它看起来更好”,而是尝试“将这张图片动画化为流畅的5秒视频片段”——具体说明会获得更好的结果。最大文件大小为200MB。坚持使用JPG、PNG、WEBP、HEIC以获得最流畅的体验。导出为MP4以获得社交平台的最佳兼容性。
常见工作流程
快速编辑:上传 → “将这张图片动画化为流畅的5秒视频片段” → 下载MP4。30秒片段需要30-60秒。
批量风格:在一个会话中上传多个文件。使用不同的指令逐个处理它们。每个文件都有自己的渲染。
迭代:从粗剪开始,预览结果,然后进行细化。会话会保持您的时间线状态,因此您可以继续调整。