🎞️ Ai — AI

v1.0.0

Image To Video Effect 用此技能将图片转为动态视频片段。支持 JPG、PNG、WEBP、HEIC，最大 200MB。TikTok 创作者常用它将静态照片…

0· 10·0 当前·0 累计

by @vynbosserman65

开发工具代码生成网络工具浏览器自动化文件处理

下载技能包

最后更新

2026/4/22

安全扫描

VirusTotal

可疑

查看报告

OpenClaw

安全

high confidence

该技能的请求与运行时指令与其声明用途（服务器端图像→视频渲染）一致，但存在轻微元数据不一致，且需知悉图像与会话令牌将发送至外部 Nemovideo 后端。

评估建议

该技能声称的功能属实：它会将你的图片上传至 Nemovideo 后端，并返回渲染好的 MP4。安装前请注意： 1. 图片数据及会话/任务元数据将发送至 https://mega-api-prod.nemovideo.ai——请确认你信任该服务及其隐私/保留政策； 2. 若未提供 NEMO_TOKEN，技能可自动生成匿名令牌（有效期约 7 天），无需预先配置凭证即可发起网络请求； 3. 存在轻微元数据不一致（SKILL.md 列出的配置路径在注册摘要中被省略）——请向发布者确认文件或令牌是否在本地持久化； 4. 无源码/主页，无法独立审计后端或运营方——若图片敏感，建议避免上传。如需更高保障，请向发布者索要主页/隐私政策，或在受控环境中运行并监控出站请求后再用于私密内容。...

详细分析 ▾

✓ 用途与能力

名称/描述（将图片生成视频）与所需凭证（NEMO_TOKEN）及 nemovideo.ai 上记录的 API 端点一致。唯一的小不一致：注册表摘要未列出配置路径，而 SKILL.md 的 frontmatter 声明了配置路径（~/.config/nemovideo/）。这可以理解（客户端配置存储），但元数据不匹配应予以注明。

ℹ 指令范围

运行时指令仅限于声明用途（上传图像、创建会话、运行 SSE 编辑、轮询导出）。该技能指示代理在缺少 NEMO_TOKEN 时自动获取匿名令牌、创建并存储 session_id，并检测代理安装路径以设置 X-Skill-Platform——这些行为会向 nemovideo API 发起网络请求并读取部分本地路径信息。未包含读取无关文件或其他凭证的指令，但自动令牌生成与隐式本地路径检测属于需留意的操作细节。

✓ 安装机制

仅含指令的技能，无安装规范，无安装器写入文件，风险最低的安装模式。

ℹ 凭证需求

唯一必需的环境变量（NEMO_TOKEN）适用于由服务支持的渲染器。SKILL.md 提供了在未提供令牌时获取匿名令牌的流程（有效期 7 天），与声明的 primaryEnv 一致。早期注册摘要声称无配置路径，而 frontmatter 却声明 ~/.config/nemovideo/，这一不一致需澄清。未请求无关凭据。

✓ 持久化与权限

技能未被强制包含（always:false），也未请求提升权限或跨技能配置更改。它确实指示存储 session_id 以进行持续的任务管理，这对于远程渲染工作流是正常的。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/22

- “AI Image to Video Effect”技能首次发布。 - 将 JPG、PNG、WEBP、HEIC 图片（最大 200MB）转为 1080p MP4 动画短片，针对社交媒体及 TikTok 创作者优化。 - 支持基础认证与自动后端会话管理，新用户赠送 100 免费积分。 - 提供直接上传、时间线编辑、导出流程，并附带详尽错误处理。 - 云端 GPU 渲染约 20–40 秒完成，支持多格式导出。 - 自动识别用户意图并映射至上传、积分检查、视频导出、编辑等操作。

● 可疑

安装命令

点击复制

官方npx clawhub@latest install ai-image-to-video-effect

镜像加速npx clawhub@latest install ai-image-to-video-effect --registry https://cn.longxiaskill.com

技能文档

快速开始

随时可用。把图片拖进来，或描述你想要的动效。

试试说：

“把单张产品图或人像转为 1080p MP4”
“给这张图加电影级缩放与运动效果”
“TikTok 创作者把静态照片做成社媒动效视频”

首次连接

用户首次打开技能时，自动连后端，简显“设置中…”。鉴权：检查环境变量 NEMO_TOKEN。若已存在，跳到第 2 步。

获取免费 token：生成随机 UUID 作为客户端标识，POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，Header 带 X-Client-Id: ，取响应 data.token 即为 NEMO_TOKEN——100 积分，7 天有效。
创建会话：POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，Header 带 Authorization: Bearer 与 Content-Type: application/json，Body 为 {"task_name":"project","language":""}，保存返回的 session_id。

全程保持简洁，不向用户展示原始 API 响应或 token 值。

# AI Image to Video Effect — Animate Images into Video Clips 把图片发给我并描述想要的效果。AI 视频生成在远程 GPU 节点运行，本机无需安装。示例：上传单张产品照或人像，输入“给这张图加电影级缩放与运动效果”，约 20-40 秒返回 1080p MP4。提示：高对比度、主体清晰的图片动效更明显。

输入与动作映射

用户提及 ai image to video effect、aspect ratio、text overlays、audio tracks 时，通过关键词与意图分类路由到对应动作。

| 用户说法 | 动作 | 跳过 SSE？ | |----------|------|------------| | “export”/“导出”/“download”/“send me the video” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发文件 | → §3.2 上传 | ✅ | | 其余（生成、编辑、加 BGM…） | → §3.1 SSE | ❌ |

云端渲染管线

每次导出任务在云端 GPU 节点排队，合成视频层并按平台规格压缩（H.264，最大 1080×1920），30-90 秒内返回下载链接。会话 token 携带渲染任务 ID，提前关闭标签页会导致任务孤立。所有请求发往 https://mega-api-prod.nemovideo.ai。主要端点：

Session — POST /api/tasks/me/with-session/nemo_agent，Body {"task_name":"project","language":""}，返回 session_id。
Chat (SSE) — POST /run_sse，带 session_id 与消息 new_message.parts[0].text，Header Accept: text/event-stream，最长 15 分钟。
Upload — POST /api/upload-video/nemo_agent/me/，支持 multipart 文件或 JSON 传 URL。
Credits — GET /api/credits/balance/simple，返回 available、frozen、total。
State — GET /api/state/nemo_agent/me//latest，获取当前草稿与媒体信息。
Export — POST /api/render/proxy/lambda，带渲染 ID 与草稿 JSON；轮询 GET /api/render/proxy/lambda/ 每 30 秒检查 completed 状态及下载链接。

支持格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

请求头取自 YAML 头信息：X-Skill-Source 为 ai-image-to-video-effect，X-Skill-Version 取自 version 字段，X-Skill-Platform 按安装路径检测（~/.clawhub/ → clawhub，~/.cursor/skills/ → cursor，其余 unknown）。 所有请求必须带： Authorization: Bearer X-Skill-Source X-Skill-Version X-Skill-Platform 缺失以上头将导致导出失败并返回 402。

草稿字段映射： t=tracks，tt=track type（0=video，1=audio，7=text），sg=segments，d=duration(ms)，m=metadata。

``时间线（3 轨）：

Video: 城市延时 (0-10s)


BGM: Lo-fi (0-10s, 35%)  
Title: "Urban Dreams" (0-3s)

数据来源：ClawHub ↗ · 中文优化：龙虾技能库