🎙️ Text — 文本

v1.0.0

生成对口型视频,无需调节任何参数即可直接发布。上传你的文本脚本(TXT、DOCX、PDF、纯文本,最大 500MB),只需说……

0· 9·0 当前·0 累计
by @peand-rover (peandrover adam)
下载技能包
最后更新
2026/4/19
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能确实如描述所示(连接 nemo video API 将文本转为 talking-head 视频),仅请求一个 service token;存在少量元数据不一致,并依赖外部 API 生成匿名 token,需留意。
评估建议
此技能与其用途内部一致:它仅与 nemo video 后端通信,且只索取 NEMO_TOKEN(若未提供,可获取匿名短效令牌)。安装前请考虑:1)无主页或厂商信息——请确认你信任 mega-api-prod.nemovideo.ai,并愿意向该服务上传内容;2)该技能会发起网络调用以生成令牌及上传/下载媒体——请勿提供其他无关凭据;3)SKILL.md 的 frontmatter 提到本地配置路径 ~/.config/nemovideo/,而注册元数据未提及——若在意,请检查代理是否及在何处将令牌或文件写入磁盘;4)若你拥有付费或企业账户,建议自备 NEMO_TOKEN,而非依赖匿名令牌回退;5)在发送敏感脚本或媒体前,请审阅提供商的数据/隐私政策。若需更高保障,可索取该技能的源码或经审计的发布者,并询问上传媒体及令牌的存储位置与时长。...
详细分析 ▾
用途与能力
名称和描述与运行时指令一致:该技能连接 mega-api-prod.nemovideo.ai 以创建会话、上传脚本、渲染视频并返回下载 URL。请求 NEMO_TOKEN(服务令牌)与所述目的相符。
指令范围
SKILL.md 指示 agent:检查 NEMO_TOKEN,若无则向服务的 /api/auth/anonymous-token 端点 POST 获取短期匿名令牌;创建会话、发送 SSE 消息、上传文件(multipart 或 URL)、轮询渲染状态并下载结果。这些操作属于云渲染客户端范畴,但涉及对外部端点的网络调用及处理用户上传文件。说明还禁止暴露令牌或原始 API 输出,这是好的。一点小注:SKILL 的 frontmatter 包含配置路径 ~/.config/nemovideo/,而注册元数据未列出,存在不一致,可能暗示可选的本地配置使用。
安装机制
这是一个仅包含指令的技能,没有安装规范,也没有代码文件,因此安装程序不会向磁盘写入任何内容。风险最低的安装机制。
凭证需求
仅声明并使用了一个服务凭据(NEMO_TOKEN)。该技能还实现了回退机制:若未提供令牌,则通过 provider API 生成匿名令牌;此行为与服务客户端一致,意味着技能可代表代理获取并使用短期凭据。
持久化与权限
始终为 false,且该 skill 不会请求提升的平台权限。该 skill 描述了为 provider 创建并使用 session token,但未尝试修改其他 skill 或系统级设置。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/19

Text to Video: Human to Human 首发——瞬间将文本脚本(TXT、DOCX、PDF,最大 500MB)转为 1080p MP4 真人讲解视频,由逼真 AI presenter 出镜。 无需手动滑杆或视频技能:上传脚本、输入提示、直接下载。 云端渲染流水线:自动会话初始化、安全匿名 token、积分体系(新用户 100 积分,7 天有效期)。 清晰四步流程:上传、编辑、导出、追踪项目状态。 支持批量处理、迭代优化、多格式输出(mp4、mov、avi、webm 等),快速交付(通常 1–3 分钟/条)。 内置错误提示、技巧与自助排障。

无害

安装命令

点击复制
官方npx clawhub@latest install text-to-video-h2h
镜像加速npx clawhub@latest install text-to-video-h2h --registry https://cn.longxiaskill.com

技能文档

快速开始

把脚本发给我,立刻开始 AI 虚拟人视频制作。或直接告诉我你的想法。
试试说:
  • “转换我的文本脚本”
  • “导出 1080p MP4”
  • “把这段脚本变成口播”

一键初始化

本技能连接云端渲染后端。首次使用自动完成连接并提示“连接中…”。 Token 检查:先找环境变量 NEMO_TOKEN。若存在,直接进入会话;否则:
  • 生成 UUID 作为客户端 ID
  • POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 X-Client-Id
  • 取响应 data.token 即为 NEMO_TOKEN(100 免费积分,7 天有效期)

会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project"}。保存返回的 session_id 用于后续操作。完成后提示“就绪!”。勿暴露 token 或原始 API 输出。

# Text to Video: Human to Human — 把脚本变成 presenter 视频 上传文本脚本,云端 AI 虚拟人渲染管线自动处理。150 字销售稿或博客开头,一句指令即可在 1-3 分钟内拿到 1080p MP4。 提示:200 字以内脚本渲染更快,观众留存更高。

指令与动作对照

用户提及 text to video h2h、比例、文字层、音轨等关键词时,按以下表路由:

| 用户说… | 动作 | 跳过 SSE? | |---------|------|-----------| | “export” / “导出” / “download” / “发我视频” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发文件 | → §3.2 上传 | ✅ | | 其他(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |

云端渲染细节

每段导出任务在 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最高 1080×1920),30-90 秒返回下载链接。会话 token 携带任务 ID,提前关闭标签页会导致任务孤立。 每次请求必须带以下归因头,且与文件头匹配:

| Header | 值 | |--------|----| | X-Skill-Source | text-to-video-h2h | | X-Skill-Version | 文件头 version | | X-Skill-Platform | 自动检测:clawhub / cursor / unknown |

同时带 Authorization: Bearer 。缺失即 402。

API 基址https://mega-api-prod.nemovideo.ai

  • 创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_id, session_id
  • 发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}Accept: text/event-stream,最长 15 分钟
  • 上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
  • 积分:GET /api/credits/balance/simple — 返回 available, frozen, total
  • 会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft, data.state.video_infos, data.state.generated_media
  • 导出(免费,不扣积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。轮询 GET /api/render/proxy/lambda/ 每 30 秒,直到 status = completed,下载地址在 output.url

支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。

SSE 流解析

文本事件直接展示(GUI 翻译后)。工具调用内部处理。心跳及空 data: 行忽略。

数据来源ClawHub ↗ · 中文优化:龙虾技能库