🎵 Unified — 统一

v1.0.0

Video Lyrics Online 只需输入需求,即可将3分钟音乐视频文件转为1080p歌词同步视频。无论是为在线音乐视频添加定时歌词,还是……

0· 7·0 当前·0 累计
下载技能包
最后更新
2026/4/19
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能的需求与运行说明大体符合云端视频/歌词渲染服务,但存在少量元数据不一致,且缺少发布者/主页,降低了可信度——安装前请检查远程端点和 token 使用。
评估建议
此技能的功能如其所述:将视频上传至远程渲染服务并返回带同步歌词的视频。安装或使用前请注意: (1)服务端点(https://mega-api-prod.nemovideo.ai)将接收你的视频/音频——请确认你信任该运营方并了解其隐私政策; (2)NEMO_TOKEN 提供 API 访问权限,绑定你的账户或匿名试用令牌——避免在此处使用长期或高权限凭证; (3)frontmatter 提到本地配置路径(~/.config/nemovideo/),而注册元数据未提及——请向发布者确认该技能是否读取本地配置文件; (4)未列出主页或发布者信息——优先选择已知厂商的技能,或向作者索要身份与文档; (5)因该技能仅为指令式,静态扫描器无法分析——网络请求与数据上传均在运行时发生,请审查端点与请求头。 若仍要使用,建议先用非敏感视频和一次性/匿名令牌测试。...
详细分析 ▾
用途与能力
名称/描述与 SKILL.md 中的操作(上传视频、创建会话、渲染/导出)一致。将 NEMO_TOKEN 作为主要凭证适用于托管服务。小不一致:顶层 registry 元数据未列出必需配置路径,而技能前言却宣传了配置路径(~/.config/nemovideo/)——应澄清此差异。
指令范围
说明聚焦于连接远程 API、创建会话、上传视频文件、读取 SSE 事件、轮询渲染状态并返回下载 URL——均为云渲染/歌词同步服务所需。SKILL.md 并未要求读取无关本地文件或无关环境变量。
安装机制
无安装规范、无代码文件——仅基于指令的 Skill。这是风险最低的安装方式(Skill 本身不会向磁盘写入任何内容)。
凭证需求
仅声明并使用了单一凭据(NEMO_TOKEN),规模合理。然而,frontmatter 引用了本地配置路径(~/.config/nemovideo/),该路径在注册元数据中未被声明;若技能在运行时确实读取该路径,将扩大其范围,应予以披露。该技能还指示发出源自安装路径检测的归因标头(读取安装路径元数据)——影响较小,但值得注意。
持久化与权限
该技能未强制持久化包含(always:false),也未请求提升系统权限。它不会指示修改其他技能或系统级配置。自主调用仍被允许(平台默认),但未与其他高风险标志组合使用。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/19

Unified Video Lyrics Online — v1.0.0 - 首个版本,支持在线 AI 歌词同步音乐视频,云端导出 1080p。 - 上传视频并描述需求,自动生成带时码歌词与叠加层。 - 连接远程 GPU 后端,服务器端快速渲染(通常 30–60 秒)。 - 按积分计费,新用户可无缝获取代币;赠送最多 100 积分。 - 支持 MP4、MOV、AVI、WebM 等多种视频/音频格式。 - 用户可通过简单聊天指令查看导出状态、管理积分、预览时间线并下载成片。

无害

安装命令

点击复制
官方npx clawhub@latest install unified-video-lyrics-online
镜像加速npx clawhub@latest install unified-video-lyrics-online --registry https://cn.longxiaskill.com

技能文档

快速开始

把带音频的视频发给我,AI 自动同步歌词;或直接描述需求。
试试说:
  • “把 3 分钟音乐视频文件转成 1080p MP4”
  • “把歌词按人声时间轴显示为屏幕文字”
  • “给音乐视频在线加时间轴歌词,面向音乐人和内容创作者”

建立连接

处理任何请求前,先连接后端 API,显示“连接中…”。 若环境变量存在 NEMO_TOKEN,直接用它创建会话;否则获取免费试用 token:
  • 生成 UUID 作为客户端 ID
  • POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 X-Client-Id
  • 响应含 100 积分、7 天有效的 token —— 用作 NEMO_TOKEN

接着创建会话:POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project","language":"en"}。用返回的 session_id 进行后续请求。 告诉用户已就绪,技术细节不出现在聊天。

# Unified Video Lyrics Online — 在线同步歌词到视频 把带音频的视频发给我,并描述想要的结果。AI 歌词同步在远程 GPU 节点运行,本机无需安装。 示例:上传 3 分钟音乐视频,输入“把歌词按人声时间轴显示为屏幕文字”,约 30-60 秒返回 1080p MP4。渲染全程在云端完成。 提示:音频干净、背景噪音少,可提高歌词同步准确度。

输入与动作匹配

用户提及统一视频歌词在线、画面比例、文字层、音轨等,将通过关键词与意图分类路由到对应动作。

| 用户说… | 动作 | 跳过 SSE? | |-------------|--------|----------| | “export”/“导出”/“download”/“发我视频” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发文件 | → §3.2 上传 | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |

云端渲染流程

每次导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。 session token 携带渲染任务 ID,提前关闭标签页会导致任务孤立。 所有请求指向 https://mega-api-prod.nemovideo.ai

主要端点:

  • SessionPOST /api/tasks/me/with-session/nemo_agent,body {"task_name":"project","language":""},返回 session_id
  • Chat (SSE)POST /run_sse,带 session_id 与消息 new_message.parts[0].textAccept: text/event-stream,最长 15 分钟。
  • UploadPOST /api/upload-video/nemo_agent/me/,支持 multipart 文件或 JSON 传 URL。
  • CreditsGET /api/credits/balance/simple,返回 availablefrozentotal
  • StateGET /api/state/nemo_agent/me//latest,获取当前草稿与媒体信息。
  • ExportPOST /api/render/proxy/lambda,带渲染 ID 与草稿 JSON;每 30s GET /api/render/proxy/lambda/ 轮询 completed 状态与下载链接。
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

请求头取自本文件 YAML 头信息:X-Skill-Sourceunified-video-lyrics-onlineX-Skill-Version 取自 version 字段,X-Skill-Platform 按安装路径检测(~/.clawhub/clawhub~/.cursor/skills/cursor,其余 unknown)。 每次 API 调用需 Authorization: Bearer 及上述三个归因头;缺失则导出返回 402。

草稿字段映射t=tracks,tt=track type(0=视频,1=音频,7=文字),sg=segments,d=duration(ms),m=metadata。

`` 时间轴(3 轨):

  • 视频:城市延时(0-10s)
  • BGM:Lo-fi(0-10s,35%)
  • 标题:“Urban Dreams”(0-3s)
``

GUI 指令转 API

后端按可视化界面返回指令,映射为 API 调用:
  • “click”或“点击” → 通过对应 API 执行动作
数据来源ClawHub ↗ · 中文优化:龙虾技能库