📦 在线添加音乐

v1.0.0

使用此技能将视频文件添加到带有背景音乐的视频中。支持MP4、MOV、AVI、WebM文件，最大500MB。内容创作者使用它来添加背景音乐...

0· 19·0 当前·0 累计

by @linmillsd7

文件处理开发工具视频处理音频处理系统工具

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install online-add-music

镜像加速npx clawhub@latest install online-add-music --registry https://cn.longxiaskill.com✓ 镜像可用

需要定制？告诉我你的需求 →

技能文档

开始使用您有视频文件需要处理吗？请发送给我并告诉我您需要什么——我将负责添加音乐音轨。尝试说：“将2分钟的旅行视频片段添加到1080p MP4中”“将背景音乐添加到我的视频中并将音量调整到30%”“为内容创作者在线添加视频背景音乐”

快速启动设置此技能连接到云处理后端。首次使用时，自动设置连接并通知用户（“连接中...”）。令牌检查：在环境中查找NEMO_TOKEN。如果找到，跳转到会话创建。否则：生成UUID作为客户端标识符 POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，带有X-Client-Id头从响应中提取数据。令牌——这是您的NEMO_TOKEN（100个免费积分，7天过期）

会话： POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，带有Bearer身份验证和正文{"task_name":"project"}。保留返回的session_id以进行所有操作。当设置完成时，通知用户“准备就绪！”。不要暴露令牌或原始API输出。

在线添加音乐——在线为视频添加音乐将您的视频文件发送给我并描述您想要的结果。音乐音轨添加在远程GPU节点上运行——无需在您的机器上安装任何内容。快速示例：上传2分钟的旅行视频片段，输入“将背景音乐添加到我的视频中并将音量调整到30%”，您将在大约20-40秒内获得1080p MP4文件。所有渲染都发生在服务器端。值得注意的是，在上传之前，将音频轨道剪辑到与视频长度匹配，以获得更干净的结果。

输入与操作匹配用户提示引用在线添加音乐、长宽比、文本覆盖或音频轨道，通过关键字和意图分类路由到相应的操作。用户说... 操作跳过SSE？ “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传其他所有内容（生成、编辑、添加BGM...）→ §3.1 SSE

云渲染管道详细信息每个导出作业都在云GPU节点上排队，合成视频层，应用平台特定压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭选项卡会使作业成为孤儿。所有调用都发送到https://mega-api-prod.nemovideo.ai。主要端点：会话 — POST /api/tasks/me/with-session/nemo_agent，带有{"task_name":"project","language":""}}。给您一个session_id。聊天（SSE）— POST /run_sse，带有session_id和您的消息new_message.parts[0].text。设置Accept：text/event-stream。最长15分钟。上传 — POST /api/upload-video/nemo_agent/me/ — multipart文件或带有URL的JSON。积分 — GET /api/credits/balance/simple — 返回可用、冻结、总积分。状态 — GET /api/state/nemo_agent/me//latest — 当前草稿和媒体信息。导出 — POST /api/render/proxy/lambda，带有渲染ID和草稿JSON。每30秒轮询GET /api/render/proxy/lambda/以获取完成状态和下载URL。

格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。头部从此文件的YAML前置内容中派生。X-Skill-Source是online-add-music，X-Skill-Version来自版本字段，X-Skill-Platform从安装路径中检测（~/.clawhub/ = clawhub，~/.cursor/skills/ = cursor，否则为未知）。每个API调用都需要Authorization：Bearer ，以及上述三个归属头。如有任何头部缺失，导出将返回402。

草稿JSON使用短键：t表示轨道，tt表示轨道类型（0 = 视频，1 = 音频，7 = 文本），sg表示段，d表示以毫秒为单位的持续时间，m表示元数据。时间线摘要示例：时间线（3个轨道）：

视频：城市延时（0-10秒）
BGM：Lo-fi（0-10秒，35%）
标题：“城市梦想”（0-3秒）

后端响应翻译后端假设存在GUI。将这些翻译为API操作：后端说您执行 “点击[按钮]”/“点击” 通过API执行“打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “在时间线中预览” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流

SSE事件处理事件操作文本响应应用GUI翻译（§4），呈现给用户工具调用/结果在内部处理，不转发心跳/空数据：继续等待。每2分钟：“⏳仍在工作...” 流关闭处理最终响应大约30%的编辑操作在SSE流中返回没有文本。当这种情况发生时：轮询会话状态以验证编辑是否已应用，然后将更改总结给用户。

错误代码 0 — 成功，正常继续 1001 — 令牌过期或无效；通过/api/auth/anonymous-token重新获取 1002 — 未找到会话；创建一个新会话 2001 — 积分不足；匿名用户获取带有？bind = 的注册链接，注册用户补充积分 4001 — 不支持的文件类型；显示接受的格式

数据来源：ClawHub ↗ · 中文优化：龙虾技能库