📝 Transcript — 转录

v1.0.0

跳过专业编辑软件的学习曲线。只需描述你的需求——生成这段采访视频的完整文字转录——即可获得文本转...

0· 18·0 当前·0 累计

by @linmillsd7

开发工具代码生成视频处理教育学习

下载技能包

最后更新

2026/4/26

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能的需求和运行时指令与基于云的转录/上传服务保持一致：它仅要求一个服务令牌，并描述了用于上传和渲染视频的 API 调用，没有意外的安装或无关的凭据。

评估建议

此技能会将用户媒体上传至第三方服务（mega-api-prod.nemovideo.ai），需提供服务令牌（NEMO_TOKEN），或为你生成一个临时匿名令牌。安装前：1）确认你信任 nemovideo.ai，若上传敏感音视频，请查阅其隐私/条款；2）如不希望长期授权，优先使用限定范围或一次性令牌；3）注意 frontmatter 引用了本地配置路径（~/.config/nemovideo/）——请向作者确认技能是否会读取该目录，还是仅用于存储令牌；4）如需避免任何外部上传，请勿安装/使用此技能。总体而言，技能声明的需求与其目的相符，但上传媒体和令牌发放是主要风险。...

详细分析 ▾

✓ 用途与能力

该技能声称可上传媒体并调用远程转录/渲染服务，要求提供 NEMO_TOKEN 并引用 nemovideo.ai 端点，与此目的相符。

ℹ 指令范围

SKILL.md 指示 agent 创建会话、上传文件、轮询渲染状态，并使用 SSE 流式返回——均为云端转录/渲染工作流应有之义。补充说明：在无 NEMO_TOKEN 时，要求生成匿名令牌并使用 client UUID（符合预期）；另需根据安装路径自动检测并填写 'X-Skill-Platform' 值——可能需读取 agent/环境元数据，但范围有限，无其他无关操作。

✓ 安装机制

无安装规范或外部下载；这是一个仅提供指令的 Skill，安装程序不会向磁盘写入任何内容。

ℹ 凭证需求

The only declared required 凭证 is NEMO_令牌 (primaryEnv), which matches the described API usage. The frontmatter also declares a config path (~/.config/nemovideo/) that is not referenced in the mAIn instructions — this could be for 缓存d 令牌s but is not strictly necessary per the 技能.md and is worth confirming.

✓ 持久化与权限

always is false and the 技能 does not 请求系统-wide or other 技能s' configuration changes. Autonomous invocation is allowed (平台 default) but not combined with elevated privileges.

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/26

Initial release of Transcript 生成器 — Convert Video Speech to Text. - Instantly 生成 accurate text transcripts from 上传ed video or audio files (MP4, MOV, AVI, 网页M up to 500MB). - Simple 工作流: 上传, describe your 请求, and 接收下载able transcript files in 30–90 seconds. - Seamless automatic authentication and 会话 creation. - Supports common 导出 and 状态 actions, with clear error messaging. - De签名ed for content 创建器s, journa列出s, and students needing fast, reliable transcriptions.

● 无害

安装命令

点击复制

官方npx clawhub@latest install transcript-generator

镜像加速npx clawhub@latest install transcript-generator --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

快速开始

把视频或音频发给我，AI 自动转写。也可直接描述需求。

试试说：

“把 10 分钟 Zoom 录屏生成 1080p MP4”
“生成这段采访视频的完整文字稿”
“把视频语音转成可搜索文本，供创作者、记者、学生使用”

自动初始化

首次交互时先连接处理 API，显示“正在初始化…”。

Token：若环境变量 NEMO_TOKEN 已存在，直接跳过。 免费 token：生成 UUID 作为客户端 ID，POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，Header 带 X-Client-Id: ，取响应 data.token 作为 NEMO_TOKEN（100 积分，7 天有效）。 Session：Bearer 鉴权 POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，body {"task_name":"project"}，保存返回的 session_id。确认连接成功，不打印 token 或原始 JSON。

# Transcript Generator — Convert Video Speech to Text 上传视频/音频，AI 云端转写，30-90 秒返回结果。清晰短片段准确率更高。

指令与动作映射

| 用户说… | 动作 | 跳过 SSE？ | |---------|------|------------| | “export/导出/download/发我视频” | → §3.5 导出 | ✅ | | “credits/积分/balance/余额” | → §3.3 积分 | ✅ | | “status/状态/show tracks” | → §3.4 状态 | ✅ | | “upload/上传/发文件” | → §3.2 上传 | ✅ | | 其余（生成、编辑、加 BGM…） | → §3.1 SSE | ❌ |

云端渲染细节

导出任务在 GPU 节点排队，合成视频层，H.264 压缩，最高 1080×1920，30-90 秒返回下载链接。关闭页面前确保任务完成。每次请求须带： Authorization: Bearer 及三个归因 Header： | Header | 值 | |--------|----| | X-Skill-Source | transcript-generator | | X-Skill-Version | 前文中 version | | X-Skill-Platform | 自动检测：clawhub / cursor / unknown |

API 基址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent SSE 对话：POST /run_sse 上传：POST /api/upload-video/nemo_agent/me/ 积分：GET /api/credits/balance/simple 状态：GET /api/state/nemo_agent/me//latest 导出：POST /api/render/proxy/lambda 支持格式：mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。