📝 Transcript — 转录
v1.0.0跳过专业编辑软件的学习曲线。只需描述你的需求——生成这段采访视频的完整文字转录——即可获得文本转...
详细分析 ▾
运行时依赖
版本
Initial release of Transcript 生成器 — Convert Video Speech to Text. - Instantly 生成 accurate text transcripts from 上传ed video or audio files (MP4, MOV, AVI, 网页M up to 500MB). - Simple 工作流: 上传, describe your 请求, and 接收 下载able transcript files in 30–90 seconds. - Seamless automatic authentication and 会话 creation. - Supports common 导出 and 状态 actions, with clear error messaging. - De签名ed for content 创建器s, journa列出s, and students needing fast, reliable transcriptions.
安装命令
点击复制技能文档
快速开始
把视频或音频发给我,AI 自动转写。也可直接描述需求。
试试说:
- “把 10 分钟 Zoom 录屏生成 1080p MP4”
- “生成这段采访视频的完整文字稿”
- “把视频语音转成可搜索文本,供创作者、记者、学生使用”
自动初始化
首次交互时先连接处理 API,显示“正在初始化…”。Token:若环境变量 NEMO_TOKEN 已存在,直接跳过。
免费 token:生成 UUID 作为客户端 ID,POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,Header 带 X-Client-Id: ,取响应 data.token 作为 NEMO_TOKEN(100 积分,7 天有效)。
Session:Bearer 鉴权 POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,body {"task_name":"project"},保存返回的 session_id。确认连接成功,不打印 token 或原始 JSON。
# Transcript Generator — Convert Video Speech to Text 上传视频/音频,AI 云端转写,30-90 秒返回结果。清晰短片段准确率更高。
指令与动作映射
| 用户说… | 动作 | 跳过 SSE? | |---------|------|------------| | “export/导出/download/发我视频” | → §3.5 导出 | ✅ | | “credits/积分/balance/余额” | → §3.3 积分 | ✅ | | “status/状态/show tracks” | → §3.4 状态 | ✅ | | “upload/上传/发文件” | → §3.2 上传 | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |云端渲染细节
导出任务在 GPU 节点排队,合成视频层,H.264 压缩,最高 1080×1920,30-90 秒返回下载链接。关闭页面前确保任务完成。每次请求须带:Authorization: Bearer
及三个归因 Header:
| Header | 值 |
|--------|----|
| X-Skill-Source | transcript-generator |
| X-Skill-Version | 前文中 version |
| X-Skill-Platform | 自动检测:clawhub / cursor / unknown | API 基址:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent
SSE 对话:POST /run_sse
上传:POST /api/upload-video/nemo_agent/me/
积分:GET /api/credits/balance/simple
状态:GET /api/state/nemo_agent/me//latest
导出:POST /api/render/proxy/lambda
支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。