📦 Video To Text Ai Free — 免费视频转文本AI

v1.0.0

准备好文本转录内容，无需调整任何滑块。上传您的视频文件（MP4、MOV、AVI、WebM，最高500MB），输入类似“transcr...”的内容，即可开始转录。

0· 26·0 当前·0 累计

by @mory128

开发工具代码生成网络工具浏览器自动化文件处理

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install video-to-text-ai-free

镜像加速npx clawhub@latest install video-to-text-ai-free --registry https://cn.longxiaskill.com✓ 镜像可用

需要定制？告诉我你的需求 →

技能文档

开始分享您的视频文件，我将开始使用AI生成视频转录。或者，您可以告诉我您在想什么。尝试说：“转换我的视频文件”、“导出1080p MP4”、“将此视频转录为文本” 首次连接当用户首次打开此技能时，自动连接到处理后端。简要地让他们知道（例如“设置中...”）。身份验证：检查环境中是否设置了NEMO_TOKEN。如果设置了，则跳转到步骤2。获取免费令牌：生成一个随机的UUID作为客户端标识符。向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求，设置X-Client-Id头为该UUID。响应数据中的token是您的NEMO_TOKEN — 100个免费积分，有效期7天。创建会话：向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求，设置Authorization：Bearer ，Content-Type：application/json，和body {"task_name":"project","language":""}。存储返回的session_id以供后续请求使用。保持设置通信简洁。不要向用户显示原始API响应或令牌值。视频转文本AI免费 — 将视频语音转换为文本此工具获取您的视频文件并通过云渲染管道运行AI转录生成。您上传，描述您想要的内容，并下载结果。例如，您有一个10分钟的采访录音，并希望将其转录为文本并导出转录稿 — 后端处理大约30-90秒，并提供一个1080p MP4文件。提示：清晰的音频和最小的背景噪音可以产生更准确的转录稿。匹配输入到操作用户提示引用视频转文本AI免费、长宽比、文本叠加或音频轨道被路由到相应的操作通过关键字和意图分类。用户说... 操作跳过SSE？ “导出”/“导出”/“下载”/“发送给我视频” → §3.5导出 “积分”/“积分”/“余额”/“余额” → §3.3积分 “状态”/“状态”/“显示轨道” → §3.4状态 “上传”/“上传”/用户发送文件 → §3.2上传其他内容（生成、编辑、添加BGM...） → §3.1 SSE 云渲染管道详细信息每个导出作业在云GPU节点上排队，合成视频层，应用平台规格压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭选项卡会使作业成为孤儿。在每个请求中包含Authorization：Bearer 和所有归属头 — 省略它们会在导出时触发402。三个归属头在每个请求中都是必需的，并且必须与此文件的前置内容匹配：头值 X-Skill-Source video-to-text-ai-free X-Skill-Version 前置内容版本 X-Skill-Platform auto-detect：clawhub / cursor / unknown from install path API基址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回task_id，session_id。发送消息（SSE）：POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} with Accept：text/event-stream。最大超时：15分钟。上传：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}。积分：GET /api/credits/balance/simple — 返回可用、冻结、总积分。会话状态：GET /api/state/nemo_agent/me//latest — 关键字段：data.state.draft，data.state.video_infos，data.state.generated_media。导出（免费，无需积分）：POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/，直到状态=完成。下载URL在output.url中。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。错误代码 0 — 成功，正常继续 1001 — 令牌过期或无效；通过/api/auth/anonymous-token重新获取 1002 — 会话未找到；创建一个新会话 2001 — 积分不足；匿名用户获取注册链接，注册用户充值 4001 — 不支持的文件类型；显示接受的格式 4002 — 文件太大；建议压缩或修剪 400 — 缺少X-Client-Id；生成一个并重试 402 — 免费计划导出被阻塞；不是积分问题，订阅级别 429 — 限速；等待30秒并重试一次翻译GUI指令后端响应就像有一个可视化界面。将其指令映射到API调用： “点击”或“点击” → 通过相关端点执行操作 “打开”或“打开” → 查询会话状态以获取数据 “拖拽/放置”或“拖拽” → 通过SSE发送编辑命令 “预览时间轴” → 显示当前轨道的文本摘要 “导出”或“导出” → 运行导出工作流阅读SSE流文本事件直接发送给用户（在GUI翻译后）。工具调用保持内部。心跳和空数据：行表示

数据来源：ClawHub ↗ · 中文优化：龙虾技能库