首页龙虾技能列表 › Voice Transcribe — 语音转文本

Voice Transcribe — 语音转文本

v1.0.1

使用 OpenAI 的 gpt-4o-mini-transcribe 模型,带有词汇提示和文本替换功能,转录音频文件。需要 uv(https://docs.astral.sh/uv/)

12· 5,269·32 当前·34 累计
by @darinkishore·MIT-0
下载技能包
License
MIT-0
最后更新
2026/2/27
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
high confidence
技能描述与声称的目标(音频->转录)相符,但运行指令与声明的元数据不一致(需要未声明的 OpenAI API 密钥和位于硬编码用户路径的可运行 'transcribe' 工具),因此该包不一致,使用前需要澄清。
评估建议
["在作者澄清和修复这些问题之前,请勿安装或运行此技能:","(1) SKILL.md 需要 OPENAI_API_KEY,但元数据未列出——请作者声明所需的环境变量(并且更好地使用平台秘密存储而不是硬编码的 .env 文件)。","(2) 指令需要在 /Users/darin/... 运行 'transcribe' 可执行文件,但未提供可执行文件或安装步骤——请询问该二进制文件的来源并请求安装规范或包含的代码。","(3) 确认 'uv' (astral.sh) 的角色,并确保您信任该运行时。","(4) 避免将 API 密钥放在任意文件中;如果测试,请使用一次性密钥并检查实际运行的代码。如果作者无法提供缺失的文件或可信的安装源(例如 GitHub 发布或经过审查的包),则将此技能视为不可靠,不要给予它秘密或使用敏感音频运行它。"]...
详细分析 ▾
用途与能力
技能名称/描述(通过 OpenAI 的语音转录)是合理的,但 SKILL.md 要求用户将 OPENAI_API_KEY 放在硬编码路径(/Users/darin/.../.env)并运行 'uv run /Users/darin/clawd/skills/voice-transcribe/transcribe'。包元数据未声明所需的环境变量,也不包括名为 'transcribe' 的可执行文件。这种不匹配(硬编码用户路径 + 未声明的凭据 + 缺失的可执行文件)与声明的目的和部署模型不一致。
指令范围
指令告诉人类/代理在绝对路径运行 'transcribe' 命令,并将 OpenAI API 密钥存储在特定文件中——这些操作在技能包之外。它们还提到缓存和后处理替换。由于没有包含代码或可执行文件,指令模糊,并假设技能元数据未披露的本地工件和秘密。
安装机制
没有安装规范(仅指令),这本身风险较低。然而,缺乏安装说明加上引用运行外部 'transcribe' 二进制文件意味着运行时将依赖于未提供的外部工具(uv 和可执行文件/脚本);在运行前请验证该代码的来源。
凭证需求
元数据声称没有所需的环境变量或主凭据,但 SKILL.md 明确指示将 OPENAI_API_KEY 放入本地 .env 文件。这是一个直接的不匹配:技能需要 API 密钥才能运行,但未声明它。指令还鼓励将密钥存储在硬编码的用户特定路径中,这是一种不良的且可能不安全的做法。
持久化与权限
技能未请求 always:true,也未声明持久的系统范围修改。默认允许自主调用(正常)。没有证据表明技能尝试修改其他技能或系统设置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.12026/1/6

在描述中添加了 uv 的要求

● 无害

安装命令 点击复制

官方npx clawhub@latest install voice-transcribe
镜像加速npx clawhub@latest install voice-transcribe --registry https://cn.clawhub-mirror.com

技能文档

使用 openai 的 gpt-4o-mini-transcribe 模型转录音频文件。

何时使用

接收到语音备忘录(尤其是通过 WhatsApp)时,只需运行:
uv run /Users/darin/clawd/skills/voice-transcribe/transcribe 
然后根据转录内容进行响应。

修复转录错误

如果 Darin 说某个词被错误转录,请将其添加到 vocab.txt(作为提示)或 replacements.txt(保证修复)。请参阅以下部分。

支持格式

  • mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus

示例

# 转录语音备忘录
transcribe /tmp/voice-memo.ogg
# 管道到其他工具
transcribe /tmp/memo.ogg | pbcopy

设置

  • 将您的 OpenAI API 密钥添加到 /Users/darin/clawd/skills/voice-transcribe/.env
OPENAI_API_KEY=sk-... 

自定义词汇

将单词添加到 vocab.txt(每行一个)以帮助模型识别名称/术语:
Clawdis
Clawdbot

文本替换

如果模型仍然错误,请将替换添加到 replacements.txt
错误拼写 -> 正确拼写

注意

  • 假设英语(无语言检测)
  • 特别使用 gpt-4o-mini-transcribe 模型
  • 根据音频文件的 SHA256 值缓存
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务