Voice Transcribe — 语音转文本

Name: Voice Transcribe — 语音转文本
Rating: 1 (12 reviews)
Author: darinkishore

darinkishore

Voice Transcribe — 语音转文本

v1.0.1

使用 OpenAI 的 gpt-4o-mini-transcribe 模型，带有词汇提示和文本替换功能，转录音频文件。需要 uv（https://docs.astral.sh/uv/）

12· 5,269·32 当前·34 累计

by @darinkishore·MIT-0

AI模型访问网络工具文件处理文档工具

下载技能包

License

MIT-0

最后更新

2026/2/27

安全扫描

VirusTotal

无害

查看报告

OpenClaw

可疑

high confidence

技能描述与声称的目标（音频->转录）相符，但运行指令与声明的元数据不一致（需要未声明的 OpenAI API 密钥和位于硬编码用户路径的可运行 'transcribe' 工具），因此该包不一致，使用前需要澄清。

评估建议

["在作者澄清和修复这些问题之前，请勿安装或运行此技能：","(1) SKILL.md 需要 OPENAI_API_KEY，但元数据未列出——请作者声明所需的环境变量（并且更好地使用平台秘密存储而不是硬编码的 .env 文件）。","(2) 指令需要在 /Users/darin/... 运行 'transcribe' 可执行文件，但未提供可执行文件或安装步骤——请询问该二进制文件的来源并请求安装规范或包含的代码。","(3) 确认 'uv' (astral.sh) 的角色，并确保您信任该运行时。","(4) 避免将 API 密钥放在任意文件中；如果测试，请使用一次性密钥并检查实际运行的代码。如果作者无法提供缺失的文件或可信的安装源（例如 GitHub 发布或经过审查的包），则将此技能视为不可靠，不要给予它秘密或使用敏感音频运行它。"]...

详细分析 ▾

⚠ 用途与能力

技能名称/描述（通过 OpenAI 的语音转录）是合理的，但 SKILL.md 要求用户将 OPENAI_API_KEY 放在硬编码路径（/Users/darin/.../.env）并运行 'uv run /Users/darin/clawd/skills/voice-transcribe/transcribe'。包元数据未声明所需的环境变量，也不包括名为 'transcribe' 的可执行文件。这种不匹配（硬编码用户路径 + 未声明的凭据 + 缺失的可执行文件）与声明的目的和部署模型不一致。

⚠ 指令范围

指令告诉人类/代理在绝对路径运行 'transcribe' 命令，并将 OpenAI API 密钥存储在特定文件中——这些操作在技能包之外。它们还提到缓存和后处理替换。由于没有包含代码或可执行文件，指令模糊，并假设技能元数据未披露的本地工件和秘密。

ℹ 安装机制

没有安装规范（仅指令），这本身风险较低。然而，缺乏安装说明加上引用运行外部 'transcribe' 二进制文件意味着运行时将依赖于未提供的外部工具（uv 和可执行文件/脚本）；在运行前请验证该代码的来源。

⚠ 凭证需求

元数据声称没有所需的环境变量或主凭据，但 SKILL.md 明确指示将 OPENAI_API_KEY 放入本地 .env 文件。这是一个直接的不匹配：技能需要 API 密钥才能运行，但未声明它。指令还鼓励将密钥存储在硬编码的用户特定路径中，这是一种不良的且可能不安全的做法。

✓ 持久化与权限

技能未请求 always:true，也未声明持久的系统范围修改。默认允许自主调用（正常）。没有证据表明技能尝试修改其他技能或系统设置。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.12026/1/6

在描述中添加了 uv 的要求

● 无害

安装命令点击复制

官方npx clawhub@latest install voice-transcribe

镜像加速npx clawhub@latest install voice-transcribe --registry https://cn.clawhub-mirror.com

技能文档

使用 openai 的 gpt-4o-mini-transcribe 模型转录音频文件。

何时使用

接收到语音备忘录（尤其是通过 WhatsApp）时，只需运行：

uv run /Users/darin/clawd/skills/voice-transcribe/transcribe

然后根据转录内容进行响应。

修复转录错误

如果 Darin 说某个词被错误转录，请将其添加到 vocab.txt（作为提示）或 replacements.txt（保证修复）。请参阅以下部分。

支持格式

mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus

示例

# 转录语音备忘录
transcribe /tmp/voice-memo.ogg
# 管道到其他工具
transcribe /tmp/memo.ogg | pbcopy

设置

将您的 OpenAI API 密钥添加到 /Users/darin/clawd/skills/voice-transcribe/.env：

OPENAI_API_KEY=sk-...

自定义词汇

将单词添加到 vocab.txt（每行一个）以帮助模型识别名称/术语：

Clawdis
Clawdbot

文本替换

如果模型仍然错误，请将替换添加到 replacements.txt：

错误拼写 -> 正确拼写

注意

假设英语（无语言检测）
特别使用 gpt-4o-mini-transcribe 模型
根据音频文件的 SHA256 值缓存

transcribe audio files using openai's gpt-4o-mini-transcribe model.

when to use

when receiving voice memos (especially via whatsapp), just run:

uv run /Users/darin/clawd/skills/voice-transcribe/transcribe

then respond based on the transcribed content.

fixing transcription errors

if darin says a word was transcribed wrong, add it to vocab.txt (for hints) or replacements.txt (for guaranteed fix). see sections below.

supported formats

mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus

examples

# transcribe a voice memo transcribe /tmp/voice-memo.ogg

# pipe to other tools transcribe /tmp/memo.ogg | pbcopy

setup

add your openai api key to /Users/darin/clawd/skills/voice-transcribe/.env:

   OPENAI_API_KEY=sk-...

custom vocabulary

add words to vocab.txt (one per line) to help the model recognize names/jargon:

Clawdis
Clawdbot

text replacements

if the model still gets something wrong, add a replacement to replacements.txt:

wrong spelling -> correct spelling

notes

assumes english (no language detection)
uses gpt-4o-mini-transcribe model specifically
caches by sha256 of audio file

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

License

运行时依赖

版本

安装命令 点击复制

技能文档

何时使用

修复转录错误

支持格式

示例

设置

自定义词汇

文本替换

注意

when to use

fixing transcription errors

supported formats

examples

setup

custom vocabulary

text replacements

notes

安装命令点击复制