📦 VoiceReal Time — 实时语音
v1.0.0在 Discord 语音频道中与 Claude AI 进行语音对话
0· 14·0 当前·0 累计
安全扫描
OpenClaw
可疑
medium confidence该插件基本实现了其描述的功能(连接机器人到 Discord、转录语音、调用宿主代理并朗读回复),但存在几处不匹配与特权操作(动态核心导入、会话存储访问、系统提示注入),安装前需仔细审查。
评估建议
安装前须知:
1)验证插件源仓库及维护者——该包依赖众多且会执行代码,请仅从可信仓库安装。
2)需准备 Discord bot token 及 STT/TTS API 密钥(OpenAI、Deepgram、ElevenLabs、AWS Polly);勿在插件配置中存放无关密钥。
3)在插件配置中限制 allowedUsers;留空则任何加入频道者均可触发 agent,可能导致语音秘密泄露。
4)插件会动态导入宿主 OpenClaw API,并读写 session 存储与 agent 工作区;若在多租户或敏感环境运行,请隔离或审查访问路径。
5)确保仅可信管理员可编辑插件配置(extraSystemPrompt/noEmojiHint),这些字段会被注入系统提示。
6)禁止在宿主设置 NODE_TLS_REJECT_UNAUTHORIZED=0;插件检测到会告警,但该设置会削弱所有出站 TLS。
7)如需更高保障,请先审计加载文件(core-bridge、voice-connection、STT/TTS 模块),并在非生产环境试运行。...详细分析 ▾
ℹ 用途与能力
插件的名称/描述(Discord voice → STT/TTS → agent)与代码和清单一致:确实需要 Discord bot token 和 STT/TTS API key。然而,注册表顶部的元数据未列出任何必需环境变量,而 package/manifest 和 SKILL.md 却引用了多个提供商密钥(OpenAI、ElevenLabs、Deepgram、Polly)——这种不一致可能误导管理员对所需密钥的判断。
⚠ 指令范围
运行时指令与代码会动态加载宿主的 extensionAPI,直接读写 agent 的会话存储、解析 agent 工作区并调用宿主 agent。这些行为对“通过 agent 路由语音”的插件而言是连贯的,但同时暴露了宿主 agent 的内部实现与持久化会话数据。SKILL.md(及 SECURITY.md)还提到可向 agent 注入额外系统提示(noEmojiHint / extraSystemPrompt);系统提示操控能力极强,若配置可被不可信用户写入,就可能被滥用。插件已提示配置输入需由管理员控制,但该信任边界必须由部署方强制落实。
✓ 安装机制
无远程/提取安装 URL 或短链接;安装通过 npm/git 进行,符合预期。该包附带常规 package-lock,依赖标准 npm 包(discord.js、Deepgram、@xenova/transformers 等)。SKILL.md 中不存在高风险的任意下载/安装步骤。
ℹ 凭证需求
所请求的凭据(Discord token、OpenAI/Deepgram/ElevenLabs/AWS Polly 的密钥,可选)与 STT/TTS 及音频播放一致。但顶层声明的“所需环境变量:无”与 manifest 和代码矛盾。插件还会检查并警告 NODE_TLS_REJECT_UNAUTHORIZED,并可能读取主机配置以解析 agent/session 存储——因此需要访问平台配置和文件系统路径,权限高于普通集成,需经用户明确同意。
ℹ 持久化与权限
该技能不是“always:true”,可由用户调用。它注册长期运行的服务、工具、自动加入行为,并写入/更新会话存储文件。这些行为对持久化语音插件属正常,但由于其持久化会话状态并动态导入宿主扩展 API,对宿主代理内部拥有长期高权限——部署者应审查并限制插件配置与 allowedUsers。
⚠ index.ts:156
环境变量访问结合网络发送
⚠ src/streaming-tts.ts:45
环境变量访问结合网络发送
⚠ src/stt.ts:37
环境变量访问与网络发送相结合
⚠ src/tts.ts:48
环境变量访问与网络发送相结合
⚠ src/tts.ts:5
文件读取结合网络发送(可能存在数据外泄)。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/4/20
Discord 实时语音对话初版(Claude AI) - 通过命令或 agent tool 加入/离开 Discord 语音频道 - VAD 自动监听与转写 - 支持多 STT/TTS 提供商:OpenAI、ElevenLabs、Deepgram 及本地方案 - Deepgram 流式 STT,低延迟识别 - 支持打断:用户插话时自动停止播报 - 自动重连与连接健康监控,保障稳定
● 无害
安装命令
点击复制官方npx clawhub@latest install jx-voice
镜像加速npx clawhub@latest install jx-voice --registry https://cn.longxiaskill.com镜像同步中