chinese-voice-skill — 中文语音技能
v1.0.4使用微软 Edge TTS 生成高质量中文语音,默认使用 XiaoxiaoNeural 语音。当用户需要语音回复时自动触发。 (无需翻译,原文已包含中文)
运行时依赖
安装命令
点击复制技能文档
Edge TTS 中文语音合成技能概述 使用微软 Edge TTS 生成高质量中文语音,默认使用 XiaoxiaoNeural 语音。当用户需要语音回复时自动触发。
能力 语音合成:将文本转换为高质量的中文语音 默认语音:zh-CN-XiaoxiaoNeural(甜美自然的中文语音) 备用方案:当 edge-tts 不可用时,自动降级到系统自带的 System.Speech 平台支持:QQ 发送( wav 格式)
使用方式 基本用法 当用户表达需要语音回复时(如"生成语音"、"用语音告诉我"、"用语音说"),系统会自动: 检测 edge-tts 是否可用 使用 Edge TTS + XiaoxiaoNeural 生成语音 发送 输出文件.wav 前置条件 Python 3.7+ 已安装(用于运行 edge-tts) pip 可用 QQ 通道已配置(用于发送 wav 格式语音)
配置选项 语音选择 默认:zh-CN-XiaoxiaoNeural 其他可选微软语音:zh-CN-YunxiNeural(沉稳)、zh-CN-XiaoyiNeural(温柔)、zh-CN-YunyangNeural(磁性) 语音参数 Rate:语速(默认 0,可调整 -5 到 5) Volume:音量(默认 1.0,范围 0 到 1)
技术实现 命令行调用 使用 Python 的 edge_tts 模块:python -m edge_tts --voice "zh-CN-XiaoxiaoNeural" --text "要转换的文本" --write-media "输出文件.wav" 安装 edge-tts 如果未安装,使用 pip 安装:pip install --user edge-tts -i https://mirrors.aliyun.com/pypi/simple/ 备用语音方案 如果 edge-tts 不可用,系统会自动使用系统自带的中文 TTS。
输出格式 文件格式:WAV(微软 TTS 标准格式) 采样率:24000 Hz 声道:单声道 位深度:16-bit
注意事项 网络要求:edge-tts 需要访问微软服务器 文件大小:生成的语音文件通常在 50-200 KB 自动清理:临时文件可能由系统自动清理 备用方案:当 edge-tts 不可用时自动降级,不影响基本功能
示例 用户:生成语音,"你好!这是一段测试文本。" AI:[调用 edge-tts 生成语音] [发送 C:\Users\ADMINI~1\AppData\Local\Temp\xxx.wav] [提示语音生成完成]
故障排除 edge-tts 未安装 使用 pip 安装 edge-tts:pip install --user edge-tts -i https://mirrors.aliyun.com/pypi/simple/ edge-tts 路径问题 检查 edge-tts 是否在 PATH 中:Get-Command edge_tts.exe -ErrorAction SilentlyContinue 语音未生成 检查网络连接 查看错误信息 确认 QQ 通道已配置 确认 ffmpeg 已安装(如需转换格式)