Fish Audio TTS — 插件工具

Name: Fish Audio TTS — 插件工具
Author: livingghost

livingghost

代码插件安全

Fish Audio TTS — 插件工具

v1.0.0

The package is internally consistent with its stated purpose (an OpenClaw Fish Audio TTS provider) and only requires a Fish Audio API key; there are no unexpected credentials, downloads, or privileged behaviors.

0· 0·0 当前

by @livingghost

数据与API 开发工具代码生成数据分析设计工具

下载插件包项目主页

最后更新

2026/4/12

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

The package is internally consistent with its stated purpose (an OpenClaw Fish Audio TTS provider) and only requires a Fish Audio API key; there are no unexpected credentials, downloads, or privileged behaviors.

安全有层次，运行前请审查代码。

版本

latestv1.0.02026/4/12

● 无害

安装命令点击复制

官方npx clawhub@latest install openclaw-fish-audio-tts

镜像加速npx clawhub@latest install openclaw-fish-audio-tts --registry https://cn.clawhub-mirror.com

插件文档

Fish Audio TTS for OpenClaw

Unofficial, community-maintained OpenClaw plugin that adds the Fish Audio TTS provider. It is built for OpenClaw's extension loader and local wrapper use, not as a generic Fish Audio SDK wrapper.

Package name: openclaw-fish-audio-tts
Extension/plugin id: fish-audio-tts
Speech provider id: fish-audio
License: MIT
Required auth: FISH_AUDIO_API_KEY or messages.tts.providers["fish-audio"].apiKey

The extension registers the fish-audio speech provider, so OpenClaw config uses messages.tts.provider: "fish-audio" and messages.tts.providers["fish-audio"].

Requirements

OpenClaw >=2026.4.11
Fish Audio API key via FISH_AUDIO_API_KEY or messages.tts.providers["fish-audio"].apiKey
A Fish Audio single-speaker voiceId / reference_id

Minimal TTS config

{
  messages: {
    tts: {
      provider: "fish-audio",
      providers: {
        "fish-audio": {
          voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
        },
      },
    },
  },
}

Example with supported settings

{
  messages: {
    tts: {
      provider: "fish-audio",
      providers: {
        "fish-audio": {
          apiKey: "optional-if-FISH_AUDIO_API_KEY-is-set",
          baseUrl: "https://api.fish.audio";,
          voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
          model: "s2-pro",
          latency: "normal",
          speed: 1,
          temperature: 0.7,
          topP: 0.7,
          normalize: true,
          chunkLength: 300,
          sampleRate: 44100,
          mp3Bitrate: 128,
        },
      },
    },
  },
}

Talk mode example

Talk mode uses talk.provider and talk.providers.<provider>. For Fish Audio, keep the Talk provider name as fish-audio.

{
  talk: {
    provider: "fish-audio",
    providers: {
      "fish-audio": {
        voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
        model: "s2-pro",
        latency: "balanced",
        speed: 1,
        normalize: true,
      },
    },
  },
}

`talk.speak` override example

The public talk.speak gateway method accepts the generic Talk override fields. For Fish Audio, the practical per-request overrides are voiceId, modelId, speed, and normalize.

{
  "method": "talk.speak",
  "params": {
    "text": "Hello, this is OpenClaw.",
    "voiceId": "802e3bc2b27e49c2995d23ef70e6ac89",
    "modelId": "s2-pro",
    "speed": 0.95,
    "normalize": "on"
  }
}

Discord voice example

Discord voice playback can override the global messages.tts config with channels.discord.voice.tts.

{
  channels: {
    discord: {
      voice: {
        enabled: true,
        tts: {
          provider: "fish-audio",
          providers: {
            "fish-audio": {
              voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
              model: "s2-pro",
              latency: "normal",
            },
          },
        },
      },
    },
  },
}

Emotion and style tags

Fish Audio emotion control is text-driven. The plugin does not transform these markers; it passes them through exactly as written.

(happy) What a beautiful day!
(sad)(whispering) I'll miss you so much.
(excited)(laughing) We did it! Ha ha ha!

These examples come from Fish Audio's emotion reference. You can mix tags such as (happy), (sad), (whispering), (laughing), (sighing), and (panting) directly into the spoken text when the target voice/model supports them.

Config reference

Key	Type	Default	Notes
`apiKey`	`string`	unset	Falls back to `FISH_AUDIO_API_KEY`.
`baseUrl`	`string`	`https://api.fish.audio`	Trailing slash is removed automatically.
voiceId	string	unset	Maps to Fish Audio single-speaker reference_id`. Required for synthesis.`
model	string	s2-pro	Supported values are listed below.
latency	string	normal	low`,` normal`,` balanced`.`
speed	number	provider default	Allowed range is 0.5 `to` 2.0`.`
temperature	number	provider default	Allowed range is 0 `to` 1`.`
topP	number	provider default	Allowed range is 0 `to` 1`.`
normalize	boolean	provider default	Maps to Fish Audio text normalization.
chunkLength	number	provider default	Allowed range is 100 `to` 300`.`
sampleRate	number	target-dependent	Allowed sample rates depend on format.
mp3Bitrate	number	128	Only applies when format is mp3`.`
opusBitrate	number	32	Only applies when format is opus`.`
maxNewTokens	number	provider default	Optional generation cap per chunk.
repetitionPenalty	number	provider default	Optional repetition control.
minChunkLength	number	provider default	Allowed range is 0 `to` 100`.`
conditionOnPreviousChunks	boolean	provider default	Keeps voice consistency across chunks.
earlyStopThreshold	number	provider default	Allowed range is 0 `to` 1`.`

Supported values

`model`

s1
s2-pro

Output formats

mp3
opus
wav
pcm

Sample rates

mp3: 32000, 44100
opus: 48000
wav / pcm: 8000, 16000, 24000, 32000, 44100

Target-specific defaults

When format-specific settings are omitted, OpenClaw picks defaults based on the output target.

Target	Format	Sample rate	Bitrate	Notes
Normal reply / file output	mp3	44100	128 `kbps`	Default for general outbound audio.
Voice note	opus	48000	32 `kbps`	Marked as voice-compatible by the provider.
Telephony	pcm	8000`	n/a	Forced for telephony output.

OpenClaw behavior notes

The extension registers only a speech provider. It does not add a new channel or realtime voice transport by itself.
messages.tts.provider must remain fish-audio. The plugin name fish-audio-tts is only for OpenClaw's plugin loader.
messages.tts.providers["fish-audio"].voiceId maps to Fish Audio's single-speaker reference_id.
talk.providers["fish-audio"] can store provider-specific Talk defaults such as model, latency, and speed.
Public talk.speak requests use the generic Talk schema; for Fish Audio the practical per-request overrides are voiceId, modelId, speed, and normalize.
Per-request temperature, topP, and latency are not exposed by OpenClaw's public talk.speak schema. Set those as provider defaults instead.
Telephony synthesis forces pcm at 8000 Hz.
The Fish Audio TTS endpoint accepts both application/json and application/msgpack. This plugin uses JSON for standard reference_id synthesis requests.
Multi-speaker reference_id arrays are available in the Fish API, but this plugin currently targets the single-speaker path only.

Service docs

ClawHub packaging notes

package.json includes openclaw.compat and openclaw.build, which are required for ClawHub-published external plugins.
package.json keeps openclaw as a peer dependency because the host runtime provides it.
The local test setup uses lightweight SDK shims so pnpm test and pnpm check can run without a sibling OpenClaw checkout.

Validation

From this package directory, first install dependencies so pnpm-lock.yaml is generated locally:

pnpm install

Then run:

pnpm test
pnpm check

pnpm test runs the local extension Vitest suite, including readme.test.ts.
pnpm check runs the local formatting check, local lint, and then the local extension test suite.

Support

[image: Sponsor]

If this plugin is useful, you can support development here:

Sponsor on GitHub

Fish Audio TTS for OpenClaw

Unofficial, community-maintained OpenClaw plugin that adds the Fish Audio TTS provider. It is built for OpenClaw's extension loader and local wrapper use, not as a generic Fish Audio SDK wrapper.

Package name: openclaw-fish-audio-tts
Extension/plugin id: fish-audio-tts
Speech provider id: fish-audio
License: MIT
Required auth: FISH_AUDIO_API_KEY or messages.tts.providers["fish-audio"].apiKey

The extension registers the fish-audio speech provider, so OpenClaw config uses messages.tts.provider: "fish-audio" and messages.tts.providers["fish-audio"].

Requirements

OpenClaw >=2026.4.11
Fish Audio API key via FISH_AUDIO_API_KEY or messages.tts.providers["fish-audio"].apiKey
A Fish Audio single-speaker voiceId / reference_id

Minimal TTS config

{
  messages: {
    tts: {
      provider: "fish-audio",
      providers: {
        "fish-audio": {
          voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
        },
      },
    },
  },
}

Example with supported settings

{
  messages: {
    tts: {
      provider: "fish-audio",
      providers: {
        "fish-audio": {
          apiKey: "optional-if-FISH_AUDIO_API_KEY-is-set",
          baseUrl: "https://api.fish.audio";,
          voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
          model: "s2-pro",
          latency: "normal",
          speed: 1,
          temperature: 0.7,
          topP: 0.7,
          normalize: true,
          chunkLength: 300,
          sampleRate: 44100,
          mp3Bitrate: 128,
        },
      },
    },
  },
}

Talk mode example

Talk mode uses talk.provider and talk.providers.<provider>. For Fish Audio, keep the Talk provider name as fish-audio.

{
  talk: {
    provider: "fish-audio",
    providers: {
      "fish-audio": {
        voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
        model: "s2-pro",
        latency: "balanced",
        speed: 1,
        normalize: true,
      },
    },
  },
}

`talk.speak` override example

The public talk.speak gateway method accepts the generic Talk override fields. For Fish Audio, the practical per-request overrides are voiceId, modelId, speed, and normalize.

{
  "method": "talk.speak",
  "params": {
    "text": "Hello, this is OpenClaw.",
    "voiceId": "802e3bc2b27e49c2995d23ef70e6ac89",
    "modelId": "s2-pro",
    "speed": 0.95,
    "normalize": "on"
  }
}

Discord voice example

Discord voice playback can override the global messages.tts config with channels.discord.voice.tts.

{
  channels: {
    discord: {
      voice: {
        enabled: true,
        tts: {
          provider: "fish-audio",
          providers: {
            "fish-audio": {
              voiceId: "802e3bc2b27e49c2995d23ef70e6ac89",
              model: "s2-pro",
              latency: "normal",
            },
          },
        },
      },
    },
  },
}

Emotion and style tags

Fish Audio emotion control is text-driven. The plugin does not transform these markers; it passes them through exactly as written.

(happy) What a beautiful day!
(sad)(whispering) I'll miss you so much.
(excited)(laughing) We did it! Ha ha ha!

These examples come from Fish Audio's emotion reference. You can mix tags such as (happy), (sad), (whispering), (laughing), (sighing), and (panting) directly into the spoken text when the target voice/model supports them.

Config reference

Key	Type	Default	Notes
`apiKey`	`string`	unset	Falls back to `FISH_AUDIO_API_KEY`.
`baseUrl`	`string`	`https://api.fish.audio`	Trailing slash is removed automatically.
`voiceId`	`string`	unset	Maps to Fish Audio single-speaker `reference_id`. Required for synthesis.
`model`	`string`	`s2-pro`	Supported values are listed below.
`latency`	`string`	`normal`	`low`, `normal`, `balanced`.
`speed`	`number`	provider default	Allowed range is `0.5` to `2.0`.
`temperature`	`number`	provider default	Allowed range is `0` to `1`.
`topP`	`number`	provider default	Allowed range is `0` to `1`.
`normalize`	`boolean`	provider default	Maps to Fish Audio text normalization.
`chunkLength`	`number`	provider default	Allowed range is `100` to `300`.
`sampleRate`	`number`	target-dependent	Allowed sample rates depend on format.
`mp3Bitrate`	`number`	`128`	Only applies when format is `mp3`.
`opusBitrate`	`number`	`32`	Only applies when format is `opus`.
`maxNewTokens`	`number`	provider default	Optional generation cap per chunk.
`repetitionPenalty`	`number`	provider default	Optional repetition control.
`minChunkLength`	`number`	provider default	Allowed range is `0` to `100`.
`conditionOnPreviousChunks`	`boolean`	provider default	Keeps voice consistency across chunks.
`earlyStopThreshold`	`number`	provider default	Allowed range is `0` to `1`.

Supported values

`model`

s1
s2-pro

Output formats

mp3
opus
wav
pcm

Sample rates

mp3: 32000, 44100
opus: 48000
wav / pcm: 8000, 16000, 24000, 32000, 44100

Target-specific defaults

When format-specific settings are omitted, OpenClaw picks defaults based on the output target.

Target	Format	Sample rate	Bitrate	Notes
Normal reply / file output	`mp3`	`44100`	`128` kbps	Default for general outbound audio.
Voice note	`opus`	`48000`	`32` kbps	Marked as voice-compatible by the provider.
Telephony	`pcm`	`8000`	n/a	Forced for telephony output.

OpenClaw behavior notes

The extension registers only a speech provider. It does not add a new channel or realtime voice transport by itself.
messages.tts.provider must remain fish-audio. The plugin name fish-audio-tts is only for OpenClaw's plugin loader.
messages.tts.providers["fish-audio"].voiceId maps to Fish Audio's single-speaker reference_id.
talk.providers["fish-audio"] can store provider-specific Talk defaults such as model, latency, and speed.
Public talk.speak requests use the generic Talk schema; for Fish Audio the practical per-request overrides are voiceId, modelId, speed, and normalize.
Per-request temperature, topP, and latency are not exposed by OpenClaw's public talk.speak schema. Set those as provider defaults instead.
Telephony synthesis forces pcm at 8000 Hz.
The Fish Audio TTS endpoint accepts both application/json and application/msgpack. This plugin uses JSON for standard reference_id synthesis requests.
Multi-speaker reference_id arrays are available in the Fish API, but this plugin currently targets the single-speaker path only.

Service docs

ClawHub packaging notes

package.json includes openclaw.compat and openclaw.build, which are required for ClawHub-published external plugins.
package.json keeps openclaw as a peer dependency because the host runtime provides it.
The local test setup uses lightweight SDK shims so pnpm test and pnpm check can run without a sibling OpenClaw checkout.

Validation

From this package directory, first install dependencies so pnpm-lock.yaml is generated locally:

pnpm install

Then run:

pnpm test
pnpm check

pnpm test runs the local extension Vitest suite, including readme.test.ts.
pnpm check runs the local formatting check, local lint, and then the local extension test suite.

Support

[image: Sponsor]

If this plugin is useful, you can support development here:

Sponsor on GitHub

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

版本

安装命令 点击复制

插件文档

Fish Audio TTS for OpenClaw

Requirements

Minimal TTS config

Example with supported settings

Talk mode example

talk.speak override example

Discord voice example

Emotion and style tags

Config reference

Supported values

model

Output formats

Sample rates

Target-specific defaults

OpenClaw behavior notes

Service docs

ClawHub packaging notes

Validation

Support

Fish Audio TTS for OpenClaw

Requirements

Minimal TTS config

Example with supported settings

Talk mode example

talk.speak override example

Discord voice example

Emotion and style tags

Config reference

Supported values

model

Output formats

Sample rates

Target-specific defaults

OpenClaw behavior notes

Service docs

ClawHub packaging notes

Validation

Support

安装命令点击复制

`talk.speak` override example

`model`

`talk.speak` override example

`model`