TTS

站内搜索

站内搜索

Fish - Speech是一个开源的文本转语音（TTS）项目。它具备多种吸引人的特性，包括零采样和少采样的TTS功能，输入10 - 30秒语音样本就能生成高质量输出。支持多语言与跨语言输入，无需担忧语言种类，涵盖多种语言。模型不依赖音素，有很强的泛化能力，在5分钟英语文本上能达到低错误率。在速度方面表现出色，在不同Nvidia显卡设备上有较好实时转换率。还有易用的WebUI推理和PyQt6图形界面且支持多操作系统，部署友好并最小化速度损失，FishAgent完全端到端并可控制音色和生成带情感的语音等。

340 0