Fish-Speech-开源的先进多语言文本转语音项目
Fish - Speech是一个开源的文本转语音(TTS)项目。它具备多种吸引人的特性,包括零采样和少采样的TTS功能,输入10 - 30秒语音样本就能生成高质量输出。支持多语言与跨语言输入,无需担忧语言种类,涵盖多种语言。模型不依赖音素,有很强的泛化能力,在5分钟英语文本上能达到低错误率。在速度方面表现出色,在不同Nvidia显卡设备上有较好实时转换率。还有易用的WebUI推理和PyQt6图形界面且支持多操作系统,部署友好并最小化速度损失,FishAgent完全端到端并可控制音色和生成带情感的语音等。