
又一个TTS开源了,隆重推出 LuxTTS:LuxTTS 是一个轻量级、基于 ZipVoice 的文本到语音模型,专为高品质语音克隆和真实感生成设计,推理速度极快
可达到 150x 实时速度以上(在单个 GPU 上生成 150 秒音频仅需 1 秒)。
它支持零样本语音克隆,使用短音频参考即可复制目标说话人声音
输出清晰的 48kHz 采样率音频,远超大多数 TTS 模型常见的 24kHz
工具特点
语音克隆:达到与大10倍模型相当的SOTA语音克隆水平。
清晰度:生成清晰的48kHz语音,不同于大多数仅限于24kHz的TTS模型。
速度:在单个GPU上可达到实时速度的150倍,而在CPU上甚至快于实时速度。
效率:占用不超过1GB显存,这意味着它能适配任何本地GPU。
本地离线运行,完全免费,实测效果还不错


