256 字
1 分钟
【开源】徐泗龙音频模型
Gemini 2.5 Pro
谁让你去必应搜我龙哥名字的😅。家里有显卡的可以往下继续看了。
模型描述
本模型是基于GPT-SoVITS的预训练模型,该语音合成工具结合了GPT(Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video Voice Transformation System)变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。训练中,我使用了偷偷录制的徐泗龙的现场演讲音频一份,经过降噪、分割后使用NVIDIA GeForce RTX 4090训练。
模型信息
共包含两个文件:虚似龙-e10.ckpt 和 虚似龙_e4_s32.pth
虚似龙-e10.ckpt
- 文件类型: CKPT 文件
- 文件大小: 148 MB (155,312,957 字节)
- SHA256:
AC74F39FDC648BF09FDCC34B7262E201B892715A1D0EF654EE5A986318704017
虚似龙_e4_s32.pth
- 文件类型: PTH 文件
- 文件大小: 81.0 MB (85,007,879 字节)
- SHA256:
3C3ADF3C717B9DE0EF2676359C775B899B51F82FCC6B25F666F82235C4CBB648
模型文件下载
如果你家里有矿,买得起显卡且对电脑知识有充分了解可以下载到本地跑一下玩玩。
GPT-SoVITS项目链接
Waiting for api.github.com...