256 字
1 分钟
【开源】徐泗龙音频模型
gemini-aiAI 摘要
Gemini 2.5 Pro

谁让你去必应搜我龙哥名字的😅。家里有显卡的可以往下继续看了。#

模型描述#

本模型是基于GPT-SoVITS的预训练模型,该语音合成工具结合了GPT(Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video Voice Transformation System)变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。训练中,我使用了偷偷录制的徐泗龙的现场演讲音频一份,经过降噪、分割后使用NVIDIA GeForce RTX 4090训练。

模型信息#

共包含两个文件:虚似龙-e10.ckpt虚似龙_e4_s32.pth

虚似龙-e10.ckpt#

  • 文件类型: CKPT 文件
  • 文件大小: 148 MB (155,312,957 字节)
  • SHA256: AC74F39FDC648BF09FDCC34B7262E201B892715A1D0EF654EE5A986318704017

虚似龙_e4_s32.pth#

  • 文件类型: PTH 文件
  • 文件大小: 81.0 MB (85,007,879 字节)
  • SHA256: 3C3ADF3C717B9DE0EF2676359C775B899B51F82FCC6B25F666F82235C4CBB648

模型文件下载#

如果你家里有矿,买得起显卡且对电脑知识有充分了解可以下载到本地跑一下玩玩。

GPT-SoVITS项目链接#

RVC-Boss
/
GPT-SoVITS
Waiting for api.github.com...
00K
0K
0K
Waiting...

【开源】徐泗龙音频模型
https://tianhw.top/posts/xsl-sovits/
作者
THW
发布于
2025-03-25
许可协议
CC BY-NC-SA 4.0