256 字

1 分钟

【开源】徐泗龙音频模型

2025-03-25

GPT-SoVITS

AI 摘要

Gemini 2.5 Pro

谁让你去必应搜我龙哥名字的😅。家里有显卡的可以往下继续看了。#

模型描述#

本模型是基于GPT-SoVITS的预训练模型，该语音合成工具结合了GPT（Generative Pre-trained Transformer）模型和SoVITS（Speech-to-Video Voice Transformation System）变声器技术，仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换（TTS）。训练中，我使用了偷偷录制的徐泗龙的现场演讲音频一份，经过降噪、分割后使用NVIDIA GeForce RTX 4090训练。

模型信息#

共包含两个文件：虚似龙-e10.ckpt 和 虚似龙_e4_s32.pth

虚似龙-e10.ckpt#

文件类型: CKPT 文件
文件大小: 148 MB (155,312,957 字节)
SHA256: AC74F39FDC648BF09FDCC34B7262E201B892715A1D0EF654EE5A986318704017

虚似龙_e4_s32.pth#

文件类型: PTH 文件
文件大小: 81.0 MB (85,007,879 字节)
SHA256: 3C3ADF3C717B9DE0EF2676359C775B899B51F82FCC6B25F666F82235C4CBB648

模型文件下载#

如果你家里有矿，买得起显卡且对电脑知识有充分了解可以下载到本地跑一下玩玩。

GPT-SoVITS项目链接#

Waiting for api.github.com...

【开源】徐泗龙音频模型

https://tianhw.top/posts/xsl-sovits/

作者

THW

发布于

2025-03-25

许可协议

CC BY-NC-SA 4.0

【开源】徐泗龙图片模型

谁让你去必应搜我龙哥名字的😅。家里有显卡的可以往下继续看了。

模型文件下载

GPT-SoVITS项目链接