如何使用GPT-Sovits训练一个角色音声模型

前言

1.反问自己:是否确实需要自行训练音声?是否可以通过直接调用现成音声API来避免这些麻烦?

2.确认自己的设备是否符合训练要求(一般建议N卡,显存(GPU专用内存)>=6G,拥有足够的硬盘空间)

3.在开始训练准备前,在互联网上先搜索一遍,是否已经存在了别人开源的训练好的你需要的角色的音声模型,实在找不到了再自行训练。

材料准备

1.整合包下载:https://github.com/RVC-Boss/GPT-SoVITS/releases

(这个是一定要下载的,可以选魔搭直链,比较快,里面包含了所有的环境依赖等)

2.需要训练的角色的音声(大概几百到一千条左右即可),如果可以获取到无杂音的纯净游戏原声就尽量获取,否则在云训练过程中处理声音也是一个时间占模。

3.一个网盘会员账号(若需要云训练)

操作流程

基本流程

1.整合包教程中文教学文档:整合包教程(详细阅读)

2.配合教学视频:2025最新GPT-SoVITS教程.2025.12.03_哔哩哔哩_bilibili

3.源码仓库:GPT-SoVITS/docs/cn/README.md at main · RVC-Boss/GPT-SoVITS

(以备不时之需,也可以阅读这里的中文介绍)

本地训练和云电脑训练

本地

本地训练按教程进行即可。注意留足存储空间。

注意后台黑框不要关闭。

云电脑

1.注册云实例时请留意分配的硬盘空间是否充足。最好留大约20G空余空间。

2.留意.list文件中每一条标注语料的源路径是否正确。可以在云电脑中用py脚本处理一遍

3.有网盘会员的话下载材料会比较快,节省时间

API调用

1.先启动后端:打开GPT-Sovits/runtime,在此路径下cmd,启动api.py或api_v2.py(一般推荐后者)

1
python api_v2.py

(这样就不用自己配环境了,因为它是封装好的)待其运行完全即可放置。

2.如何请求:参考项目:https://github.com/jianchang512/gptsovits-api 在README中有说明。

2.官方文档对于请求的细节有所缺失,可以尝试使用AIAgent解读api_V2.py和上述提到的项目,令其编写请求方式,反复试几次就行了。

后记

三思而后行,不用着急。

Donate
  • Copyright: Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source.
  • Copyrights © 2025-2026 AKi
  • Visitors: | Views:

请我喝杯咖啡吧~

支付宝
微信