如何使用GPT-Sovits训练一个角色音声模型

Word count: 630 | Reading time≈ 2 min

前言

1.反问自己：是否确实需要自行训练音声？是否可以通过直接调用现成音声API来避免这些麻烦？

2.确认自己的设备是否符合训练要求（一般建议N卡，显存（GPU专用内存）>=6G，拥有足够的硬盘空间）

3.在开始训练准备前，在互联网上先搜索一遍，是否已经存在了别人开源的训练好的你需要的角色的音声模型，实在找不到了再自行训练。

（这个是一定要下载的，可以选魔搭直链，比较快，里面包含了所有的环境依赖等）

2.需要训练的角色的音声（大概几百到一千条左右即可），如果可以获取到无杂音的纯净游戏原声就尽量获取，否则在云训练过程中处理声音也是一个时间占模。

3.一个网盘会员账号（若需要云训练）

1.整合包教程中文教学文档：整合包教程（详细阅读）

（以备不时之需，也可以阅读这里的中文介绍）

本地训练按教程进行即可。注意留足存储空间。

注意后台黑框不要关闭。

1.注册云实例时请留意分配的硬盘空间是否充足。最好留大约20G空余空间。

2.留意.list文件中每一条标注语料的源路径是否正确。可以在云电脑中用py脚本处理一遍

3.有网盘会员的话下载材料会比较快，节省时间

1.先启动后端：打开GPT-Sovits/runtime，在此路径下cmd，启动api.py或api_v2.py（一般推荐后者）

1	python api_v2.py

（这样就不用自己配环境了，因为它是封装好的）待其运行完全即可放置。

2.如何请求：参考项目：https://github.com/jianchang512/gptsovits-api 在README中有说明。

2.官方文档对于请求的细节有所缺失，可以尝试使用AIAgent解读api_V2.py和上述提到的项目，令其编写请求方式，反复试几次就行了。

三思而后行，不用着急。

Donate

Copyright： Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source.