当前位置: 首页 > news >正文

GPT-SoVITS-WebUI 初体验

一、安装

conda create -n GPTSoVits python=3.9

#                                                                                                                                                                                                                             
# To activate this environment, use                                                                                                                                                                                           
#                                                                                                                                                                                                                             
#     $ conda activate GPTSoVits                                                                                                                                                                                              
#                                                                                                                                                                                                                             
# To deactivate an active environment, use                                                                                                                                                                                    
#                                                                                                                                                                                                                             
#     $ conda deactivate        

二、激活环境

conda activate GPTSoVits

三、补充安装依赖

bash install.sh

四、退出

conda deactivate     

五、AutoDL镜像项目启动方法

        开启WebUI

echo {}> ~/GPT-SoVITS/i18n/locale/en_US.json && source activate GPTSoVits && cd ~/GPT-SoVITS/ && python webui.py zh_CN

          作者:RVC-Boss
          链接:https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official
          来源:CodeWithGpu

辨别不同的端口

WebUI 端口 http://localhost:9874/

UVR5 端口 http://localhost:9873/

数据达标 端口 http://localhost:9871/

TTS推理 端口 http://localhost:9872/

这些端口你要主动启动了才会有

UVR5 需要的模型

UVR5 所用到的模型放置路径

GPT-SoVITS/tools/uvr5/uvr5_weights

UVR5 可能用得到的模型

model_bs_roformer_ep_317_sdr_12.9755

数据准备

音频数据清洗和音频切割、音频数据打标是关键

其中音频数据打标最为致命,非常花时间,我一般直接跳过。。。。。。

在打标之前先用UVR5进行音频伴奏分离、混响分离,提取出稍微干净一些的人声

然后就是音频切割,如果是4090,建议每一份切割后的音频都在24秒以下,20秒左右

于是我自个儿尝试了以下调整,不一定对啊,参考啊

threshold 不懂 不动

min_length 应该是多长的话语切割一次,不满这个时长则继续等到不少于这个时长为止 单位是毫秒

4090只有24GB显存 我把这个参数调成了 2000 即 20秒

min_interval 应该是说话停顿,说话没有到达停顿 就不要切割 

我设置成了 200 , 我怕录音中说话比较密,等讲话者换气的时候 200毫秒是足够了 

max_sil_kept 看起来就是静音时间 我从默认的500 改成了400 好像等于没改

TTS推理

推理主要是把原先的数据集放回去参考

可能还有更好的方法,但是这个方法是真的简单方便


http://www.mrgr.cn/news/19415.html

相关文章:

  • LLM代码实现-Qwen(Function Calling)
  • LLM常见问题(RAG部分)
  • 搭建 xxl-job 执行器项目
  • 运动耳机哪个品牌好?精选五款热门品牌骨传导耳机推荐
  • 该走纯软还是嵌入式?
  • 路径处理秘籍:Golang path包最佳实践与技巧
  • 银行卡二三四要素验证-银行卡二三四要素验证接口-银行卡二三四要素验证api
  • 移动端自动化测试--2、定位APP
  • # 使用 OpenAI 的 Embeddings 接口实现文本和代码的语义搜索
  • SpringBoot使用入门
  • 关于HTTP通讯流程知识点补充—常见状态码及常见请求方式
  • 027集——goto语句用法——C#学习笔记
  • HTTP 之 消息结构(二十二)
  • 5.5树与二叉树的应用
  • 4款免费又好用的软件,良心无广,每一款都值得收藏
  • 宣布 Vue 3.5 版发布
  • map容器中的“值”为vector<type>型的时候的操作
  • 如何查看Mac的处理器架构‌‌是ARM还是x86
  • 为电源而疯狂:电源处理简介
  • Gitlab-ce upgrade 16.0.1 to 17.3.1【Gitlab-ce 16.0.1 升级 17.3.1】