当前位置: 首页 > news >正文

基于GPT-SoVITS的API实现批量克隆声音

目标是将每一段声音通过GPT-SoVITS的API的API进行克隆,因为拼在一起的整个片段处理会造成内存或者缓存溢出。

在这里插入图片描述
将目录下的音频文件生成到指定目录下,然后再进行拼接。

通过AI工具箱生成的数据文件是这样的结构,temp目录下是没个片段生成的部分,connect_是正常拼接的音频文件,silent_是剪切无声片段的音频文件,
在这里插入图片描述
这里克隆后会拼接生成一个 clone的音频文件。

然后移动到指定的目录下。
在这里插入图片描述

实现的完整代码如下:

# env 日常使用目录/py
# -*- coding: UTF-8 -*-
'''
@Project :日常使用目录 
@File    :inerefance.py
@IDE     :PyCharm 
@Author

http://www.mrgr.cn/news/5961.html

相关文章:

  • C学习(数据结构)-->实现链式结构二叉树
  • springboot 上传文件失败:The temporary upload location
  • 【JavaEE初阶】三次握手与四次挥手
  • 操作系统中的锁:自旋锁、互斥锁、条件变量、信号量、死锁
  • token令牌,过滤器,JWT,拦截器
  • 基于 Dots + GPU Instance 的大规模物体渲染
  • Day03-MonoBehavior中的常用内容
  • 金九银十,软件测试面试八股文【含答案+文档】
  • 解决 vmware nat 模式无法上网
  • C++入门——14树型关联容器
  • Go 语言类型转换 19
  • X-AnyLabeling系列:多类别单通道掩码转多边形坐标点
  • XML 实例:深入解析与实际应用
  • 网上花店设计+vue
  • 数据库如何插入优化分别用oracle和mysql举例
  • C ++初阶:C++入门级知识点
  • CSS的:nth-last-child()伪类:逆序子元素选择的艺术
  • commvault学习(9):备份mysql(linux平台)
  • Ubuntu启用root用户
  • 【django进阶知识点】