当前位置：首页 > news >正文

基于GPT-SoVITS的API实现批量克隆声音

news 2026/2/5 4:08:44

目标是将每一段声音通过GPT-SoVITS的API的API进行克隆，因为拼在一起的整个片段处理会造成内存或者缓存溢出。

在这里插入图片描述
将目录下的音频文件生成到指定目录下，然后再进行拼接。

通过AI工具箱生成的数据文件是这样的结构，temp目录下是没个片段生成的部分，connect_是正常拼接的音频文件，silent_是剪切无声片段的音频文件，
在这里插入图片描述
这里克隆后会拼接生成一个 clone的音频文件。

然后移动到指定的目录下。
在这里插入图片描述

实现的完整代码如下：

# env 日常使用目录/py
# -*- coding: UTF-8 -*-
'''
@Project ：日常使用目录 
@File    ：inerefance.py
@IDE     ：PyCharm 
@Author