音频数据集大全(2)-语音合成

news/2024/6/16 22:55:04

1、Speechocean762

简介:一个开源语音语料库,专为发音评估设计。该语料库包含来自250名非母语人士的5000个英语发音,其中一半的人是儿童。五位专家对每个发音进行了句子级、词级和音素级的注释 该语料库允许用于商业和非商业目的

下载链接:openslr.org

2、Hi-Fi Multi-Speaker English TTS Dataset

简介:一个专为训练文本到语音模型而设计的多说话者英语数据集。该数据集基于LibriVox有声读物和Project Gutenberg的文本,均为公共领域。数据集包含大约291.6小时的语音,由10位说话者提供,其中每位说话者至少提供了17小时的语音,以44.1kHz的采样频率

下载链接:http://www.openslr.org/109/

3、RyanSpeech

简介:RyanSpeech是一个用于研究自动文本到语音(TTS)系统的语音语料库。公开可用的TTS语料库通常有噪声,由多个说话者录制,或者没有高质量的男性语音数据。为了满足语音识别领域对高质量、公开可用的男性语音语料库的需求。这个数据集包含了真实对话场景中的文本材料,这些材料包含超过10小时由专业男声演员在44.1kHz下录制的声音。

下载链接:http://mohammadmahoor.com/ryanspeech/

4、AISHELL-3 语⾳合成数据库

简介:AISHELL-3 语音合成数据库是一个大规模的多说话人普通话语料库,用于训练多说话人文本到语音(TTS)系统。该数据库包含大约85小时的情感中性记录,由218名普通话母语者提供。这些母语者的辅助属性,如性别、年龄组和母语口音,都在数据库中明确标记。此外,还提供了汉字级别和拼音级别的转录,以及一些数据处理策略和技术,这些策略和技术与所呈现的数据库特征相匹配,并对多个语音合成系统进行了实验,以评估生成的语音样本的质量,显示出令人满意的结果。

下载链接:https://openslr.magicdatatech.com/resources/93/data_aishell3.tgz

5、RUSLAN

简介:RUSLAN语音合成数据集是一个专门用于俄语口语合成的数据集。我们可以看到,RUSLAN语音合成数据集主要关注于俄语口语的合成和识别,而不是其他语言或多语言环境下的语音合成。这个数据集可能包含了大量的俄语口语材料,这些材料被用来训练和评估语音合成系统。

下载链接:RUSLAN: Russian Spoken Language Corpus For Speech Synthesis

  1. 6、VocBench

简介:VocBench语音合成数据集是一个专门用于评估神经声码器(neural vocoders)的框架,它通过系统性研究来比较不同的神经声码器在一个共享环境中的表现。该数据集的目的是为了公平地比较这些神经声码器之间的性能,并且展示了每个声码器合成样本的竞争效率和质量

下载链接:GitHub - facebookresearch/vocoder-benchmark: A repository for benchmarking neural vocoders by their quality and speed.

7、Silent Speech EMG

简介:Silent Speech EMG语音合成数据集主要涉及通过肌肉活动(EMG)信号来实现无声语音的技术。这种技术允许用户在不发出任何声音的情况下,通过肌肉活动来表达自己的意图或情感。

下载链接:GitHub - dgaddy/silent_speech: Code for voicing silent speech from EMG. Official repository for the papers "Digital Voicing of Silent Speech" at EMNLP 2020 and "An Improved Model for Voicing Silent Speech" at ACL 2021. Also includes code for converting silent speech to text.

8、Arabic Speech Corpus

简介:阿拉伯语语音语料库(1.5 GB)是用于语音合成的现代标准阿拉伯语(MSA)语音语料库。该语料库包含超过3.7小时的MSA语音的语音和拼写转录,与音素级别上的记录语音一致。注释包括单个音素上的单词重音标记。语音语料库是南安普顿大学的纳瓦·哈拉比博士学位工作的一部分。该语料库是使用专业工作室用南黎凡特阿拉伯语(大马士革口音)录制的。使用该语料库作为输出的合成语音产生了高质量、自然的声音。

下载链接:


http://www.mrgr.cn/p/01448113

相关文章

溪谷联运SDK功能全面解析

近期,备受用户关注的手游联运10.0.0版本上线了,不少用户也选择了版本更新,其中也再次迎来了SDK的更新。溪谷软件和大家一起盘点一下溪谷SDK的功能都有哪些吧。 一、溪谷SDK具有完整的运营功能和高度扩展性 1.登录:登录是SDK最基础…

如何使用Matlab进行三角剖分(自定义函数实现delaunayTriangulation 使用Bowyer-Watson 算法)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 前言 一、Delaunay三角形 二、使用步骤 1.Bowyer-Watson算法 2.算法步骤 三、动画演示 四、核心代码 五、对比matlab自带函数和我们的算法: 总结 前…

贝叶斯定理

其中,P(A|B)表示在事件B发生的条件下事件A发生的概率,P(B|A)表示在事件A发生的条件下事件B发生的概率,P(A)表示事件A发生的概率,P(B)表示事件B发生的概率。 对于这个公式 ,我觉得没什么好说的,背过记住吧。…

鸿蒙 DevEcoStudio:通知栏通知实现

【使用notificationManager实现通知栏功能】 【普通通知、长文本通知、多行通知、图片通知】 import notificationManager from ohos.notificationManager import image from ohos.multimedia.image Entry Component struct Index {State message: string Hello World// 将图…

Salesforce ADFS SSO 配置

1.set up 中 Certificate and Key Management创建认证 2.setup中Single Sign-On Settings新建SSO,输入必填 3.setup中My Domain Settings设置登录跳转: 最后将Single Sign-On Settings中metadata.xml下载下来给ADFS端使用: 最后效果&#xff…

弘君资本股市行情:股指预计保持震荡上扬格局 关注汽车、银行等板块

弘君资本指出,近期商场体现全体分化,指数层面上看,沪指一路震动上行,创出年内新高,创业板指和科创50指数体现相对较弱,依然是底部震动走势。从盘面体现上看,轮动依然是当时商场的主基调&#xf…

计算机精选期刊特辑

文章目录 一、征稿简介二、合作期刊三、投稿咨询四、咨询 一、征稿简介 艾思科蓝依托互联网信息与数据库技术、整合渠道与合作资源,提供EI/SCI/SCIE/SSCI期刊论文的内容审查、发表支持等服务。艾思科蓝与多所知名出版社达成战略合作关系,持续开展合作征…

功耗相关总结

文章目录 功耗相关的使用场景MCU中低功耗的应用RTOS中低功耗应用 功耗相关的使用场景 目前越来越多的嵌入式设备采用电池进行供电,而不是跟台式电脑一样,可以一直连接着电源。在电池供电的场景下,对功耗的要求很高,工程师们尽量希…

利用 MongoDB Atlas 进行大模型语义搜索和RAG

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集&…

Linux——进程信号(一)

1.信号入门 1.1生活中的信号 什么是信号? 结合实际红绿灯、闹钟、游戏中的"!"等等这些都是信号。 以红绿灯为例子: 一看到红绿灯我们就知道:红灯停、绿灯行;我们不仅知道它是一个红绿灯而且知道当其出现不同的状况…

es数据备份和迁移Elasticsearch

Elasticsearch数据备份与恢复 前提 # 注意: 1.在进行本地备份时使用--type需要备份索引和数据(mapping,data) 2.在将数据备份到另外一台ES节点时需要比本地备份多备份一种数据类型(analyzer,mapping,data,template) …

DSPy - prompt 优化

文章目录 一、关于 DSPy与神经网络的类比常见问题解答**DSPy 优化器可以调整什么?****我应该如何使用 DSPy 完成我的任务?****如果我对提示或合成数据生成有更好的想法怎么办?**DSPy 代表什么? 二、安装三、文档A) 教程B) 指南C) …

构建高效可靠的消息队列系统:设计与实现

✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨ 🎈🎈作者主页: 喔的嘛呀🎈🎈 目录 一、引言 二、设计目标 2.1、高可用性 1. 集群搭建 1.1 …

20232803 2023-2024-2 《网络攻防实践》实践十报告

目录 1. 实践内容1.1 SEED SQL注入攻击与防御实验1.2 SEED XSS跨站脚本攻击实验(Elgg) 2. 实践过程2.1 SEED SQL注入攻击与防御实验2.1.1 熟悉SQL语句2.1.2 对SELECT语句的SQL注入攻击2.1.3 对UPDATE语句的SQL注入攻击2.1.4 SQL对抗 2.2 SEED XSS跨站脚本攻击实验(Elgg)2.2.1 发…

Python正则解析网页

目录 1、正则表达式 2、rs模块 3、贪婪与非贪婪 4、词频统计 一、正则表达式 什么是正则表达式 正则表达式,又称规则表达式(Regular Expression,在代码中常简写为regex、regexp或RE) 正则表达式描述了一种字符串匹配的模式&a…

CF451E: Devu and Flowers(容斥原理 + 考虑反面 + golang组合模版)

题目截图 题目翻译 题目分析 正难则反,考虑所有不符合的例子 由于n很小,所以可以状态压缩二进制遍历完全部不符合例子的组合 对于不符合的例子,假设其中第i个不符合,那么就消耗掉fi 1个球 以此类推,减剩下s2个球 这时…

【MySQL精通之路】MySQL8.0新增功能-原子DDL语句支持

太长不看系列: 本文一句话总结,MySQL8.0支持多条DDL语句执行时的原子性了(仅限Innodb) 本文属于下面这篇博客的子博客: 【MySQL精通之路】MySQL8.0官方文档-新增功能 1.意义描述 MySQL 8.0支持原子数据定义语言&…

源网络地址转换SNAT

左上角的是访问互联网发送的数据包,第一个是访问,第二个是网页传回来的 3、4项是源端口号和目的端口号(3是随机的(1024-65535),那个是http的网页服务端口就是80) 那么往回传数据的时候源和目的…

成都爱尔胡建斌院长提醒近视超过600度,记得每年检查眼底!

高度近视是指近视度数在600度及以上的一种屈光不正的状态。 近视的眼睛必定是变形的。在正常情况下,人的眼球类似球体,但随着近视加深,眼轴变长,眼球体积逐渐增大,整个眼球从圆球型向椭圆球形发展,而眼球壁…

【Spring security】【pig】Note03-pig token令牌解析器过程

🌸🌸 pig token令牌解析器过程 🌸🌸 pig后端源码 一、解析请求中的令牌值。 二、验证令牌 内省并验证给定的令牌,返回其属性。返回映射表示令牌有效。 /*** author lengleng* date 2019/2/1 扩展用户信息*/ publi…