当前位置: 首页 > news >正文

“精准学”官宣将公布中国首个语音端到端大模型

教育科技公司“精准学”宣布,公司已在AI语音交互技术上取得领先性的突破,成功训练了中国首个语音端到端大模型“心流知镜-s(V02)”,可直接实现语音输入-语音输出的交互,使其更适配辅学场景,使大模型达到“真人老师”级别的自然对话交流体验。

“心流知镜-s(V02)” 使用端到端语音结构,避免了级联ASR+LLM+TTS方式额外延迟,同时也更好的改善纯文本模型损失的情感节奏等丰富信息,接近人类的语音交互体验。

精准学也提供时间表开放基础模型供学术和非商用使用,致力于为中文 AI社区的科研和技术探索作出贡献。

“心流知镜-s(V02)”的发布,不仅将在高质量中文语音Codec 和中文自监督预训练Encoder 基础设施上填补中文开源社区的空白,还将在全球范围内成为首个开放给技术社区的语音端到端大模型。

据「TMT星球」了解,精准学将于近期对外展示这项技术的应用成果。5月,公司获得了阿里2亿元投资,目前其AI辅学机Bong系列已在天猫京东上线。不久后用户也可以在精准学AI辅学机上体验到这项技术突破成果。


http://www.mrgr.cn/news/6113.html

相关文章:

  • Go语言基础--函数基本介绍及包
  • 《黑神话:悟空》发售后快手游戏笔记本电脑GMV日环比增长40%
  • SSH远程管理/TCP Wrappers访问控制
  • 【个人学习】JVM(8): 对象的实例化、内存布局、访问定位
  • Python Lambda 表达式详解
  • 第5章 虚拟机的安装和使用
  • 【国赛】【美赛】【五一杯】【电工杯】【华数杯】【亚太杯】······各赛事历年优秀论文+真题分享
  • Springboot的小区物业管理系统
  • Node.js中的pipe方法:深入解析与应用指南
  • T6:好莱坞明星识别
  • 韩国云主机玩游戏性能怎么样
  • 基于大语言模型的物联网(artificial intelligence of thing)
  • 网络通信tcp
  • 【HTML】模拟插头连接断开动画
  • 线段树的原理
  • Swagger
  • VUE3的computed()使用场景
  • [数据集][目标检测]手钳检测数据集VOC+YOLO格式141张1类别
  • 初始redis:List
  • SpringCache操作Redis