当前位置: 首页 > news >正文

赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践

赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践

AI 语音交互大模型其实有两种主流的做法:

  1. All in LLM
  2. 多个模块组合, ASR+LLM+TTS

实际应用中,这两种方案并不是要对立存在的,像永劫无间这种游戏的场景,用户要的是低延迟,无障碍交流。并且能够触发某些动作技能。这就非常适合使用成熟的 ASR 和 TTS 技术来负责音频的处理,而 LLM 就可以专门做用户意图的理解。

1.数据

要是想训练一个大模型,去思考自己有什么样的数据,数据的获取方法有两种

  1. 自动化的获取,就像 Aone Copilot 代码补全场景一样,我们从原始的代码中通过某些规则扣出一块,作为模型的预测数据,我们只需要设定好策略就可以得到千万条数据用来训练

  2. 半自动获取,我们可以借助一些更强大的生成模型比如 ChatGPT,让他代替人工生成一些数据,再经过规则清洗得到最终使用的数据

  3. 用户使用数据, 类似商品和短视频推荐的数据,都是通过曝光点击行为来做训练的

  4. 人工标注,这种数据获取方法成本非常高,做这种事情的时候,千万先想好自己的业务诉求和价值


http://www.mrgr.cn/news/24910.html

相关文章:

  • 如何在 Ubuntu 系统上部署 Laravel 项目 ?
  • Java 每日一刊(第4期):Java 23 即将发布
  • Ae软件2018-2023全版本 不限速下载
  • C语言 | Leetcode C语言题解之第399题除法求值
  • Python | Leetcode Python题解之第400题第N位数字
  • Spring Cloud(一)
  • 3个热门、好用、功能强大的C#开源帮助工具类
  • 日志管理之Logrotate
  • 使用Linq进行多表查询(C#)
  • 真正解决微信截图卡住(假死)
  • 【AcWing】快速排序的Go实现
  • Python中的类(一)
  • 【PyQt6 应用程序】在用户登录界面实现密码密文保存复用
  • 误删?损坏?别怕!固态硬盘数据恢复工具助你轻松找回
  • UE5——笔刷Brush工具
  • Qt第三课 ----------按钮的控件属性
  • 【移动端】Flutter与uni-app:全方位对比分析
  • 队列的详细操作
  • 采用qt做一个命令行终端
  • YoloV10改进策略:上采样改进|动态上采样|轻量高效,即插即用(适用于分类、分割、检测等多种场景)