当前位置: 首页 > news >正文

基于ESP32S3的链接大语言模型对话模块

本实物模块从实物外观、模块组成、API申请及功能说明四部分来介绍这款基于ESP32S3的大语言模型对话模块。

1、实物外观

13b24c44c92dd4f3d827dddcbb619a3d.jpeg

2、模块介绍

本硬件平台主要由三个模块组成,包括MAX9814录音模块、MAX98357音频功放模块和ESP32S3模块。如下图所示。

MAX9814录音模块:

1d7ba1396d1fa2894c20fd0f1750227d.jpeg

MAX98357音频功放模块:

e298eec511c8afabe5f384b6dd1775dc.jpeg

ESP32S3模块:

bd4c187fc237e4bff851009e09735e74.jpeg

3、API申请

本硬件平台需要用户自己申请3个API,分别是语音识别API、大语言模型API和语音合成API,本硬件平台用的语音识别API是百度智能云,大语言模型API是阿里通义千问,语音合成API是讯飞平台。因此,这里介绍上述三种API的申请方式,用户仅需在代码中更改API基础信息即可完成配置。

首先是百度语音识别API的申请:

搜索百度智能云并进入官网:

38794ad6f556a995783cfece9a5c2b1a.jpeg在官网中选择产品--语音技术--短语音识别标准版:

db4f5f769e780abc1b2bf7a865d63364.jpeg点立即使用,并登录百度账号:

cf8a95f01b924ee9b583f817589de0fa.jpeg

  1. 第一次用可以使用免费尝鲜获取一部分体验额度:

cb039bac7b4bcb4658aa83887cebdb0d.jpeg创建短语音识别应用,并获取API Key、Secret Key,以及通过调试获取token:

3168e0d581433f66edabd8366bbeca8c.jpeg

67adb63d143d03c8829f23a956a74ff4.jpeg

然后是阿里通义千问API的申请:

搜索阿里云并进入官网,扫码登录:

a3353b0b2cc0e4f8ed2ad7d5b0380b33.jpeg搜索Dashscope进入灵积服务模型:

b754294af102cbb2412d6016d6a2451d.jpeg

14a30dc31c62aca49f3860c759d77bde.jpeg进入API-KEY管理,创建新的API-Key:

1c1704f6aacfa008162d04f5a07632a0.jpeg

最后是讯飞语音合成API的申请:

首先搜索讯飞语音合成APi,并进入官网:

3471ea4d851e0d0b87613f8303095ae5.jpeg第一次使用有免费额度,直接领取个人免费套餐,进入登录界面:

f3040d8298d7ee4f3a5908b8d1649450.jpeg进入官网后领取完在线语音合成额度:

6156437397ad9a44224b49bef866076b.jpeg8724000ceec33536f45a8507f6121e1c.jpeg领取完额度后进入控制台创建新应用:

8bb84402c1413289913b1b77181e80ff.jpeg创建完之后就能获取APPID、APISecret、APIKey:

3cbb2d17dc85d84aa83c834b89255331.jpeg

以上就是所有API的申请教程。

4、功能介绍

本硬件平台可以实现链接开源大语言对话模型,并与其实时对话的功能。具体操作步骤如下:

第一步是上电,此时系统会介绍一下自己,上下两个LED都不亮;

f368c6b7430e9d0e0cdcfcb8296c49ff.jpeg

第二步是按下录音按钮,上面的LED开始常亮。此时可以与系统对话,录音时间为5s,上面LED灭后,表示录音结束。

fb916c4a4db66eb82631ee3dbd9bd530.jpeg

等待2-3s之后,系统输出大语言模型反馈结果,并通过喇叭发声的方式输出,此时下面的LED会亮,输出结束之后下面的LED会灭。

60fef658dbcc0b414f4b86e3512ca585.jpeg

本文大部分内容都属于原创,如需转载,请附上本文网站,
如果需要相关的仿真图、程序代码等资料可以直接私信我,我会及时回复。
 


http://www.mrgr.cn/news/25422.html

相关文章:

  • 算法刷题:300. 最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组
  • 一文读懂多组学联合分析产品在医学领域的应用
  • 模拟实现计算器(switch函数实现与转移表实现)
  • 【Linux 19】线程概念
  • Unity基本操作
  • 【linux】一种基于虚拟串口的方式使两个应用通讯
  • 通信工程学习:什么是SDH同步数字体系
  • 大模型国产化算力方案
  • c++11——share_ptr的助手weak_ptr
  • 前端 + 接口请求实现 vue 动态路由
  • buck boost Ldo 经典模型的默写
  • 排序题目:一手顺子
  • 【办公】会议纪要模板
  • OJ 两两交换链表中的节点
  • MySQL之库和表操作
  • Python容器一之字符串
  • 好看好听的小猪包扩音器,轻巧便携更好用,得胜E10上手
  • 批量插入insert到SQLServer数据库,BigDecimal精度丢失解决办法,不动代码,从驱动层面解决
  • 干部画像系统是什么?
  • 卫生间漏水原因很多,切莫病急乱投医