当前位置: 首页 > news >正文

虚幻引擎 | (类恐鬼症)玩家和NPC语音聊天

SETUP:工具和插件

工具elevenlabs或者讯飞,用于Speech Synthesis(语音合成,text to speech)。

https://elevenlabs.io/app/speech-synthesis/text-to-speechicon-default.png?t=O83Ahttps://elevenlabs.io/app/speech-synthesis/text-to-speech     elevenlab有10000字的免费试听额度

虚幻需要安装的插件(都支持虚幻5.0-5.4): (以下插件非本人所著,1-3需付费购买,1-2结合使用,4必装)

1)Runtime Speech Recognizer (不免费) :识别玩家通过麦克风讲的话

  • English-only and multilingual models available, with multilingual supporting 100 languages)
  • Fast recognition speed (反应速度快)
  • Optional translation of recognized speech to English (可以支持翻译机器人)
  • NOTE: The images with plugin examples are made in conjunction with 2)RuntimeAudioImporter, although you may have your own implementation of audio input to be processed in RuntimeSpeechRecognizer.

2)Runtime Audio Importer(不免费):导入录制的音频到引擎中

3)Offline Speech Recognition(不免费)

  • No dependencies on other paid cloud services
  • Easy to setup
  • One time payment
  • The server can handle multiple clients at the same time 支持多人使用
  • No internet required 支持离线

4)VArest(免费):REST通信(for the communication with API)

Speech to Text实现步骤:

示例使用Runtime Speech RecognizerRuntime Audio Importer。

完成购买后,Runtime Speech Recognizer的插件document中提供copyable blueprint可供直接复制使用。

1)缺失变量报错:

Blueprint复制过来之后,(包括你从自己其他工程复制过来的蓝图)会出现由于缺失变量造成的报错,只需要右键set variable的部分(节点如下图),即可一键重新创建变量,报错就可以解决。

2)blank audio报错

如果无法用笔记本麦克风语音输入,debug message会出现blank audio

详见:笔记本麦克风不能正常接入语音-CSDN博客

3)切换语言

系统设置:插件->Runtime Speech Recognizer中,可以把Model Language从English only切换成多语种

4)响应时间问题:

语言模型将所有答案一起传回,字数越多等得越久。

MetahumanSDK的文字to语音to口型,同样字数越多耗时越长,也受网速的影响。

到这条分割线以上,就可以实现和虚幻引擎编辑器对话了。

————————————————待更新————————————————————

5)文字识别准确性(避免空耳),stepsize,手动设置识别语言

————————————————同系列文章————————————————————

和NPC纯文字聊天。

游戏开发| Unreal5.2-5.4接入chatGPT定制游戏NPC-CSDN博客文章浏览阅读1k次,点赞18次,收藏6次。Unreal5.2-5.4接入chatgpt,制作游戏内不同人设的NPC角色https://blog.csdn.net/charon8778/article/details/142092626


http://www.mrgr.cn/news/24766.html

相关文章:

  • 【C++】C++ 多态的底层实现原理
  • Window 本地启动Nacos
  • Windows本地部署ollama并实现无公网IP远程运行qwen大语言模型
  • 【操作系统】二、进程管理:4.死锁(银行家算法、系统安全状态、静态分配策略、资源有序分配法)
  • 模拟面试后端开发复盘
  • kvm 虚拟机命令行虚拟机操作、制作快照和恢复快照以及工作常用总结
  • 《OpenCV计算机视觉》—— 身份证号码识别案例
  • 演化式原型开发-系统架构师(六十五)
  • 【PyTorch入门·求导相关】一文解释 PyTorch的求导 (backward、autograd.grad)
  • es6(1)
  • 深入探讨-JavaScript-逻辑赋值运算符
  • I.MX6U裸机-汇编LED灯实验
  • 微服务网关全能进化:设计模式加持下的Spring Cloud Alibaba落地实践(三)
  • 动态规划(一)——斐波那契数列模型
  • [java][struts2]03Struts2配置处理结果(result)总结
  • 2024年华为杯数学建模研赛 最全赛中助攻|选题建议+思路+代码+成品论文预定
  • 【强化学习环境搭建】mujoco,mujoco_py,d4rl等强化学习相关资源安装及使用的参考资料链接 持续更新ing
  • 建筑电焊工模拟试题(单选题附答案)
  • 0911(绘制事件,qt中的网络通信)
  • Robust Image Denoising through Adversarial Frequency Mixup