当前位置: 首页 > news >正文

jdk21使用Vosk实现语音文字转换,免费的语音识别

1.下载vosk的model

vosk官网:https://alphacephei.com/vosk/models
我这里使用较小的vosk-model-small-cn-0.22

2.添加相关pom文件

 <!-- 获取音频信息 --><dependency><groupId>org</groupId><artifactId>jaudiotagger</artifactId><version>2.0.3</version></dependency><!-- 语音识别 --><dependency><groupId>net.java.dev.jna</groupId><artifactId>jna</artifactId><version>5.16.0</version></dependency><dependency><groupId>com.alphacephei</groupId><artifactId>vosk</artifactId><version>0.3.45</version></dependency>

3.代码

添加model和使用的音频,我这里用的wav格式的,不同格式的参数会不一样


import org.vosk.LibVosk;
import org.vosk.LogLevel;
import org.vosk.Model;
import org.vosk.Recognizer;import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.UnsupportedAudioFileException;
import java.io.*; public class testVosk {public static void main(String[] argv) throws IOException, UnsupportedAudioFileException {LibVosk.setLogLevel(LogLevel.DEBUG);try (Model model = new Model("E:\\srk\\bigData\\vosk-model-small-cn-0.22");InputStream fis = AudioSystem.getAudioInputStream(new BufferedInputStream(new FileInputStream("C:\\Users\\Administrator\\Downloads\\mdhs1-5ob2k.wav")));Recognizer recognizer = new Recognizer(model, 16000)) {int bytes;byte[] b = new byte[4096];while ((bytes = fis.read(b)) >= 0) {if (recognizer.acceptWaveForm(b, bytes)) {System.out.println(recognizer.getResult());} else {System.out.println(recognizer.getPartialResult());}}String result = recognizer.getFinalResult();System.out.println(result);}}
}

4.可能遇到的问题

1.乱码,我搞了半天(捂脸)
因为jdk17以后编号的模式改了,所以在网上找了各种设置编码的格式都没有生效。
比如jvm设置 -Dfile.encoding=UTF-8都没生效。

-Dfile.encoding=UTF-8

jdk17以前的还是正常的。
解决方法1:

  1. win系统控制面板找到“区域与语言设置”

  2. 在弹出框中选择更改系统区域设置
    在这里插入图片描述

  3. 勾选beta使用utf-8
    在这里插入图片描述
    解决方法2:
    在这里插入图片描述

5.相关资料

  1. gitcode相关api

http://www.mrgr.cn/news/96668.html

相关文章:

  • Laravel Trait 实现 统一JSON 响应格式
  • Spring-事务属性
  • Axure项目实战:智慧运输平台后台管理端-承运商管理(中继器筛选)
  • 博客学术汇测试报告
  • Android:Dialog的使用详解
  • ffmpeg滤镜使用
  • 音频进阶学习二十四——IIR滤波器设计方法
  • VUE3+Mapbox-GL 实现鼠标绘制矩形功能的详细代码和讲解
  • NVR接入录像回放平台EasyCVR视频融合平台城市/乡镇污水处理厂解决方案
  • 蓝桥杯专项复习——二分查找、二分答案
  • Laravel APP_KEY 生成方法
  • 力扣每日一题:2712——使所有字符相等的最小成本
  • 苍穹外卖项目结构
  • 网络架构搭建中的 QinQ 与端口安全策略
  • DAY 32 leetcode 242--哈希表.有效的字母异位词
  • Oracle数据库数据编程SQL<3.5 PL/SQL 存储过程(Procedure)>
  • 魔改chromium——基础环境搭建
  • Open GL ES ->GLSurfaceView在正交投影下的图片旋转、缩放、位移
  • OpenCV图像输入输出模块imgcodecs
  • 什么是 CSSD?