当前位置: 首页 > news >正文

Python使用Tesseract OCR识别文字

        Tesseract-OCR是一款由Google维护的开源光学字符识别(OCR)引擎,它能够从图像中识别出文本,并将其转换为可编辑的文本格式。以下是关于Tesseract-OCR的详细介绍:

一、背景与发展

  • 起源:Tesseract最初是惠普实验室的一款专利软件,主要用于满足联合国和图书馆对文档数字化的需求。
  • 开源与发展:在2005年,Tesseract被开源,并随后由Google收购和赞助进行后续的开发和维护。
  • 技术支持:随着技术的发展,Tesseract引入了深度学习技术,如LSTM(长短期记忆网络),显著提升了识别的准确性和速度。

二、主要功能与特点

  1. 高精度识别:Tesseract采用深度学习等先进技术,对图像中的文本进行高精度识别,尤其对印刷体文本的识别率高达95%以上。
  2. 多语言支持:支持超过100种语言的识别,包括英文、中文(简体和繁体)、德文、法文等,且可通过训练来扩展识别其他语言。
  3. 灵活性与可扩展性:提供灵活的API接口,可轻松集成到各种应用中。同时,用户还可以根据需要自定义训练模型,以满足特定领域或特殊字体的需求。
  4. 跨平台性:支持Windows、Mac OS、Linux等多种操作系统,具有良好的兼容性和扩展性。
  5. 广泛应用:可应用于文档数字化、社交媒体分析、自动化数据输入等多个领域。

三、使用方法

官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata
下载地址:https://digi.bib.uni-mannheim.de/tesseract/

  1. 下载与安装
    1. 下载地址在本文章顶部,注意尽量不要下载带dev,alpha,beta等版本,这些版本不稳定,也可能是测试版本。建议下载最新稳定版本。
    2. 安装过程可以附带选择要安装的语言包,如下简体中文,之后自动会从服务器下载该语言包下来。(这里不建议勾选下载语言包,因为速度太慢了,教程后面会介绍怎么拓展语言包。)
    3. 在文章顶部找到语言包地址的链接,下载需要的的语言包,如下图,红框内为中文简体语言包,下载后将该包直接放在程序安装目录的tessdata文件夹里面即可。
  2. 配置环境变量
  3. 基本使用
    #!/usr/bin/env python3
    # -*- coding: utf-8 -*-import pytesseract
    from PIL import Image# 建议图像识别前,先对图像进行灰度化和 二值化,以提高文本识别率(这里略过)image = Image.open("D:1234.jpg")
    # 解析图片,lang='chi_sim'表示识别简体中文,默认为English
    # 如果是只识别数字,可再加上参数config='--psm 6 --oem 3 -c tessedit_char_whitelist=0123456789'
    content = pytesseract.image_to_string(image, lang='chi_sim')
    print(content)

    参考链接:https://www.jianshu.com/p/f7cb0b3f337a


http://www.mrgr.cn/news/11143.html

相关文章:

  • 民宿管理平台系统
  • 小程序全局本地存储和读取数据
  • Facebook AI的应用前景:如何利用人工智能提升平台功能
  • matlab与VS混合编程以及错误解决
  • TMDOG的微服务之路_07——初入微服务,NestJS微服务快速入门
  • 回调与观察者模式区分
  • 《计算机操作系统》(第4版)第10章 多处理机操作系统 复习笔记
  • 【MySQL数据库管理问答题】第8章 维护稳定的系统
  • Jenkins发邮件功能如何配置以实现自动化?
  • 需方软件供应链安全保障要求及开源场景对照自评表(上)
  • Unity 编辑器-监听创建控件,prefab创建或添加组件的自动处理⭐
  • python源码:基于fastapi+websocket双向信息通道的简易网页聊天室
  • HR招聘面试测评工具,DISC性格测试,disc行为风格
  • 【案例58】WebSphere输出日志输出慢导致线程被阻塞
  • word技巧:保护Word文档页眉,确保内容不被随意修改
  • 什么牌子的运动耳机最好用?五大绝佳臻品细致汇集!
  • 入门STM32--按键输入
  • Jmeter下载、配置环境变量
  • 制造业中的MES知识与ERP\PLM\WMS架构关系(附智能制造MES解决方案PPT下载)
  • ES6笔记总结:第四天(ES6完结)