当前位置: 首页 > news >正文

文本字符分割算法尝试

一、基于opencv的分割算法

import cv2
import numpy as np
from matplotlib import pyplot as pltimg = cv2.imread('scratch.png', 0)
# global thresholding
ret1, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# Otsu's thresholding
th2 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
# Otsu's thresholding
# 阈值一定要设为 0 !
ret3, th3 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# plot all the images and their histograms
images = [img, 0, th1, img, 0, th2, img, 0, th3]
titles = ['Original Noisy Image', 'Histogram', 'Global Thresholding (v=127)','Original Noisy Image', 'Histogram', "Adaptive Thresholding",'Original Noisy Image', 'Histogram', "Otsu's Thresholding"
]
# 这里使用了 pyplot 中画直方图的方法, plt.hist, 要注意的是它的参数是一维数组
# 所以这里使用了( numpy ) ravel 方法,将多维数组转换成一维,也可以使用 flatten 方法
# ndarray.flat 1-D iterator over an array.
# ndarray.flatten 1-D array copy of the elements of an array in row-major order.
for i in range(3):plt.subplot(3, 3, i * 3 + 1), plt.imshow(images[i * 3], 'gray')plt.title(titles[i * 3]), plt.xticks([]), plt.yticks([])plt.subplot(3, 3, i * 3 + 2), plt.hist(images[i * 3].ravel(), 256)plt.title(titles[i * 3 + 1]), plt.xticks([]), plt.yticks([])plt.subplot(3, 3, i * 3 + 3), plt.imshow(images[i * 3 + 2], 'gray')plt.title(titles[i * 3 + 2]), plt.xticks([]), plt.yticks([])
plt.show()

二、基于skimage的分割算法尝试

参考链接:

Niblack and Sauvola Thresholding — skimage 0.24.1rc0.dev0 documentation (scikit-image.org)

 Python图像处理二值化方法实例汇总_python_脚本之家 (jb51.net)

skimage sauvola阈值 (主要用于文本检测)

import matplotlib
import matplotlib.pyplot as pltfrom skimage.data import page
from skimage.filters import (threshold_otsu, threshold_niblack,threshold_sauvola)matplotlib.rcParams['font.size'] = 9image = page()
binary_global = image > threshold_otsu(image)window_size = 25
thresh_niblack = threshold_niblack(image, window_size=window_size, k=0.8)
thresh_sauvola = threshold_sauvola(image, window_size=window_size)binary_niblack = image > thresh_niblack
binary_sauvola = image > thresh_sauvolaplt.figure(figsize=(8, 7))
plt.subplot(2, 2, 1)
plt.imshow(image, cmap=plt.cm.gray)
plt.title('Original')
plt.axis('off')plt.subplot(2, 2, 2)
plt.title('Global Threshold')
plt.imshow(binary_global, cmap=plt.cm.gray)
plt.axis('off')plt.subplot(2, 2, 3)
plt.imshow(binary_niblack, cmap=plt.cm.gray)
plt.title('Niblack Threshold')
plt.axis('off')plt.subplot(2, 2, 4)
plt.imshow(binary_sauvola, cmap=plt.cm.gray)
plt.title('Sauvola Threshold')
plt.axis('off')plt.show()

三、IntegralThreshold(主要用于文本检测)

工程所在链接

GitHub - Liang-yc/IntegralThreshold: Adaptive Thresholding Using the Integral Image.


http://www.mrgr.cn/news/20754.html

相关文章:

  • React-CSS
  • C++ 在给定斜率的线上找到给定距离处的点(Find points at a given distance on a line of given slope)
  • iOS——APP启动流程
  • 【C语言从不挂科到高绩点】13-二维数组以及数组元素增加和删除
  • 盘古信息IMS MOM,高效灵活的企业数字化解决方案
  • 开放式运动耳机好不好用?超靠谱好评榜单实物测评
  • 美团面试:mysql 索引失效?怎么解决? (重点知识,建议收藏,读10遍+)
  • 录屏没声音怎么办?3招解决,教您秒变声音大师
  • 【Boost】Asio库学习(一)
  • 号称第一本程序员的Agent入门书籍?《大模型应用开发 动手做AI Agent》来了!
  • 基于SringBoot框架的智慧博物馆预约平台
  • Spark常见面试题整理
  • Java队列详细解释
  • VLDB 2024论文解读丨GaussDB:计算-内存-存储三层池化解耦的多主云原生数据库
  • 基于51单片机的倒计时装置proteus仿真
  • Java高级编程—多线程(完整详解线程的三种实现方式、以及守护线程、出让线程、插入线程、线程声明周期等,附有代码+案例)
  • 零基础入门~汇编语言(第四版王爽)~第4章 第一个程序
  • 前端面试:margin和padding分别适合什么场景使用?
  • 不敢相信,华为智能眼镜2开放式聆听也能做到通话隐私保护了?
  • 如果文件从存储卡中被误删除,存储卡数据恢复如何恢复?