我在识别图片中的文本时遇到问题,python

如何解决我在识别图片中的文本时遇到问题,python

我接到了一个学校项目,用于识别各种验证码,但在实施过程中遇到了一些困难。

这种类型的图像将被送入输入

enter image description here

,

enter image description here

,

enter image description here

我使用以下代码处理它们:

import cv2 
import pytesseract 

# load image 
fname = 'picture.png' 
im = cv2.imread(fname,cv2.COLOR_RGB2GRAY) 

pytesseract.pytesseract.tesseract_cmd = r'C:\Tesseract-OCR\tesseract.exe'

im = im[0:90,35:150]

im = cv2.blur(im,(3,3)) 

im = cv2.threshold(im,223,250,cv2.THRESH_BINARY) 
im = im[1] 

cv2.imshow('',im) 
cv2.waitKey(0) 

经过所有处理后,图像看起来是这样的:

enter image description here

而此时,我有一个问题,如何将图像修改为计算机可读性良好,而不是错误的{{1} }} 他会显示TAREQ.

我正在尝试使用 7TXB6Q 库显示图像中的文本,如下所示

pytesseract

我写在这里是希望得到宝贵的建议(也许您知道从图片中获取文本或处理上面固定的图像的最合适方法)。祝大家平安)


更多图片

enter image description here

enter image description here

enter image description here

enter image description here

解决方法

您可以尝试查找计数并消除那些具有小区域的计数。这种预处理操作应该会增加 OCR 结果的成功率。

之前:before

import cv2 as cv
import numpy as np

# your thresholded image im
bw = cv.imread('bw.png',cv.IMREAD_GRAYSCALE)

_,cnts,_ = cv.findContours(bw,cv.RETR_TREE,cv.CHAIN_APPROX_SIMPLE)
# remove the largest contour which is background
cnts = np.array(cnts[1:],dtype=object)

areas = np.array(list(map(cv.contourArea,cnts)))

thr = 35
thr_cnts = cnts[areas > thr]

disp_img = 255 * np.ones(bw.shape,dtype=np.uint8)
disp_img = cv.drawContours(disp_img,thr_cnts,-1,(0,0),cv.FILLED)
disp_img = cv.bitwise_or(disp_img,bw)

cv.imshow('result',disp_img)
cv.waitKey()
cv.destroyAllWindows()

cv.imwrite('result.png',disp_img)

结果:result


编辑:似乎合并两个代码并没有给出相同的结果。这是从头到尾的完整代码。

输入:CAPTCHA

import cv2 as cv
import numpy as np

# load image 
fname = 'im.png'
im = cv.imread(fname,cv.IMREAD_GRAYSCALE)

# crop
im = im[0:90,35:150]

# blurring is essential for denoising
im = cv.blur(im,(3,3))

thr = 219
# the binary threshold value is very important
# using 220 instead of 219 causes loss of a letter
# because it touches to the bottom edge and gets involved in the background
_,im = cv.threshold(im,thr,255,cv.THRESH_BINARY)

cv.imshow('',im)
cv.waitKey(0)

阈值:threshold

# binary image
bw = np.copy(im)

# find contours and corresponding areas
_,cv.RETR_LIST,cv.CHAIN_APPROX_NONE)
cnts = np.array(cnts,dtype=object)
areas = np.array(list(map(cv.contourArea,cnts)))

thr = 35
# eliminate contours that are smaller than threshold
# also remove the largest contour which is background
thr_cnts = cnts[np.logical_and(areas > thr,areas != np.max(areas))]

# draw the remaining contours
disp_img = 255 * np.ones(bw.shape,bw)

cv.imshow('',disp_img)
cv.waitKey()
cv.destroyAllWindows()

结果:result

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)> insert overwrite table dwd_trade_cart_add_inc > select data.id, > data.user_id, > data.course_id, > date_format(
错误1 hive (edu)> insert into huanhuan values(1,'haoge'); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive> show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 <configuration> <property> <name>yarn.nodemanager.res