我正在为我的项目使用TessBaseAPI制作一个简单的OCR Android应用程序.我做了一些图像预处理步骤,如二值化和图像增强.但他们的结果是50%到60%.我们如何提高识别率?
我包括两个样本图像.
http://imageshack.us/photo/my-images/94/1school.jpg/
http://imageshack.us/photo/my-images/43/15071917.jpg/
解决方法:
以上对上述命令的补充适用于您的第二个图像:
-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \
他们为结果添加适当水平的偏斜和裁剪,以便Tesseract的生活变得更容易……
所以完整的命令应该是以下内容,它会在我的系统上产生正确的结果:
convert 15071917.jpg \
-type grayscale \
-negate \
-gamma 1 \
-contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast \
-normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
-despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \
15071917.png \
&& \
tesseract 15071917.png OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
TESCO
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。