技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

Tess-两个OCR无法正常工作

时间：2022-01-09分类：Android作者：编程之家

我试图在android上使用tess-two从图像获取文本.

但这给了我一个非常糟糕的结果

01-16 12:00:25.339: I/Tesseract(native)(29038): Initialized Tesseract API with language=spa

大约30秒后,它显示为结果字符串：

{ga
 .,
r¿
 y“: A
  r M í
:3 
'  ‘Ev’.-:.. -: A 7
 » w- ?" _
 Á.» ¿"A ¿rw-V r
 mjÏfn 'n’n . Y
' "\'ZA".‘.¡ A‘ :‘ïvAv- « ‘
:"Éf‘Ï'" -Ï«l :‘,.v:...»- .
 ' RFI' .. ’ g)" 3;:- 1-;4',
= * ¿,arifgggk mw; .1.  ,
'  "53» "J
't‘ ‘ ¿Las ;.‘».L',-‘»
 ' '  'N‘“ "“=: - '. V  .  ‘9!
5.? ' “F a .“ 
Y , <_  7- . 7.-, .
;«  z "1:;2wr . A - . ' -»‘ 5“:
“4-”, ¿rn 73:33: w v'.‘ ¿a ‘ A ,z, v VA
...,,« ' 'Q ' ‘ 4 214€. 5 . AV ¿JL y .13:
1  » . 21mm; » ¿ati-“ﬂ ¿ab-1377*“ w”
. x ‘ ‘ ú  F v'v: 
1 . ' . ; (“ya  í .

当然那是不正确的,即时通讯使用这张照片：

我已经尝试了很多次,总是得到相似的结果.

可能会出错,这是我使用tess-two的代码

    TessBaseAPI baseApi = new TessBaseAPI();
    baseApi.init("/mnt/sdcard/external_sd/tess/", "spa",TessBaseAPI.OEM_TESSERACT_ONLY);
    baseApi.setimage(bitmap);
    String recognizedText = baseApi.getUTF8Text();
    Log.d("Texto leido", "texto: "+recognizedText);
    baseApi.end();

这就是我从文件中获取位图的方式

    BitmapFactory.Options options = new BitmapFactory.Options();
    options.inPreferredConfig = Bitmap.Config.ARGB_8888;
    Bitmap bitmap = BitmapFactory.decodeFile(photopath.getAbsolutePath(), options);

我在imageview上使用该位图,它似乎是正确的,所以我找不到为什么它的效果不好.

任何想法？

在此更改图像文本语言的语言代码.

例如：如果您想要英语文本识别,则使用“ eng”或西班牙语作为“ spa”

1)

   TessBaseAPI baseApi = new TessBaseAPI();
        baseApi.init("/mnt/sdcard/external_sd/tess/", "eng");
        baseApi.setimage(bitmap);
        String recognizedText = baseApi.getUTF8Text();
        Log.d("Texto leido", "texto: "+recognizedText);
        baseApi.end();

2)从 Download here下载语言包文件
您必须下载osd.traineddata.zip文件和tesseract-ocr-3.01.eng.tar.zip(此处eng为英文,spa为西班牙文..等)文件粘贴到资产文件夹中.

3)在设置位图之前将其转换为灰度图像位图

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：android-无法从BroadcastReceiver启下一篇：按查询分组在列表视图android中显示

相关推荐

Android 性能优化——之控件的优化

Android性能优化——之控件的优化前面讲了图像的优化，接下来分享一下控件的性能优化，这里主要是面向自定义View的优化。 1、首先先说一下我们在自定义View中可能会犯的3个错误： 1）UselesscallstoonDraw()：我们知道调用View.invalidate()会触发Vi...

作者：张旭小侠时间：2024-09-26

android TextView描边

前言上一篇已经讲了如何实现textView中粗字体效果，里面主要重写了onDraw方法。这一边讲一个进阶功能，实现textView的描边效果。上效果图。上代码：原理讲解：效果实现思路是：因为系统api只给paint设置strokewidth方法，却没有提供设置描边的色值的方法，而且我们通

作者：张旭小侠时间：2024-09-26

GreenDao教程1

最近项目重构，涉及到了数据库和文件下载，发现GreenDao这个框架还是不错的。直接面向对象的，可以通过对对象的操作，实现数据的存储。但是官网上的API是在不敢恭维，文档写的很糙，看了半天，才搞懂一系列的流程。在此进行一下纪念。免得那天需要修改的时候，一脸懵逼。直接上干货官网地址：http://

作者：张旭小侠时间：2024-09-26

WebView加载页面的两种方式——网络页面和本地页面

WebView加载页面的两种方式一、加载网络页面加载网络页面，是最简单的一种方式，只需要传入http的URL就可以，实现WebView加载网络页面代码如下图：二、加载本地页面 1、加载assets目录下的HTML页面：加载assets目录的页面，大多数可以用来做页面数据的存储打包，这样可以

作者：张旭小侠时间：2024-09-26

Android 全局使用第三方字体

给APP全局设置字体主要分为两个方面来介绍一、给原生界面设置第三方字体 1、准备工作-下载第三方字体：传送门将文件放入工程assets目录下。（一般个人习惯单独命名一个文件夹放字体文件，也可直接放入根目录，但记得改引用路径） 2、代码实现 a、自定义application，将第三方的字体，替换当

作者：张旭小侠时间：2024-09-26

Android中粗字体

前言最近UI大牛出了一版新的效果图，按照IOS的效果做的，页面里面有普通字体、中粗字体、加粗字体。对于IOS的小伙伴，分分钟搞定，但是对于Android开发的我，瞬间懵逼了。WTF！安卓只有粗和不粗呀，哪有中粗这回事。硬着头皮做出来一版之后，看到UI嫌弃的表情。深深的刺痛了我的完美心。说啥也要搞

作者：张旭小侠时间：2024-09-26

TabLayout基本使用

前言 Tablayout继承自HorizontalScrollView，可以用作顶部标签效果、底部导航栏效果。一般多与ViewPager一起使用。想直接了解如何实现短下滑效果的请看：TabLayout的高级用法首先上几个效果图。图：使用方法下面我们来看如何使用，第一步，先在gradle引

作者：张旭小侠时间：2024-09-26

AndroidStudio 各种异常情况处理大法

最近使用AndroidStudio出现了.java文件，显示为xml文件等问题，通过各种采坑之后，发现删除本地的缓存文件这个方法最管用，差不多可以根治95%的莫名其妙的问题。解决办法如下；先将AS关闭，然后找到你电脑的目录C:\Users\用户名\.AndroidStudio3.5\system\

作者：张旭小侠时间：2024-09-26

Android文件各种存储路径的比较

1、File cacheDir = context.getCacheDir(); 应用内部存储空间（数据文件私有）文件存储到这个路径下，不需要申请权限，当应用被卸载的时候，目录下的文件会被删除。需要注意的是，这个文件的目录和应用的存储位置有关，当应用被移动到外部存储设备的时候，文件的绝对路径也是

作者：张旭小侠时间：2024-09-26

汉诺塔问题

汉诺塔问题最近面试题遇到过汉诺塔的问题，当时竟然懵逼了，不会了！！大学研究的问题竟然都忘光了，于是抓紧捡起来。然而在网上看了看博客，发现非递归算法还真挺多。下面总结了一下。一、递归算法 1、递归算法优缺点：递归算法算是最易于理解也是最容易实现的，但是对内存的消耗也是巨大的，因为递归需要系统堆栈来

作者：张旭小侠时间：2024-09-26

小编推荐

苹果市值2025年有望达4万亿美元