微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

OCR tessdata目录不正确

如何解决OCR tessdata目录不正确

我一直遵循this tutorial尝试创建OCR,并且已经复制并粘贴了所有必要的代码,并按照步骤进行操作,但是在运行OCRDemo.java时,我始终收到此错误:>

打开数据文件./eng.traineddata时出错 请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录。 加载语言“ eng”失败 Tesseract无法加载任何语言!

所以我假设问题是TESSDATA_PREFIX具有错误的目录。当前它是“ C:\ CodeRepository \ OCR \ tessdata”,我得到了该目录并通过逐字进入文件资源管理器并复制并粘贴来确认该目录。但是我一直收到此错误消息。我也尝试过“ OCR \ tessdata”,“ tessdata”,但是它们都不起作用。帮助吗?

这是我的pom.xml代码,其中包含TESSDATA_PREFIX:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">


<modelVersion>4.0.0</modelVersion>
  <groupId>OCR</groupId>
  <artifactId>OCR</artifactId>
  <version>0.0.1-SNAPSHOT</version>
  <properties>
    <TESSDATA_PREFIX>C:\CodeRepository\OCR\tessdata</TESSDATA_PREFIX>
  </properties>
  <dependencies>
    <dependency>
        <groupId>net.sourceforge.tess4j</groupId>
        <artifactId>tess4j</artifactId>
        <version>4.3.1</version>
    </dependency>
  </dependencies>
</project>

解决方法

从给定的链接看来,它会将读者指向不兼容的语言数据文件。尝试https://github.com/tesseract-ocr/tessdata_fast

,
 ITesseract instance = new Tesseract();          
        instance.setDatapath("C:\\Users\\Tux\\Documents\\tessdata"); 

这对我有用,无需设置环境变量。我只是将语言文件放在“tessdata”文件夹中

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。