OCR tessdata目录不正确

如何解决OCR tessdata目录不正确

我一直遵循this tutorial尝试创建OCR，并且已经复制并粘贴了所有必要的代码，并按照步骤进行操作，但是在运行OCRDemo.java时，我始终收到此错误：>

打开数据文件./eng.traineddata时出错请确保将TESSDATA_PREFIX环境变量设置为“ tessdata”目录。加载语言“ eng”失败 Tesseract无法加载任何语言！

所以我假设问题是TESSDATA_PREFIX具有错误的目录。当前它是“ C：\ CodeRepository \ OCR \ tessdata”，我得到了该目录并通过逐字进入文件资源管理器并复制并粘贴来确认该目录。但是我一直收到此错误消息。我也尝试过“ OCR \ tessdata”，“ tessdata”，但是它们都不起作用。帮助吗？

这是我的pom.xml代码，其中包含TESSDATA_PREFIX：

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">


<modelVersion>4.0.0</modelVersion>
  <groupId>OCR</groupId>
  <artifactId>OCR</artifactId>
  <version>0.0.1-SNAPSHOT</version>
  <properties>
    <TESSDATA_PREFIX>C:\CodeRepository\OCR\tessdata</TESSDATA_PREFIX>
  </properties>
  <dependencies>
    <dependency>
        <groupId>net.sourceforge.tess4j</groupId>
        <artifactId>tess4j</artifactId>
        <version>4.3.1</version>
    </dependency>
  </dependencies>
</project>

解决方法

从给定的链接看来，它会将读者指向不兼容的语言数据文件。尝试https://github.com/tesseract-ocr/tessdata_fast。

 ITesseract instance = new Tesseract();          
        instance.setDatapath("C:\\Users\\Tux\\Documents\\tessdata");

这对我有用，无需设置环境变量。我只是将语言文件放在“tessdata”文件夹中