为什么会返回此错误?
root@amd-3700-2gb ~/ocr_test # tesseract -l dan pdf.png out pdf Tesseract Open Source OCR Engine v3.03 with Leptonica Error opening data file /usr/local/share/tessdata/osd.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. Failed loading language 'osd' Tesseract Couldn't load any languages! Warning: Auto orientation and script detection requested,but osd language Failed to load
语言清单
root@amd-3700-2gb ~/ocr_test # tesseract --list-langs List of available languages (3): eng dan dan-frak
输出为txt
这很好,输出文本到out.txt
tesseract -l dan pdf.png out
输出PDF
这会创建out.pdf,但也会返回提到的错误,并且PDF中的可搜索文本没有意义
tesseract -l dan pdf.png out pdf
解决方法
错误消息很明确:它需要osd.traineddata文件.您可以安装或下载Orientation&来自
https://github.com/tesseract-ocr/tessdata的Tesseract脚本检测数据.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。