如何解决为什么 tabula.read_pdf_with_template 完全忽略文本?
我使用 tabula python 库来提取发票(获取 CSV)。当我使用时:
rezultat = tabula.read_pdf_with_template(pdf_path,tabula_template)
我只得到数字。没有文字 (!?)
这很有效:
tabula.convert_into(pdf_path,output,output_format="csv",pages="all")
但我不知道如何强制使用模板(定义的文档坐标)和正确的编码。
如果你能帮忙,
问候
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。