微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从Python中的PDF中提取带有字体详细信息(样式和大小)的文本

我期待从 Python中的PDF中提取文本及其字体详细信息(样式和大小).

我需要读取/解析文本内容获取字体详细信息.请建议.

解决方法

一个python库.请看一下PDFminer.

http://www.unixuser.org/~euske/python/pdfminer/index.html.

pdftext.py为您提供从pdf中提取的文本,它还为您提供其他信息,如字体和字体大小等.

你可以试试.

注意:不支持Python 3

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐