微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从pdf提取页面作为jpeg

如何解决从pdf提取页面作为jpeg

可以使用pdf2image库。

您可以使用以下方法简单地安装它:

pip install pdf2image

安装完成后,您可以使用以下代码获取图像。

from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)

以jpeg格式保存页面

for page in pages:
    page.save('out.jpg', 'JPEG')

编辑:Github仓库pdf2image也提到它使用pdftoppm并且需要其他安装:

pdftoppm是执行实际操作的软件。它作为更大的软件包poppler的一部分分发。Windows用户必须为Windows安装poppler。Mac用户必须为Mac安装poppler。如果发行版不存在,则Linux用户将预先安装pdftoppm(在Ubuntu和Archlinux上进行了测试),如果未运行,请运行sudo apt install poppler-utils

您可以通过以下步骤使用anaconda在Windows下安装最新版本:

conda install -c conda-forge poppler

请注意:http://blog.alivate.com.au/poppler- windows/上提供的Windows版本最高为0.67,但请注意,0.68已于2018年8月发布,因此您将无法获得最新功能错误修复。

解决方法

在python代码中,如何有效地将pdf中的某个页面另存为jpeg文件?(用例:我有一个python
flask网络服务器,将在其中上传pdf-s,并存储与每个页面相对应的jpeg-s。)

该解决方案已经结束,但是问题在于它无法将整个页面转换为jpeg。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。