微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用python PDF提取提取任何图像?

如何解决如何使用python PDF提取提取任何图像?

我按照教程使用 TKinter、PyPDF2 和 PIL 创建了一个 PDF 提取程序。 这是图片提取代码

def extract_images(page):
    images = []
    if '/XObject' in page['/Resources']:
        xObject = page['/Resources']['/XObject'].getobject()

        for obj in xObject:
            if xObject[obj]['/Subtype'] == '/Image':
                size = (xObject[obj]['/Width'],xObject[obj]['/Height'])
                data = xObject[obj].getData()
                mode = ""
                if xObject[obj]['/ColorSpace'] == '/DeviceRGB':
                    mode = "RGB"
                else:
                    mode = "CMYK"
                img = Image.frombytes(mode,size,data)
                images.append(img)
    else:
        img = Image.new("RGB",(100,100),(255,255,255))
        images.append(img)
        
    return images

它适用于提供的测试文件,但没有其他pdf,通常会出现错误

raise NotImplementedError("不支持的过滤器 %s" % filterType) NotImplementedError: 不支持的过滤器 /DCTDecode

我已经尝试更改代码,但我根本找不到解决方

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。