如何解决将 python 请求响应加载到 tabula.read_pdf
我有一个下载 pdf 作为响应的 URL。我想使用 python request 模块下载 pdf 文件,并想在 tabula 模块的函数 read_pdf 中加载相同的响应以提取pdf 文件中的 pdf。但是,我想在内存中执行此操作(不保存在磁盘中),但是 read_pdf 函数采用一个参数 input_path,该参数应该是 str、路径对象或类文件对象)。 任何人都可以提出一种将响应对象转换为类文件对象的方法吗?
附注:
- 我已经尝试过 io 模块的 BytesIO 和 StringIO,但是没有用。
- 在tabula doc 中,也提到了 pdf 文件的 URL,但我想在请求标头中传递一些附加参数以及代理,如果有,可以通过请求模块轻松完成有什么方法可以在 read_pdf 函数中传递所有这些参数。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。