我有一个包含表单字段的pdf文件,需要将数据导出到一个自动的xml文件中.这是我为测试创建的示例表单的屏幕:
注意:通过单击工具>可以使用Acrobat Professional手动导出它.表格>导出表单数据,最后选择xml扩展名进行文件输出.这是我手动导出时得到的结果:
<?xml version="1.0" encoding="UTF-8"?> <fields> <first_name>John</first_name> <last_name>Doe</last_name> </fields>
但是,我需要自动化它,例如使用python脚本,Java实现或一些命令行工具.我可以使用哪些库或工具将表单字段数据导出到xml?该工具或库应该是开源的,我可以将它集成到我的工作流程中.
我已经尝试过python pdfminer库,它帮助我导出pdf文件的静态部分(如Static form header,First name:和Last name :):但是如何导出表单字段数据(在我的例子中是表单字段的内容) first_name和last_name)??
解决方法
原文地址:https://www.jb51.cc/html/227517.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。