微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

sql-server-2008 – 如何从PDF中提取数据?

我的公司通过Excel从外部公司接收数据.我们将其导出到sql Server以运行数据报告.他们现在正在改为PDF格式,有没有办法可靠地从PDF中移植数据并将其插入我们的sql Server 2008数据库

这需要编写应用程序还是有自动执行此操作的方法

解决方法

这完全取决于他们如何在PDF中包含数据.一般来说,这里有两种可能的情况:

>数据只是PDF中的文本对象.您需要使用工具从PDF中提取文本,然后将其插入数据库.
>数据包含在PDF中的表单字段中.您需要使用工具从表单字段中提取数据并将其插入数据库.

希望场景#2适用于您,因为这正是PDF表单的设计目的.场景#1实际上只是一个你只能使用的黑客,如果你没有任何其他选择.从PDF中提取纯文本并不像您预期​​的那样简单或准确.

如果您正在收到PDF表单,那么您需要做的就是将PDF表单中的正确字段与数据库中的相应字段匹配,然后填入数据.如果您编写自己的应用程序,此过程可以完全自动化.

Would this require writing an app or
is there an automated way of doing
this?

是的,这两个选项都需要编写应用程序或购买应用程序.如果您编写自己的应用程序,则需要找到支持从表单字段检索数据或从PDF中提取文本的第三方PDF库.

原文地址:https://www.jb51.cc/mssql/76473.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐