微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从pdf中选择文本并将其插入excel

如何解决从pdf中选择文本并将其插入excel

我有这个pdf,我必须从中选择一些字段,现在我可以使用pdf文本来阅读pdf全文!如何从中选择字段并将其插入!我试图通过pdf来做到卓越,但这对我没有用! 这是我的pdf文件,有很多这样的pdf文件,每次我为相应的pdf文件生成新的Excel工作表时!这是PDF文件Link 我必须选择字段发票日期,编号,描述,数量,价格,商品总价,总计,小计。

解决方法

我只是查看了您提供的PDF中的文档属性,它指示发票已加标签。这是个好消息。

有了带标签的PDF,您可以使用UiPath Anchor Based数据提取,这比依靠普通的UiPath OCR数据提取工具要容易得多。

enter image description here

基于锚的活动

关键是使用基于UiPath Anchor的活动,然后通过find元素活动选择所需文本旁边或上方的硬编码值,然后使用get text活动。这将在名称/值对上很好地工作。

如果数据是表格形式的,那么您将需要使用UiPath scrape工具,该工具将在数据表中返回结构化数据。您可能需要对返回的数据表应用一些逻辑,以提取所需的确切字段。但是,如果PDF文件的格式都是一致的,则应该不会太繁琐。

Adob​​e阅读顺序

顺便说一句,有时候,如果在这些UiPath活动正常工作之前将PDF的阅读模式设置为其他设置,则需要更改PDF的阅读模式以进行推断或标记,因此请确保在Adobe Reader中设置了正确的阅读模式。 / p>

以下是如何extract PDF text并保存到Excel的示例。看来符合您的业务需求。

UiPath,祝您好运!

,

请先阅读PDF。如果PDF为正常格式,请使用“阅读PD​​F文本”活动;如果PDF为扫描的PDF格式,请使用“带OCR的PDF”。

然后使用Regex获得所需的输出。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。