如何解决使用R查找保存在文件夹中的pdf文档中的特定字符串的页码
我有500家公司的目录,每家公司都包含10年的年度报告(例如〜directory / firm1 / 2007_annual-report.pdf)。我有兴趣找到搜索字符串所在的页码。
例如,每个公司在年度报告末尾按不同标题报告公司信息,例如公司信息,公司目录,目录,公司信息,公司目录。我尝试如下,但是以某种方式给了我错误的页码和以下错误消息:
“ PDF错误:无效的字体粗细”
<!DOCTYPE html>
<html>
<body>
<script>
var email='jack@jack.com';
var password='secret';
var data={'key1':133};
alert(email);
alert(password);
</script>
</body>
</html>
在StackOverflow上进行搜索时,我找到了一种解决方案,该解决方案用于一个pdf文档并使用Python 。链接如下:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。