使用R查找保存在文件夹中的pdf文档中的特定字符串的页码

如何解决使用R查找保存在文件夹中的pdf文档中的特定字符串的页码

我有500家公司的目录，每家公司都包含10年的年度报告（例如〜directory / firm1 / 2007_annual-report.pdf）。我有兴趣找到搜索字符串所在的页码。

例如，每个公司在年度报告末尾按不同标题报告公司信息，例如公司信息，公司目录，目录，公司信息，公司目录。我尝试如下，但是以某种方式给了我错误的页码和以下错误消息：

“ PDF错误：无效的字体粗细”

<!DOCTYPE html>
<html>
  <body>

    <script>
      var email='jack@jack.com';
      var password='secret';
      var data={'key1':133};
      alert(email);
      alert(password);
    </script>

  </body>
</html>

在StackOverflow上进行搜索时，我找到了一种解决方案，该解决方案用于一个pdf文档并使用Python 。链接如下：

f-string