微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

检查PDF是否为Word VBA中的图像/ OCR

如何解决检查PDF是否为Word VBA中的图像/ OCR

我正在Word中使用VBA打开一堆PDF文件一个一个),并查找一些文本。我运行的某些文件实际上是图像/不是OCR。我只想跳过它们,但是我不确定要执行哪种检查。在这文件上,它仍然“找到”字符串,并进入我不希望它处理的代码部分。

CREATE FUNCTION pg_temp.mkdb(var text) RETURNS void
   LANGUAGE plpgsql STRICT AS
$$BEGIN
   EXECUTE format('CREATE DATABASE %I;','prefix_' || var || '_suffix');
END;$$;

SELECT pg_temp.mkdb(:'variable');

有人可以建议如何防止图像“通过”我的支票吗?谢谢!

解决方法

OCR'd PDF通常还将包含原始内容的图像和原始内容的图像。并且,根据OCR软件和输入图像的质量,您所追求的文本可能会或可能不会正确渲染。

尝试以下方法:

Dim pdfDoc As Word.Document
Set pdfDoc = Documents.Open(FileName:=FSOFile.Path,ConfirmConversions:=False,Format:=wdOpenFormatAuto)
With pdfDoc
  With .Range
    .Find.Execute FindText:="Evaluation Rating",MatchCase:=True
    If .Find.Found = True Then
      ' Process the found content,e.g.:
      MsgBox .Paragraphs(1).Range.Text
    End If
  End With
  .Close False
End With

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。