微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Selenium-无法从动态渲染的pdf下载/检索数据

如何解决Selenium-无法从动态渲染的pdf下载/检索数据

具有:

场景:单击网页上的链接时,将生成动态pdf并在新窗口中打开。生成的pdf包含网页数据,该数据随测试数据而变化。

问题:打开pdf的新窗口的URL,不包含.pdf扩展名。 网址为:ondeselect

由于下载的pdf损坏。

我使用过https://t4.merlin.net/delegate/PrintSnapshotReportPDFGenerateServlet_B类,然后使用了WebClient方法来下载Pdf。下面是相同的代码

由于下载了损坏的pdf版本, downloadFile->此方法不会读取pdf。

PdfReader reader = new PdfReader(filePath)

****下面是PDF的HTML DOM。 图像为:PDF Image

 WebClient wcx = new WebClient();
 wcx.Headers.Add("User-Agent: browseAndDownload");
 ServicePointManager.Expect100Continue = true;
 ServicePointManager.SecurityProtocol = SecurityProtocolType.Tls12;
 wcx.DownloadFile(url,PathToSavePDF);

尝试过的解决方案:

  1. 使用PDFReader类阅读
  2. 切换到新窗口并执行ctrl + a和ctrl + c,但不执行任何操作。

**使用IE11

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。