如何解决使用Mule-Datawave要下载HTML中的所有图像
我遇到一种情况,我需要使用Datawave下载HTML中所有添加的图像(URL)。
示例:这是我的HTML收到的有效载荷
<div class="Container"> \n\n
<img src="https://test.documentforce.com/servlet/rtaImage?eid=ka0000000id01&feoid=00aF000002MA1&refid=0BR5w000001mnlq" alt="">
<div>...</div>\n\n
<img src="https://test.documentforce.com/servlet/rtaImage?eid=ka0000000id02&feoid=00aF000002GE2&refid=0BR5w000001hh2u" alt="">\n\n
</div>
您能给我一些示例代码吗,这些示例代码会通过HTML并下载所有实际的图片而不是URL的
解决方法
您可以将具有内容类型的readUrl用作application / octet-stream,尽管它将为您提供字节流。您可以做的是提取url的内容,然后读取文件,类似于所描述的here
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。