如何解决在网站上使用jsoup将文字标记在脚本标签内
我正在尝试使用Jsoup在网站的js脚本中检索数据。
脚本位于标题中,如下所示:
<head>
<script1>
function
</script1>
<link>
<script2>
var = someJsonData
</script2>
</head>
我唯一想获得的是第二个脚本中的字符串“ var = someJsonData”。
由于该脚本似乎总是(或几乎)位于head标签的末尾,因此我可以使用它来访问它:
String page = client.get("https://mywebsite.fr);
Element strScript = Jsoup.parse(page).select("head > script").last();
通过使用此代码,我可以检索到我感兴趣的最后一个脚本,但是我得到了:
<script>
var = someJsonData;
</script>
同时我只想要:
var = someJsonData
是否有比使用Jsoup last函数更好的方法来获取最后一个脚本? (该脚本是唯一包含字符串“ window.datalayer”的脚本)?
谢谢!
解决方法
您可以使用strScript.data()获取脚本内容。
供参考https://simplesolution.dev/java-jsoup-extract-javascript-from-script-element/
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。