如何解决Jsoup Element.text是断断续续的吗?
| 在以下代码片段中: String linkHref = \"\";
String linkText = \"\";
Elements links = div.getElementsByTag(\"a\");
for (Element link : links) {
linkHref = link.attr(\"href\");
linkText += link.text();
break;
}
即使我可以在WebView上清楚看到链接文本,linkText有时还是空的!
另一方面,linkHref总是以正确的值结尾。
有什么可能解释这种看似间歇性的行为?
这是Jsoup中的错误吗?我可能还缺少其他东西吗?
更新,回答@ BalusC的以下问题:Jsoup版本是jsoup-1.5.2,并且div.html()表示:
<div class=\"d2 dl\">
<a href=\"nextp.html\" class=\"cO\"><img src=\"images/no001.jpg\" alt=\"\" vspace=\"0\" width=\"69\" border=\"0\" height=\"69\" hspace=\"0\" /></a>
<span class=\"bc\">2.</span>
<a accesskey=\"2\" href=\"nextp.html\"> Subject line </a>
</div>
<p class=\"aG\">Human resource policies are viewed as a valuable to understand the companies.</p>
<div>
</div>
解决方法
第一个链接根本不包含文本。它包含一个图像。因此,Jsoup的工作做得非常好。
您可能想先使用ѭ2来检查链接是否包含文本。
if (link.hasText()) {
linkText += link.text();
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。