微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Jsoup-如何检测严格相邻的元素-检查元素是否已删除

如何解决Jsoup-如何检测严格相邻的元素-检查元素是否已删除

我需要使用jsoup检测严格相邻的元素。为此,我将使用How to detect strictly adjacent siblings中提供的示例,但是我需要一个Jsoup的有效示例-Java。

输入

<div id="container">
    <span class="highlighted">Paragraph 1</span>
    <span class="highlighted">Paragraph 2</span>
    This is just loose text.
    <p class="highlighted">Paragraph 3</p>
</div>

我要完成的工作是用所有同级相似元素的文本构建单个元素。

private String removeSimilarTags(String htmlContent){
        org.jsoup.nodes.Document doc = Jsoup.parse(htmlContent);

        Elements highlightedSpanElements = doc.select("span.highlighted"); //Selecting all spans with class highlight
        for(Element span : highlightedSpanElements){
            Element beforeEl = span.prevIoUsElementSibling();
            if(span != null) //I need another function to verify if element has been already removed{
                beforeEl.after("<span class='"+HIGHLIGHT+"'>"+mergeAdjacentSpans(span)+"</span>");
            }
        }
        return doc.outerHtml();
    }

 private String mergeAdjacentSpans(Element span){
        Element nextEl = span.nextElementSibling() != null ? span.nextElementSibling() : null;
       
        String text = span.text();
        if(nextEl != null && nextEl.tagName().equalsIgnoreCase(SPAN_TAG)
                          && nextEl.classNames().contains(HIGHLIGHT)){
            //Next Element is also  a highlighted span
           text =  text.concat(" "+ mergeAdjacentSpans(spanEl));
        }
        span.remove();
        return text;
    }

我也想对如何验证某个元素已被删除有一些见解。我无法在网上找到明确的答案。

谢谢你们!

解决方法

因此,要检测元素是否严格相邻,您应该知道Jsoup https://stackoverflow.com/questions/47881838/difference-between-jsoup-element-and-jsoup-node#:~:text=A%20node%20is%20the%20generic,Node中Node和Element之间的区别。在我的情况下,我使用Node是因为它包含字符串或实际元素之后出现的所有元素,因此它对标签元素不敏感。

private boolean isNexSiblingAdjacent(Element span){
  Node informationAfterNode = span.nextSibling();
  Element nextTaggedElement = span.nextElementSibling();
  return informationAfterNode.outerHtml().trim().length() == 0 ||
 informationAfterNode.outerHtml().equalsIgnoreCase(nextTaggedElement.outerHtml());
}

所以我要做的第一个条件是验证它内部是否有空格,但是您可以检查它是否以结尾,以检查它是否也是注释。由于这两个条件将使其仍然相邻。最后但同样重要的一点是,检查节点的html是否与in元素中的html类似。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。