如何解决使用 jsoup 将 html 解析为文档会创建 "转换
我正在尝试使用 jsoup 解析 html 响应,但发现它转换了 html 字符,甚至在使用 jsoup.parse 之前尝试使用建议的 ascii 设置或 StringEscapeUtils.unescapeHtml 仍然没有帮助.
String decodedHTML= StringEscapeUtils.unescapeHtml(htmlD);
decodedHTML = Parser.unescapeEntities(htmlD,false);
Document docs = Jsoup.parse(decodedHTML,"UTF-8");
System.out.println(docs);
输出包括“文档”中的以下内容:
<div class="\"search-video-card\""><div
class="\"video__cover\""
为什么会发生这种情况,我该如何预防。我尝试了在类似问题中找到的以下内容:
Document.OutputSettings settings = docs.outputSettings();
docs.outputSettings().prettyPrint(false).escapeMode(EscapeMode.extended);
settings.prettyPrint(false);
settings.charset("ASCII");
String modifiedFileHtmlStr = docs.html();
System.out.println(modifiedFileHtmlStr);
没有用。
编辑:
原文:
bigPipe.onPageletArrive({"container":"","id":"pagelet_video","html":"
<div class="video-list" data-empty="30">
<div class="search__filter">
<div class="filter__sort">
<span class="filter__label">排序:</span>
<ul class="filter__item-list item-list__type">
<li data-type="1">相关</li>
<li data-type="2">最多观看</li>
<li data-type="3">最多评论</li>
<li data-type="4">最多收藏</li>
<li data-type="5">最新发布</li>
</ul>
<span class="filter__unfold">展开筛选</span>
</div>
<div class="filter__type" style="display: none;">
<span class="filter__label">分类:</span>
<ul class="filter__item-list item-list__channel">
<li data-cid="0">全部</li>
<li data-cid="177">AC正义</li>
<li data-cid="155">番剧</li>
<li data-cid="1">动画</li>
<li data-cid="60">娱乐</li>
<li data-cid="201">生活</li>
<li data-cid="58">音乐</li>
<li data-cid="123">舞蹈·偶像</li>
<li data-cid="59">游戏</li>
<li data-cid="70">科技</li>
<li data-cid="68">影视</li>
<li data-cid="59">体育</li>
<li data-cid="125">鱼塘</li>
</ul>
<span class="filter__fold">收起筛选</span>
</div>
</div>\n\n
<div class="btn-group">
<span class="btn-card icon-ks icon-icon--qia-pian-zhan-shi"></span>
<span class="btn-line icon-ks icon-icon_-zheng-tiao-zhan-shi active"></span>
</div>
<div id="video-list">
<span class="total-num" data-total="246">共246条结果</span>
<div class="normal-list" style="display:none">
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。