jsoup - 编程之家

JSoup - 使用当前会话 / Shiro 登录并加载 JSF 页面

我在从受保护的 JSF 页面获取 HTML 内容时遇到问题。我使用 Apache Shiro 作为身份验证提供程序。来

org.w3c.dom.Document -> Jsoup？

有没有什么方法可以将w3cdom文档转换成Jsoup文档而不需要序列化成字符串？从 Jsoup->w3cdom 有一个 <a

如何使用jsoup从网站获取视频或音频的URL

我正在使用 jsoup 来解析这个网站的所有 HTML：<a href="https://vnexpress.net/ngo-diec-pham-than-tuong-sup-do-4333987.html"

使用 JSoup 从网站收集列表条目时被抛出我的 for 循环

我的目标是使用 JSoup 从食谱页面中提取成分列表。我设法从网站上获得了我的第一个列表条目，但是我

java-如何同时从两个或多个网站获取数据？(Android应用)

我做了一个应用程序,它从不同的网址获取数据.我使用for循环使用jsoup lib从不同的URL获取数据.现在,这需要很多时间,例如5秒.首先从url1中获取数据,然后从2中获取数据,然后从3中获取数据.这就是我想的时间.所以我想知道我们是否可以同时(多个线程)从不同的URL获取数据？public class Title extends AsyncTask

java-在jsoup选择器中允许缺少父项

我想从一个网站检索书籍,但是该网站使用不同的html来显示相同的内容.在某些页面中,它有一个div,然后是ul和li,如下所示：<div class='book-description'> <ul> <li>info 1</li> <li>info 2</li

使用JSoup删除HTML标记之间的文本

在某些HTML清理的情况下,我想保留标签之间的文本(这是Jsoup的默认行为),在某些情况下,我想删除文本以及HTML标记.请问有人可以说明如何使用Jsoup删除HTML标签之间的文本？最佳答案Cleaner将始终删除标签并保留文本.如果需要删除元素(即标记和文本/嵌套元素),可以预先解析HTML,使用remove()或empty()删除元素,然后通过清理器

如何使用jsoup从这个html标签获取文本？

当我使用jsoup提取数据时,我遇到了一个位置.这样的数据：This is a <strong>strong</strong> number <date>2013</date> 我想得到这样的数据：这是一个数字我怎样才能做到这一点？谁能帮我？最佳答案您可以将html解析为Document,选择body-Elem

java – 如何在Android中将字符串转换为UTF-8？

我正在使用一个名为Jsoup的HTML解析器来加载和解析HTML文件.问题是我正在抓取的网页是用ISO-8859-1字符集编码的,而Android使用的是UTF-8编码(？).这导致一些字符显示为问号.所以现在我想我应该将字符串转换为UTF-8格式.现在我在Android SDK中找到了这个名为CharsetEncoder的类,我想这可以帮助我.但我无法弄清

java – 使用Jsoup登录Asp.net表单的方法

我正在尝试使用以下代码登录到http://www.investabroadproperties.com/站点Connection.Response loginForm = Jsoup.connect('http://www.investabroadproperties.com/') .method(Connection.Met

比较 tika 和正则，我更喜欢jsoup jsoup 抓取 iteye 网站

jsoup 效果 qq新闻内容抓取正则表达（正则） http://knight-black-bob.iteye.com/blog/2312411 比较 tika 和正则，我更喜欢jsoup 正则比较难写，，，，，，下面有jar 包下载 <dependency> <groupId>org.jsoup</groupId> <artifactId>js

Android JSOUP ExceptionInInitializerError

我用amigo库更新了我的dex类(它改变了一个apk,用另一个apk和相同的密钥和签名,除了JSOUP之外都工作了) 错误： FATAL EXCEPTION: Thread-1567 Process: com.smedic.tubtub, PID: 26102 java.lang.ExceptionInInitializerError at org.jsoup.nodes.Document$Ou

android – 使用AsyncTask和Jsoup发布APK时出错

我收到这个错误： 03-04 09:55:55.915: W/dalvikvm(20171): Exception Ljava/lang/NullPointerException; thrown while initializing La/a/b/k; 03-04 09:55:55.915: W/dalvikvm(20171): Exception Ljava/lang/ExceptionInIn

xml解析神器PK，花落谁家？Jsoup Or Xpath?

原文：点击打开链接今天简单测了下使用Jsoup和Xpath解析XML的文件的方便程度，两者都可以完成解析，提取特定的元素或节点内容，但明显Jsoup更胜一筹，我们都知道Xpath是专业的xml结构化文档的查询语言，虽然语法功能强大，但是代码还是比较繁琐。虽然jsoup的出现，并不是专门用来解析XML使用的，但是使用jsoup这个轻巧的类库，我们可以完成网页抓取，HTML解析，模拟登陆等一些功能，

XML解析神奇比较Jsoup or Xpath

转载自http://qindongliang.iteye.com/blog/2162519 今天简单测了下使用Jsoup和Xpath解析XML的文件的方便程度，两者都可以完成解析，提取特定的元素或节点内容，但明显Jsoup更胜一筹，我们都知道Xpath是专业的xml结构化文档的查询语言，虽然语法功能强大，但是代码还是比较繁琐。虽然jsoup的出现，并不是专门用来解析XML使用的，但是使用jsoup

【软件周刊】Bootstrap 将不再支持 IE 9；Swoole 2.0 正式版发布，协程特性支持 PHP 7

PHP 的异步并行、网络通信引擎 Swoole 发布 2.0 正式版，协程特性支持 PHP 7 2.0 版本最大的更新是增加了对协程（Coroutine）的支持。基于 Swoole2.0 协程，PHP 开发者可以以同步的方式编写代码，底层自动进行协程调度，转变为异步 IO。解决了传统异步编程嵌套回调的问题。正式版已同时支持 PHP 5 和 PHP 7。目前 Swoole 底层内置的协程客户端组件

html – 使用JSoup post方法登录网站

我正在尝试使用JSoup post方法登录网站.我看到了一些例子,但都没有对我有用. 我正在尝试登录： http://ug.technion.ac.il/Tadpis.html 为此,我有以下代码： String url = "http://ug.technion.ac.il/Tadpis.html"; doc = Jsoup.connect(url).data("userid", "my_us

html – Jsoup unescapes特殊字符

我正在使用Jsoup从HTML页面中删除所有图像. 我通过HTTP响应接收页面 – 它还包含内容字符集. 问题是Jsoup取消了一些特殊字符. 例如,输入： <html><head></head><body><p>isn’t</p></body></html> 跑完之后 String check = "<html><head></head><body><p>isn’t</p

html – Jsoup如何选择具有多个属性的标签

我有一个表标签 <table width="100%" align="center"/> 到目前为止Jsoup提供 Document document =Jsoup.parse(htmlString); document.select("table[width=100%],table[align=center]"); 这是OR命令,即如果任何一个匹配则填充元素. 为了选择宽度= 100％且对齐=中

html – jsoup：如何选择满足条件的子节点

这是 HTML的一部分(问题简化)： <a href="/auctions?id=4672" class="auction sec"> <div class="progress"> <div class="guarantee"> <img src="/img/ico/2.png" /> </div> </div> </a> <a href="/auctions?id=4