HTML解析器 - 编程之家

HTML解析器HTML解析器专题提供HTML解析器的最新资讯内容，帮你更好的了解HTML解析器。

Painty 提供了将 HTML 代码转成图片的 PHP 解决方案，支持以下的 HTML 标签： H1 STRONG, B

Scrender是一个用来生成网页缩略图的Java类库，基于SWT开发。它实质上是调用本地浏览器引擎对要进行截图的网站进行渲染，然后保存该网页的缩略图。

本站使用 jsoup 来解析 HTML。 jsoup 是一款 Java 的HTML 解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据。

JoyHTML的目的是解析HTML文本当中的链接和正文，利用超链接密度法为主要判断依据的标记窗算法，采用DOM树解析模式。

afterwork 是一个 C# 语言用来解析 HTML 文档的开发包。

基于行块分布函数的通用网页正文抽取：线性时间、不建DOM树、与HTML标签无关

这是一个 PHP5 的 HTML 文档解析器，示例代码： // Create DOM from URL or file $html = file_get_html (\'http://www.google.com/’);

HTML4J 是一个 Java 解析 HTML 的类库。示例代码： Reader re = ... // Create the document HTMLDoc doc = new HTMLDoc();

Jerry 是 Jodd 工具包中的一个HTML解析工具。它有点像是用Java实现的jQuery。Jerry是一个高效简洁的Java库，用来简化HTML的解析，遍历和操作。

很多人需要提取网页的一些内容, 可以利用正则表达式提取,也可以用beautifulsoap等工具. 正则表达式方法速度快,缺点是不好找到匹配的正则.

这是一个纯 JavaScript 的 HTML 文档解析器，在线演示。示例代码： var results = “”;

PyH 是一个用来生成HTML页面的Python模块，使用面向对象的方式，HTML的标签都会对应一个Python的对象，输出的HTML文档排版良好，易于阅读。

Krabber是kVitrail的网页抽取工具。 Krabber的设计目标是提供一个可以为Java应用调用的、可以执行网页上的JavaScript代码、并返回JavaScript代码执行后的网页的HTML代码的网页抽取工具。

RenderSnake 是一个轻量级的Java类库用来通过Java方法生产html页面，包含4个核心类库：

XSS HTMLFilter这是一个采用Java实现的开源类库。用于分析用户提交的输入，消除潜在的跨站点脚本攻击(XSS)，恶意的HTML，或简单的HTML格式错误。

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful

Objective-C-HMTL-Parser 是一个用 ObjectiveC 编写的简易 HTML 解析器。示例代码： NSError *error = nil;

HtmlDistiller 是一个 .NET 的 HTML 文档解析类库。该类库对 HTML 文档的格式要求并不严格，可根据标签名、属性和样式进行过滤。

htmlcxx 是一个 C++ 的 HTML 解析器和 CSS1 的解析器。The parsing politics attempt to mimic

chtml-matcher 是一个 Lisp 的库用来从 HTML 文档中抽取信息，它使用 closure-html 库将 HTML 解析成 lhtml

分类导航