Gumbo 介绍
Gumbo 是 Google 的一款用C语言实现的HTML5解析库,无需任何外部依赖。
目标及特征:
-
遵循 HTML5 规范
-
功能强大,可处理一些不规范的 HTML 标签
-
简单的 API
-
支持源位置和指针回到原始文本
-
轻巧、没有外部依赖
-
通过 html5lib-0.95 兼容测试
-
已在超过25亿个来自谷歌索引的页面中进行过测试
示例代码:
#include "gumbo.h" int main(int argc, char** argv) { GumboOutput* output = gumbo_parse(argv[1]); // Do stuff with output->root gumbo_destroy_output(&kGumboDefaultOptions, output); }
Gumbo 官网
https://github.com/google/gumbo-parser
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。