GECCO 介绍
Gecco是什么
Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。同时Gecco基于十分开放的MIT开源协议,无论你是使用者还是希望共同完善Gecco的开发者,欢迎pull
request。如果你喜欢这款爬虫框架请star 或者 fork!
主要特征
-
简单易用,使用jquery风格的选择器抽取元素
-
利用Redis实现分布式抓取,参考gecco-redis
-
支持结合Spring开发业务逻辑,参考gecco-spring
-
支持htmlunit扩展,参考gecco-htmlunit
GECCO 官网
https://git.oschina.net/xtuhcy/gecco
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。