Cassandra或Hadoop Hive或MYSQL?

我正在开发网络爬虫,哪个对存储数据有好处?卡桑德拉或者Hadoop的蜂巢或MySQL?为什么?我有过去在我的MySQL数据库6个月的数据1TB,我需要索引他们,我需要得到了把我的搜索尽快,并且我认为,它会存储更多数据,例如10个Peta Byes,因为我的抓取工具正在快速运行,我需要快速进行读/写操作,我需要将其集成到我的PHP应用程序中

最佳答案
这取决于您的要求的详细信息,但是我认为在您的情况下,HBase将是最佳选择.
充分证明了将HBase用作Web爬网程序数据库,BigTable白皮书中介绍了HBase的用法.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


mysql中%不能表示什么
mysql中的column什么意思
mysql中asc什么意思
mysql中的where什么意思
mysql中如何求百分比
mysql中no是不是关键字
mysql中column可以省略吗
mysql中before是什么意思
mysql中主键约束和唯一约束是什么关系
mysql中的varchar是什么意思
在mysql中用来查询结果的函数是?
mysql中enum是什么意思
mysql中on是什么意思
mysql中主键约束和唯一约束怎么区分出来的
mysql中表更新数据的命令是哪个
mysql中or的用法
mysql中的unique如何实现唯一
mysql中and和or的区别
desc在mysql中什么意思
mysql中的unique是什么意思