我有一个应用程序,需要分析不同级别的聚合,这就是OLAP工作负载.我想更频繁地更新我的数据库.
例如,这里是我的更新的样子(模式看起来像:time,dest,source ip,browser – >访问)
(15:00-1-2-2010,www.stackoverflow.com,128.19.1.1,safari) --> 105 (15:00-1-2-2010,128.19.2.1,firefox) --> 110 ... (15:00-1-5-2010,www.cnn.com,128.19.5.1,firefox) --> 110
然后我想问一下上个月从firefox浏览器访问www.stackoverflow.com的内容.
我知道Vertica系统可以以相对便宜的方式(性能和可扩展性明智,但不是成本方面)来做到这一点.我在这里有两个问题
1)有没有一个开源产品可以建立在这个问题上呢?特别是,蒙德里安系统的工作效果如何? (可扩展性和性能)
2)有没有HBase或Hypertable基础解决方案(显然,赤裸裸的HBase / Hypertable不能这样做)? – 但是如果有一个基于HBase / Hypertable的项目,可扩展性可能不会是一个问题IMO)?
谢谢!
解决方法
您可以下载greenplum数据库的免费版本(单节点版本).我没有尝试过,但我认为/猜测是一个强大的野兽.阅读这里:
http://www.dbms2.com/2009/10/19/greenplum-free-single-node-edition/
另一个选项是MongoDB,它是快速和免费的,您可以使用JavaScript编写MapReduce函数进行分析.
我在这里的声誉是低到添加超链接到mongodb,所以你必须google.我每个帖子只能添加一个超链接.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。