微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

第二章 大数据Hadoop生态圈之Hbase

(一)概念与特性

hbase是建立在hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统
它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化的半结构化的松散数据。
与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。

(二)hbase表结构

HBase中的表一般有这样的特点:

大:一个表可以有上10亿行,上100万列
面向列:面向列(族)的存储和权限控制,列(族)独立检索。
稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。
hbase表中,只支持一种数据类型:byte[]
hbase的表中,列族和kv都会自动排序,排序的规则是按照列族名和列名的字典顺序
行也会排序,根据行健的字典顺序

(三)逻辑视图

HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族(row family)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐