特别说明:一下内容均来自网络,个人整理和摘要的内容而已
1 简介
HBase,是一个Hadoop上的数据库,是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,它介于NoSQL和RDBMS之间,是Google Bigtable的开源实现。。利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase中的表一般有如下特点:
- 海量数据:一个表可以有上亿行,上百万列
- 面向列:面向列(族)的存储和权限控制,列(族)独立检索
- 稀疏:对于为空(NULL)的列,并不占用存储空间,因此,表可以设计的非常稀疏
Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单;Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。