先看视频。
【赵强老师】HBase的过滤器
HBase其实一个缩写,是Hadoop Database的简称,从问世之初,就为了解决用大量廉价的机器高速存取海量数据、实现数据分布式存储提供可靠的方案。HBase与一般的数据库又有所区别,HBase本身的存取接口相当简单,不支持复杂的数据存取,更不支持SQL等结构化的查询语言;HBase也没有除了rowkey以外的索引,所有的数据分布和查询都依赖rowkey。所以,HBase在表的设计上会有很严格的要求。
体系架构为master/slave架构。主节点运行的服务称为HMaster,从节点服务称为HRegionServer,底层采用HDFS存储数据。
HMaster负责管理多个HRegionServer、恢复HReigionServer故障等。
HRegionServer负责多个区域的管理及相应客户端请求。HRegionServer还负责区域划分并通知HMster有了新的子区域。
HBase需要ZooKeeper集群服务,默认情况下,它管理一个ZooKeeper实例,作为“权威机构”。ZooKeeper会记录HMaster位置、根目录表位置等核心数据,此时若有HRegionServer崩溃,就可以用通过ZooKeeper来进行分配协调。此外,当HBaseClient连接到HBase时,其必须首先访问ZooKeeper,在获取HMaster、HRegionServer、-ROOT-等核心数据后,方可连接到HRegionServer。