Hbase
Hbase简介
分布式数据库不支持sql
储存key-value数据
将数据储存在不同的机器上利用不同的机器处理并发请求
HBase是一个高可靠性、高性能(快)、面向列、可伸缩的分布式数据库系统
Hbase的特点
海量存储
面向列 列式存储
极易扩展
高并发
稀疏
稀疏主要是针对Hbase列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会占用存储空间的。
无模式
多版本
缺点
不适合做报表分析统计
主从架构
主节点 Hmaster
• 为Region server分配region(数据)
• 负责Region server的负载均衡
• 发现失效的Regionserver并通过拆分LOG重新分配其上的region
• 管理用户对table定义的各类DDL操作
从节点 HRegion Server
• 管理master为其分配的Region
• 处理来自客户端的读写请求
• 负责和底层HDFS的交互,存储数据到HDFS
• 负责Region变大以后的拆分
• 负责Storefile的合并工作
• 负载均衡的事情
管理表的片段数据(region)
Region:HBase中的数据都是按row-key进行排序的,对这些按row-key排序的数据进行水平切分,每一片称为一个Region,它有startkey和endkey,Region的大小可以配置,一台RegionServer中可以放多个Region
namespace
hbase中没有数据库的概念 , 可以使用namespace来达到数据库分类别管理表的作用
Hbase安装
环境准备
1.zookeeper集群启动
2.HDFS正常启动
3.时间同步
• yum -y install ntpdate.x86_64
• 时间同步 ntpdate 0.asia.pool.ntp.org
0.asia.pool.ntp.org1.asia.pool.ntp.org2.asia.pool.ntp.org3.asia.pool.ntp.org
4.上传解压
5.修改配置hbase-env.sh
hbase-env.sh修改内容:注意放开注释export JAVA_HOME=/usr/apps/jdk1.8.0_141/esc /ZK 回车export HBASE_MANAGES_ZK=false
6.修改配置文件hbase-site.xml
hbase.rootdirhdfs://ck01:8020/hbase
hbase.cluster.distributedtrue hbase.unsafe.stream.capability.enforce false
hbase.zookeeper.quorumck01:2181,ck02:2181,ck03:2181
7.配置文件regionservers
doit01doit02doit03
8.集群分发
9.启动
bin/hbase-daemon.sh start masterbin/hbase-daemon.sh start regionserver
10.网页访问 doit01:16010