《大数据: HBase与Hive集成使用》

一、HBase与Hive的对比

1.Hive

  • Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询
  • Hive适用于离线的数据分析和清洗,延迟较高
  • Hive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行

2.HBase

  • 是一种面向列存储的非关系型数据库
  • 适用于单表非关系型数据的存储,不适合做关联查询,类似JOIN等操作
  • 数据持久化存储的体现形式是Hfile,存放于DataNode中,被ResionServer以region的形式进行管理
  • 面对大量的企业数据,HBase可以直线单表大量数据的存储,同时提供了高效的数据访问速度
上一篇:不新鲜的集群重新格式化namenode,用hdfs namenode -format报错


下一篇:强大!Nginx 配置在线一键生成“神器”