开发者学堂课程【大数据 Hive 教程精讲:pache Hive--架构&组件】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/90/detail/1374
pache Hive--架构&组件
介绍:
一、Hive架构
二、Hive组件
一、Hive架构
二、Hive组件
用户接口:包括CLI、JDBC/ODBC、WebGUI。
其中,CLI(command lineinterface)为 shell命令行;JDBC/ODBC是 Hive 的 JAVA实现,与传统数据库JDBC类似;WebGUI 是通过浏览器访问 Hive。
元数据存储:通常是存储在关系数据库如 mysql/derby 中。Hive 将元数据存储在数据库中。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。
解释器、编译器、优化器、执行器:完成 HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中,并在随后有 MapReduce调用执行。
Hive 与 Hadoop的关系
Hive 利用 HDFS存储数据,利用 MapReduce 查询分析数据。