pache Hive--架构&组件| 学习笔记

开发者学堂课程【大数据 Hive 教程精讲pache Hive--架构&组件】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/90/detail/1374


pache Hive--架构&组件


介绍:

一、Hive架构

二、Hive组件

一、Hive架构

pache Hive--架构&组件| 学习笔记


二、Hive组件

用户接口:包括CLI、JDBC/ODBC、WebGUI。

其中,CLI(command lineinterface)为 shell命令行;JDBC/ODBC是 Hive 的 JAVA实现,与传统数据库JDBC类似;WebGUI 是通过浏览器访问 Hive。

元数据存储:通常是存储在关系数据库如 mysql/derby 中。Hive 将元数据存储在数据库中。Hive 中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。

解释器、编译器、优化器、执行器:完成 HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中,并在随后有 MapReduce调用执行。

Hive 与 Hadoop的关系

Hive 利用 HDFS存储数据,利用 MapReduce 查询分析数据。

上一篇:ECS7天实践训练营入门班第三组精选文章(6)


下一篇:Apache Hive--安装部署--内置 derby 版以及缺陷| 学习笔记