Apache Hive--介绍&Hive 实现思路模拟| 学习笔记

开发者学堂课程【大数据 Hive 教程精讲Apache Hive--介绍&Hive 实现思路模拟】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/90/detail/1360


Apache Hive--介绍&Hive实现思路模拟


内容介绍:

一、Hive简介

二、为什么使用Hive?

 

一、Hive简介:

什么是 Hive?

Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类 SQL查询功能。

本质是将 SQL 转换为 MapReduce 程序。

主要用途:用来做离线数据分析,比直接用 MapReduce开发效率更高。

Apache Hive--介绍&Hive 实现思路模拟| 学习笔记

为什么使用Hive?

直接使用 Hadoop MapReduce 处理数据所面临的问题:

人员学习成本太高

MapReduce 实现复杂查询逻辑开发难度太大使用 Hive :

操作接口采用类 SQL 语法,提供快速开发的能力

避免了去写 MapReduce,减少开发人员的学习成本

功能扩展很方便

上一篇:【原】webapp开发中兼容Android4.0以下版本的css hack


下一篇:如何用 Python 和 fast.ai 做图像深度迁移学习?