数据工程师:必备的 Hive 安装&交互方式技能

Hive 安装

hive 的下载地址为:
https://archive.apache.org/dist/hive/

数据工程师:必备的 Hive 安装&交互方式技能

从图中可以看出,hive 有许多可下载的安装版本,这里我使用 hive-2.3.0 的版本为大家演示。

 

step1:下载、上传并解压安装包

进入目标机器将下载的安装包上传至服务器的 /your_directory 路径下,进行解压,命令如下所示

cd /your_directory
tar -zxvf apache-hive-2.3.0-bin.tar.gz -C  /your_directory

 

step2:安装 Mysql 用于存储 Hive 元数据

开始在 Linux 下安装 Mysql 数据库,按照以下顺序步骤执行:

a. 查看是否已安装 Mysql
yum list installed mysql*
如果检测出已安装 Mysql 则可以先卸载掉, 然后再进行安装;

 

b. 安装 Mysql 客户端
yum -y install mysql

 

c. 安装 Mysql 服务器端
yum -y install mysql_server

 

d. 安装 Mysql 开发库
yum -y install mysql-devel

 

e. 配置 Mysql 配置文件
设置 utf-8 编码
vim /etc/my.cnf , 在 my.cnf 文件中添加 default-character-set=utf8;

 

f. 启动 Mysql 数据库
service mysqld start;

 

g. 创建 root 密码
mysqladmin -u root password 123456

 

h. 进入 Mysql 数据库
mysql -hlocalhost -P3306 -uroot -p123456


i. 进入 Mysql 客户端进行授权

grant all privileges on . to 'root'@‘%’ identified by 'test_001' with grant option;
 
flush privileges;

 

step3:修改 hive 的配置文件

修改 hive-env.sh 文件

cd /your_directory/apache-hive-2.3.0-bin/conf
cp hive-env.sh.template hive-env.sh
HADOOP_HOME=/your_directory/hadoop-2.7.5
export HIVE_CONF_DIR=/your_directory/apache-hive-2.3.0-bin/conf

修改 hive-site.xml 文件

 数据工程师:必备的 Hive 安装&交互方式技能

 

 

从图中可以看出该 xml 文件里设置了 Mysql (存储 hive 元数据信息的数据库) 的连接URL,驱动名称,数据库用户名,密码等关键信息。

 

step4:添加 Mysql 的连接驱动包

Hive 使用 Mysql 作为元数据存储,需要连接 Mysql 数据库,所以将 mysql-connector-java-5.1.38.jar 这个 jar 包上传到 /your_directory/apache-hive-2.3.0-bin/lib这个目录下, 然后启动 Hive。Hive的安装部署就结束了。

 

step5:配置 Hive 的环境变量

在服务器执行以下命令配置 hive 的环境变量

sudo vim /etc/profile
export HIVE_HOME=/your_directory/apache-hive-2.3.0-bin
export PATH=:$HIVE_HOME/bin:$PATH

请记住配置完 hive 的环境变量后,需要使用以下命令使其生效

source /etc/profile

 

Hive 的交互方式

第1种:bin/hive进入hive客户端

# 进入到hive的安装目录
cd /your_directory/apache-hive-2.3.0-bin/
# 输入以下命令则可以进入hive客户端页面
bin/hive

hive 客户端页面如下图所示

数据工程师:必备的 Hive 安装&交互方式技能

 

 创建一个数据库

# 如果数据库名为:mytest的不存在,则创建一个名为 mytest 的数据库,如果存在也不会报错,只是不会创建 mytest 这个名字的数据库;
create database if not exists mytest;

 

第2种:使用 sql 语句或者 sql 脚本进行交互

不进入 hive 的客户端直接执行 hive 的 hql 语句

(1). hive -e 的方式

cd /your_directory/apache-hive-2.3.0-bin
bin/hive -e'create database if not exists mytest;'

 

(2). hive -f 的方式

cd /your_directory

vim test_hive.sql

test_hive.sql内容如下:

create database if not exists mytest;
use mytest;
 
create table t_student(id int, name string);

#通过hive -f来执行sql脚本
bin/hive -f /your_directory/test_hive.sql

以上交互方式创建的 mytest 数据库的元数据信息存储在上述安装的元数据库 mysql 库表中。

 

欢迎关注【无量测试之道】公众号,回复【领取资源】

Python+Unittest框架API自动化、

Python+Unittest框架API自动化、

Python+Pytest框架API自动化、

Python+Pandas+Pyecharts大数据分析、

Python+Selenium框架Web的UI自动化、

Python+Appium框架APP的UI自动化、

Python编程学习资源干货、

资源和代码 免费送啦~
文章下方有公众号二维码,可直接微信扫一扫关注即可。

备注:我的个人公众号已正式开通,致力于IT互联网技术的分享。

包含:数据分析、大数据、机器学习、测试开发、API接口自动化、测试运维、UI自动化、性能测试、代码检测、编程技术等。

微信搜索公众号:“无量测试之道”,或扫描下方二维码:

数据工程师:必备的 Hive 安装&交互方式技能

添加关注,让我们一起共同成长!

上一篇:VUE CONF开发者大会最全!最快!PPT下载!


下一篇:移动端性能优化系列—启动速度