一:常用版本
1.版本
0.13.1 2014年
1.2.1 2015年
版本之间的区别:支持SQL不同,向关系型数据库靠拢。
目前看到的版本是2.3.2了。
2.官网
二:安装配置hive
1.检测hadoop
2.解压hive
3.修改环境
sudo vi /etc/profile
4.source以下
5.复制hive-env.sh
6.编辑hive-env.sh
设置hadoop的配置环境,因为hive需要hadoop,不然hive和hadoop没有关联。
hive的配置文件目录要启动的,因为除了默认的hive加载,自定义的hive文件在conf下,也需要加载。
7.在HDFS上创建文件夹并修改写权限
同组可写权限。
保存hive的数据,主要放在HDFS上的warehouse文件夹下。
说明:
为啥是这个目录。因为hive.metastore.warehouse.dir在默认文件中的位置是这个位置,所以就设置了这个目录。
8.验证hive的安装
属于启动。
进入hive的命令行。
二:操作hive
1.显示有哪些数据库
有一个default数据库。
说明:
假设在这个数据库下创建一个表,这个表就在user/hive/warehouse文件夹下。
2.创建数据库
3.在新建的数据库中新建表
使用新建的数据库
use hadoop09;
这个使用的字符串是string,不是varchar,因为底层是hadoop。
4.加载数据
首先要书写数据:
加载数据:
5.HDFS里文件的分布
一开始是数据仓库文件。
hadoop09是数据库,所以生成的文件名字教hadoop09.db。
student是一张表。
里面有一个文件,是数据文件,这个文件也是刚才在本地编辑的文件。
维护都是使用文件夹。
6.hive查询语句
三:hive的问题
1.问题的由来
当开启第二个hive的时候,就会出现问题。
因为hive的默认数据库使用的是derby,只能启用一个实例,所以不适合企业。
解决的方案是:使用mysql关系数据库代替derby。
四:配置mysql
1.卸载已经安装的mysql
2.安装mysql
3.查看mysql的状态
4.开启服务
5.设置开机启动
6.设置密码
7.进入数据库
8.修改连接权限的位置
9.修改连接权限
增加一个权限
删除其他的
10.刷新权限,退出,重启服务
以上的mysql已经配置完成
五.配置hive
1.生成hive-site.xml
2.配置hive-site.xml、
官网位置:
修改的配置:
3.在lib下加入驱动
4.启动hive
5.观看效果
出现了metastore数据库。
六:日志的配置问题
1.问题的由来
2.在conf中启用
3.修改配置,hive运行的日志配置
七.人性化设置
1.列名,数据库名
2.效果