Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera
Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python
Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce
Job等等。
HUE功能是很强大的,目前安装只是为了方便的操作hive。百度搜索了一下HUE,看到下面界面
进入之后,找到
嗯…需要docker,先安装一个。找到菜鸟教程按照教程安装。
这里介绍一下下面会用到的docker命令。
#查看所有容器
docker ps -a
#从镜像gethue/hue:latest实例化一个容器 -p 端口映射 -it交互式终端
docker run -it -p 8888:8888 gethue/hue:latest
#启动容器
docker start <容器id>
docker stop <容器id>
dokcer restart <容器id>
#进入容器shell
docker exec -it <容器id> /bin/bash
#从宿主机拷贝到容器内
docker cp 本地文件路径 <容器id>:容器内路径
#从容器内拷贝到宿主机
docker cp <容器id>:容器内路径 本地文件路径
装好以后执行命令,运行hue
docker run -it -p 8888:8888 gethue/hue:latest
docker自动下载镜像(很慢,可以配置国内镜像)。完成以后查看一下
[root@hadoop01 hadoop]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
a5d520ca60c3 gethue/hue:latest "./startup.sh" 3 hours ago Up About an hour 0.0.0.0:8888->8888/tcp flamboyant_bardeen
修改配置文件hue.ini,找到并修改下面的信息
hive_server_host=192.168.229.201 #hive所在的主机IP地址
hue自带的sqllite数据库使用时会出现库锁的问题。换成mysql,修改以下配置
[[[mysql]]]
# Name to show in the UI.界面显示是什么无所谓
nice_name="My SQL DB"
#数据库名
name=hue
# 数据库引擎
engine=mysql
#数据库主机IP
host=192.168.229.203
#端口
port=3306
#用户名
user=hue
#密码
password=!QAZ2wwsx
初始化hue数据库
/usr/share/hue/build/env/bin/hue syncdb
/usr/share/hue/build/env/bin/hue migrate
重启容器后访问主机8888端口
首次进入,用户名和密码都输入hadoop,点击蓝色按钮创建账号。这个账号要和hive的账户相同。
下篇文章介绍Hive SQL