09 hive

.安装Hive

  1. 下载解压重命名权限
  2. 配置环境变量  $HIVE_HOME

  09 hive

 

 

 

  1. 修改Hive配置文件 gedit

    09 hive

 

 

 

  1. 配置mysql驱动
    1. 下载合适版本的mysql jar包,拷贝到/usr/local/hive/lib目录下 ls
    2. 在mysql新建hive数据库 show databases;
    3. 配置mysql允许hive接入  show grants for 'hive'@'localhost';
  2. 启停

     

    1. 启动Hadoop--启动Hive--退出Hive--停止Hadoop

09 hive

 

 

 

二、Hive操作

  • hive创建与查看数据

09 hive

 

 

 

 

 

  • mysql查看hive元数据表DBS
  • 09 hive
  • hive创建与查看表
  • 09 hive
  • mysql查看hive元数据表TBLS
  • 09 hive
  • hdfs查看表文件位置
  • 09 hive
  • hive删除表
  • 09 hive
  • mysql查看hive元数据表TBLS
  • 09 hive
  • hive删除数据库
  • 09 hive
  • mysql查看hive元数据表DBS 
  • 09 hive
  • hdfs查看表文件夹变化
  • 09 hive

    三、hive进行词频统计

  • 准备txt文件
  • 启动hadoop,启动hive
  • 创建并查看文本表  create table
  • 09 hive
  • 导入文件的数据到文本表中 load data local inpath
  • 09 hive
  • 分割文本 split
  • 09 hive
  • 行转列explode
  • 09 hive
  • 统计词频group by

    09 hive

    •  

准备txt文件

上传文件至hdfs

09 hive

 

 

从hdfs导入文件内容到表wctext, 并查看hdfs源文件,hfds数据库文件

09 hive

 

 

统计词频

09 hive

 

 

词频统计结果存到数据表里,并查看表和文件

09 hive

 

 

本地调用本地hql文件进行词频统计,将结果保存为本地文件

wc.hql

09 hive

 

 

 

09 hive

 

 

退出hive,停止hadoop

上一篇:Solidity番外篇(一)Solidity在线or插件使用


下一篇:微信JS SDK使用权限签名算法