一、概述
之前有篇文章:Hive实战:详解Hive复合数据类型,讲解了Hive三种复合数据类型使用,之前例子中一张表只有一种复合数据类型,这篇文章我们主要演示下,多余单张表存在多种复合数据类型的情况,如何编写对应的HQL建表语句。
二、实例演示
1.假设我们有一些学生信息数据,字段分别有姓名name String类型、爱好interests array类型、课程和分数course map类型、info 手机号和年龄 struct类型,下面我们直接看数据文件student1.txt:
lujisen1,basketball|football,yuwen:80|shuxue:81,18668984418|20lujisen1,basketball|volleyball,yuwen:90|shuxue:91,18668984417|21
2.这张表含有array、map、struct三种符合数据类型,如何进行建表对数据进行分割呢?创建表语句如下:
create table studetn1(name string,interests array<string>,course map<string,double>,info struct<phone:string,age:int>)row format delimited fields terminated by ','collection items terminated by '|'map keys terminated by ':'lines terminated by '\n';
下面来分析下这个建表语句:
1).row format delimited 这个是行格式化限制,下面就指定行里面的字段如何分隔;
2)fields terminated by ',':指定每个字段的用逗号分隔;
3).collection items terminated by '|' 复合数据类型map、array的分隔符 ,内部元素都用“|”分隔;
4).map keys terminated by ':' 这里是map专属的设置 指定map中key/value分隔符是":"
5).lines terminated by '\n' 这里就比较好理解了 指定每行的分隔符
3.下面我就实际操作一下,用上面的语句建表student1,截个图:
4.加载数据:
load data local inpath '/root/student1.txt' into table student1;
5.查询下数据表,验证数据加载成功:
可能还有其他复杂数据类型,原理跟这个基本一致。