例如数据长这个样子
id | name | value |
1 | 张三 | 1,2,3 |
2 | 李四 | 4,5,6,7 |
想要这个样子
id | name | value |
1 | 张三 | 1 |
1 | 张三 | 2 |
1 | 张三 | 3 |
2 | 李四 | 4 |
2 | 李四 | 5 |
2 | 李四 | 6 |
2 | 李四 | 7 |
实现:
select id,name, single_value
from table
lateral view explode(split(value, ',')) test_value as single_value;
关键点:explode
explode() takes in an array (or a map) as an input and outputs the elements of the array (map) as separate rows. UDTFs can be used in the SELECT expression list and as a part of LATERAL VIEW.
总结起来一句话:explode就是将hive一行中复杂的array或者map结构拆分成多行。
关键点:lateral view
lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (’,’ columnAlias)*
fromClause: FROM baseTable (lateralView)*
lateral view用于和split, explode等UDTF一起使用,它能够将一行数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。lateral view首先为原始表的每行调用UDTF,UDTF会把一行拆分成一或者多行,lateral view再把结果组合,产生一个支持别名表的虚拟表。