hive表新增字段无法覆盖写入内容

今天遇到hive表新增字段,以往建表都是建外表,直接drop后,重新创建。

由于这次全部使用内表创建的,所以使用add column功能新增字段。

alter table xy_dw.dw_transaction_eth add columns(type1 string comment '类型');

但是发现,如果已经存在记录的情况下覆盖写入,新添加的字段任然为NUll。

如果是新的记录,则可以写入。

被坑了两天(我一直以为我程序哪里出问题了)终于发现了猫腻。

 

注意:如果创建的是分区表,则在添加新字段时,必须要带上cascade,否则该字段无法进入数据。

根本原因是元数据中带分区表的元数据和hive的实际存储不一致。

alter table xy_dw.dw_transaction_eth add columns(type1 string comment '类型') cascade;

 

如果已经添加了字段,没有带cascade怎么解决呢。

我们可以修改字段,在修改字段名时带上,在修改回来。如下:

alter table xy_dw.dw_transaction_eth change type1 type string comment '类型' cascade;
alter table xy_dw.dw_transaction_eth change type type1 string comment '类型' cascade;

可能使用msck repair table xy_dw.dw_transaction_eth; 也有可能修复,没测试过。

 

上一篇:ETH开发0——开发环境搭建


下一篇:静态LACP模式