今天遇到hive表新增字段,以往建表都是建外表,直接drop后,重新创建。
由于这次全部使用内表创建的,所以使用add column功能新增字段。
alter table xy_dw.dw_transaction_eth add columns(type1 string comment '类型');
但是发现,如果已经存在记录的情况下覆盖写入,新添加的字段任然为NUll。
如果是新的记录,则可以写入。
被坑了两天(我一直以为我程序哪里出问题了)终于发现了猫腻。
注意:如果创建的是分区表,则在添加新字段时,必须要带上cascade,否则该字段无法进入数据。
根本原因是元数据中带分区表的元数据和hive的实际存储不一致。
alter table xy_dw.dw_transaction_eth add columns(type1 string comment '类型') cascade;
如果已经添加了字段,没有带cascade怎么解决呢。
我们可以修改字段,在修改字段名时带上,在修改回来。如下:
alter table xy_dw.dw_transaction_eth change type1 type string comment '类型' cascade;
alter table xy_dw.dw_transaction_eth change type type1 string comment '类型' cascade;
可能使用msck repair table xy_dw.dw_transaction_eth; 也有可能修复,没测试过。