问题描述:
使用Spark写hudi表并同步到hive,然后使用Hue hive查询同步的hudi表。发现对COW类型的表进行count查询和select * 查询出的数据总条数不一致,并且查询MOR表的实时视图也报错:
FAILED:Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
解决方法:
在执行查询时设置:
set hive.input.format=org.apache.hudi.hadoop.hive.HoodieCombineHiveInputFormat