用nifi把hdfs数据导到hive

全景图:

用nifi把hdfs数据导到hive 

 

1. ListHDFS & FetchHDFS:

ListHDFS:

用nifi把hdfs数据导到hive

 

FetchHDFS:

用nifi把hdfs数据导到hive

 

2. EvaluateJsonPath:

{"status": {"code":500,"message":"FAILED","detail":"DTU ID not exists"}}

用nifi把hdfs数据导到hive

如果json里有数组,需要先用SplitJson分隔:

用nifi把hdfs数据导到hive

 

 

3. RouteOnContent:

用nifi把hdfs数据导到hive

 

4. ReplaceText:

先在hive里创建一个表:

create table tb_test(
register string,
register_url string
);

 

用nifi把hdfs数据导到hive

insert into yongli.tb_test(register, register_url)values('${register}','${register_url}')
 
 

下面介绍一种效率更高的方式:

还是用ReplaceText:

用nifi把hdfs数据导到hive

 
再用MergeContent:

用nifi把hdfs数据导到hive

insert into yongli.tb_dtu(dtuid, addr, value, time)values

 

5. PutHiveQL:

创建一个HiveConnectionPool

用nifi把hdfs数据导到hive

 

设置Database Connection URL, User, Password:

用nifi把hdfs数据导到hive

 

 

 

NIFI 中国社区 QQ群:595034369

上一篇:查询SQLSERVER执行过的SQL记录(历史查询记录)


下一篇:BUAA 2020 软件工程 个人博客作业