今天了解了一下sqoop的相关知识。
sqoop主要有导入和导出两种功能;
导入:导入就是从非大数据集群(RDBMS,如mysql)往大数据集群(hbase,hive,hdfs)里导数据。
主要有:
mysql===>hdfs
mysql===>hive(分两步,mysql===>hdfs,hdfs===>hive)
mysql===>hbase
导出:导出就是从大数据集群往非大数据集群导数据;
主要有:
hdfs/hive===>mysql;
还有就是sqoop脚本导入导出数据,主要是完成定时的任务;
相关链接:(3条消息) 大数据工具之Sqoop上手笔记_ChanZany的博客-CSDN博客