Kettle实现Oracle数据导入HBase

某个生产数据库(oracle)中单表记录了上亿的车辆定位数据,应用系统的轨迹回放功能已出现明显的加载卡顿现象(优化了索引,查询指定车辆一段时间内的定位数据,差不多在15秒)。考虑到常规分表的方案治标不治本、同时也是为其他更大量级数据项目积累经验,我们决定尝试使用hbase来存储定位数据。要做的第一步就是需要将数据导入到hbase里。由于我们已经建立了CDH环境,且之前已经通过里面的streamset套件成功实现了kafka定位数据导入到hive,故一开始的决定是继续使用streamset来完成数据导入。然而这种方案折腾了很久也没走通,也是各种坑(踩坑参考这个帖子:https://blog.csdn.net/JJBOOM425/article/details/108093283),且受运行环境限制我们没法对oracle进行基础配置,最后不得不转而考虑使用kettle。

环境说明:

——Kettle8.3

——Oracle11g

——CDH6.3.1、HBase2.1.4,集群5个节点

 

Kettle实现Oracle数据导入HBase

上一篇:自动创建数据库中的表结构


下一篇:InfluxDB的简单使用