1 、datax的安装,略,下载安装包开箱即用
2 、开发可以参考官方的github非常全面
datax的job配置指导
3、操作中发现hbase的数据一直导出为空。job的配置文件hbase2oracle3.json如下:
按照如上的配置使用命令调用: python datax.py …/job/hbase2oracle3.json
发现数据没有读取出来。
最后将job的json文件改成小写之后才成功了!
数据成功读取并导入到了Oracle
总结:
大数据环境中有些场景下对大小写是敏感的,不像Oracle,大小写不明感(除了用户名密码),由于我这次创建hbase时,列使用的是小写字母,但是datax的job配置文件中写了大写,导致数据没有读取到,掉坑里了,一定要注意。。。。