编译DataX

下载 DataX

首先,访问 DataX 官网地址 https://github.com/alibaba/DataX/ 进行下载
编译DataX

编译 DataX

下载后解压 DataX,在确保已经安装了maven之后,进入DataX目录,执行 mvn -U clean package assembly:assembly -Dmaven.test.skip=true 命令进行编译。

java14以上的编译问题

如果 java 版本是14以下,那么不会有问题。如果 java 版本跟我一样是 15,则会报如下错误
编译DataX
由于在 Java15,Oracle新增了一个 java.lang.Record 类,因此如果这么导入 import com.alibaba.datax.common.element.*; 编译器无法判断,到底是引用 com.alibaba.datax.common.element.Record,还是引用 java.lang.Record,因此报错。

使用find . -name *.java | xargs grep -F 'com.alibaba.datax.common.element.*' 来查找有哪些引发混淆的文件。

  • find 命令用来指定文件类型,点号表示当前路径
  • xargs是一个给其他命令传递参数的过滤器
  • grep -F 表示查找文件中是否包含某个字符串,-F表示纯粹的字符串(默认使用正则表达式匹配)
  • grep -l 可以只显示文件路径,不显示匹配到的内容

编译DataX
有两种方法进行替换

  1. 使用vim逐个替换。例如vim /home/chen/Documents/DataX-master/core/src/main/java/com/alibaba/datax/core/transport/transformer/FilterTransformer.java,然后使用命令 :%s#Record #com.alibaba.datax.common.element.Record #g进行批量替换,为所有 Record 明确其引用的包名。替换完后,再输入 :wq 对修改进行保存并退出。这个方法少量文件还好,要是文件多的话,就十分麻烦了。
  2. 使用sed命令批量处理,将 Record 替换为 com.alibaba.datax.common.element.Record
sed -i 's/Record /com.alibaba.datax.common.element.Record /g' `find . -name *.java | xargs grep -F 'com.alibaba.datax.common.element.*'`

编译DataX手动处理下下面文件

/home/chen/Documents/DataX-master/odpsreader/src/main/java/com/alibaba/datax/plugin/reader/odpsreader/ReaderProxy.java
/home/chen/Documents/DataX-master/streamreader/src/main/java/com/alibaba/datax/plugin/reader/streamreader/StreamReader.java
/home/chen/Documents/DataX-master/mongodbwriter/src/main/java/com/alibaba/datax/plugin/writer/mongodbwriter/MongoDBWriter.java
/home/chen/Documents/DataX-master/hbase11xsqlreader/src/main/java/com/alibaba/datax/plugin/reader/hbase11xsqlreader/HbaseSQLReaderTask.java
/home/chen/Documents/DataX-master/hbase20xsqlreader/src/main/java/com/alibaba/datax/plugin/reader/hbase20xsqlreader/HBase20xSQLReaderTask.java

在vim中:行号可以直接跳转到指定行

某个库找不到的解决办法

如果遇到某个包下载不到,使用浏览器进入 https://public.nexus.pentaho.org/service/rest/repository/browse/omni/ 页面手动下载到 m2 的对应目录即可
编译DataX
编译DataX

找不到 oscarJDBC.jar

[ERROR] Failed to execute goal on project oscarwriter: Could not resolve dependencies for project com.alibaba.datax:oscarwriter:jar:0.0.1-SNAPSHOT: Could not find artifact com.oscar:oscar:jar:7.0.8 at specified path /home/chen/Documents/DataX-master/oscarwriter/src/main/lib/oscarJDBC.jar -> [Help 1]

编译DataX这个是阿里工程师的失误,网上也找不到这个包,因此进入pom.xml,注释该选项即可

<!--
<dependency>
    <groupId>com.oscar</groupId>
    <artifactId>oscar</artifactId>
    <version>7.0.8</version>
    <scope>system</scope>
    <systemPath>${basedir}/src/main/lib/oscarJDBC.jar</systemPath>
</dependency>
-->

编译成功

编译DataX

上一篇:MySQL死锁原因和处理方案


下一篇:记一次内存飙升排查