1. 上传jdbc包
目前看ojdbc6.jar 比较通用。只需要上传这个包就可以了。
- 下载instantclient_11_2 ,进去就能看到ojdbc6.jar 了
- 或者去Oracle所在服务器下,${ORACLE_HOME}/jdbc/lib/,也能看到这个包
上传路径是Kettle安装目录下的lib目录下。 例如我的安装路径是 D:\g\data-integration,那么就把ojdbc6.jar放到D:\g\data-integration\lib 目录下.
2. 启动Kettle
使用kettle安装目录下的Spoon.bat,启动kettle,大约等待1分钟左右,就起来了。
3. 新建一个转换
拖拽到空白处后,再双击这个图标就可以进入编辑状态了。
4. 介绍表输入
双击打开表输入(Table input)之后,大体的工作区域如下。下面分别对这5个常用的地方做介绍:
-
步骤的名称,步骤是Kettle转换对象中的最小执行单元。
-
通常一个转换可以包含多个步骤,步骤之间的数据流向可以通过箭头表示。需要注意的是,转换如果运行起来,则所有的步骤也跟着并发执行。而数据是从箭头的起始流向箭头的末尾。
-
这个就好像开车走高速一样,所有的收费站都是一起运行起来的,而路上的车是由一个收费站进入并且行驶到下一个收费站,也就是说数据是有序的;步骤是并发的。
-
-
连接名称,这里仅仅是一个连接的名称,而这个名称背后代表了一个连接串,而且连接Oracle、MySQL的配置方法类似,但是需要不同的jar包。
-
编辑连接的按钮,犹豫按钮前面的下拉列表中没有连接,所以这个按钮暂时无法使用。
-
新增连接,如其名。
-
SQL编辑区,表输入这个步骤其实就是执行一个sql,把数据库返回的数据推送到下游。
5. 新增数据库连接
数据库连接指的就是表输入中的Connection,这部分我们需要新建一个。点击表输入中的“New...” 按钮
5.1 认识数据库连接
首先还是大体介绍数据库连接的工作区域。
- 数据库连接名称,这个名称就是“表输入”部分需要选择的数据库连接名称。方便表达,总是比连接串一大串写进去好;
- 连接的类型,到底是连接Oracle还是MySQL?
- 连接方式,最常用的是JDBC和JNDI两种方式,其实最终也是使用JDBC,只不过JNDI的配置更加方便一些,直接使用配置文件即可。我们的实验中使用了JDBC方式。
5.2 编辑数据库连接
如下图所示,最简单的数据库连接需要操作6步。
- 数据库连接名称。
- Oracle服务器所在的IP地址。
- 数据库服务名,这个可以通过
lsnrctl status
获取到。如果没权限,就直接问DBA把。 - 用户名,密码
- 另外需要注意,如果数据库的连接端口有了修改,也需要把1521替换掉。
- 最后点击test,如果成功,则表示数据库连接创建好了。 记得要保存。