Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
1、JDK环境设置
由于PDI是采用java 编写,因此需要在本地有JVM 的运行环境。JDK下载链接:JDK_1.8
JDK安装很简单,一直点击“下一步”即可完成。安装完成后,设置环境变量如下:
JAVA_HOME=C:/Program Files/Java/jdk1.8.0_152
Path=C:/Program Files/Java/jdk1.8.0_152/bin
CLASSPATH=.;C:/Program Files/Java/jdk1.8.0_152/lib/dt.jar;C:/Program Files/Java/
jdk1.8.0_152/lib/tools.jar;
2、Oracle环境变量设置
此步骤可选可不选,根据实际环境需求来配置。这里使用oracle instantclient 11.2.0.4 x64版本,只需解压即可使用。
ORACLE_BASE=C:/Oracle
ORACLE_HOME=C:/Oracle/instantclient_11_2
LD_LIBRARY_PATH=C:/Oracle/instantclient_11_2
NLS_LANG=AMERICAN_AMERICA.ZHS16GBK
SQL_PATH=C:/Oracle/instantclient_11_2
TNS_ADMIN=C:/Oracle/instantclient_11_2/network/admin
PATH=C:/Oracle/instantclient_11_2
3、获取PDI软件
此软件为绿色软件,下载后,解压到任意目录即可使用;当前最新稳定版是7.1。安装完成之后,点击目录下面的spoon.bat即可启动kettle。下载链接:Data Integration 7.1
4、JDBC驱动设置
Oracle JDBC驱动下载:Oracle Database 11g Release 2 JDBC Drivers(ojdbc6.jar和ojdbc6_g.jar)
MySQL JDBC驱动下载:MySQL Connector Java
PostgreSQL JDBC驱动下载: PostgreSQL JDBC Driver
将以上下载下来的jar文件,解压到PDI家目录的lib文件夹下即可。
参考文献:
1、Spoon User Guide
2、Pentaho Data Integration Steps
3、Kettle调度使用方法
4、Kettle社区版下载
5、Kettle企业版下载
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/197929.html