Kettle入门之Hello World


Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。

1 下载安装

  • 各个版本下载地址: 这里以pdi-ce-7.1.0.0-12.zip为例
  • JDK的版本在1.7以上。
  • 需要数据库驱动,这里以mysql为例:将myslq的驱动mysql-connector-java-5.1.47.jar放在kettle解压后的文件lib里面。
    Kettle入门之Hello World

2 打开图形界面

window双击打开Spoon.dat
Kettle入门之Hello World

3 transformation脚本

3.1 文件 -> 新建 -> 转换

3.2 建DB连接

Kettle入门之Hello World
Kettle入门之Hello World

3.3 核心对象 -> 输入 -> 表输入

Kettle入门之Hello World
双击表输入
Kettle入门之Hello World

3.4 核心对象 -> 输出 -> 插入/更新

Kettle入门之Hello World
双击插入/更新
Kettle入门之Hello World

3.5 运行

Kettle入门之Hello World
可以看日志等
Kettle入门之Hello World

4 job脚本

4.1 文件->新建->作业

4.2 画图

将start,转换和成功拖动右边,并连好线。
Kettle入门之Hello World

4.3 双击start

设置时间间隔,这里设置为1分钟。
Kettle入门之Hello World

4.4 双击转换

Kettle入门之Hello World

4.5 执行

Kettle入门之Hello World