Kettle准备
安装准备:
首先安装Jdk1.8,不建议使用高版本jdk(比如jdk12会爆反射问题),建议使用1.8.0_191。
下载地址:https://sourceforge.net/projects/pentaho/files/
本文涉及版本是8.3,下载完成后直接解压即可。
将数据库连接jar包,比如mysql-connector-java-5.1.45.jar放入kettle工作目录/lib下。如需使用其他数据库,对应加入。
重要概念:
步骤:每一个特定功能的抽象执行块
转换:数据抽取、转换、加载流程的步骤流程
作业:将多个转换或一些任务封装,用于ETL任务的执行
数据库连接:转换、作业中使用的数据库连接
节点连接:连接两个步骤的连线。有几种不同的连接,关联到其他转换建立节点连接时会提示你
可视化界面:
解压后的工作目录下,运行Spoon.bat/Spoon.sh,启动一段时间以后,出现可视化界面。
基本操作:
拖:从步骤列表拖组件到右边面板
拉:移动组件位置
拽:按住shift键,鼠标选择前一个组件到后一个组件,建立节点连接
新建、保存以及其他常规菜单:地球人都知道,自己试一试,很简单