ETL-kettle-excel批量插入数据库

ETL--kettle-excel批量插入数据库

主要有四个步骤:

步骤一、根据指定正则获取符合该正则的本地文件。

步骤二、Excel输入控件通过一个符合标准的Excel文件配置工作表(Sheets)和字段(Fields)。

步骤三、Exce输入控件切换成[从前面的步骤获取文件名]。

步骤四、输出到数据库。

转换效果如图:

ETL-kettle-excel批量插入数据库

 

具体实现:

步骤一实现:

内容: 根据指定正则获取符合该正则的本地文件。

实现方法:通过该转换中[获取文件名]控件来实现

实现过程:

(1)填写指定的正则表达式,如图:

ETL-kettle-excel批量插入数据库

(2)点击[浏览]按钮,选择目录,如图:

ETL-kettle-excel批量插入数据库

(3)点击[增加]按钮,如图:

ETL-kettle-excel批量插入数据库

(4)点击[显示文件名称]按钮测试,如果能跟正则表达式批匹配上就OK,如图:

ETL-kettle-excel批量插入数据库

步骤二实现:

内容: Excel输入控件通过一个符合标准的Excel文件配置工作表(Sheets)和字段(Fields)。

实现方法:通过该转换中[Excel输入]控件来实现

实现过程:

(1)、表格类型下列选择Excel 2007 XLSX(Apache POI) ,点击[浏览]按钮,做一个模板来配置工作表(Sheets)和字段(Fields),

    如图:

ETL-kettle-excel批量插入数据库

(2)、点击[增加]按钮,如图:

ETL-kettle-excel批量插入数据库

(3)、切换工作表点击[获取工作表名称]按钮,选择你需要的sheets,如图:

ETL-kettle-excel批量插入数据库

(4)、切换到[字段]点击[获取来自头部数据的字段]按钮,选择所需要的字段,如图:

ETL-kettle-excel批量插入数据库

以上步骤二配置成功。

步骤三实现:

内容: Exce输入控件切换成[从前面的步骤获取文件名]。

实现方法:通过该转换中[Excel输入]控件来实现

实现过程:

(1)将[从前面的步骤获取文件名]打钩

(2)[从那个步骤读文件名]下拉选择上一个步骤。

(3)[保存文件名的字段]下拉选择filename。

如图:

ETL-kettle-excel批量插入数据库

步骤四实现:

内容: 输出到数据库。

实现方法:通过该转换中[表输入]控件来实现

实现过程:

ETL-kettle-excel批量插入数据库