Kettle处理文件导入到数据库,对数据进行相应校验,将校验结果发送邮件

工作中有这样的需求 
1. 数据规范化: 
去空格、制表符、换行符、回车符、单引号(中文、英文)、双引号(中文、英文) 
根据邮箱生成登录名,登录名为@之前的内容 
2. 数据校验 
根据集团提供的名单,按照以下几个点校验: 
 空值:分为姓名、身份证、手机、邮箱 
 重复:身份证、手机号、登录名、邮箱 
 合法性校验:手机号11位数字;身份证合法性校验 
 与系统数据校验: 
 手机号已使用、系统中的身份证为空或者数值与excel中的数值不一致; 
 登录名已使用、系统中的身份证为空或者数值与excel中的数值不一致; 
完成数据规范化,并将校验通过的数据导入到数据库,将错误的数据导出自动发送邮件。 
(1)首先对数据进行规范化,处理的excel第一列id有为空,根据约定,id为空不处理所以增加了过滤记录的操作 
流程如下: 
 Kettle处理文件导入到数据库,对数据进行相应校验,将校验结果发送邮件
(2) 
根据写好的SQL完成数据的校验 
(SQL的结果集 通过流的 方式 输出到excel里) 
流程如下:

 Kettle处理文件导入到数据库,对数据进行相应校验,将校验结果发送邮件
(3) 
总调度实现数据导入、校验、错误发送邮件、正确数据保存在数据库 
流程如下: 

Kettle处理文件导入到数据库,对数据进行相应校验,将校验结果发送邮件
原文:https://blog.****.net/angelina7/article/details/53944473