kettle与Hadoop整合------操作详解

先下载hadoop集群得两个文件:core-site.xml hdfs-site.xml
两个文件地址:/export/servers/hadoop/etc/hadoop
下载命令:
sz core-site.xml
sz hdfs-site.xml

关于下载Linux下载文件到window中操作详解课参考:
https://blog.csdn.net/data_curd/article/details/106431302

下载完毕得Hadoop文件上传到kettle中得:
data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514
这个文件夹里面

文件上传完毕后,在data-integration\plugins\pentaho-big-data-plugin文件夹里面有
plugin.properties文件,打开编辑这个文件
active.hadoop.configuration= 后面添加 cdh514
如下图所示:

kettle与Hadoop整合------操作详解

以上操作完毕后,建议关闭kettle软件,重启一次

接下来直接上图:

业务需求:
输入:Hadoop
输出:Excel

kettle与Hadoop整合------操作详解
**

在kettle中创建转换的快捷键:ctrl + n
在kettle中创建作业的快捷键:ctrl + alt + n**

kettle与Hadoop整合------操作详解

kettle与Hadoop整合------操作详解
kettle与Hadoop整合------操作详解
kettle与Hadoop整合------操作详解
kettle与Hadoop整合------操作详解
kettle与Hadoop整合------操作详解

kettle与Hadoop整合------操作详解

kettle与Hadoop整合------操作详解
kettle与Hadoop整合------操作详解