kettle与Hadoop整合------操作详解
先下载hadoop集群得两个文件:core-site.xml hdfs-site.xml
两个文件地址:/export/servers/hadoop/etc/hadoop
下载命令:
sz core-site.xml
sz hdfs-site.xml
关于下载Linux下载文件到window中操作详解课参考:
https://blog.csdn.net/data_curd/article/details/106431302
下载完毕得Hadoop文件上传到kettle中得:
data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514
这个文件夹里面
文件上传完毕后,在data-integration\plugins\pentaho-big-data-plugin文件夹里面有
plugin.properties文件,打开编辑这个文件
在active.hadoop.configuration= 后面添加 cdh514
如下图所示:
以上操作完毕后,建议关闭kettle软件,重启一次
接下来直接上图:
业务需求:
输入:Hadoop
输出:Excel
**
在kettle中创建转换的快捷键:ctrl + n
在kettle中创建作业的快捷键:ctrl + alt + n**