Hadoop下WordCount开发实战(附源码)
首先安装Eclipse和hadoop的插件,打开eclipse后看到项目侧会看到DFS
开启Hadoop,单击右下角的如下图中的小象
编辑DFS的连接配置信息
点击finish
右击DFS刷新,会看到hdfs下的目录:
++++++++++++++++++++++++++++++++++++++++++++++++++++
右击File新建项目:
输入项目名WordCount
将所安装的hadoop下的share中的common,hdfs,mapreduce,yarn下的jar包(不是lib下的)都拷贝到一个文件 中 ,选择Specify Hadoop library location 选择刚刚的文件路经。
然后右击项目名,选择Build Path,导入刚刚文件中的jar包(也可以将刚刚的jar包做成自己的library)
然后分别按下图新建类:
Map程序
Reduce程序
主程序:
然后点击如图所示:
接着点击Java Application回生成WordCount项目,安图填写
注意hdfs的/hadoopdata/input中要有上传的文件
上传命令:
然后点击run,刷新DFS就会看到新的输出文件:
完毕!源码解读见:https://blog.csdn.net/c275046758/article/details/47069881