Hadoop下WordCount开发实战(附源码)

首先安装Eclipse和hadoop的插件,打开eclipse后看到项目侧会看到DFS

开启Hadoop,单击右下角的如下图中的小象

Hadoop下WordCount开发实战(附源码)编辑DFS的连接配置信息


Hadoop下WordCount开发实战(附源码)点击finish

右击DFS刷新,会看到hdfs下的目录:

Hadoop下WordCount开发实战(附源码)

++++++++++++++++++++++++++++++++++++++++++++++++++++

右击File新建项目:

Hadoop下WordCount开发实战(附源码)

输入项目名WordCount

将所安装的hadoop下的share中的common,hdfs,mapreduce,yarn下的jar包(不是lib下的)都拷贝到一个文件 中 ,选择Specify Hadoop library location 选择刚刚的文件路经。

然后右击项目名,选择Build Path,导入刚刚文件中的jar包(也可以将刚刚的jar包做成自己的library)

然后分别按下图新建类:

Hadoop下WordCount开发实战(附源码)

Map程序

Hadoop下WordCount开发实战(附源码)

Reduce程序

Hadoop下WordCount开发实战(附源码)

主程序:

Hadoop下WordCount开发实战(附源码)

然后点击如图所示:

Hadoop下WordCount开发实战(附源码)

接着点击Java Application回生成WordCount项目,安图填写

Hadoop下WordCount开发实战(附源码)

注意hdfs的/hadoopdata/input中要有上传的文件

Hadoop下WordCount开发实战(附源码)

上传命令:

Hadoop下WordCount开发实战(附源码)

然后点击run,刷新DFS就会看到新的输出文件:

Hadoop下WordCount开发实战(附源码)

完毕!源码解读见:https://blog.csdn.net/c275046758/article/details/47069881