Hadoop中如何实现计数器

这篇文章将为大家详细讲解有关Hadoop中如何实现计数器，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

package mapreduce;

import java.io.IOException;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Counter;
import org.apache.hadoop.mapreduce.Mapper;
/**
 * KEYIN	即k1		业务上表示每一行的起始位置，又称偏移量
 * VALUEIN	即v1		业务上表示每一行的文本内容
 * KEYOUT	即k2		业务上表示每一行的每个单词
 * VALUEOUT	即v2		业务上表示每一行的每个单词出现的次数,常量1
 * @author Xr
 *
 */
public class MyMapper extends Mapper<LongWritable,Text,Text,LongWritable> {

	/**
	 * 解析每一行的文本，解析成每一个单词，统计每一个单词出现的次数
	 */
	@Override
	protected void map(LongWritable key, Text value,Context context)
			throws IOException, InterruptedException {
		//计数器
		Counter counter = context.getCounter("Words", "hello");
		//counter.setValue("");//设置初始值
		//每一行的文本内容
		String string = value.toString();
		if(string.contains("hello")){
			int times = string.split("hello").length-1;
			counter.increment(times);//自动累加
		}
		//每一行包含的单词数组
		String[] split = string.split(" ");
		for(String word : split){
			context.write(new Text(word), new LongWritable(1));
		}
	}
}

关于“Hadoop中如何实现计数器”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

Hadoop中如何实现计数器

相关推荐