【3.6】计数器应用和数据清理(ETL)

一. 计数器应用【3.6】计数器应用和数据清理(ETL)

二. 数据清洗(ETL)

在运行核心业务MapReduce 程序之前,往往要先对数据进行清洗,清理掉不符合用户
要求的数据
。清理的过程往往只需要运行Mapper 程序,不需要运行Reduce 程序。

(1)数据清洗案例实操-简单解析版

(2)数据清洗案例实操-复杂解析版