分布式并行计算框架MapReduce

什么是计算框架?

是指实现某项任务或某项工作从开始到结束的计算过程或流的结构。

分布式并行计算框架MapReduce

什么是并行计算框架?

是指为更快的计算某项任务或某项工作,将计算程序分发到多台服务器上,使每个服务器计算总任务的一部分,多台服务器同时计算的框架。

分布式并行计算框架MapReduce

什么是分布式并行计算框架

一个大的任务被拆分成多个小任务,每个小任务同时执行。按照执行流程进行计算。

分布式并行计算框架MapReduce

大数据为什么快?

横向扩展移动程序到数据端多个数据副本分布式存储(减小磁盘IO瓶颈),分布式计算(众人拾柴火焰高—人多力量大)