Hadoop核心概念

大数据开发总体架构:
Hadoop核心概念
Hadoop是大数据开发所使用的一个核心框架。使用Hadoop可以方便的管理分布式集群,将海量数据分布式的存储在集群中,并使用分布式并行程序来处理这些数据。
Hadoop由许多子系统组成,如下图:
Hadoop核心概念
Hadoop1.x与2.x的对比:
Hadoop核心概念
YARN:管理集群资源(内存、CPU)