大数据集群搭建CM认知

Apache Hadoop

由Apache 公司开源的Hadoop版本。涵盖了最原生的Hadoop特性,所有的Hadoop发行版均基于该版本进行改进。

Cloudera CDH

由Cloudera公司发行的Hadoop版本,全称(Cloudera’s Distribution Including Apache Hadoop)。该版本在基于原生Apache Hadoop版本进行改进,添加了补丁和自行开发的组件,更加稳定易用。目前国内使用最多的版本。

Cloudera manager的概念

Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。

cloudera manager的功能

  1. 管理:对集群进行管理,如添加、删除节点等操作。
  2. 监控:监控集群的健康情况,对设置的各种指标和系统运行情况进行全面监控。
  3. 诊断:对集群出现的问题进行诊断,对出现的问题给出建议解决方案。
  4. 集成:多组件进行整合。
    大数据集群搭建CM认知

cloudera manager的架构

大数据集群搭建CM认知
理解:

  1. Server:负责软件安装、配置,启动和停止服务,管理服务运行的群集。
  2. Agent:安装在每台主机上。负责启动和停止的过程,配置,监控主机。
  3. Management Service:由一组执行各种监控,警报和报告功能角色的服务。
  4. Database:存储配置和监视信息。
  5. Cloudera Repository:软件由Cloudera 管理分布存储库。(有点类似Maven的中心仓库)
  6. Clients:是用于与服务器进行交互的接口(API和Admin Console)