Hadoop与Spark介绍

大数据概念

1.海量的
2.规模大的,维度多的
3.爆发性增长的
4.价值密度低、价值量大

Hadoop

1.Hadoop生产背景

Hadoop与Spark介绍

2.Hadoop生态体系架构

1.整体架构Hadoop与Spark介绍
2.组件介绍Hadoop与Spark介绍
3.zookeeper架构

Hadoop与Spark介绍

Hadoop架构

Hadoop组件

Hadoop与Spark介绍

Hadoop相关术语

Hadoop与Spark介绍

HDFS架构

Hadoop与Spark介绍

YARN架构

Hadoop与Spark介绍

YARN资源的几种调度模式

1.先进先出
Hadoop与Spark介绍

2.百分比调度模式
Hadoop与Spark介绍
3.公平调度
Hadoop与Spark介绍

Spark介绍

性能对比

Hadoop与Spark介绍

模式介绍

Hadoop与Spark介绍

架构介绍

Hadoop与Spark介绍

架构模式

Hadoop与Spark介绍

Hadoop与Spark介绍

简单架构解决方案

Hadoop与Spark介绍

Hadoop产品

Hadoop与Spark介绍
Hadoop与Spark介绍

Hadoop搭建

  1. hadoop推荐搭建模式:Ambari+HDP模式
  2. Hadoop搭建重要文件:
    core-site.xml 全局参数
    hdfs-site.xml hdfs参数
    mapred-site.xml mapreduce参数
    yarn-site.xml yarn参数
    capacity-scheduler.xml yarn计算队列
  3. 50070 hdfs的界面
  4. 8088 yarn界面
  5. Hadoop与Spark介绍