大数据技术原理与应用第8讲:Hadoop再探讨
Hadoop再探讨单元测验
1单选(2分)
下列说法正确的是
A.第二名称节点无法解决单点故障问题
B.第二名称节点是热备份
C.HDFS HA提供高可用性,可以实现可扩展性、系统性能和隔离性
D.HDFS HA可用性不好
2单选(2分)
HDFS Federation设计不能解决“单名称节点”存在的哪个问题
A.良好的隔离性
B.性能更高效
C.单点故障问题
D.HDFS集群扩展性
3多选(3分)
下列哪些是Hadoop1.0存在的问题
A.表达能力有限
B.抽象层次低
C.执行迭代操作效率低
D.开发者自己管理作业之间的依赖关系
4多选(3分)
下列对Hadoop各组件的理解正确的是
A.Tez:支持DAG作业的计算框架
B.Oozie:工作流和协作服务引擎
C.Pig:处理大规模数据的脚本语言
D.Kafka:分布式发布订阅消息系统
5多选(3分)
对新一代资源管理调度框架YARN的理解正确的是
A.YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架
B.MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务
C.YARN既是资源管理调度框架,也是一个计算框架
D.YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMaster
6判断(2分)
HDFS HA(High Availability)是为了解决单点故障问题。
对
B.2.00/2.00
7判断(2分)
在HDFS Federation(HDFS联邦)中,设计了多个相互独立的名称节点,使得HDFS的命名服务能够水平扩展。
对
8判断(2分)
相对于Hadoop1.0而言,Hadoop2.0主要增加了HDFS HA和HDFS Federation(联邦)等特性。
对