Hadoop安装部署之伪分布模式

Hadoop有三种安装模式:
本地模式——>本地模式配置
伪分布模式——>伪分布模式
全分布模式

一.伪分布模式
特点:在单机上,模拟一个分布式的环境,具备Hadoop的所有功能
HDFS:NameNode + DataNode + SecondaryNameNode
Yarn:ResourceManager + NodeManager
1.配置伪分布模式:
Hadoop安装部署之伪分布模式
2.
更改JAVA_HOME路径:vi hadoop-env.sh
配置参数:JAVA_HOME
在第25行更改: /root/training/jdk1.8.0_144
Hadoop安装部署之伪分布模式
3.

hdfs-site.xml
					<!--配置数据块的冗余度,默认是3-->
					<!--原则冗余度跟数据节点个数保持一致,最大不要超过3-->
					<property>	
						<name>dfs.replication</name>
						<value>1</value>
					</property>
                    <!--是否开启HDFS的权限检查,默认是true-->
					<!--使用默认值,后面会改为false-->
					<!--
					<property>	
						<name>dfs.permissions</name>
						<value>false</value>
					</property>				
                    -->

Hadoop安装部署之伪分布模式
(*)在configuration中间更改配置文件
Hadoop安装部署之伪分布模式
4.

core-site.xml
					<!--配置HDFS主节点的地址,就是NameNode的地址-->
					<!--主机名+9000是RPC通信的端口-->
					<property>	
						<name>fs.defaultFS</name>
						<value>hdfs://bigdata111:9000</value>
					</property>
            
                    <!--HDFS数据块和元信息保存在操作系统的目录位置-->
					<!--默认是Linux的tmp目录,一定要修改-->
					<property>	
						<name>hadoop.tmp.dir</name>
						<value>/root/training/hadoop-2.7.3/tmp</value>
					</property>

注意:Linux的tmp目录,一定要修改,因为Linux的tmp目录会重启清空,所以要在hadoop创一个tmp目录
Hadoop安装部署之伪分布模式
(*)在configuration中间更改配置文件

Hadoop安装部署之伪分布模式
5.

mapred-site.xml(默认没有这个文件)
					<!--MR程序运行容器或者框架-->
					<property>	
						<name>mapreduce.framework.name</name>
						<value>yarn</value>
					</property>

注意:由于默认没有这个文件mapred-site.xml,需要生成mapred-site.xml
Hadoop安装部署之伪分布模式
(*)在configuration中间更改配置文件
Hadoop安装部署之伪分布模式
6.

yarn-site.xml
       <!--配置Yarn主节点的位置-->
       <!--写主机名或IP地址-->
					<property>	
						<name>yarn.resourcemanager.hostname</name>
						<value>bigdata111</value>
					</property>

<!--NodeManager执行MR任务的方式是Shuffle洗牌-->
					<property>	
						<name>yarn.nodemanager.aux-services</name>
						<value>mapreduce_shuffle</value>
					</property>

在configuration中间更改配置文件
Hadoop安装部署之伪分布模式
7.对HDFS的NameNode进行格式化 ————>目录:/root/training/hadoop-2.7.3/tmp (在这个目录生成一些信息,来保持即将要生成的数据,这种叫元信息)
举例:软盘,需要格式化
格式化命令:hdfs namenode -format
Hadoop安装部署之伪分布模式
怎么查看格式化生成?
看日志:Storage directory /root/training/hadoop-2.7.3/tmp/dfs/name has been successfully formatted. 有这句就说明格式化成功。
Hadoop安装部署之伪分布模式
用tree命令查看格式化生成了什么
Hadoop安装部署之伪分布模式
(*)启动命令:
HDFS:start-dfs.sh
Yarn: start-yarn.sh
统一的:start-all.sh
Hadoop安装部署之伪分布模式
Web Console访问:hdfs: 端口: 50070
yarn: 端口:8088