大数据学习笔记之Hadoop环境配置

Hadoop 运行环境搭建

1、禁用防火墙

2、在/etc/hosts 中设置ip映射关系

3、安装JDK

伪分布式搭建

配置core-site.xml

<property>
<name>fs.defaultFS</name>
<value>hdfs://bigdata111:9000</value>
</property>

<property>
<name>hadoop.tmp.dir</name>
<value>/opt/module/hadoop-2.7.3/data</value>
</property>

配置hdfs-site.xml

<property>
<name>dfs.replication</name>
<value>3</value>
</property>

<property>
<name>dfs.namenode.secondary.http-address</name>
<value>bigdata111:50090</value>
</property>

<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

配置yarn-site.xml

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

<property>
<name>yarn.resourcemanager.hostname</name>
<value>bigdata111</value>
</property>

<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>

配置mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>bigdata111:10020</value>
</property>

<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>bigbata111:19888</value>
</property>

在hadoop-env.sh、yarn-env.sh、mapred-env.sh最后添加JDK配置

export JAVA_HOME=/opt/module/jdk1.8.0_144

以上就把改配置的地方都配置完了，下面需要格式化和启动

执行hdfs namenode -format命令

看到这个就说明成功了

执行start-all.sh 依次输入密码

在浏览器访问自己虚拟机的ip:50070地址验证是否成功

打开页面显示正常就说明配置成功了

大数据学习笔记之Hadoop环境配置

相关推荐