Hadoop配置伪分布式

Hadoop配置伪分布式

 

Hadoop海量数据存储,需要分布式存储,

Namenode:名称节点(NN),存放文件目录和路径,重要节点。有备份辅助节点

DataNode:数据节点(DN),存放数据,有副本

Hadoop配置伪分布式

 

HDFS:分布式文件系统。

MapReduce:在分布式文件系统之上进行运算,海量数据并发运算,yarn他就是一个框架

Hadoop配置伪分布式

 

1处是独立模式

2处是伪分布式模式

3处是完全分布式模式

 

①、如何配置伪分布式模式

首先进入找到hadoop文件,复制一份:

Hadoop配置伪分布式

 

然后进入到备份后的hadoop-pseudo文件夹里,编辑后卫-site.xml的文件:

Hadoop配置伪分布式

※  编辑这三个

Core-site.xml核心文件:

 

<configuration>

<property>

 

<name>fs.defaultFS</name>

<value>hdfs://localhost/</value>

 

</property>

</configuration>

Hadoop配置伪分布式

Hdfs-site.xml:文件系统

<configuration>

<property>

 

<name>dfs.replication</name>

<value>1</value>

 

</property>

</configuration>

Hadoop配置伪分布式

Yarn-site.xml:框架

<configuration>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>localhost</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

Hadoop配置伪分布式

第四个文件,mapred-site.xml

复制mapred-site.xml.template复制后改名为mapred-site.xml,然后再gedit编辑,保存关闭:

Hadoop配置伪分布式

然后查看是否有ssh(安全访问技术),由图可看出已经存在有了:

Hadoop配置伪分布式

这个ssh完全不行的,我们还是要安装服务器版

查询一下,然后再进行安装:

Hadoop配置伪分布式

安装后查看会生成一个ssh-******文件**分为公钥public key和私钥private key

Hadoop配置伪分布式

Hadoop配置伪分布式

然后我们可以自己生成一个**:

Hadoop配置伪分布式

然后我们可以查看有一个隐藏的.shh文件,然后cd进入.shh

Hadoop配置伪分布式

Hadoop配置伪分布式

然后把公钥放入授权认证的文件里:

Hadoop配置伪分布式

Hadoop配置伪分布式

可以ssh试着登陆:

Hadoop配置伪分布式

可查看感知到了一个主机known_hosts

Hadoop配置伪分布式

可以退出:

Hadoop配置伪分布式

如果再登陆的话就不提示要密码了:

Hadoop配置伪分布式

然后我们可以对文件系统进行格式化,namenode就是放目录的节点:

Hadoop配置伪分布式

然后我们可以启动文件系统:

Hadoop配置伪分布式

再启动yarn(Hadoop资源管理器):

Hadoop配置伪分布式

然后我们可以看一下进程jps:

Hadoop配置伪分布式

可以-l查看详细信息:

Hadoop配置伪分布式

然后我们可以打开火狐浏览器输入localhost:50070或localhost:9870查看名称节点:

Hadoop配置伪分布式

或者输入localhost:8088查看资源管理器:

Hadoop配置伪分布式

不用可以停止yarn和dfs:

Hadoop配置伪分布式

关闭后为了方便创建目录和显示目录

还要重新启动起来

有一个指令统一启动dfs和yarn,就是all

Hadoop配置伪分布式

为hadoop设置统一配置环境变量指定配置目录:

Hadoop配置伪分布式

没设置之前,都是显示其他用户的:

Hadoop配置伪分布式

然后可以在hadoop下创建文件夹了:

Hadoop配置伪分布式

设置之后就可查看只有自己创建的了:

Hadoop配置伪分布式