Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

前言

         最近,是在做集群搬移工作,大家肯定会遇到如下的场景。

         (1) 比如,你新购买的电脑,初步者学习使用Ambari集群。从旧电脑复制到新电脑这边来

         (2) 比如,你公司Ambari集群的ip,因业务或其他情况需要,暂时需要更改ip

         (3) 比如,你更改了主机名

    (4)也许其他的原因

 

 

 

   扩展

linux虚拟机系统的复制或克隆后续问题解决!

 

 

 

 

 

 

问题详情

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

 

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

  黄色问号表示: Heartbeat Lost

  即所有的服务都心跳丢失了。。重启ambari-server和ambari-agent都不能解决。

 

 

 

 

 

 

 

 

 

解决途径

  1、  查看个节点之间是否可以相互通信,若ssh连接不上,有可能是该节点关机了,没有打开,手动开启该节点,再次验证是否可互通。

  2、  在主节点启动ambari-server restart和ambari-agent restart,为了保证其它节点也成功启动,在其它从节点也要进行:ambari-agent restart操作。

  3、  遇到问题

      3.1  mysql server start失败

    在启动过程中,经常出现mysql服务启动失败。查看失败信息,找到是在哪个节点的mysql服务不能正常启动,一般报错是mysql.sock这个问题,解决方法:在对应节点上进行处理:mv /var/lib/mysql/mysql.sock  /var/lib/mysql/mysql.sock_bk. 然后再次启动ambari服务。一般即可。

     3.2 datanode start 失败

            1)关闭集群全部的服务 #ambari-service stop

          2)修改目录所有者 #cd /data1/hadoop/

                         #chown –R hdfs:hadoop  hdfs/

          3)重启集群服务 #ambari-service start 并且在ambari的界面start All所有组件。

      Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

     4、

  下次可以试着通过手动启动来看看,出现的问题
如果过你通过手动启动的话,你就应该能看到报错的信息。
 
 
 
 
 

 

 

  如果你的ip改变了,怎么来解决?

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

 

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

 

 

 

 

   如果你的主机名改变了,怎么来解决?

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

 

 

    

 最后,重新启动所有节点上的ambari-server 和 ambari-agent

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...
[[email protected] ~]$ sudo service ambari-server stop
Using python  /usr/bin/python2
Stopping ambari-server
Ambari Server stopped
[[email protected] ~]$ sudo service ambari-agent stop
Verifying Python version compatibility...
Using python  /usr/bin/python2
Found ambari-agent PID: 7495
Stopping ambari-agent
Removing PID file at /var/run/ambari-agent/ambari-agent.pid
ambari-agent successfully stopped
[[email protected] ~]$ sudo service ambari-server start
Using python  /usr/bin/python2
Starting ambari-server
Ambari Server running with administrator privileges.
Organizing resource files at /var/lib/ambari-server/resources...
Server PID at: /var/run/ambari-server/ambari-server.pid
Server out at: /var/log/ambari-server/ambari-server.out
Server log at: /var/log/ambari-server/ambari-server.log
Waiting for server start....................
Ambari Server 'start' completed successfully.
[[email protected] ~]$ sudo service ambari-agent start
Verifying Python version compatibility...
Using python  /usr/bin/python2
Checking for previously running Ambari Agent...
Starting ambari-agent
Verifying ambari-agent process status...
Ambari Agent successfully started
Agent PID at: /var/run/ambari-agent/ambari-agent.pid
Agent out at: /var/log/ambari-agent/ambari-agent.out
Agent log at: /var/log/ambari-agent/ambari-agent.log
[[email protected] ~]$ 
Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

  其他节点,不多赘述。

 

   

 

 

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

 

 

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

 

 

 

 

 

 

 

 

Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)...

  解决



本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/7922897.html,如需转载请自行联系原作者