关于Hadoop NameNode之间切换失败的解决过程记录

今晚在本机Hadoop集群起来之后,其中一个NameNode挂了,关于Hadoop NameNode之间切换失败的解决过程记录但是HA下的另一个NameNode却还停留在Standby状态。

查看了ZKFC的日日志后发现在active切换过程当中node2链接不上node1的rpc端口日志:关于Hadoop NameNode之间切换失败的解决过程记录

追踪原因:关于Hadoop NameNode之间切换失败的解决过程记录
查看hdfs-site.xml的配置:

关于Hadoop NameNode之间切换失败的解决过程记录


真是瞬间打脸,

修改配置进行测试:关于Hadoop NameNode之间切换失败的解决过程记录

node1挂掉之后成功让node2上位置:

关于Hadoop NameNode之间切换失败的解决过程记录

所以总结一下,在开发过程中遇到的很多异常很大一部分自己配置时候的粗心大意,还有要养成看日志的好习惯!