关于Hadoop NameNode之间切换失败的解决过程记录
今晚在本机Hadoop集群起来之后,其中一个NameNode挂了,但是HA下的另一个NameNode却还停留在Standby状态。
查看了ZKFC的日日志后发现在active切换过程当中node2链接不上node1的rpc端口日志:
追踪原因:
查看hdfs-site.xml的配置:
真是瞬间打脸,
修改配置进行测试:
node1挂掉之后成功让node2上位置:
所以总结一下,在开发过程中遇到的很多异常很大一部分自己配置时候的粗心大意,还有要养成看日志的好习惯!