遇到问题--hadoop---节点服务重启成功一段时间后又停止

情况

我们发现CDH中一个hbase的regionServer节点经常自动停止,没有明显的错误信息。

重启后又过一小段时间又自动停止

原因

这种情况一般都是需要排查相关服务的日志的,比如我们是regionServer节点的服务,则需要先看regionServer节点的日志。

遇到问题--hadoop---节点服务重启成功一段时间后又停止

很幸运的是 原因很快就找到了。

一进入日志界面就报错找不到日志文件路径。

遇到问题--hadoop---节点服务重启成功一段时间后又停止

一般这种情况有可能是读写权限的问题。

然后我们登录服务器去查看这个目录,发现dfs2目录进不去,报错 input error。

这种情况是 挂载的硬盘损坏了,出现了坏道,导致读取不了数据。

解决方式

重新更换挂载硬盘 或者 先修改配置 修改regionServer节点使用到dfs2目录的配置,指向其他目录。同时需要注意读写权限的问题。