大数据量的Spark任务,导致其中某些服务器偶现连接不上自动重启
当时一直以为内存被全部耗完导致自动启动,但操作系统不应该去进行重启,后来查看操作系统的dump文件
进入/var/crash目录,查看到对应日期下的 vmcore-dmesg.txt文件
后来找到类似的问题处理:http://aperise.iteye.com/blog/2326082
# uname -sr
Linux 3.10.0-123.el7.x86_64
发现此内核版本存在bug
解决方案:Centos 7.0操作系统内核级bug,需要进行升级,即update to the kernel-3.10.0-123.20.1.el7(or later)
下载链接:http://ftp.scientificlinux.org/linux/scientific/7.0/x86_64/updates/security/
个人使用的升级版本是kernel-3.10.0-123.20.1.el7.x86_64.rpm
升级步骤:yum install kernel-3.10.0-123.20.1.el7.x86_64.rpm
重启电脑