k8s(kuberneters) 节点频繁Node became not ready原因排查

主要原因:系统线程数满导致阿里云terway网络插件一直启动失败,进而导致节点频繁处于Node became not ready,进一步造成该节点调度出现问题。
查看当前系统线程数设置(网上很多文章说是进程数,请仔细甄别)
cat /proc/sys/kernel/pid_max
32768

查看系统线程数:ps -efL|wc -l

1、查看/var/log/message
k8s(kuberneters) 节点频繁Node became not ready原因排查

2、解决方法,重启docker或重启服务器,重启kubelet没用
总结:
因为某些pod程序大量创建线程数导致系统线程数被占满
加上系统线程数监控,提前发现并解决问题