记录第一次线上OOM,程序假死问题处理

记录第一次线上OOM,程序假死问题处理

记录第一次线上OOM,程序假死问题处理

新入职一家公司,作为一个菜鸡,直接上手改造项目,顺便吐槽下现在线上跑的程序半小时重启一次,菜鸟正式上手处理问题,前面的业务之类的就略过了。
linux小白处理类似问题重点如下!!!!!谢谢以下两位大佬整理的命令,撒花
输出日志的指令
JVM操作的其他指令这一篇对于之前不会linux的小白很有用,比如我,推荐!!!

现有的现象

在这里推荐一款在线工具https://gceasy.io/ ,真香,直接把日志上传就可以在线分析了,问题解决之前的gc情况如下记录第一次线上OOM,程序假死问题处理
从这里可以看到堆满了,但是程序并没有报错OOM(黑人问号),而且一直在运行
用到的堆栈指令可以到这两篇博客看看,难找

linux小白处理类似问题重点如下!!!!!
输出日志的指令
JVM操作的其他指令这一篇对于之前不会linux的小白很有用,比如我,推荐!!!

最后解决方法

通过调用jmap -histo 309命令查看堆内对象存储情况,发现异常队列记录第一次线上OOM,程序假死问题处理
分析此处代码,以及相关的代码逻辑,发现入队操作以前的人是用的多线程,而出队的操作是只创建了一个线程在跑,导致队列在半小时内被塞满,但是还是在发送消息。所以没有消费,但是有一直在发送数据到下游kafka。于是我加了线程池,多出10个线程处理发送数据逻辑。至此程序上线情况良好,未在出现程序假死情况以及堆中存满数据。完结撒花,第一篇博客记录成长~~

如果这篇博客对你有一丝丝的帮助,麻烦点个赞,谢谢~~否则年轻人,你不讲武德:记录第一次线上OOM,程序假死问题处理
记录第一次线上OOM,程序假死问题处理
给你一套混元形意太极门闪电鞭!!!

linux小白处理类似问题重点如下!!!!!

linux小白处理类似问题重点如下!!!!!
输出日志的指令
JVM操作的其他指令这一篇对于之前不会linux的小白很有用,比如我,推荐!!!