线上问题排查

文章目录

概述

我们经常在线上会遇到很多的问题,遇到问题,排查问题的过程是非常重要的经验。java程序员在线上遇到的问题有以下几种。
1、线上OOM
2、线上机器cpu飙高
3、线上网络慢

还有很多很多
下面我们就这些问题,来说下处理流程

问题处理流程

如果有人反馈网络变慢,系统特别卡,这时候线上可能是由于cpu飙高导致系统的响应速度变慢。这时候,处理流程如下

1、top 查看当前应用的 cpu 的占用率,可以 ps -ef|grep “应用名” 拿到进程id,然后再去
top -pid 进程号,查看这个进程的 cpu 占用率,分析cpu的占用率高不高

2、然后继续查看当前应用的gc情况,通过jstat -gc 查看堆内存的使用情况。

通过上述2点,如果cpu占用率不高,且堆内存的空间也OK,则大概可以定位是网络抖动的问题
如果 cpu占用率高,则可能线上存在死循环导致的

3、top -Hp pid 查看当前哪个线程的使用率是最高的
线上问题排查

4、printf %x\n 线程号 将十进制表示的线程id 转换为 16进制
线上问题排查

5、通过 jstack -l 进程号 >> jstack.txt 将当前的线程的信息输出出来,根据解析出的16进制线程号查找当前线程是怎样的状态。如果是死循环的话,一直