记录一次项目CPU飙到200%的解决过程
起因是我给某个接口的方法添一个查询数据库的几行代码,如图
结果测试在测试环境发现这个接口调不通了,一直超时,并且调用几次后项目宕了。
一、查看导致CPU飙升的线程
首先需要定位到是服务里的那些线程导致CPU飙升的。具体查找方法:
1、在服务器上使用 top 命令发现服务CPU飙到了200 如图
2、记录CPU较高的pid 使用 top -Hp $pid 可以看到具体是哪个线程占用了CPU很高,记下该线程的id。
3、使用 printf '%x' $线程pid 转换为16进制(由于jstack打印出来线程id是以16进制表示的)
4、使用jstack $pid > jsctak_98.txt 转为文本文件 并且使用 vi jstack_98.txt查看并通过16进制的关键字找到对应的线程信息如下图
5、寻找线程信息对应的业务代码,发现是第一个图中的代码。
6、接着看是因为什么导致的内存溢出,发现是StringBuffer.append方法导致的内存溢出。并且是在java.sql.Timesamp.toString方法的第358行。
7、查看java.sql.Timesamp.toString方法的第358行。发现确实是StringBuffer.append的方法,再业务代码的行数推测出在查询sql的过程中调用了这个方法
8、在这一行打一个断点debug一下,发现确实走了这一行代码。由于表中数据量过大导致内存溢出。
这个问题是由于我的失误导致的,我想查的是等于staffCode这个值的代码结果手误选了不等于这个值的方法。