记一次线上排查问题

Java
287
0
0
2022-11-08

​确定哪个线程占用了大量 CPU

查看cpu高的进程

top

img

查看最高的线程ThreadId

这里假设为996382

top -Hp \[PID\]

导出堆栈信息

jstack \[PID\] > PID.txt

获取ThreadId对应的16进制数

printf %x \[ThreadId\]

从栈信息中查询对应的线程内容

cat PID.txt|grep -i \[16进制的ThreadId\]

根据线程内容进行,具体分析,如果是业务线程,查看具体代码分析,如果是GC Thread,需要继续查看堆信息

这次是GC Thread,下面查看内存信息

分析Java内存泄漏

dump 堆文件

jmap -dump:format=b,file=[XXX.hprof] [pid]

压缩文件,下载到本地

#压缩 tar -xvf XXX.tar.gz [XXX.hprof] 
# 下载 sz XXX.tar.gz

本地解压2次

img

Eclipse MAT 调整 内存使用

注意最新版本MAT,支持jdk11,需要下载,老的版本,这里使用1.8.0

Eclipse MAT 下载地址

MemoryAnalyzer.ini 中的Xmx,保证可以装在堆文件。

img

堆文件导入MAT,进行分析

File-> Open File 导入文件,耐心等待几分钟,之后选择Leak Suspects Report (泄漏探测)

img

在探测报告中,查看堆栈信息,点击 See stacktrace

img

定位到相应代码,具体分析

img

注意事项

dump操作,耗时,生产环境慎用。

替代方案

Arthas 用户文档

写在最后

这次排查,是poi读取大excel,造成的内存一次,csv还是首选,excel慎用