基于arthas排查Java内存问题

能帮助解决的问题

  1. 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  2. 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  3. 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  4. 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  5. 是否有一个全局视角来查看系统的运行状况?
  6. 有什么办法可以监控到JVM的实时运行状态?
  7. 怎么快速定位应用的热点,生成火焰图?
  8. 怎样直接从JVM内查找某个类的实例?

官方文档

Arthas 用户文档 ‒ Arthas 3.5.4 文档

开始体验

下载jar包

wget https://arthas.aliyun.com/arthas-boot.jar

启动jar包

java -jar arthas-boot.jar --target-ip 0.0.0.0
#可以通过浏览器访问
http://127.0.0.1:8563

arthas-bootArthas的启动程序,它启动后,会列出所有的Java进程,用户可以选择需要诊断的目标进程。

选择要调试的java进程

[INFO] arthas-boot version: 3.5.4
[INFO] Found existing java process, please choose one and input the serial number of the process, eg : 1. Then hit ENTER.
* [1]: 1377 demo-arthas-spring-boot.jar
# 选择1,回车
$ 1 
# 会显示以下信息,说明已经启动成功了
[INFO] Start download arthas from remote server: https://arthas.aliyun.com/download/3.5.4?mirror=aliyun
[INFO] Download arthas success.
[INFO] arthas home: /home/shell/.arthas/lib/3.5.4/arthas
[INFO] Try to attach process 1377
[INFO] Attach process 1377 success.
[INFO] arthas-client connect 0.0.0.0 3658
  ,---.  ,------. ,--------.,--.  ,--.  ,---.   ,---.                           
 /  O  \ |  .--. ''--.  .--'|  '--'  | /  O  \ '   .-'                          
|  .-.  ||  '--'.'   |  |   |  .--.  ||  .-.  |`.  `-.                          
|  | |  ||  |\  \    |  |   |  |  |  ||  | |  |.-'    |                         
`--' `--'`--' '--'   `--'   `--'  `--'`--' `--'`-----'                          
wiki       https://arthas.aliyun.com/doc                                        
tutorials  https://arthas.aliyun.com/doc/arthas-tutorials.html                  
version    3.5.4                                                                
main_class                                                                      
pid        1377                                                                 
time       2021-10-21 14:10:42

查看JVM信息

sysprop

查看所有的System properties信息
  • 可以查单个key

sysprop java.version

  • 设置key值
    • sysprop testkey testvalue

sysenv

命令可以获取到环境变量

dashboard (常用命令)

命令可以查看当前系统的实时数据面板

q

输入 q 或者 Ctrl+C 可以退出dashboard命令

history

可以查看历史执行指令

Tab键可以帮助开发者补全命令,也可以借助 -h 来提示相关命令的文档介绍

Jad

查看反编译代码jad com.example.demo.arthas.user.UserController--source-only 只打印出反编译的源代码

Sc

命令可以查找到所有JVM已经加载到的类。 如果搜索的是接口,还会搜索所有的实现类sc javax.servlet.Filter sc -d javax.servlet.Filter 可以打印类的具体信息Sc *StringUtils 支持通配

Sm

sm命令则是查找类的具体函数sm java.math.RoundingModesm -d java.math.RoundingMode 通过-d参数可以打印函数的具体属性:sm java.math.RoundingMode

Ognl

可以动态执行代码Ognl '@java.lang.System@out.println("hello ognl")'更多用法参考文档

reset

Arthas在 watch/trace 等命令时,实际上是修改了应用的字节码,插入增强的代码显式执行 reset 命令,可以清除掉这些增强代码。

exit

exit 或者 quit 命令可以退出Arthas。

Stop

彻底退出Arthas

thread

Thead 查看所有线程信息Thread 16 查找线程ID为16的栈Thread -n 3 查看CPU使用率top n的栈Thead -b 查找线程是否有阻塞

排查问题案例

RTT问题

curl http://127.0.0.1:9093/goods/listAllGoods?goodsType=2

查看GoodsServiceImpl listAllGoods方法执行耗时

trace com.findqu.ms.test.GoodsServiceImpl listAllGoods

从日志可以看出来

com.findqu.ms.test.GoodsServiceImpl:listAllGoods()耗时较多,可以重点去排查问题

异常问题

curl http://localhost:61000/user/0
{"timestamp":1550223186170,"status":500,"error":"Internal Server Error","exception":"java.lang.IllegalArgumentException","message":"id < 1","path":"/user/0"}

查看UserController的 参数/异常

watch com.example.demo.arthas.user.UserController * '{params, throwExp}'watch com.example.demo.arthas.user.UserController * '{params, throwExp}' -x 2 如果想把获取到的结果展开,可以用-x参数

上一篇:Linux内核中root_domain的建立与初始化


下一篇:spring boot 和shiro的代码实战demo