下载和安装
curl -O https://alibaba.github.io/arthas/arthas-boot.jar
java -jar arthas-boot.jar
使用as.sh
curl -L https://alibaba.github.io/arthas/install.sh | sh
直接在shell下面执行./as.sh,就会进入交互界面。
也可以执行./as.sh -h来获取更多参数信息。
常用的命令
基本命令
- help——查看命令帮助信息
- cat——打印文件内容,和linux里的cat命令类似
- pwd——返回当前的工作目录,和linux命令类似
- cls——清空当前屏幕区域
- session——查看当前会话的信息
- reset——重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类
- version——输出当前目标 Java 进程所加载的 Arthas 版本号
- history——打印命令历史
- quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
- shutdown——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
查看系统整体情况
- dashboard——当前系统的实时数据面板
- thread——查看当前 JVM 的线程堆栈信息
- jvm——查看当前 JVM 的信息
- sysprop——查看和修改JVM的系统属性
- sysenv——查看JVM的环境变量
- getstatic——查看类的静态属性
类相关命令
- sc——查看JVM已加载的类信息
- sm——查看已加载类的方法信息
- jad——反编译指定已加载类的源码
- mc——内存编绎器,内存编绎.java文件为.class文件
- redefine——加载外部的文件,redefine到JVM里
- dump——dump 已加载类的 byte code 到特定目录
- classloader——查看classloader的继承树,urls,类加载信息,使用classloader去getResource
监控相关
- monitor——方法执行监控
- watch——方法执行数据观测
- trace——方法内部调用路径,并输出方法路径上的每个节点上耗时
- stack——输出当前方法被调用的调用路径
- tt——方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测
问题
- 初次使用时的一些问题
[ERROR] Target process 9298 is not the process using port 3658, you will connect to an unexpected process.
[ERROR] 1. Try to restart as.sh, select process 959, shutdown it first with running the 'stop' command.
[ERROR] 2. Try to use different telnet port, for example: as.sh --telnet-port 9998 --http-port -1
这个问题初用者必出,原因为 arthas 选择一个应用进行诊断时弄了一个 session,可以使用 arthas-client ,web arthas client 进行登录,这个提示告诉你要先关闭以前的 arthas-boot ,或者重新选择一个端口。
在 ~/.arthas/lib/3.1.7/arthas 下有一个 arthas-client.jar 使用 java -jar arthas-client.jar 可以进入上次的 session ,shutdown 后就可以选择其它的进程进行诊断了,或者你可以继续诊断当前应用
- 反编译失败
Memory compiler error, exception message: Compilation Error
line: 9 , message: package org.springframework.stereotype does not exist ,
line: 11 , message: cannot find symbol
symbol: class Service ,
, please check $HOME/logs/arthas/arthas.log for more details.
Affect(row-cnt:0) cost in 16 ms.
- mc命令有可能失败。如果编译失败可以在本地编译好.class文件,再上传到服务器
- 可以使用sc命名查找相应类的ClassLoader,获取classLoaderHash。再用mc命令进行反编译
# 获取classLoaderHash
sc -d *SayService | grep classLoaderHash
# classLoaderHash 439f5b3d
# 使用classLoaderHash进行反编译
mc -c 439f5b3d /tmp/SayService.java -d /tmp
实战操作
- 使用monitor命令对类、方法的调用进行监控。
monitor -c 2 com.example.arthastest.service.SayService sayHello
从上图的监控可以看出类SayService的sayHello方法耗时抖动比较大,需进一步排查
- 使用trace命令对方法内部调用路径,并输出方法路径上的每个节点上耗时统计
trace com.example.arthastest.service.SayService sayHello '#cost > 300'
从上图的监控数据可以看到processName方法耗时多
- 使用watch命令观察到指定方法的调用情况。能观察到的范围为:返回值、抛出异常、入参,通过编写 OGNL 表达式进行对应变量的查看。
watch com.example.arthastest.service.SayService processName "{params,returnObj}" -x 2 '#cost>300'
从上图的监控可以看出传入参数xiaoming时的耗时较多
- 使用jad反编译指定已加载类的源码
jad --source-only com.example.arthastest.service.SayService
# 可以使用如下命令将生成后的源码指定到文件中
jad --source-only com.example.arthastest.service.SayService > /tmp/SayService.java
看到反编译后的代码,基本可以确认问题出在哪里。
- 使用sc命令获取加载该方法的classLoaderHash
sc -d *SayService | grep classLoaderHash
- 修改源码后使用mc编译.java文件生成.class
修改后的源码如下图
mc -c 439f5b3d /tmp/SayService.java -d /tmp
- 使用redefine命令重新加载修改后的代码
redefine -c 439f5b3d /tmp/com/example/arthastest/service/SayService.class
再次使用相同的参数访问该方法,会发现耗时明显降低。
注意:redefine命令和jad/watch/trace/monitor/tt等命令会冲突。执行完redefine之后,如果再执行上面提到的命令,则会把redefine的字节码重置。 原因是jdk本身redefine和Retransform是不同的机制,同时使用两种机制来更新字节码,只有最后修改的会生效。redefine后使用jad再次查看源码会发现依旧是以前的,这是命令冲突导致的,会使已生效redefine修改失效。