top命令详析及排查问题使用演示

1. top基本使用

top命令运行图

top命令详析及排查问题使用演示

第一行:基本信息

top命令详析及排查问题使用演示

第二行:任务信息

top命令详析及排查问题使用演示

第三行:CPU使用情况

top命令详析及排查问题使用演示

第四行:物理内存使用情况

top命令详析及排查问题使用演示

buff/cache:

buffers 和 cache 都是内存中存放的数据,不同的是,buffers 存放的是准备写入磁盘的数据,而 cache 存放的是从磁盘中读取的数据

在Linux系统中,有一个守护进程(daemon)会定期把buffers中的数据写入的磁盘,也可以使用 sync 命令手动把buffers中的数据写入磁盘。使用buffers可以把分散的 I/O 操作集中起来,减少了磁盘寻道的时间和磁盘碎片。 
cache是Linux把读取频率高的数据,放到内存中,减少I/O。Linux中cache没有固定大小,根据使用情况自动增加或删除。

第五行:交换区使用情况

top命令详析及排查问题使用演示

Swap(内存交换区):

是硬盘上的一块空间。在内存不足的情况下,操作系统把内存中不用的数据存到硬盘的交换区,腾出内存来让别的程序运行。因此,开启swap会一定程度的引起 I/O 性能下降(阿里服务器默认不开)。

第六行:进程详细信息

top命令详析及排查问题使用演示

2. 问题排查模拟

介绍一下使用到的top参数

top命令详析及排查问题使用演示

线上的出现需要使用top排查的情况一般是死循环或者死锁,下面通过代码来模拟两种情况

package com.zang.top.controller;

import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController; import java.util.concurrent.TimeUnit; /**
* @author zangjf
* @version zangjf: TopController.java,v1.0 2019/2/27 22:51 zangjf Exp $$
* @since 1.0
*/
@RestController
@RequestMapping("top")
public class TopController { private Object lock1 = new Object();
private Object lock2 = new Object(); @RequestMapping("test")
public String test() {
return "success";
} // 死循环
@RequestMapping("loop")
public String loop() {
System.out.println("start");
while (true) {}
} // 死锁
@RequestMapping("deadlock")
public String deadlock() {
new Thread(() -> {
synchronized (lock1) {
try{
TimeUnit.SECONDS.sleep(1);
} catch (Exception e) {}
synchronized (lock2) {
System.out.println("thread1 over");
}
}
}).start();
new Thread(() -> {
synchronized (lock2) {
try{
TimeUnit.SECONDS.sleep(1);
} catch (Exception e) {}
synchronized (lock1) {
System.out.println("thread2 over");
}
}
}).start();
return "success";
}
}

放到服务器上启动

top命令详析及排查问题使用演示

2.1 死循环

手动制造CPU飙高的场景,重复执行该命令三次,模拟三个导致高cpu占用的线程

curl localhost:8080/top/loop

top命令详析及排查问题使用演示

执行top命令,可以看到pid为22095的进程CPU占用较高

top命令详析及排查问题使用演示

查看pid为22095的进程中线程的具体情况

top -p 22095 -H

top命令详析及排查问题使用演示

可以看到PID为22114,22115和22116的线程占用CPU较高。这里可能有人有疑惑,为什么线程也有PID啊?其实线程进程都会有自己的ID,这个ID就叫做PID,PID是不特指进程ID,线程ID也可以叫做PID。

jstack命令工具可以得到线程堆栈信息,根据这些线程堆栈信息,我们可以去检查Java程序出现的问题。

打印PID为22095的进程的详细堆栈信息。

jstack 22095 > loop.txt

以PID为22114的线程为例,到loop.txt中查找该线程的信息,因为jstack中PID用的是16进制,所以需要将10进制的PID转换为16进制的数值到文件中查找。

printf "%x" 22114
# 输出5662

top命令详析及排查问题使用演示

可以定位到程序中出现问题的代码位置

top命令详析及排查问题使用演示

2.2 死锁

模拟死锁

curl localhost:8080/top/deadlock

输出堆栈信息

top命令详析及排查问题使用演示

jstack 22223 > deadlock.txt

查看文件最后的信息,看到发现一个死锁及产生位置

top命令详析及排查问题使用演示

参考:https://mp.weixin.qq.com/s/G7F25H3h7WuqiUdU_ocbhA

上一篇:Git学习笔记07-删除文件


下一篇:bash: php: command not found