Java垃圾回收调优实战

Java 垃圾回收调优不同于任何其它性能优化活动。

首先你要确保自己足够了解整个应用的情况以及调优预期的结果,而不是单单满足于应用的某一部分调优。一般情况下,遵循以下过程比较容易:

Java垃圾回收调优实战

  1. 明确自己的性能目标。

  2. 测试。

  3. 测量调优结果。

  4. 与目标进行比较。

  5. 改变方法并再次测试。

性能调优目标要是可确定且可测量的,这非常重要。这些目标包括延迟、吞吐量和容量,想要了解更多,我推荐看看垃圾回收手册(Garbage Collection Handbook)中相应的章节。让我们看看在实践中如何设定并达到这样的调优目标。为了这个目的,让我们来看一个示例代码:


  1. //imports skipped for brevity 
  2. public class Producer implements Runnable { 
  3.  
  4.   private static ScheduledExecutorService executorService = Executors.newScheduledThreadPool(2); 
  5.  
  6.   private Deque<byte[]> deque; 
  7.   private int objectSize; 
  8.   private int queueSize; 
  9.  
  10.   public Producer(int objectSize, int ttl) { 
  11.     this.deque = new ArrayDeque<byte[]>(); 
  12.     this.objectSize = objectSize; 
  13.     this.queueSize = ttl * 1000
  14.   } 
  15.  
  16.   @Override 
  17.   public void run() { 
  18.     for (int i = 0; i < 100; i++) { 
  19.       deque.add(new byte[objectSize]); 
  20.       if (deque.size() > queueSize) { 
  21.         deque.poll(); 
  22.       } 
  23.     } 
  24.   } 
  25.  
  26.   public static void main(String[] args) throws InterruptedException { 
  27.     executorService.scheduleAtFixedRate(new Producer(200 * 1024 * 1024 / 10005), 0100, TimeUnit.MILLISECONDS); 
  28.     executorService.scheduleAtFixedRate(new Producer(50 * 1024 * 1024 / 1000120), 0100, TimeUnit.MILLISECONDS); 
  29.     TimeUnit.MINUTES.sleep(10); 
  30.     executorService.shutdownNow(); 
  31.   } 

代码中提交了两个作业(job),且每 100ms 运行一次。每个作业模拟特定对象的生命周期:先创建对象,让它们“存活”一段时间,然后忘记它们,让 GC 回收内存。 运行这个示例时,开启 GC 日志并使用以下参数:

-XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps

我们立即在日志文件中看到 GC 的影响和下面这些相似:


  1. 2015-06-04T13:34:16.119-02001.723: [GC (Allocation Failure) [PSYoungGen: 114016K->73191K(234496K)] 421540K->421269K(745984K), 0.0858176 secs] [Times: user=0.04 sys=0.06, real=0.09 secs] 
  2. 2015-06-04T13:34:16.738-02002.342: [GC (Allocation Failure) [PSYoungGen: 234462K->93677K(254976K)] 582540K->593275K(766464K), 0.2357086 secs] [Times: user=0.11 sys=0.14, real=0.24 secs] 
  3. 2015-06-04T13:34:16.974-02002.578: [Full GC (Ergonomics) [PSYoungGen: 93677K->70109K(254976K)] [ParOldGen: 499597K->511230K(761856K)] 593275K->581339K(1016832K), [Metaspace: 2936K->2936K(1056768K)], 0.0713174 secs] [Times: user=0.21 sys=0.02, real=0.07 secs] 

基于日志中的信息,我们可以开始改善性能。并请牢记三个不同的目标:

  1. 确保 GC pause(垃圾回收暂停)的最坏情况不要超过预期的临界值。

  2. 确保应用程序线程停滞时间不超过预先确定的阀值。

  3. 降低基础架构成本,同时确保我们仍可以实现合理的延迟和吞吐量目标。

为此,以三个不同的配置各运行了10分钟,在下表中总结了三个差距较大的结果:

GC算法

有效工作

长暂停

-Xmx12g

-XX:+UseConcMarkSweepGC

89.8%

560 ms

-Xmx12g

-XX:+UseParallelGC

91.5%

1,104 ms

-Xmx8g

-XX:+UseConcMarkSweepGC

66.3%

1,610 ms

实验中,设置不同的 GC 算法和不同的堆大小,运行相同的代码,然后测量垃圾回收暂停的持续时间和吞吐量。实验细节和结果的解释都在我们的垃圾回收手册中。看看手册中的一些例子,修改一些简单的配置造成延迟、吞吐量等各方面的性能完全不同。

注意:为了保持示例尽可能简单,只有数量有限的输入参数被改变,例如没有对不同数量的核心(CPU core)或不同堆布局进行测试。


来源:51CTO

上一篇:超酷的神经网络合成动物运动动画,解救动画师!(代码开源+视频)


下一篇:SQL基础语句总结