开发高性能JAVA应用程序基础(内存篇)

2022-07-11 19:14:27

虽然Java的垃圾回收和当前高配置的服务器可以让程序员大部分时间忘掉OutOfMemoryError的存在，但是访问量增大后频繁的GC会额外消耗CPU (使用top查看结果为us值高)，系统响应速度下降，积压的请求又会占用更多内存从而恶性循环，严重时可能导致系统不断Full GC造成应用停顿。

优化内存的使用可从以下几方面着手：

一、节流

1 使用单例模式

单例模式是开发者最早接触并使用的设计模式之一，尽管写代码的时候可能还不知道用了设计模式。简单来说就是构造函数private化，通过静态方法获得唯一实例。因为其特性，对于某些场景例如每次请求都要使用无状态工具类的检验方法，使用单例模式可以大量节省创建新对象的开销。

public class Singleton {
private Singleton() {}
private static Singleton instance = new Singleton();
public static Singleton getInstance() {
return instance;
}
public void doSomething() { }
}

2 缓存常用对象

简单来说就是按一定特征创建"对象缓存池"，使用集合类保存已创建的对象，当有相同特征的对象申请时，使用缓存池中现有的对象代替通过 new关键字重新创建。

public class BigObjectPoolTest {
public static void main(String[] args) {
long start = System.nanoTime();
for(int i = 0; i < 10000; i++) {
BigObjectPool.getBigObject("xxx", true);
}
System.out.println("使用缓存池耗时" + TimeUnit.MILLISECONDS.convert(System.nanoTime() - start, TimeUnit.NANOSECONDS) + "毫秒");
start = System.nanoTime();
for(int i = 0; i < 10000; i++) {
BigObjectPool.getBigObject("xxx", false);
}
System.out.println("不使用缓存池耗时" + TimeUnit.MILLISECONDS.convert(System.nanoTime() - start, TimeUnit.NANOSECONDS) + "毫秒");
}
}
class BigObjectPool {
private static Map<String, BigObject> map = new HashMap<String, BigObject>();
static {
map.put("xxx", new BigObject("xxx"));
map.put("yyy", new BigObject("yyy"));
}
public static BigObject getBigObject(String key, boolean usePool) {
if(usePool) {
BigObject bo = map.get(key);
if(bo == null) {
bo = new BigObject(key);
}
return bo;
} else {
return new BigObject(key);
}
}
}
class BigObject{
private String name;
private byte[] data = new byte[1024 * 1024];
public BigObject(String name) { this.name = name; }
}

以-Xms32m -Xmx32m -Xloggc:d:/gc.log 参数运行

使用缓存池耗时3毫秒
不使用缓存池耗时998毫秒

(查看gc.log，可以观察到不使用缓存池触发Minor GC 1000次以上)

实际业务中通常使用EhCache等框架代替自己实现缓存池。

与这种实现原理相似的也有一个设计模式：享元模式，区别是享元模式更关注类设计结构上的优化，对上下文环境的设计也做了明确定义。

3 避免设计过大的对象

如果业务模型中要求的类的属性和方法都非常多，可以尝试将其拆分成多个小类，再通过合成/聚合模式组装成一个大类，这也符合设计模式的优化思想。甚至可以结合上面的对象缓存池的方式将其中一部分内容缓存化。

class Composition {
private BigObject bigObject = null;
private int id;
public void setBigObject(BigObject bigObject) {
this.bigObject = bigObject;
}
public Composition(int id) {
this.id = id;
}
}

Composition c = new Composition(1);
c.setBigObject(BigObjectPool.getBigObject("xxx", true));

4 一些小技巧

使用StringBuilder代替用+号连接字符串

尽量使用int, long等基本类型代替Integer, Long包装对象

合理利用SoftReference和WeakReference

二、开源 - 调整虚拟机参数

一般设置 java -server -Xms2048m -Xmx2048m -XX:PermSize=256m -XX:MaxPermSize=256m

-Xms和-Xmx决定java堆区可使用的内存最小值和最大值，通常设为相同的值，避免运行期间反复的重新申请内存。如果出现OutOfMemoryError: Javaheap space，则在硬件允许的情况下临时调大-Xmx，为排查问题和优化代码争取时间。

-XX:PermSize和-XX:MaxPermSize决定永久代可用空间大小，存放class和meta信息，通常设置为相同的值。如果出现OutOfMemoryError: PermGen space，说明加载的类和jar文件过多，可以调大这两个参数值。

如果web容器下有多个应用引用了相同的第三方jar文件，可以转移到容器的共享目录。

另一个重要参数是-Xmn，决定堆区新生代的大小，通常占-Xmx的比值设置为1/4到1/3。如果业务中有大量体积大且生命周期很短的对象创建需求，可适当调大新生代空间以利于失效对象在新生代中被回收。

此外，可通过参数设置回收算法：

–XX:+UseSerialGC
–XX:+UseParallelGC
–XX:+UseParallelOldGC
–XX:+UseConcMarkSweepGC

回收算法的选择和对比需要较大的篇幅介绍，这里不做详细的解释。通常来说，对于响应时间优先的web应用，ConcMarkSweepGC(CMS)是个不错的选择。

需要注意的是，经过几代发展后，JVM对内存管理已经做的非常好。如果不是有明确的证据证明JVM的默认选择不合理，就没必要做过多细节的调整设置。调整后，可通过-XX:+PrintGCDetails -XX:+PrintGCTimeStamps等参数输出GC信息进行比对，优化的首要目标是减少Full GC次数和时间。

参考资料: 分布式java应用基础与实践

码农公寓