java 深拷贝探讨

2022-02-22 19:55:34

java 深拷贝探讨

本文将讨论以下4个问题

    1. java Cloneable接口实现深拷贝
    2. java 序列化实现深拷贝
    3. 号称最快的深拷贝二方库cloning源码分析
    4. 几种拷贝方式速度的比较

深拷贝的概念本文就不说了。在C++中实现深拷贝一般情况下重载赋值操作符 “=” 来实现同一个类的对象间的深拷贝，所以很自然的在java中我们也同样可以定义一个copy函数，在函数内部为对象的每一个属性作赋值操作。这种方式简单自然，但存在一个致命性的问题：如果有一天在类中新增加了一个需要深拷贝的属性，那么相应的copy函数也得进行修改，这种方法给类的可扩展性带来了极大的不方便。怎么解决这种问题，且看接下来的1、2、3章节的实现方式和4节的速度测试。

1. java Cloneable接口实现深拷贝

这种方式，需要类实现Colneable接口 clone 函数，在clone函数中调用super.clone。这种方式的深拷贝同样会带来另一个问题，如果类中有其他类的对象作为属性，则其他的类也需要重载并实现Cloneable接口。来一个例子，在下例中ComplexDO中包含了SimpleDO对象，要实现ComplexDO深拷贝，则需要先实现SimpleDO的clone接口：

public class SimpleDO implements Cloneable, Serializable {
        private int x = 1;
        private String s = "simpleDO";
    
        @Override
        protected Object clone() throws CloneNotSupportedException {
            SimpleDO newClass = (SimpleDO)super.clone();
            return newClass;
        }
    }

    public class ComplexDO implements Cloneable, Serializable {
        private int x = 1;
        private String s = "complex";
        private Integer a = 123;
        private Integer b = 1234;
        private Integer c = 1334455;
        private String s2 = "hehehe";
        private String s3 = "hahahaha";
        private Long id = 1233245L;
        private ArrayList<SimpleDO> l = new ArrayList<SimpleDO>();
    
        @Override
        public Object clone() throws CloneNotSupportedException {
            ComplexDO newClass = (ComplexDO) super.clone();
            newClass.l = new ArrayList<SimpleDO>();
            for (SimpleDO simple : this.l) {
                newClass.l.add((SimpleDO) simple.clone());
            }
            return newClass;
        }
    }

需要注意的是很多文章说String类型的对象赋值操作符是深拷贝，但是其实在java中使用赋值操作符的都属于浅拷贝，但为什么这么明显的错误这么多的文章会非要说这个是深拷贝呢？我的理解是String、类型的属性都是基本类型，而且提供的方法只要是设计到内部数据的变动都会new一个新的对象出来。所以一个String的操作不会影响到其原先指向的内存。所以一般说String等基础类的赋值操作为深拷贝。

由于这个原因，在使用String字符串拼接的时候，需要开辟新的内存，所以很多人建议用StringBuilder来代替String来做拼接，因为StringBuilder只有在内置的char数组范围不够的时候才重新申请更大的内存(对于现代JVM，会对代码调优，String+String会被优化成StringBuilder.append的相类似的指令)。与拼接相对的裁剪，在String有个subString函数，当使用subString函数时，新String的内部char数组和原String是否相同？这个比较有意思，感兴趣的可以对比看看JDK1.6和JKD1.7的实现。

2. java 序列化实现深拷贝

这种方式的原理是利用java序列化，将一个对象序列化成二进制字节流，然后对该字节流反序列化赋值给一个对象。代码示例：

    public Object seirCopy(Object src) {
        try {
            ByteArrayOutputStream byteOut = new ByteArrayOutputStream();
            ObjectOutputStream out = new ObjectOutputStream(byteOut);
            out.writeObject(src);

            ByteArrayInputStream byteIn = new ByteArrayInputStream(byteOut.toByteArray());
            ObjectInputStream in = new ObjectInputStream(byteIn);
            Object dest = in.readObject();
            return dest;
        } catch (Exception e) {
            //do some error handler
            return null;
        }
 }

当然，也可以选用json等序列化的库来完成序列化，这种方式有效的规避了Cloneabel接口的可扩展缺点，一个函数就可以基本上适用于所有的类.缺点是相对内存拷贝，序列化需要先将对象转换成二进制字节流，然后反序列化将该二进制字节流重新拷贝到一块对象内存，相对慢点。

3. 号称最快的深拷贝二方库cloning源码分析

先上源码心得：在cloning中源码中，拷贝的过程主要是靠递归来实现，即对对象内部的每一个属性对象递归调用，直到该属性可直接赋值为止。拷贝的机制是通过反射拿到对象内部的每一个属性，使用Objenesis框架生成该属性的类的新对象，然后赋值。
再看看源码的类图（图中的直线箭头表示调用）：

在源码中，核心的处理逻辑在Cloner类中，
分两条递归链路：

（1）deepClone->cloneInternal->fastClone->cloneInternal
（2）deepClone->cloneInternal->cloneObject->cloneInternal

在（1）中fastClone完成的是继承自IfastCloner接口类的对象，即都是些集合操作的拷贝；
在（2）中cloneObject完成的是通过反射机制拿到普通对象的每一个属性，然后对使用Objenesis新生成对象的属性赋值。

这种方式可扩展性强，不仅可以依靠其现有的代码完成深拷贝，还可以自己定义一些克隆的方式和不需要克隆的类型，灵活性强。
放上源码链接，代码量小，逻辑清晰，适合阅读：https://github.com/kostaskougios/cloning

4. 几种拷贝方式速度的比较

上述3中模式都可以完成深拷贝，那种拷贝的方式速度最快是我们所关心的。
先上测试代码：

    public void testCloneComplex() throws CloneNotSupportedException {
        final int copyCount = 1;
        List<ComplexDO> complexDOList = new ArrayList<ComplexDO>(copyCount * 3);
        final ComplexDO complex = new ComplexDO();

        //调用二方库
        long start = System.currentTimeMillis();
        for(int i = 0; i < copyCount; ++i) {
            final ComplexDO deepClone = cloner.deepClone(complex);
            complexDOList.add(deepClone);
        }
        long end = System.currentTimeMillis();
        System.out.println("deepClone cost time=" + (end-start));

        //调用Cloneable接口实现的clone函数
        start = System.currentTimeMillis();
        for(int i = 0; i < copyCount; ++i) {
            final ComplexDO interfaceClone = (ComplexDO) complex.clone();
            complexDOList.add(interfaceClone);
        }
        end = System.currentTimeMillis();
        System.out.println("interfaceClone cost time=" + (end-start));

        //序列化与反序列化生成新对象
        start = System.currentTimeMillis();
        for(int i = 0; i < copyCount; ++i) {
            final ComplexDO seirClone = seirCopy(complex);
            complexDOList.add(seirClone);
        }
        end = System.currentTimeMillis();
        System.out.println("seirClone cost time=" + (end-start));
    }

拷贝次数	clone接口拷贝	序列化拷贝	cloning库拷贝
1	0	70	14
100	0	198	26
1000	4	1259	172

运行结果的单位为毫秒（此数据忽略不计算java热点和可能的gc）。从这个表可以得出结论：

实现Cloneable接口的拷贝是最快的，因为他只涉及到了内存拷贝，但是如果涉及的属性为普通对象比较多的时候写起来麻烦点
序列化/反序列化拷贝最慢
使用cloning库，由于使用了递归和反射机制相对Cloneable接口实现的拷贝要慢，但比序列化方式要快。

码农公寓