ArrayList为什么线程不安全线程不安全体现在哪些方面源码角度分析其具体原因

2022-06-23 00:36:15

一、ArrayList源码摘录

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    /**
     * 列表元素集合数组
     * 说明ArrayList基于数组存储数据
     */
    transient Object[] elementData; 

    /**
     * 列表大小，elementData中存储的元素个数
     */
    private int size;
}

add() 方法

/**
 * Appends the specified element to the end of this list.
 * 将指定的元素追加到列表的末尾。
 * add() 方法做了如下操作：
 *     1.检查容量是否足够，如不够将进行扩容，并自增 modCount
 *     2.将指定的元素追加到列表的末尾
 *
 * @param e element to be appended to this list
 * @return <tt>true</tt> (as specified by {@link Collection#add})
 */
public boolean add(E e) {
    //确保容量足够，如果不够进行扩容
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    //将e存在index为size的位置（即最后一位的下一位置），size++
    //我们都知道，++操作不是原子指令，多线程情况下将发生并发问题
    elementData[size++] = e;
    return true;
}

二、测试用例

@Test
public void listThreadUnsafe() throws InterruptedException {
    List<String> list = new ArrayList<>();
    Thread t1 = new Thread(new Runnable() {
        @Override
        public void run() {
            for (int i = 0; i < 100; i++) {
                list.add("t1-" + i);
            }
        }
    });
    Thread t2 = new Thread(new Runnable() {
        @Override
        public void run() {
            for (int i = 0; i < 100; i++) {
                list.add("t2-" + i);
            }
        }
    });
    t1.start();
    t2.start();

    Thread.sleep(2000);
    int size = list.size();
    System.out.println("size = " + size);
    for (int i = 0; i < size; i++) {
        System.out.println("索引为" + i + "的元素为：" + list.get(i));
    }
}

本用例多跑几次，将出现下面几种并发问题。

三、ArrayList线程不安全的表现

add()实际执行的过程为：

elementData[size] = e;
size = size + 1;

1. 并发环境下进行add操作时可能会导致elementData数组越界

问题现场如下：
有两个线程：t1，t2。有ArrayList size=9（即其中有9个元素）。elementData.length=10
t1进入add()方法，这时获取到size值为9，调用ensureCapacityInternal()方法判断容量是否需要扩容
t2也进入add()方法，这时获取到size值也为9，也调用ensureCapacityInternal()方法判断容量是否需要扩容
t1发现自己的需求为size+1=10，容量足够，无需扩容
t1发现自己的需求为也size+1=10，容量足够，无需扩容
t1开始设置元素操作，elementData[size++] = e，成功，此时size变为10
t2也开始进行设置元素操作，它尝试设置elementData[10] = e，而elementData没有进行过扩容，它的下标最大为9。于是此时会报出一个数组越界的异常：ArrayIndexOutOfBoundsException

用例体现为：

2. 一个线程的值覆盖另一个线程添加的值

这个问题要分多钟情况了

2.1 情况1 size大小符合预期，但是中间有null值存在

流程描述如下：

问题现场如下：
有两个线程：t1，t2。有ArrayList size=5（即其中有5个元素）。elementData.length=10
t1进入add()方法，这时获取到size值为5，调用ensureCapacityInternal()方法判断容量是否需要扩容
t2也进入add()方法，这时获取到size值也为5，也调用ensureCapacityInternal()方法判断容量是否需要扩容
t1发现自己的需求为size+1=6，容量足够，无需扩容
t1发现自己的需求为也size+1=6，容量足够，无需扩容
t1开始设置元素操作，elementData[size] = e，成功，
t2也开始设置元素操作，elementData[size] = e，成功，注意此时t1的size+1还没执行
t1 size = size + 1 = 6，并写入主存
t2 size = size + 1 = 7
这样，size符合预期，但是t2设置的值被覆盖，而且索引为6的位置将永远为null，因为size已经为7，下次add()也会从7开始。除非手动set值。

用例体现如下：

我们发现，t2的“t2-0”元素被覆盖。

2.2 情况2 size大小比预期的小

情况分析：

问题现场如下：
有两个线程：t1，t2。有ArrayList size=5（即其中有5个元素）。elementData.length=10
t1进入add()方法，这时获取到size值为5，调用ensureCapacityInternal()方法判断容量是否需要扩容
t2也进入add()方法，这时获取到size值也为5，也调用ensureCapacityInternal()方法判断容量是否需要扩容
t1发现自己的需求为size+1=6，容量足够，无需扩容
t1发现自己的需求为也size+1=6，容量足够，无需扩容
t1开始设置元素操作，elementData[size] = e，成功，
t2也开始设置元素操作，elementData[size] = e，成功，注意此时t1的size+1还没执行
t1 size = size + 1 = 6，暂未写入主存
t2 size = size + 1 此时因为t1操作完size还未写入主存，所以size依然为5，+1后仍为6
t1将size=6 写入主存
t2将size=6 写入主存
这样，size=6 比预期结果小了。

用例体现：

总结

上面介绍的情况都有其出现的概率，并不是每次都出现，只是在临界状态下出现错误。但是，作为程序的编写者，即使有千万分之一的概率，我们也要尽量去避免它，这是程序员的基本素养。

Tips

关于写入主存。
基本现在的CPU都是多核心的，每个核心有各自的高速缓存，计算任务需要在高速缓存中进行，对于缓存的访问速度 L1 > L2 > L3 > 内存。L1、L2为各核心独有，L3为多个核心共享。
我们的程序运行在主内存，但计算需要在CPU中完成。
当执行计算任务时，比如 size+1 操作，CPU先将 size 的值读进CPU缓存，在CPU缓存中计算 +1，然后再将结果写入主内存。

码农公寓