多线程中使用Java集合类

Java集合类中,某个线程在 Collection 上进行迭代时,通常不允许另一个线性修改该 Collection。通常在这些情况下,迭代的结果是不确定的。如果检测到这种行为,一些迭代器实现(包括 JRE 提供的所有通用 collection 实现)可能选择抛出此异常。执行该操作的迭代器称为快速失败 迭代器,因为迭代器很快就完全失败,而不会冒着在将来某个时间任意发生不确定行为的风险。

因此,当一个线程试图ArrayList的数据的时候,另一个线程对ArrayList在进行迭代的,会出错,抛出ConcurrentModificationException。

比如下面的代码:


  1. final List<String> tickets = new ArrayList<String>(); 
  2. for (int i = 0; i < 100000; i++) { 
  3.    tickets.add("ticket NO," + i); 
  4. System.out.println("start1..."); 
  5. for (int i = 0; i < 10; i++) { 
  6.    Thread salethread = new Thread() { 
  7.        public void run() { 
  8.            while (tickets.size() > 0) { 
  9.                tickets.remove(0); 
  10.                System.out.println(Thread.currentThread().getId()+"Remove 0"); 
  11.            } 
  12.        } 
  13.    }; 
  14.    salethread.start(); 
  15. System.out.println("start2..."); 
  16. new Thread() { 
  17.    public void run() { 
  18.        for (String s : tickets) { 
  19. System.out.println(s); 
  20.        } 
  21.    } 
  22. }.start(); 

上述程序运行后,会在某处抛出异常:

java.util.ConcurrentModificationException

at java.util.ArrayList$Itr.checkForComodification(Unknown Source)

at java.util.ArrayList$Itr.next(Unknown Source)

at mytest.mytestpkg.Tj$2.run(Tj.java:138)

Vector是线程同步的,那么把ArrayList改成Vector是不是就对了呢?

答案是否定的,事实上,无论是ArrayList还是Vector,只要是实现Collection接口的,都要遵循fail-fast的检测机制,即在迭代是时候,不能修改集合的元素。一旦发现违法这个规定就会抛出异常。


事实上,Vector相对于ArrayList的线程同步,体现在对集合元素是否脏读上。即ArrayList允许脏读,而Vector特殊的机制,不会出现脏读,但是效率会很差。

举个例子,一个集合,有10个线程从该集合中删除元素,那么每个元素只可能由一个线程删除掉,不可能会出现一个元素被多个线程删除的情况。

比如下面的代码:


  1. final List<String> tickets = new ArrayList<String>(); 
  2. for (int i = 0; i < 100000; i++) { 
  3.    tickets.add("ticket NO," + i); 
  4. System.out.println("start1..."); 
  5. for (int i = 0; i < 10; i++) { 
  6.    Thread salethread = new Thread() { 
  7.        public void run() { 
  8.            while (true) { 
  9. if(tickets.size()>0
  10. System.out.println(Thread.currentThread().getId()+ tickets.remove(0)); 
  11. else 
  12. break
  13.            } 
  14.        } 
  15.    }; 
  16.    salethread.start(); 

for循环构造10个线程删除同一个集合中的数据,理论上只能删除100000次。但是运行完发现,输出的删除次数108494次,其中很多数据都是被多个线程删除,比如下面的输出片段:

17ticket NO,35721

14ticket NO,35699

11ticket NO,35721

18ticket NO,35721

17ticket NO,35729

11ticket NO,35729

14ticket NO,35729

17ticket NO,35729

14ticket NO,35734

17ticket NO,35734

13ticket NO,35721

可以看到35721,35729都被多个线程删除。这事实上就是出现了脏读。解决的办法就是加锁,使得同一时刻只有1个线程对ArrayList做操作。

修改代码,synchronized关键字,让得到锁对象的线程才能运行,这样确保同一时刻只有一个线程操作集合。


  1. final List<String> tickets = new ArrayList<String>(); 
  2. for (int i = 0; i < 100000; i++) { 
  3.    tickets.add("ticket NO," + i); 
  4. System.out.println("start1..."); 
  5. final Object lock=new Object(); 
  6. for (int i = 0; i < 10; i++) { 
  7.    Thread salethread = new Thread() { 
  8.        public void run() { 
  9.            while (true) { 
  10. synchronized(lock) 
  11. if(tickets.size()>0
  12. System.out.println(Thread.currentThread().getId()+ tickets.remove(0)); 
  13. else 
  14. break
  15.            } 
  16.        } 
  17.    }; 
  18.    salethread.start(); 

这样得到的结果就是准确的了。

当然,不使用synchronized关键字,而直接使用vector或者Collections.synchronizedList 也是同样效果:


  1. final List<String> tickets =java.util.Collections.synchronizedList(new ArrayList<String>()); 
  2. final List<String> tickets =new Vector<String>(); 

vector和Collections.synchronizedList 都是线程同步的,避免的脏读的出现。


















本文转自cnn23711151CTO博客,原文链接:http://blog.51cto.com/cnn237111/1135527 ,如需转载请自行联系原作者


上一篇:[翻译]ADO.NET Entity Framework Beta2(九)/快速入门(实体框架)(4)/查询实体及关系


下一篇:Matplotlib打卡4文字图例