Java 并发/多线程教程(八)-竞态条件和临界区

      本系列译自jakob jenkov的Java并发多线程教程,个人觉得很有收获。由于个人水平有限,不对之处还望矫正!

      竞态条件是在临界区内可能发生的一种特殊情况。临界区是多线程并发执行一代码,根据线程的执行顺序可能产生多种结果的区域。多线程在临界区执行代码的结果可能不一样,不同的结果取决于线程的执行顺序。也就是说,临界区包含竞态条件。竞态一词源于隐喻,线程在临界区进进行资源竞争,在临界区的资源竞争影响最后的结果。

     这听起来有点复杂,在下面的篇幅中,将会在下面的篇幅中介绍更多与竞态条件和临界区的相关内空。

临界区

     在一个应用的内部执行多个线程本身不会导致什么问题,当多个线程同时访问相同的资源,问题就出现了。举个例子:相同的内存资源(变量、数组、或者对象),系统资源(数据库、webservice)或者文件。

      实事上,这种问题仅出现在多个线程同时对这些资源进行写操作时。只要资源不更改,多个线程同时对相同的资源进行读是安全的。

      下面的这个例子当多个线程同时执行时可能会出错:

public class Counter{

    protected long count= 0;    

    public void add(long value){

         this.count=this.count+value;

   }

}

假设有两个线程A和B,在Counter的同一个实例上同时执行add方法,我们没办法预知操作系统在这两个线之间的调度顺序。这段代码在JVM中不是以原子操作的方式执行。而是把他们当作一组指令去执行:

1、从内存中读取this.count的值到寄存器

2、把值添添加后写到寄存器

3、把寄存器中的值写回到内存中

观察线程A和线程B的执行,将会发生些什么。

this.count = 0;

A: Reads this.count into register(0);

B:Reads this.count into register(0);

B:Add value 2 to register;

B:Writes register value(2) back to memory, this.count now equals 2

A:Add value 3 to register;

A:Writes register value(3) back to memory,this.count now equals 3

      这两个线程的目的是想对count进行加2,加3操作。因此这两个线程的执行结果预期应该为5,然而,由于这两个线程的交错执行,结果将会不同。 在上面的例子中,A线程和B线程刚开始从内存中读取到的数据都是0,然后它们各自将值加到counter上,然后将值写回到内存中,而不是5,this.count的值的最后的值就是最后一个写这个值的线程,在上面的例子中,他可能是A线程,也有可能会是B线程。

临界区的竞态条件

       在上面的例子中,当执行add()方法时,当多线程去执行这段代码时,在临界区就产生了竞态条件。

      当两个线程访问相同的资源,他们的访问顺序就叫做竞态条件,导致竞态条件产生的代码区就是临界区。

预防竞态条件

        要预防竞态条件的产生,你要确保临界区的代码以原子指令执行。也就是说一次只有单一的线程去执行它,在这个线程执行完,离开临界区之前,没有其他的线程可以执行。

      竞态条件也可以通过临界区的线程同步来避免。线程同步可以采用java同步代码块、锁或者原子变量(java.util.concurrent.atomic.AtomicInteger)来实现 。

临界区吞吐量

对于较小的临界区,使得整个临界区一起同步工作。但是,较大的临界区分解成较小的临界区有可能会有好处,它允许多个线程在较小的临界区中执行,这样可以减少共享资源的竞争,提升整个临界区的吞吐量。

下面由简单的例子来说明,我想要表达的意思:

public class TwoSums{

    private int sum1 = 0;

    private int sum2 = 0;

    public void add(int val1,int val2){

         synchronized(this){

               this.sum1 +=val1;

               this.sum2 +=val2;

          }

     }

}

注意,这个add()方法把相加后的值赋给两个不同的变量。为了避免竞态条件,求和的代码在java的同步代码块中执行。通过这种方式,在同时执行这段代码时,只有一个线程执行求和操作。然而,由于两个求和参数是两个完全独立的变量,你可以把他们分散到两个同步代码块中去求和。就像下面一样:

public class TwoSums{

   private int sum1 = 0;

   private int sum2 = 0;

   private Integer sum1Lock  = new Integer(1);

   private Integer sum2Lock = new Integer(2);

   private void add(int val1,int val2){

         synchronized(this.sum1Lock){

               this.sum1 += val1;

         }

         synchronized(this.sum2Lock){

               this.sum2 += val2;

          }

   }

}

现在两个线程可以同时执行add()方法。其中一个线程进行第一个同步代码块,第二线程进入到第二个同步代码块,由于这两个同步代码对不同的对象进行同步操作,所以两个不同的线程可以各自独立的去执行这两个代码块。通过这种方式,线程可以尽量少的减少等待去执行add()方法。

这个例子非常简单,当然,在实际的运用中,共享资源可能分解可能更为复杂,需要更多的去分析他们执行顺序的可能性。

上一篇:HanLP分词工具中的ViterbiSegment分词流程


下一篇:HanLP-基于HMM-Viterbi的人名识别原理介绍