Java线程(二):线程同步synchronized和volatile

上篇通过一个简单的例子说明了线程安全与不安全,在例子中不安全的情况下输出的结果恰好是逐个递增的(其实是巧合,多运行几次,会产生不同的输出结果),为什么会产生这样的结果呢,因为建立的Count对象是线程共享的,一个线程改变了其成员变量num值,下一个线程正巧读到了修改后的num,所以会递增输出。

要说明线程同步问题首先要说明Java线程的两个特性,可见性和有序性。多个线程之间是不能直接传递数据交互的,它们之间的交互只能通过共享变量来实现。拿上篇博文中的例子来说明,在多个线程之间共享了Count类的一个对象,这个对象是被创建在主内存(堆内存)中,每个线程都有自己的工作内存(线程栈),工作内存存储了主内存Count对象的一个副本,当线程操作Count对象时,首先从主内存复制Count对象到工作内存中,然后执行代码count.count(),改变了num值,最后用工作内存Count刷新主内存Count。当一个对象在多个内存中都存在副本时,如果一个内存修改了共享变量,其它线程也应该能够看到被修改后的值,此为可见性。多个线程执行时,CPU对线程的调度是随机的,我们不知道当前程序被执行到哪步就切换到了下一个线程,一个最经典的例子就是银行汇款问题,一个银行账户存款100,这时一个人从该账户取10元,同时另一个人向该账户汇10元,那么余额应该还是100。那么此时可能发生这种情况,A线程负责取款,B线程负责汇款,A从主内存读到100,B从主内存读到100,A执行减10操作,并将数据刷新到主内存,这时主内存数据100-10=90,而B内存执行加10操作,并将数据刷新到主内存,最后主内存数据100+10=110,显然这是一个严重的问题,我们要保证A线程和B线程有序执行,先取款后汇款或者先汇款后取款,此为有序性。本文讲述了JDK5.0之前传统线程的同步方式,更高级的同步方式可参见Java线程(八):锁对象Lock-同步问题更完美的处理方式

下面同样用代码来展示一下线程同步问题。

TraditionalThreadSynchronized.java:创建两个线程,执行同一个对象的输出方法。

  1. public class TraditionalThreadSynchronized {
  2. public static void main(String[] args) {
  3. final Outputter output = new Outputter();
  4. new Thread() {
  5. public void run() {
  6. output.output("zhangsan");
  7. }
  8. }.start();
  9. new Thread() {
  10. public void run() {
  11. output.output("lisi");
  12. }
  13. }.start();
  14. }
  15. }
  16. class Outputter {
  17. public void output(String name) {
  18. // TODO 为了保证对name的输出不是一个原子操作,这里逐个输出name的每个字符
  19. for(int i = 0; i < name.length(); i++) {
  20. System.out.print(name.charAt(i));
  21. // Thread.sleep(10);
  22. }
  23. }
  24. }

运行结果:

  1. zhlainsigsan

显然输出的字符串被打乱了,我们期望的输出结果是zhangsanlisi,这就是线程同步问题,我们希望output方法被一个线程完整的执行完之后再切换到下一个线程,Java中使用synchronized保证一段代码在多线程执行时是互斥的,有两种用法:

1. 使用synchronized将需要互斥的代码包含起来,并上一把锁。

  1. {
  2. synchronized (this) {
  3. for(int i = 0; i < name.length(); i++) {
  4. System.out.print(name.charAt(i));
  5. }
  6. }
  7. }

这把锁必须是需要互斥的多个线程间的共享对象,像下面的代码是没有意义的。

  1. {
  2. Object lock = new Object();
  3. synchronized (lock) {
  4. for(int i = 0; i < name.length(); i++) {
  5. System.out.print(name.charAt(i));
  6. }
  7. }
  8. }

每次进入output方法都会创建一个新的lock,这个锁显然每个线程都会创建,没有意义。

2. 将synchronized加在需要互斥的方法上。

  1. public synchronized void output(String name) {
  2. // TODO 线程输出方法
  3. for(int i = 0; i < name.length(); i++) {
  4. System.out.print(name.charAt(i));
  5. }
  6. }

这种方式就相当于用this锁住整个方法内的代码块,如果用synchronized加在静态方法上,就相当于用××××.class锁住整个方法内的代码块。使用synchronized在某些情况下会造成死锁,死锁问题以后会说明。使用synchronized修饰的方法或者代码块可以看成是一个原子操作

每个锁对(JLS中叫monitor)都有两个队列,一个是就绪队列,一个是阻塞队列,就绪队列存储了将要获得锁的线程,阻塞队列存储了被阻塞的线程,当一个线程被唤醒(notify)后,才会进入到就绪队列,等待CPU的调度,反之,当一个线程被wait后,就会进入阻塞队列,等待下一次被唤醒,这个涉及到线程间的通信,下一篇博文会说明。看我们的例子,当第一个线程执行输出方法时,获得同步锁,执行输出方法,恰好此时第二个线程也要执行输出方法,但发现同步锁没有被释放,第二个线程就会进入就绪队列,等待锁被释放。一个线程执行互斥代码过程如下:

1. 获得同步锁;

2. 清空工作内存;

3. 从主内存拷贝对象副本到工作内存;

4. 执行代码(计算或者输出等);

5. 刷新主内存数据;

6. 释放同步锁。

所以,synchronized既保证了多线程的并发有序性,又保证了多线程的内存可见性。

volatile是第二种Java多线程同步的机制,根据JLS(Java LanguageSpecifications)的说法,一个变量可以被volatile修饰,在这种情况下内存模型(主内存和线程工作内存)确保所有线程可以看到一致的变量值,来看一段代码:

  1. class Test {
  2. static int i = 0, j = 0;
  3. static void one() {
  4. i++;
  5. j++;
  6. }
  7. static void two() {
  8. System.out.println("i=" + i + " j=" + j);
  9. }
  10. }

一些线程执行one方法,另一些线程执行two方法,two方法有可能打印出j比i大的值,按照之前分析的线程执行过程分析一下:

1. 将变量i从主内存拷贝到工作内存;

2. 改变i的值;

3. 刷新主内存数据;

4. 将变量j从主内存拷贝到工作内存;

5. 改变j的值;

6. 刷新主内存数据;

这个时候执行two方法的线程先读取了主存i原来的值又读取了j改变后的值,这就导致了程序的输出不是我们预期的结果,要阻止这种不合理的行为的一种方式是在one方法和two方法前面加上synchronized修饰符:

  1. class Test {
  2. static int i = 0, j = 0;
  3. static synchronized void one() {
  4. i++;
  5. j++;
  6. }
  7. static synchronized void two() {
  8. System.out.println("i=" + i + " j=" + j);
  9. }
  10. }

根据前面的分析,我们可以知道,这时one方法和two方法再也不会并发的执行了,i和j的值在主内存中会一直保持一致,并且two方法输出的也是一致的。另一种同步的机制是在共享变量之前加上volatile:

  1. class Test {
  2. static volatile int i = 0, j = 0;
  3. static void one() {
  4. i++;
  5. j++;
  6. }
  7. static void two() {
  8. System.out.println("i=" + i + " j=" + j);
  9. }
  10. }

one方法和two方法还会并发的去执行,但是加上volatile可以将共享变量i和j的改变直接响应到主内存中,这样保证了主内存中i和j的值一致性,然而在执行two方法时,在two方法获取到i的值和获取到j的值中间的这段时间,one方法也许被执行了好多次,导致j的值会大于i的值。所以volatile可以保证内存可见性,不能保证并发有序性。

没有明白JLS中为什么使用两个变量来阐述volatile的工作原理,这样不是很好理解。volatile是一种弱的同步手段,相对于synchronized来说,某些情况下使用,可能效率更高,因为它不是阻塞的,尤其是读操作时,加与不加貌似没有影响,处理写操作的时候,可能消耗的性能更多些。但是volatile和synchronized性能的比较,我也说不太准,多线程本身就是比较玄的东西,依赖于CPU时间分片的调度,JVM更玄,还没有研究过虚拟机,从顶层往底层看往往是比较难看透的。在JDK5.0之前,如果没有参透volatile的使用场景,还是不要使用了,尽量用synchronized来处理同步问题,线程阻塞这玩意简单粗暴。另外volatile和final不能同时修饰一个字段,可以想想为什么。

本文来自:高爽|Coder,原文地址:http://blog.csdn.net/ghsau/article/details/7424694

上一篇:利用ADO让普通人用excel读取oracle数据库表的通用办法


下一篇:利用Python网络爬虫爬取学校官网十条标题