多线程概念的引入是人类又一次有效压寨计算机的体现,而且这也是非常有必要的,因为一般运算过程中涉及到数据的读取,例如从磁盘、其他系统、数据库等,CPU的运算速度与数据读取速度有一个严重的不平衡,期间如果按一条线程执行将会在很多节点产生阻塞,使计算效率低下。另外,服务器端是java最擅长的领域,作为服务器必须要能同时响应多个客户端的请求,同样需要多线程的支持。在多线程情况下,高并发将带来数据的共享与竞争问题,tomcat作为中间件将多线程并发等细节尽量封装起来处理,使用户对多线程透明,更多地关注业务处理即可。但如果想要深入剖析tomcat我们有必要深入了解多线程并发技术,此章节将介绍多线程并发的一些底层原理及JDK并发包的实现的相关知识,并不会对所有具体的并发类的使用方法进行介绍,针对一些在Tomcat中使用的类会稍微详细阐述。
1、Java内存模型——JMM
在多核时代,如何提高CPU的性能成为了一个永恒的话题,而这个话题的讨论主要就是如何定义一个高性能的内存模型,内存模型用于定义处理器的各层缓存与共享内存的同步机制及线程和内存交互的规则。
Java的世界也有属于它自己的内存模型,Java内存模型,即Java Memory Model,简称JMM。由于Java被定义成一种跨平台的语言,所以在内存的描述上面也要能是跨平台的,Java虚拟机试图定义一种统一的内存模型,能将各种底层硬件及操作系统的内存访问差异进行封装,使Java程序在不同硬件及操作系统上都能达到相同的并发效果。它描述了程序中各个变量之间的关系,包括实例域、静态域、数据元素及在实际计算机系统中将变量存储到内存和从内存中取出变量的底层细节。
为更好理解JMM的工作机制,由图2-5-1-1带入,从整体上看有几个比较重要的主体,主存、工作内存、变量、变量副本、线程等。首先看主存与工作内存及他们的关系,主存保存了java程序的所有变量,当然这个变量不包括局部变量和方法参数,而工作内存则包含了这些变量的副本;其次是线程与工作内存的关系,每个线程都有一个属于自己的工作内存,不同线程之间的工作内存是互相不可见的,且线程对变量的操作也只能是针对自己的工作内存;最后是关于线程之间的通信机制,由于线程直接不可直接传递,假如一条线程对一个变量进行重新赋值,那么只能通过如下途径让另外一条线程知道,线程一将变量改变反应到主存中,线程二再从主存中读取,这样就基本完成了线程之间的通信了。
JMM定义额八个操作来完成工作内存与主存的通信。假如一条线程准备对一个变量进行新的赋值操作,它可能会先用lock操作锁住主存中的某个变量(不让其他线程获得此变量的锁,直至使用unlock操作释放该变量的锁),接着使用read操作将变量从主存独到工作内存,紧接着load操作将得到的变量值放到工作内存中的变量副本,use操作则将变量值传给线程执行引擎进行运算操作,assign操作把新的变量值从线程执行引擎中传递到工作内存,继续往下,store操作则把变量值从工作内存传送到主存中,接着write操作将得到的值写入主存相应的变量中,最后使用unlock操作释放变量的锁。
图2-5-1-1 java内存模型JMM
Java内存模型具有三个特性:原子性、可见性和有序性。
① 原子性,java内存模型保证了read、load、assign、use、store、write六个操作具有原子性,我们可以认为除了long和double类型外,对其他基本数据类型所对应的内存单元的访问读写都是原子的。但由于这个原子性的颗粒度太小,通常情况下我们需要更大颗粒度的原子性,这时就需要用锁来保证了。
② 可见性,在java内存模型中,简单说如果一条线程更改了共享变量的值,而其他线程能马上知道这个更改,我们则说这个变量具有可见性。一般来说有四种方式能保证变量的可见性,分别为volatile、synchronized、final和锁。首先谈谈volatile,被此关键词声明的变量,每当有任何更改时都将立即同步到主存中,而每个线程要使用这个变量时都要重新从主存刷新到工作内存,这样就确保了变量的可见性(当然,普通变量最终也会同步到主存,再由主存同步到每个线程的工作内存,只是这个最终可能比较“长久”,不能保证可见性);由于synchronized底层也是通过锁进行实现,所以synchronized和锁的本质是一样的,当一个线程释放一个锁时,将会强制刷新工作内存中的变量值到主存中,而当另一个线程获取此锁的时候将会强制重新装载此变量值,当然这两个线程获取的是同一个锁,这样就保证了变量的可见性;被final声明的变量一旦完成初始化,其他线程就能看到这个final变量。其实,可见性其实可以看成是一种机制,线程在进入/退出同步块程序时,它将发送/接收一个变量的更改。
③ 有序性,有序性指在线程内看方法的执行,所有的指令都是有序的,都按照一种串行方式执行,而在线程内观察其他线程,所有指令都是无序的,指令都可能交叉执行。Java中提供了volatile和synchronized两个关键词保证线程之间操作的有序性,而这个有序性仅仅是相对的,volatile禁止指令重排序,synchronized则保证持有同一个锁的同步块只能串行运行。
JMM可以说是Java的基础,它的定义将直接影响JVM及java多线程实现的机制,要想深入了解多线程并发中的相关问题现象,对Java内存模型的深入研究是必不可少的。它的定义必须考虑下面几个方面,其一是如何更加有效地提高线程的性能效率;其二是如何将底层物理硬件及操作系统的差异屏蔽掉提供统一的对外概念;最后是如何使它的模型既严谨又宽松,保证语义不会产生歧义和一些优化扩展。