JVM的IO选择
查JVM源码时刚好看到JVM库的一段代码:
public static SelectorProvider create() {
String osname = AccessController.doPrivileged(
new GetPropertyAction("os.name"));
if ("SunOS".equals(osname)) {
return new sun.nio.ch.DevPollSelectorProvider();
}
// use EPollSelectorProvider for Linux kernels >= 2.6
if ("Linux".equals(osname)) {
String osversion = AccessController.doPrivileged(
new GetPropertyAction("os.version"));
String[] vers = osversion.split("\\.", 0);
if (vers.length >= 2) {
try {
int major = Integer.parseInt(vers[0]);
int minor = Integer.parseInt(vers[1]);
if (major > 2 || (major == 2 && minor >= 6)) {
return new sun.nio.ch.EPollSelectorProvider();
}
} catch (NumberFormatException x) {
// format not recognized
}
}
}
return new sun.nio.ch.PollSelectorProvider();
}
如果2.6版本以后的都用了epoll,那基本上就不必刻意用AIO了。
说说IO
阻塞IO
它是经典的一种通信模式,在通信过程中读和写操作都是阻塞的,而阻塞期间处理线程不可用于其他任务的执行。从A机器到B机器它的通信过程是:A机器一条线程对socket写数据,写完后等待对方数据,B机器一条线程对该socket读数据后往A机器写数据,接着再等待A机器下次传输数据过来,不断循环此交互操作直到完成通信。这个过程可以看到A机器和B机器负责读写的线程都是写完读完就进入等待状态,这种方式就是阻塞IO模式。
非阻塞IO
阻塞使机器利用率很低,因为任何一个连接读写都可能挂起cpu。所以提供了一种非阻塞IO,执行线程先判断某个连接是否可读或可写,只有可读或可写的连接才会被执行具体的读写操作,这样执行线程就不会被挂起cpu了,线程一直都在遍历所有的连接,机器利用率起来了。
事件驱动非阻塞IO
然而直接对连接的遍历是很耗cpu的,当连接数量大起来遍历也是一个重操作。所以操作系统内核继续改良,提供一种基于事件驱动的非阻塞IO,核心思想是应用进程将关注的事件列表告诉内核,系统内核会把可读可写的连接对应更新应用进程关注的事件列表,应用进程遍历事件列表即可得知哪些连接可用,内核负责维护事件列表,应用进程得到事件列表后对相应的连接做详细读写操作。
异步IO
异步IO更像另外一种风格,它是内核每当有某个连接可读可写就调用该连接对应的回调函数,而并非更新事件列表。