数据从一台主机发送到网络中的另一台主机需要经过很多步骤,先得有相互沟通的意向,然后得有物理渠道(物理链路),其次双方还得有语言能够交流,且步调要一致。
TCP状态转化
如图,是TCP/IP 的握手过程,当我们在压测一个网络程序的时候,可能会遇到CPU,网卡,带宽等都不是瓶颈,但是性能就是压不上去的情况,如果观察一下网络链接情况,查看当前网络连接都处于什么状态,就会发现可能是由于网络链接的并发数不够导致连接都处于TIME_WAI状态,这时就需要做TCP网络参数调优了。
影响网络传输的因素
将数据从一个地方正确的传输到另一个 地方所需要的时间,我们称为响应时间,影响响应时间的因素就很多了。
- 网络带宽---------影响数据传输的关键环节
- 传输距离---------数据在光纤中的移动不是走直线,会有一个折射率,大概是光的2/3 左右
- TCP拥塞控制--------TCP传输是一个停等停等的协议,双方要步调一致,就要通过拥塞控制来调节。
Java Socket 的工作机制
主机A 的应用程序要和主机B的应用程序通信,必须通过Socket建立连接,而建立Socket连接必须由底层TCP/IP来建立TCP连接。建立TP连接需要底层IP来寻址网络中的主机,网络层的IP可以帮助我们根据IP地址来寻找目标主机,但是一个主机可以运行多个应用程序, 那么与指定应用程序通信就要通过TCP或UDP的地址,即端口号来指定。这样就可以通过一个Socket 实例来唯一代表一个主机上的应用程序的通信链路了。
建立通信链路
当客户端要与服务器通信时,客户端首先要创建一个Socket实例,操作系统会为这个Socket实例分配一个没有被使用的本地端口号,并创建一个包含本地地址,远程地址和端口号的套接字数据结构,这个数据结构将会一直保存在系统中直到这个链接被关闭。在创建Socket实例的构造函数正确返回之前,将要进行TCP的三次握手协议,TCP握手协议完成后,Socket实例对象将会被创建完成,否则会抛出IOException错误。
与之对应的服务器端会创建一个ServerSocket 实例,创建ServerSocket 比较简单,只要指定的端口号没被占用,一般都会创建成功。同时操作系统也会为ServerSocket 实例创建一个底层数据结构在这个数据结构中,包含指定监听的端口号和监听地址的通配符,通常情况下是 * ,即监听所有地址,之后调用accept() 方法时,将进入阻塞状态,等待客户端的请求。当一个新的请求来时,将为这个连接创建一个新的套接字数据结构, 该套接字数据结构的信息包含的地址和端口信息正是请求源地址和端口。这个新创建的数据结构将会关联到ServerSocket 实例的一个未完成的连接数据结构列表中,这时服务端的与之对应的Socket 实例并没有完成创建,而要等到与客户端的三次握手完成后,这个服务端的Socket才会返回,并将这个Socket 实例对应的数据结构从未完成列表中移到已完成列表中。 所以,与 ServerSocket 所关联的列表中每个数据结构都代表与一个客户端所建立的TCP连接。
数据传输
Socket 如何进行数据传输?
- 当连接已经建立的时候,服务端和客户端都会有一个Socket 实例,每个Socket 实例都会有一个InputStream 和OutputStream,并通过这两个对象来交换数据。
- 网络I/O 都是以字节流传输的,所以当创建Socket对象时,系统会将为InputStream 和OutputStream分别分配一定大小的缓存区,数据的写入和读取都通过缓存区完成。
- 写入端将数据写入到OutputStream对应的SendQ 队列中,当队列填满时,数据将会被转移到另一端InputStream的RecvQ中,如果RecvQ填满了,那么OutputStream的write()会阻塞。直到RecvQ队列有足够的空间容纳SendQ发送的数据。
- 缓存区的大小以及写入端的速度和读取端的速度非常影响这个连接的数据传输效率,由于可能会发生阻塞,所以网络I/O和磁盘I/O不同的是,数据的读取和写入还要有个协调的过程,如果两边同时传送数据,则可能会发生死锁。如何避免这种情况? 后面又引进了NIO的工作方式。