【JavaEE网络】网络编程及其应用概述

2024-04-29 07:04:54

在面向字节流的情况下，会产生一些其他的问题：粘包问题，这里“粘”的是“应用层数据报”，通过TCP read/write的数据，都是TCP报文的载荷，也就是应用层数据。
发送方一次性是可以发送多个应用层数据报的，但是接受的时候，如何区分，从哪里到哪里是一个完整的应用层数据报？如果没设计好，接收方就很难区分，甚至产生bug！

那么如何避免粘包问题呢？归根结底就是一句话，明确两个包之间的边界。

此处正确的做法，是合理地设计应用层协议，这件事本身在传输层这边已经无解了，需要站在应用层的角度，来解决这个问题

1.应用层协议中，引入分隔符，区分包之间的边界。

比如\n

2.应用层协议中，引入"包长度”，也能区分包之闻的边界。

比如使用最开头固定的2个字节表示包的长度，0x0003aaa

粘包问题不仅仅是TCP才有的，只要是面向字节流的机制（文件）也有同样的问题，解决方案也都是一样。要么使用分隔符，要么使用长度

TCP异常情况

网络本身就会存在一些变数，导致TCP连接不能继续正常工作了。以下是出现那些情况时TCP如何处理使其正常

进程崩溃

进程就没了=>PCB没了=>文件描述符表也就被释放了=>相当于调用了socket.close()，socket在系统内核也是一个文件，也会被放到文件描述符表中=>崩溃的一方就会发出FIN，进一步触发四次挥手，此时连接就正常释放了。此时TCP的处理和进程正常退出没啥区别

主机关机（正常步骤的关机）

正常关机，就会先尝试干掉所有的进程（强制终止进程），就和上述所说的崩溃的处理是一样的。主机关机会有一定的时间，在这个时间内四次挥手可能是挥完的，如果没挥完也没事

主机掉电（拔电源，没有任何反应的机会）

电脑瞬间黑了，此时自然就没有任何可以操作的空间了。

此处就涉及到"心跳包”，B这边虽然是接收方，也会周期性的给对方发起一个不携带任何业务数据(载荷)TCP数据报

发起这个包的目的，就是为了触发ACK，就是确认一下A是否正常工作/确认网络是否畅通.

网线断开

相当于主机掉电的升级版。

此时A和B就无法通信了
A这边发生的情况，就是主机掉电的第一种情况
B这边发生的情况，就是主机掉电的第二种情况

以上 TCP 介绍的十个核心的特性

确认应答(可靠性)
超时重传(可靠性)
连接管理(可靠性)
滑动窗口(效率)
流量控制(可靠性)
拥塞控制(可靠性)
延时应答(效率)
捎带应答(效率)
面向字节流 => 粘包问题(编程注意事项目)
异常情况处理 => 心跳包(异常情况)

TCP/UDP对比

我们说了TCP是可靠连接，那么是不是TCP一定就优于UDP呢？TCP和UDP之间的优点和缺点，不能简单，绝对的进行比较

TCP用于可靠传输的情况，应用于文件传输，重要状态更新等场景；

UDP用于对高速传输和实时性要求较高的通信领域，例如，早期的QQ，视频传输等。另外UDP可以用于广播；

网络层重点协议

在复杂的网络环境中确定一个合适的路径。

IP协议

协议头格式如下：

4位版本号（version）：指定IP协议的版本，对于IPv4来说，就是4。现有的IP协议只有两个版本，IPV4，IPV6

4位头部长度（header length）：IP头部的长度是多少个32bit，也就是 length * 4 的字节数。4bit表示最大的数字是15，因此IP头部最大长度是60字节。

IP报头是可变长的

IP报头又是带有选项的

此处单位也是4个字节

8位服务类型（Type Of Service）：3位优先权字段（已经弃用），4位TOS字段，和1位保留字段（必须置为0）。4位TOS分别表示：最小延时，最大吞吐量，最高可靠性，最小成本。这四者相互冲突，只能选择一个。对于ssh/telnet这样的应用程序，最小延时比较重要；对于ftp这样的程序，最大吞吐量比较重要。

最小延时：传输一个数据报的时间尽量短
最大吞吐量：一定时间内传输的数据量尽量多

最高可靠性：在传输过程中最不容易触发丢包

最小成本：在传输过程中消耗的硬件资源最低

16位总长度（total length）：IP数据报整体占多少个字节。IP报头 + 载荷的长度

16位标识（id）：唯一的标识主机发送的报文。如果IP报文在数据链路层被分片了，那么每一个片里面的这个id都是相同的。

3位标志字段：第一位保留（保留的意思是现在不用，但是还没想好说不定以后要用到）。第二位置为1表示禁止分片，这时候如果报文长度超过MTU，IP模块就会丢弃报文。第三位表示"更多分片"，如果分片了的话，最后一个分片置为1，其他是0。类似于一个结束标记。

13位分片偏移（framegament offset）：是分片相对于原始IP报文开始处的偏移。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值 * 8 得到的。因此，除了最后一个报文之外，其他报文的长度必须是8的整数倍（否则报文就不连续了）。

16位标识、3位标志字段、13位分片偏移：描述了整个 IP 数据报拆包组包的过程

8位生存时间（Time To Live，TTL）：数据报到达目的地的最大报文跳数。一般是64。每次经过一个路由，TTL -= 1，一直减到0还没到达，那么就丢弃了。这个字段主要是用来防止出现路由循环。

8位协议：表示上层（传输层）协议的类型。

16位头部校验和：使用CRC进行校验，来鉴别头部是否损坏。

32位源地址和32位目标地址：表示发送端和接收端。（数据部从哪来到哪去）

选项字段（不定长，最多40字节）：略。

IP地址

网络上有那么多主机，需要有办法描述主机的具体位置。IP地址就是解决这个问题的关键。

IP地址概念

IP地址（Internet Protocol Address）是指互联网协议地址，又译为网际协议地址。

IP地址作用

IP地址是IP协议提供的一种统一的地址格式，它为互联网上的每一个网络和每一台主机分配一个逻辑地址，以此来屏蔽物理地址的差异。

IP地址格式

IP地址是一个32位的二进制数，通常被分割为4个“8位二进制数”（也就是4个字节），如：01100100.00000100.00000101.00000110。

通常用“点分十进制”的方式来表示，即 a.b.c.d 的形式（a,b,c,d都是0~255之间的十进制整数）。如：100.4.5.6。

所谓的IP地址其实是一个32位的整数（4字节），表示方式：点分十进制。因为32位的方式表示很难记忆。点分十进制：使用三个.把32位分成4部分，每个部分就是8位，1字节，每个字节范围0-255（不带符号）

IP地址不够用了怎么办？[重点]

动态分配IP（DHCP）

你这个设备，不会一直需要上网，需要上网，就分配ip，不需要就先不分配。

这种方案，只能缓解，不能根治

NAT机制（网络地址转换）（理解网络结构的重点）

只需要保证在我所在的局域网内不重复即可，在别的局域网也可以使用这样的IP地址。此时，大量的设备可以使用同样的IP了（但是是在不同局域网中），此时 IP 不够用问题就得到了很大的改善了

但还是想了别的办法。把IP地址分成两大类：

内网IP：不同的局域网内的设备，内网 IP 可以重复；同一个局域网内的设备，内网 IP 不能重复

10.*

172.16.~172.31.

192.168.*

以上三种开头的是内网IP

外网IP：外网IP不能重复

局域网之间如何通信？

如果局域网内部的设备之间进行通信，肯定是可以的（局域网内部内网 ip 都是唯一的）
A局域网中的设备，想和 B 局域网中的设备通信，这个时候咋办？（当前很可能这俩设备的 ip 相同）

当前的规则是禁止的！要想通信，就需要有一个带有外网 IP 的设备进行中转

局域网内部的设备访问带有外网 IP 的设备

像平时使用的电脑，手机，都是在局域网内部使用，他们会有一个内网 IP

还有一类设备，是“服务器”，服务器可以有外网 IP

这个过程中，就涉及到 NAT 工作过程了

NAT机制下，意义在于说，一个外网IP代表的不一定是一个设备了，而是很多设备

上述过程是简化的，不太严谨。真实情况是，我的电脑的数据经过我家路由器，会进行 NAT，经过电信光猫，又有 NAT，经过电信路由器又有 NAT，（每次经历路由器转发，都“可能”会触发 NAT 机制，至于是否触发，取决于路由器咋配置的）

NAT机制的缺点：

效率不高
非常繁琐
不方便直接访问局域网内的设备

NAT最大的优点：纯软件实现（省钱）

IPv6（从根本上解决IP地址不够用的问题）

IPv4，是 4 个字节，32位，表示 IP 地址

IPv6，是 16 个字节，128 位，表示IP 地址

2^32=42亿左右

2^128次方=4个42亿相乘，这个数字足以支持我们把地球上的每一粒砂子都分配一个 IP 地址

但由于IPv4和IPv6不兼容，要想升级IPv6就要升级路由器设备=>花钱

相比之下，NAT方案只需要路由器开发商开发出新版本的软件(路由器固件)，升级软件，即可直接支持（成本非常低的）

IP地址的组成

IP地址分为两个部分，网络号和主机号

网络号：标识网段，保证相互连接的两个网段具有不同的标识；

主机号：标识主机，同一网段内，主机之间具有相同的网络号，但是必须有不同的主机号；

通过合理设置网络号和主机号，就可以保证在相互连接的网络中，每台主机的IP地址都是唯一的。

同一个局域网中设备的网络号必须相同，主机号必须不同
两个相邻的局域网，网络号必须不同

那么，如何划分网络号和主机号呢？

通过子网掩码识别

cmd后输入 ipconfig /all 就能找到

子网掩码和 IP 地址一样，也是 4 字节，32 位的整数。左侧必须是连续的 1，右侧必须是连续的 0

分类

过去曾经提出一种划分网络号和主机号的方案，把所有IP 地址分为五类

码农公寓