文章目录
一、数据链路层
1、熟悉 Ethernet 帧结构
- 首先打开wireshark软件,ctrl+E开始捕获
- 在Cmder输入命令,ping腾讯主页:
ping www.tencent.com
- 在wireshark中,ctrl+E停止捕获,设置过滤条件
ip.addr == 183.66.105.205
- 从图中我们可以看到
目的MAC:00:74:9c:9f:40:13
源 MAC :70:1c:e7:a3:da:18
类型:IPv4 (0x0800)
字段:17
字长:74 bytes (592 bits)
Wireshark 展现给我们的帧中没有校验字段的原因
- 在物理层上网卡要先去掉前导同步码和帧开始定界符,然后对帧进行CRC检验,如果帧校验和错,就丢弃此帧。如果校验和正确,就判断帧的目的硬件地址是否符合自己的接收条件,如果符合,就将帧交“设备驱动程序”做进一步处理。这时我们的抓包软件才能抓到数据,因此,抓包软件抓到的是去掉前导同步码、帧开始分界符、FCS之外的数据。
2、了解子网内/外通信时的 MAC 地址
- ping 旁边的计算机(同一子网)
ping 192.168.43.19
- 抓包结果
-
发出帧源MAC地址:70:1c:e7:a3:da:18
返回帧源MAC地址:1c:1b:b5:60:0e:b9
这个地址是处在同一子网里的该计算机的MAC地址 -
ping qige.io (或者本子网外的主机都可以)
ping qige.io
-
抓包结果
-
发出帧源MAC地址:70:1c:e7:a3:da:18
返回帧源MAC地址:00:74:9c:9f:40:13
这个地址是本主机所在子网的网关MAC地址。 -
再次 ping www.tencent.com (或者本子网外的主机都可以)
ping www.tencent.com
- 抓包结果
- 发出帧源MAC地址:70:1c:e7:a3:da:18
返回帧源MAC地址:00:74:9c:9f:40:13
这个地址是本主机所在子网的网关MAC地址。
通过以上的实验,你会发现:
访问本子网的计算机时,目的 MAC 就是该主机的
访问非本子网的计算机时,目的 MAC 是网关的
请问原因是什么?
- 当本机访问的是本子网的计算机,对方主机的MAC物理地址在表中,数据包无需离开本通信子网即可将传输数据传送到对方。
当本机访问的是非本子网的计算机,对方主机的MAC物理地址不在表中,数据包就需要离开本通信子网,传输数据要离开本通信子网,就要经过网关,因此,该目的MAC物理地址就是本网关的物理地址。
3、掌握 ARP 解析过程
- 为防止干扰,先使用 arp -d * 命令清空 arp 缓存,ping 旁边的计算机(同一子网),同时用 Wireshark 抓这些包(可 arp 过滤),查看 ARP 请求的格式以及请求的内容,注意观察该请求的目的 MAC 地址是什么。再查看一下该请求的回应,注意观察该回应的源 MAC 和目的 MAC 地址是什么。
- 发出帧,广播地址:ff:ff:ff:ff:ff:ff
回复时,是对方的MAC物理地址 - 再次使用 arp -d * 命令清空 arp 缓存
然后 ping qige.io (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 arp 过滤)。查看这次 ARP 请求的是什么,注意观察该请求是谁在回应。
回复的是子网的网关MAC地址。
通过以上的实验,你应该会发现,
ARP 请求都是使用广播方式发送的 如果访问的是本子网的 IP,那么 ARP 解析将直接得到该 IP 对应的 MAC;如果访问的非本子网的IP, 那么 ARP 解析将得到网关的 MAC。 请问为什么?
- 当本机访问的是本子网的计算机, ARP 解析将也是在本子网里进行,所以ARP解析得到是对方主机的MAC物理地址;
当本机访问的是非本子网的计算机,ARP 解析要经过网关,因此,该ARP 解析得到的目的MAC物理地址就是本网关的物理地址。
二、网络层
1、熟悉 IP 包结构
- 打开wireshark软件,ctrl+E开始捕获
- 在Cmder输入命令,ping腾讯主页:
ping www.tencent.com
- 抓包结果
- 从图中我们可以看到
版本:IPV4
头部长度:20 bytes
总体长度:60
存活时间TTL:128s
协议:ICMP
为提高效率,我们应该让 IP 的头部尽可能的精简。但在如此珍贵的 IP 头部你会发现既有头部长度字段,也有总长度字段。请问为什么?
- 头部长度是来表明该包头部的长度,可以使得接收端计算出报头在何处结束及从何处开始读数据。总长度是为了接收方的网络层了解到传输的数据包含哪些。
2、 IP 包的分段与重组
根据规定,一个 IP 包最大可以有 64K 字节。但由于 Ethernet 帧的限制,当 IP 包的数据超过 1500 字节时就会被发送方的数据链路层分段,然后在接收方的网络层重组。
缺省的,ping 命令只会向对方发送 32 个字节的数据。我们可以使用 ping 202.202.240.16 -l 2000 命令指定要发送的数据长度。此时使用 Wireshark 抓包(用 ip.addr == 202.202.240.16 进行过滤),了解 IP 包如何进行分段,如:分段标志、偏移量以及每个包的大小等
ping 202.202.240.16 -l 2000
- 抓包结果
- 分段标志是0x20
DF(不分段位):0表示允许分段,1则表示不允许分段
MF(更多段位),0表示后面没有包,1则表示后面还有其他包。
偏移量:Fragment Offset=0,表明该包位于数据流的0号位置。
包的大小:Total Length=1500,它包含IP包头部及数据两个部分。
分段与重组是一个耗费资源的操作,特别是当分段由传送路径上的节点即路由器来完成的时候,所以 IPv6 已经不允许分段了。那么 IPv6中,如果路由器遇到了一个大数据包该怎么办?
- IPv6中分段只能在源与目的地上执行,不能在路由器上进行。当数据包过大时,路由器就会直接丢弃该数据包包,并向发送端发回一个"分组太大"的ICMP差错报文,之后发送端就会使用较小长度的IP数据报重发数据。
3、考察 TTL 事件
在 IP 包头中有一个 TTL 字段用来限定该包可以在 Internet上传输多少跳(hops),一般该值设置为 64、128等。
在验证性实验部分我们使用了 tracert 命令进行路由追踪。其原理是主动设置 IP 包的 TTL 值,从 1 开始逐渐增加,直至到达最终目的主机。
请使用 tracert www.baidu.com 命令进行追踪,此时使用 Wireshark 抓包(用 icmp 过滤),分析每个发送包的 TTL 是如何进行改变的,从而理解路由追踪原理。
tracert www.baidu.com
- 抓包结果
路径上的每个路由器在转发数据包之前至少将数据包上的 TTL 递减 1,因此 Tracert 先发送 TTL 为 1 的回应数据包,并在随后的每次发送过程将 TTL 递增 1,直到目标响应或 TTL 达到最大值,从而确定路由。通过检查中间路由器发回的“ICMP 已超时”的消息确定路由。
在 IPv4 中,TTL 虽然定义为生命期即 Time To Live,但现实中我们都以跳数/节点数进行设置。如果你收到一个包,其 TTL 的值为 50,那么可以推断这个包从源点到你之间有多少跳?
- 跳数为128-50=78跳。
三、传输层
1、熟悉 TCP 和 UDP 段结构
- 用 Wireshark 任意抓包(可用 tcp 过滤),熟悉 TCP 段的结构,如:源端口、目的端口、序列号、确认号、各种标志位等字段。
- 源端口:54080
目的端口:80
序列号:0
确认号:0
标志位:0x002 - 用 Wireshark 任意抓包(可用 udp 过滤),熟悉 UDP 段的结构,如:源端口、目的端口、长度等。
- 源端口:57190
目的端口:53
长度:49
校验和:0x6071
由上大家可以看到 UDP 的头部比 TCP 简单得多,但两者都有源和目的端口号。请问源和目的端口号用来干什么?
- 源端口来表示发送终端的某个应用程序,目的端口来表示接收终端的某个应用程序。
2、分析 TCP 建立和释放连接
-
打开浏览器访问 qige.io 网站,用 Wireshark 抓包(可用 tcp 过滤后再使用加上 Follow TCP Stream),不要立即停止 Wireshark 捕获,待页面显示完毕后再多等一段时间使得能够捕获释放连接的包。
-
请在你捕获的包中找到三次握手建立连接的包,并说明为何它们是用于建立连接的,有什么特征。
-
第一次握手的标志位为SYN,代表客户端请求建立连接: Sep= 0
第二次握手由对方发回确认包,标志位为SYN,ACK:,ACK=0+1=1,Sep=0
第三次握手客户端再次发送确认包:ACK=0+1=1,Sep=1 -
请在你捕获的包中找到四次挥手释放连接的包,并说明为何它们是用于释放连接的,有什么特征
-
建立状态:ACK=1, seq=259
服务器确认:ACK=1,seq=259,ack=4382
服务器询问释放连接:FIN=1, ACK=1,seq=259,ack=4382
用户端回复:ACK=1,seq=4382,ack=260
去掉 Follow TCP Stream,即不跟踪一个 TCP 流,你可能会看到访问 qige.io时我们建立的连接有多个。请思考为什么会有多个连接?作用是什么?
- 这样的连接是为了允许多个用户访问。在业务频率不高的情况下,可以节省信道的使用,防止其长时间占用信道
我们上面提到了释放连接需要四次挥手,有时你可能会抓到只有三次挥手。原因是什么?
- 原因是将第二次、第三次挥手发出的包合并为了一个。
四、应用层
1、了解 DNS 解析
- 先使用 ipconfig /flushdns 命令清除缓存,再使用 nslookup qige.io 命令进行解析,同时用 Wireshark 任意抓包(可用 dns 过滤)。
你可能会发现对同一个站点,我们发出的 DNS 解析请求不止一个,思考一下是什么原因?
- 一个域名并不只有一台服务器主机,虽然域名相同,但每一台服务器的IP地址不同。
2、了解 HTTP 的请求和应答
-
打开浏览器访问 qige.io 网站,用 Wireshark 抓包(可用http 过滤再加上 Follow TCP Stream),不要立即停止 Wireshark 捕获,待页面显示完毕后再多等一段时间以将释放连接的包捕获。
-
请在你捕获的包中找到 HTTP 请求包,查看请求使用的什么命令,如:GET, POST。并仔细了解请求的头部有哪些字段及其意义。
-
GET:请求方法
Cache-Control:指定请求和响应遵循的缓存机制
Host:指定请求的服务器的域名和端口号
Connection:连接状态
Pragma:用来包含实现特定的指令
Accept:指定客户端能够接收的内容类型
User-Agent:User-Agent的内容包含发出请求的用户信息 -
请在你捕获的包中找到 HTTP 应答包,查看应答的代码是什么,如:200, 304, 404 等。并仔细了解应答的头部有哪些字段及其意义。
- 应答代码200,表示响应成功
Content-Length:内容长度
Content-Type:内容类型
Server:服务器
Date:时间
Connection:连接类型
刷新一次 qige.io 网站的页面同时进行抓包,你会发现不少的 304 代码的应答,这是所请求的对象没有更改的意思,让浏览器使用本地缓存的内容即可。那么服务器为什么会回答 304 应答而不是常见的 200 应答?
- 服务器对于浏览器的第一次应答对于浏览器来说已经有了缓存,因此浏览器第二次发送请求的时候,可以直接在缓存区获取到需要的内容,不需要服务器在回复对应的内容,可以减少服务器的一些工作,减小开销。