【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

磕头了各位,就我天天往楼层弱电间和中心机房跑

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

问题背景:

  在XX楼,学校清理了两个房间作为新工作室,该楼的网段起初分配为VLAN90-98网段,管理员查看配置发现95网段是空着的无人使用,决定将新工作室使用95网段进行上网,配置了接入交换机对应端口为vlan95以及将信息点的跳线接到对应接入交换机的45、46端口,在测试机上配置好IP地址后却结果发现数据无法联通,ping不通网关地址254。

 

大致网络拓扑结构:

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

 

开始问题排查:

1.因为测试无法到达网关,首先在二层数据流经处排查问题

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

检查接入交换机的配置,在接入处配置了vlan,在上联接口配置了trunk,放行了vlan95

[XX楼接入交换机]display current-configuration
#
interface GigabitEthernet1/0/45
 port access vlan 95
#
interface GigabitEthernet1/0/46
 port access vlan 95
#
interface Ten-GigabitEthernet1/0/49
 port link-type trunk
 undo port trunk permit vlan 1
 port trunk permit vlan 95

 

检查vlan,没有问题

[XX楼接入交换机]display vlan br
95        VLAN 0095                        GE1/0/38  GE1/0/45 GE1/0/46
                                          XGE1/0/49  XGE1/0/50  XGE1/0/51
                                          XGE1/0/52


由于对整体网络结构的不了解,通过lldp检查邻居,寻找上行设备为汇聚交换机

[XX楼接入交换机]display lldp neighbor-information list
Chassis ID : * -- -- Nearest nontpmr bridge neighbor
             # -- -- Nearest customer bridge neighbor
             Default -- -- Nearest bridge neighbor
Local Interface Chassis ID      Port ID                    System Name
XGE1/0/49       00be-d5f2-f5e2  Ten-GigabitEthernet1/0/6   XX楼汇聚交换机

 

 

2.检查上联汇聚交换机

再次通过lldp检查上下联邻居,检查连接的端口,可以看到上联通过端口聚合连接到核心交换机

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

[XX楼汇聚交换机]display lldp neighbor-information list
Chassis ID : * -- -- Nearest nontpmr bridge neighbor
             # -- -- Nearest customer bridge neighbor
             Default -- -- Nearest bridge neighbor
Local Interface Chassis ID      Port ID                    System Name
XGE1/0/6        00be-d5fa-8fc4  Ten-GigabitEthernet1/0/49  XX楼接入交换机
XGE1/0/23       084f-0ace-5300  XGigabitEthernet1/2/0/0    核心交换机
XGE1/0/24       084f-0ace-5300  XGigabitEthernet2/2/0/0    核心交换机

 

检查配置,上下连接的端口均为trunk且放行了vlan95

[XX楼汇聚交换机]display current-configuration
#
interface Ten-GigabitEthernet1/0/6
 port link-type trunk
 port trunk permit vlan 95
#
interface Ten-GigabitEthernet1/0/23
 port link-type trunk
 port trunk permit vlan 95
#
interface Ten-GigabitEthernet1/0/24
 port link-type trunk
 port trunk permit vlan 95
#

 

3.找到问题!

由于少部分管理网段的网关在核心上,而大部分业务网段的网关是配置在汇聚上面的,我查询了汇聚上的vlanif接口地址,发现vlan95的网关地址居然不在该台汇聚交换机上,91-98其余的网关均在上面,和一旁的管理员再次沟通确认了一下,他跟我确认是91-98网关都在的,我只好表达质疑,继续排

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

[XX楼汇聚交换机]display ip interface brief
*down: administratively down
(s): spoofing  (l): loopback
Interface           Physical Protocol IP address      VPN instance Description
Vlan91              up       up      xxx.xxx.xxx.xxx  --           --
Vlan92              up       up      xxx.xxx.xxx.xxx  --           --
Vlan93              up       up      xxx.xxx.xxx.xxx  --           --
Vlan94              up       up      xxx.xxx.xxx.xxx  --           --
Vlan96              up       up      xxx.xxx.xxx.xxx  --           --
Vlan97              up       up      xxx.xxx.xxx.xxx  --           --
Vlan98              up       up      xxx.xxx.xxx.xxx  --           --

 

 

 

 

4.检查核心交换机的配置,检查三层流量走向

跟管理员申请了权限,登录核心设备上查看了相关配置。

既然汇聚上网关不在上面,那就需要通过排查三层数据走向找到vlan95的网关在哪一台上面了。直接检查了核心设备上的路由表,可以看到95的静态路由指向的下一跳是隔壁楼汇聚交换机,那么问题就很好解决了

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

<核心交换机>display ip routing-table
Route Flags: R - relay, D - download to fib
------------------------------------------------------------------------------
Routing Tables: Public
         Destinations : 155      Routes : 155
Destination/Mask    Proto  Pre  Cost      Flags NextHop         Interface
 
   x.x.95.0/24  Static 60   0          RD  x.x.x.x(隔壁楼汇聚交换机)  Vlanifxxx

 

lldp看一下邻居,确认一下连接的接口,毕竟核心设备,我一个学生,不敢乱动

<核心交换机>display lldp neighbor brief
Local Intf    Neighbor Dev             Neighbor Intf             Exptime(s)
XGE1/2/0/0    XX楼汇聚交换机           Ten-GigabitEthernet1/0/23 110
XGE1/2/0/7    隔壁楼汇聚交换机         Ten-GigabitEthernet1/0/24 104
XGE2/2/0/0    XX楼汇聚交换机           Ten-GigabitEthernet1/0/24 113
XGE2/2/0/7    隔壁楼汇聚交换机         Ten-GigabitEthernet1/0/23 105

 

 

5.找到vlan95的网关设备了,打通数据流经的trunk

确认vlan95的网关在隔壁楼的汇聚上了,这证实了网络管理员手里的信息有误

[隔壁楼汇聚交换机]display ip interface brief
*down: administratively down
(s): spoofing  (l): loopback
Interface           Physical Protocol IP address      VPN instance Description
Vlan95              up       up      x.x.x.95.x  --          --


设置标签

 

再次确认lldp上与核心设备相连的端口

[隔壁楼汇聚交换机]display lldp neighbor-information list
Chassis ID : * -- -- Nearest nontpmr bridge neighbor
             # -- -- Nearest customer bridge neighbor
             Default -- -- Nearest bridge neighbor
Local Interface Chassis ID      Port ID                    System Name
XGE1/0/23       084f-0ace-5300  XGigabitEthernet2/2/0/7    核心交换机
XGE1/0/24       084f-0ace-5300  XGigabitEthernet1/2/0/7    核心交换机

 

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

配置连接的端口trunk,放行vlan95

[隔壁楼汇聚交换机]display current-configuration
interface Ten-GigabitEthernet1/0/23
 port link-mode bridge
 port link-type trunk
 port trunk permit vlan 95
#
interface Ten-GigabitEthernet1/0/24
 port link-mode bridge
 port link-type trunk
 port trunk permit vlan 95

 

在核心设备上的端口trunk,放行vlan95

<核心交换机>display lldp neighbor brief
Local Intf    Neighbor Dev             Neighbor Intf             Exptime(s)
XGE1/2/0/7    隔壁楼汇聚交换机    Ten-GigabitEthernet1/0/24 104
XGE2/2/0/7    隔壁楼汇聚交换机    Ten-GigabitEthernet1/0/23 105

 打通trunk

<核心交换机>display current-configuration
#
interface Eth-Trunk5
 port link-type trunk
 port trunk allow-pass vlan 95
#
interface XGigabitEthernet1/2/0/7
 eth-trunk 5
#
interface XGigabitEthernet2/2/0/7
 eth-trunk 5
#

 【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

ping通了,收工

完工小结:

  其实我只做了两个步骤,找到vlan95网关地址所在,然后打通所有trunk的放行。解决过程其实也很简单,排完错甚至有点无大语,学校管理员自信满满的认为业务网关没有问题,压根没往这方向去想。但是暴露了不少问题,在网络实施时很多基础的配置具体下发的时候,没有好好的做一个检查就验收存档了,或者是之前对配置又改动了,也没又记录下来,导致了这次排了半天还以为是什么stp问题,环路啊啥的。不过按照网络规划的初衷,这个95网段的网关不应该在隔壁楼的汇聚上面,后续我应该会把网关迁移到本楼的汇聚上。

【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

上一篇:selenium-->文件上传


下一篇:《Docker进阶与实战》——第3章理解Docker镜像