写在前面:这段时间在学习 lwip 协议栈,阅读了朱升林老师编著的《LwIP 深度剖析与实战演练》 ,很经典的一本书,强推。
LwIP协议栈的学习笔记与总结这里暂时不写,该文章纪录工作中我所解决的网络 bug。
组播 bug
bug 表现:
在不执行网卡绑定操作之前,网卡可以接受组播报文,在执行网卡绑定操作之后,网卡无法接受组播报文。
bug 分析:
通过与写网卡驱动的好朋友沟通交流(本人不会写网卡驱动),得知网卡如果想要接受组播报文的话,那么需要开启混杂模式,所以,猜测,在网卡绑定过程中,或者绑定网卡开启组播过程中更改了网卡的硬件设置,而没有开启混杂模式。
bug 解决:
在网卡的抽象结构 struct netif 中,存在一个 igmp_mac_filter
成员,如下:
该成员是一个函数指针,在进入一个组播组,也就是发送 IGMP membership report 报文时会调用该函数;
在离开一个组播组,也就是发送 IGMP Leave-group message 报文时,也会调用该成员指向的函数。
而出现这个 bug 的原因就是系统在编写网卡封装层时,错误的编写了 igmp_mac_filter
指向的函数。
在该函数中,按照逻辑,在进入一个组播组时,需要开启混杂模式,在离开组播组时,需要撤销刚刚开启的混杂模式(如果本来就没有开启的话)。
而现实是,系统封装的该函数在判断当前正在加入一个组播组时,没有进行检查混杂模式是否开启,如果没有开启就开启混杂模式的操作,所以导致 bug 的出现。
修改 igmp_mac_filter
指向的函数的代码逻辑,问题解决。