https://www.bilibili.com/video/BV1yi4y1g7ro?p=2
讲的不错
v2框架
v3框架:
深度拼接,
而FPN是在对应维度上进行相加。
one stage存在正负样本不均衡问题:
RPN把正负样本占比限制在1:3
yolov5创新点:
yolov4采用了Mosaic数据增强方式,yolov5延续。
yolov3,yolov4中,训练不同数据集中的初始锚框是单独运行的结果,yolov5中集成化,自适应计算不同训练集的最佳锚框值 https://zhuanlan.zhihu.com/p/172121380
yolov5首次采用focus结构。
以yolov5s结构为例,原始608*608*3的图像输入Focus结构,采用切片操作,先变成304*304*12的特征图,再经过一次32个卷积核的卷积操作,最终变成304*304*32的特征图。
Yolov4网络结构中,借鉴了CSPNet的设计思路,在主干网络中设计了CSP结构。
Yolov5与Yolov4不同点在于,Yolov4中只有主干网络使用了CSP结构。
而Yolov5中设计了两种CSP结构,以Yolov5s网络为例,CSP1_X结构应用于Backbone主干网络,另一种CSP2_X结构则应用于Neck中。
Neck上采用了FPN+PAN的结构,cspnet,增加了特征融合能力。