yolo

https://www.bilibili.com/video/BV1yi4y1g7ro?p=2

讲的不错

yolo

 

 v2框架

v3框架:

yolo

 

 深度拼接,

而FPN是在对应维度上进行相加。

 

 

one stage存在正负样本不均衡问题:

yolo

 

RPN把正负样本占比限制在1:3

yolov5创新点:

yolov4采用了Mosaic数据增强方式,yolov5延续。

yolov3,yolov4中,训练不同数据集中的初始锚框是单独运行的结果,yolov5中集成化,自适应计算不同训练集的最佳锚框值  https://zhuanlan.zhihu.com/p/172121380

yolov5首次采用focus结构。

以yolov5s结构为例,原始608*608*3的图像输入Focus结构,采用切片操作,先变成304*304*12的特征图,再经过一次32个卷积核的卷积操作,最终变成304*304*32的特征图。

 

Yolov4网络结构中,借鉴了CSPNet的设计思路,在主干网络中设计了CSP结构。

yolo

Yolov5与Yolov4不同点在于,Yolov4中只有主干网络使用了CSP结构。

而Yolov5中设计了两种CSP结构,以Yolov5s网络为例,CSP1_X结构应用于Backbone主干网络,另一种CSP2_X结构则应用于Neck中。

yolo

 

 

Neck上采用了FPN+PAN的结构,cspnet,增加了特征融合能力。

 

上一篇:AI大视觉(十) | Yolo v3中关于交叉熵与均方差损失函数的思考


下一篇:YOLO---YOLOv3 with OpenCV 再使用