yolo

2023-12-28 08:26:52

讲的不错

v2框架

v3框架：

深度拼接，

而FPN是在对应维度上进行相加。

one stage存在正负样本不均衡问题：

RPN把正负样本占比限制在1：3

yolov5创新点：

yolov4采用了Mosaic数据增强方式，yolov5延续。

yolov3,yolov4中，训练不同数据集中的初始锚框是单独运行的结果，yolov5中集成化，自适应计算不同训练集的最佳锚框值　　https://zhuanlan.zhihu.com/p/172121380

yolov5首次采用focus结构。

以yolov5s结构为例，原始608*608*3的图像输入Focus结构，采用切片操作，先变成304*304*12的特征图，再经过一次32个卷积核的卷积操作，最终变成304*304*32的特征图。

Yolov4网络结构中，借鉴了CSPNet的设计思路，在主干网络中设计了CSP结构。

Yolov5与Yolov4不同点在于，Yolov4中只有主干网络使用了CSP结构。

而Yolov5中设计了两种CSP结构，以Yolov5s网络为例，CSP1_X结构应用于Backbone主干网络，另一种CSP2_X结构则应用于Neck中。

Neck上采用了FPN+PAN的结构，cspnet，增加了特征融合能力。

码农公寓