1. yolov3的backbone为darknet53,整个网络中是没有用到池化层和全连接层
2. Rectangular inference(矩形推理)/ training(矩形训练)
矩形推理就是为了加快网络训练与推理速度速度,因为yolov3在训练的时候会对我们输入的图像数据进行预处理,将图像缩放到416*416,再送到网络中进行训练。这样的话会产生很多无用的信息。
正常预处理
如图,我们看到,我们添加了很多对我们训练的干扰信息,存在很多信息的冗余,所以如果用到Rectangular
Rectangular
我们需要注意到,这个tirck确实能够减少信息的冗余,但是这样会导致不同的输入图像的尺寸在预处理后,一个bach中的图像长宽比会有很大的差别,yolov3为我们提供将比例相近的图片放在一个 batch,这样显然填充的就更少一些了。
同时矩形训练与dataloader中的shuffle不可共用,原理就不用多说了。
3. Attention机制
yolov3引入了SE注意力机制