1、数据增强改进(马赛克,穿个马甲照样认出你)
2、标签平滑(原来不是猫就是狗,现在九分猫,七分狗)
3、传统IOU如果没交,那么为0,梯度消失。改进引入了C(C可以把groudtruth和预测框包起来)的公式,可以让不重叠的时候,预测框朝真实框前进。因为不同位置GIOU和IOU相同,引入DIoU,就是两个框中心点的距离,C框对角线之间的距离加入到公式中,问题解决。最终用的CIoU,就是这个损失函数中加入了长宽比(真实和预测框的长宽比是否一致)
4、soft-nms 不符合的降降分,最后核算的时候合格的还要
5、CSPNet channel(特征图)一半原来下传,另一半不断。拼接,优点快,精度略微提升
6、CBAM 加入注意力机制:给每个特征图权重(就是重要程度),一张特征图中的点/位置也有重要与否之分,也加入进去
V4中用的SAM,就是只用了位置那部分注意力机制,因为计算量问题
7、网络中将Max-Pooling/Average-Pooling去掉,直接连Convolution+SAM
8、PAN—类似maskrcnn,从顶到底,用p层的捷径,从底向上。特征拼接代替加法
9、不用relu(太绝对)用Mish(再能给一次机会),计算量增加,效果会提升