VGG 论文笔记

1. 网络结构:

VGG 论文笔记除去大小为1×1的卷积核,其他卷积核都是3×3 ,步长为1,填充为2; 池化层都是2×2,步长为2,填充为0

也就是说,卷积层都不改变图像的尺寸,池化层会让图的尺寸缩小一半

VGG 论文笔记

 

2. VGGNet改进点总结

1. 使用了更小的3*3卷积核,和更深的网络。两个3*3卷积核的堆叠相对于5*5卷积核的视野,三个3*3卷积核的堆叠相当于7*7卷积核的视野。这样一方面可以有更少的参数(3个堆叠的3*3结构只有7*7结构参数数量的(3*3*3)/(7*7)=55%);另一方面拥有更多的非线性变换,增加了CNN对特征的学习能力。

2. 在VGGNet的卷积结构中,引入1*1的卷积核,在不影响输入输出维度的情况下,引入非线性变换,增加网络的表达能力,降低计算量。

3. 训练时,先训练级别简单(层数较浅)的VGGNet的A级网络,然后使用A网络的权重来初始化后面的复杂模型,加快训练的收敛速度。

4. 采用了Multi-Scale的方法来训练和预测。可以增加训练的数据量,防止模型过拟合,提升预测准确率。
 

参考博客:VGG-论文解读_abc_138的博客-CSDN博客_vgg

上一篇:VGG图像分类卷积神经网络


下一篇:带你读论文系列之计算机视觉--VGG