最原始的Inception模块
思路是对输入的feature map进行多尺度卷积核的并行计算,然后把结果进行汇总、融合。
缺点
不同尺度 filter 生成的feature map摞起来以后会越来越厚,最后导致参数量爆炸!
Note:
- 对于一个RGB图像,如 256×256×3 来说。256×256是这张图片的尺寸,我们看到的RGB图片其实是由 3 张单色的图片(单通道图片)摞在一起形成的。所以说,对于第一层卷积,我们的filter个数就代表了我们可以提取到多少张 单通道 图片,所以生成的feature map的通道数=filter的个数。
改进后的Inception模块(使用了1×1卷积)
我们要注意 1×1 卷积的位置:
- 卷积之前
- 池化之后
优点(参数量前后对比)
使用了 1×1 卷积,参数量仅为原来的一小半。
1×1卷积的作用:
- 升维/降维
- 跨通道信息交流
- 减少参数量(减少一半的参数量)
- 增加模型深度,提高模型的非线性表达能力
使用改进的Inception模块构建GoogLeNet网络
GoogLeNet中两个辅助的分类器
GoogLeNet和VGG-16参数的对比
GoogLeNet的参数量仅为VGG-16的 8.37%
GoogLeNet为2014年ImageNet图像分类冠军
VGG为2014年ImageNet图像分类亚军