在CS231n里讲到现在也在逐渐不使用 pooling,因为发现完全可以使用
-
一个 stride 不等于1的卷积来代替pooling,
**另外,不少工作,如生成模型(generative models)、对抗网络(adversarial networks)、变分自动编码器(variational autoencoders ,VAEs),发现用stride不等于1的卷积来代替 pooling 带来的优势。
常用的几种pooling:
- max:反向过程会记录当时正向时最大值的位置,反向则最大值位置不变,其他位置填补0;
- average:反向过程会将正向的平均值,以平均的形式分摊到每个位置;
**stochastic:反向一样记录正向时时被随机选中的位置,该位置值不变,其他位置填补0。