Rotation equivariant vector field networks
提出Rotation Equivariant Vector Field Networks(RotEqNet,旋转等变向量场网络) ,对CNN网络的旋转不变性进行改进。
输入网络的图像如果旋转,输出辨别的是否也会旋转
开始做实验是出现对三种不同的图像期望出现三种不同的结果:
1.同变性;2没有变化;3协方差在定位中
卷积:图片 ,卷积核:
有两种方法说明旋转不变性或者旋转等变性:1特征旋转2滤波器旋转
方法1:在样本中加入旋转图像的样本,在第一次全连接之前让CNN学习全连接的特征来获取旋转不变性
优点:不用改变网络,只改变数据。
缺点:只能考虑输入图像的旋转变化
适合用于图像的分类
RotEqNet 基于CNN构建另外的模块来处理本地的方向信息
方法2:旋转滤波器: 通过可以学习的pooling对特征进行操作
他们通过有选择地采样少量旋转来避免在(高维)特征映射上彻底地应用滤波器。
在较深的层上使用 避免了在前期使用时丢失了重要信息
但旋转的方向有限
RotEqNet解决了这一问题:
滤波器w 以不同间隔旋转
先对图像进行m/2的零填充,
w进行旋转,然后进行双线插值 R为旋转的个数
在旋转之后有部分值到矩阵之外,导致只有部分值用于计算
旋转过后的w的梯度:
Z包含两个向量u,v ,分别表示水平和垂直 ,特征被映射成矢量形式
w滤波器也增加一维:
对于pooling层:
对于激活函数RrLu:
经过激活层后的特征:
这里用了maxpooling:
对矢量z进行标准化:
RotEqNet虽然模型较小,但需要更多的滤波器进行卷积操作,对于minst 普通的只需4个 而RotEqNet需要17个 带来的是要更大的内存和运算时间