RoI Pooling两次量化误差

参考:https://www.jianshu.com/p/670a3e42107d

候选框从原图坐标映射到的feature map坐标时,位置坐标可能存在浮点数,此时进行取整操作从而出现第一次量化;其次,在ROI Pooling求取每个小网格的位置时也同样存在浮点数取整的情况。这两次量化的结果都使得候选框的位置出现了偏差。

 

RPN推荐128个rois(对于原图的坐标),当和feature一起传入 Fast-RCNN时,rois的坐标会映射到 feature map上,按照缩放因子,rois坐标会缩放16,然后把rois缩放后映射在 feature map 上的框进行一个 roi pooling(这里rois坐标可能是浮点型,但是feature map上是整形,会有精度损失)。比如 feature map 为 36x49(wxh),rois中一个坐标映射为(xmin=15,ymin=17,xmax=29,ymax=30)但是要输出 7x7,就是rois会分成7*7个小网格,每个小网格的大小bin_w,bin_h多少?为:bin_w = ((29-15)/7) = 2 bin_h = ((30-17)/7) = 1.85(这里有小数,所以会掉丢小数,会有精度损失)所以,w分为7*2,h分为 7*x,因为算下来感觉应该是6个2*1+1个2*7,应该如下所示,同种 颜色代表同个bin单元:

RoI Pooling两次量化误差

 

上一篇:bert 三种pooling策略对比


下一篇:分割网络模型(FCN、Unet、Unet++、SegNet、RefineNet)