sface

单步检测方法分为两类:anchor-based如ssd、RetinaNet;2)Anchor-free 如DenseBox、UnitBox;anchor-based处理的尺度范围虽小,更精准;anchor-free范围较大,但检测微小尺度的能力低下。
anchor-based和anchor-free方法的输出在定位方式和置信度得分方面差异显著。
anchor-based方法,ground truth IOU >=0.5锚点被视为正训练样本。锚点框住的区域是人脸的置信度,而不是网络预测的回归框内是人脸。
anchor free方法,网络训练方式类似于目标分割任务。输出的特征图以边界框中心为圆心,半径与边界框尺度成比例的椭圆区域被定义为正样本区域。分类置信度得分实质是像素落在人脸上的置信度。
SFACE 将回归的边界框架和ground truth边界框之间的IOU当作Classfication Subnet 的ground truth 。

FLOPs 39M的Backbone,

Face Attention Network: An Effective Face Detector for the Occluded Faces
segmentation mask 或者saliency map。retinaNet,FAN选择增加一个segmentation分支,对于学到的score map ,做一个exp把 取值范围从[0,1]放缩到[1,e],然后乘以原有的特征图。sefmentation 分支只叠加了2个conv3*3,loss 采用sigmoid cross entropy.
FAN的分层Attention

U-shape 能融合丰富的特征信息和high-level的语义信息。retinaNet(FPN+ResNet).retinaNet包括两个subnet,一个用于f分类,另一个用于回归。
anchor assign strategy
在FAN中,共有5个detector layers,每一个都有特定的scale anchor.另外anchor的长宽比都是1和1.5.论文统计了widerface人脸像素大小占比,用于调整anchors的大小。
attention function
为了解决遮挡的问题,提出了novel anchor-level attention.
可以近似为加了一个segment的branch
data augmentation
提出了随机crop策略,来模拟训练数据的遮挡。we also employ augmentation from random flip and color jitter.

上一篇:页面每次加载时重新获取css文件


下一篇:ZetCode PyQt4 tutorial widgets II