目录
概
本文介绍AUGMIX算法——对现有的的一些augmentation方法进行混用, 并构建了一个新的损失函数.
主要内容
其中\(\mathrm{Dirichlet}\)为狄利克雷分布.
通过实验指出, Augmentation的混用(增加样本的多样性)以及损失函数的设计都是有利于稳定性以及不确定度的.
\[\mathbf{JS}(p_{orig};p_{augmix1};p_{augmix2}) = \frac{1}{3} (\mathbf{KL}[p_{orig}\|M]+\mathbf{KL}[p_{augmix_1}\| M] + \mathbf{KL}[p_{augmix_2}\| M]), \]
其中\(M:= (p_{orig} + p_{augmix1}+p_{augmix2})/3\).
实验的指标
Clean Error: 指在干净样本上的错误率;
\(E_{c,s}\): 指在困难等级\(1 \le s \le 5\), 污染(摄动, corruption) \(c\)下的错误率;
\(CE_c = \sum_{s=1}^5E_{c,s}/ \sum_{s=1}^5 E_{c,s}^{\mathrm{Alexnet}}\);
\(mCE\): \(\mathrm{mean}_{c} \: CE_{c}\);
flip probability (FP): 微小摄动下, 样本预测类改变的概率; 如何估计?
\(mFP\): the mean flip probability (对于所有的\(c\)); -衡量鲁棒性;
\(mFR\): \(mFP\) 比上 Alexnet 的\(mFP\) ;
不确定估计:
\[\sqrt{\mathbb{E}_C [\mathbb{P}(Y = \hat{Y} | C=c)-c)^2]}, \]
其中\(C\)为预测\(\hat{Y}\)正确的\(confidence\)(如果输出是一个概率向量, 那么就应当是对应类别的概率), 采用如下方式估计:
其中\(B_i\), 是我们按照confidence的序来将测试样本分割为\((B_1, B_2, \ldots, B_b)\).