LAFEAT: Piercing Through Adversarial Defenses with Latent Features论文解读
2023-11-08 12:45:10
摘要
在这篇文章中,我们展示了特定“robust“模型中的隐变量特征对于对抗攻击来说是非常易受攻击的。基于这一点,我们提出了一个统一的
l
∞
−
n
o
r
m
l_{\infty}-norm
l∞−norm白盒攻击算法LAFEAT,这个算法在梯度下降过程中利用隐变量特征。我们展示了这种算法不仅执行成功计算时计算复杂度更低,并且它也是对一系列防御机制下,相比于目前SOTA的一个强力的adversary。这提示我们模型的robustness