【迁移攻击笔记】梯度平滑攻击!UNDERSTANDING AND ENHANCING THE TRANSFERABILITY OF ADVERSARIAL EXAMPLES
1.主要内容
①研究了:网络结构、大小和精度,loss梯度的局部平滑性 对 迁移率 的影响。
②提出了局部光滑方法:用各个点周围的梯度代替各个点本身的梯度。(防止边界过抖影响迁移率)
2.Introduction:
①对抗转移是不对称的,模型A生成的对抗实例很容易转移到模型B,反之可能不成立。(我觉得这一点很好解释,大边界到小边界很好转移,反之不行,不知道为什么作者说这一点说明边界相似性没法解释)
②在大多数情况下,多步攻击比一步攻击更有效。
③大模型产生的对抗性例子比小模型产生的对抗性例子更不具有可转移性。
④损失曲面的局部非光滑性损害了所生成的对抗性样本的可转移性。因此提出variance-reduced attack,用局部平均梯度代替原始梯度来生成对抗性样本。由于局部平均具有抑制loss曲面局部振荡的平滑效应,因此我们称之为variance-reduced attack。此方法也可以与ensemble-based和momentum-based结合。
3.实验证明
①单步/多步效果差不太多:
②精度越高可迁移性更好:③网络越深可迁移性越差:
4.variance-reduced attack与实验验证:
边界梯度的不平滑导致迁移性降低:采用周围梯度的期望:
用平均梯度近似上述过程:
各种实验验证 / 与ensemble和momentum结合 / 对此方法超参数进行调整:
希望路过这儿的你可以关注我一下~~我会定期更新一系列阅读笔记和总结,加入自己的见解和思路,希望能对你有用~