[paper]SPATIALLY TRANSFORMED ADVERSARIAL EXAMPLES

本文提出了一种基于空间变换(spatially transformed)(smooth image deformation)的对抗样本生成算法。(LpL_p距离较大,但图像更真实更不容易被检测)
之前的生成算法大多是将LpL_p范数作为损失函数,然后直接调整像素值。

两个重要因素
1)图片亮度和质量
2)几何关系

先前的大多数对抗攻击都建立在改变亮度和质量的基础上,同时假设在对抗扰动生成过程中图片的几何关系保持不变。

算法:
最小化空域局部形变,而不是传统的像素值LpLp 距离。具体地,设输入图像为xx,输出的对抗样本为xadvx_adv,每个像素的位移场为ff,则x(r)=xadv(r+f)x(r)=x_adv(r+f),由于图像的空间是离散的,因此这里使用了双线性插值,而该操作是可微的。如下图所示:
[paper]SPATIALLY TRANSFORMED ADVERSARIAL EXAMPLES
[paper]SPATIALLY TRANSFORMED ADVERSARIAL EXAMPLES
xadvix_{adv}^{i}表示图像第ii个像素的像素值
(uadvi,uadvi)(u_{adv}^{i},u_{adv}^{i})表示对抗图像xadvx_{adv}的坐标
N(ui,ui)N(u^{i},u^{i})是第ii个像素的四个相邻像素点 (top-left, top-right, bottom-left, bottom-right)的索引

优化目标:
[paper]SPATIALLY TRANSFORMED ADVERSARIAL EXAMPLES
其中Ladv(x,f)=max(maxit  g(xadv)ig(xadv)t,k)L_{adv}(x,f)=max(\underset{i\neq t}{max}\ \ g(x_{adv})_i-g(x_{adv})_t,k)g(z)g(z)表示模型的logits输出,tt 为目标类别,kk 是置信水平
较高的置信水平能保证生成对抗样本的鲁棒性。
最小化空间变换ff可以确保stAdv具有较高的感知质量。

为了计算fflowf_{flow},需要计算任意两个相邻像素的空间移动距离之和。
[paper]SPATIALLY TRANSFORMED ADVERSARIAL EXAMPLES

we enforce the locally smooth spatial transformation perturbation LowL_{flow} based on the total variation. Intuitively, minimizing the spatial transformation can help ensure the high perceptual quality for stAdv, since adjacent pixels tend to move towards close direction and distance.