您的位置: 首页 > 文章 > 论文笔记--Adversarial examples in the physical world (2016).

论文笔记--Adversarial examples in the physical world (2016).

分类: 文章 • 2024-05-01 08:46:41

思路

证明通过手机拍摄的图像也会被错误分类，即手机照片的对抗性仍然存在，使用ImageNet Inception分类器。

原图像到对抗样本的转换公式，对z值加扰动，x原图像，三通道的图片，只在Z方向上加の。
论文笔记--Adversarial examples in the physical world (2016).

一、对Z添加扰动的两种方法

（1）快速方法FGSM：
论文笔记--Adversarial examples in the physical world (2016).
（2）基本迭代方法BIM：
对每个像素使用小步长，clip之后的像素是原来的邻居，a=1，每步改变1。

对抗性生成目标类的标准：

通过在梯度方向上迭代来使得log损失最大。
噪声添加过多人眼不能正常识别，迭代方法添加的扰动更细小。
の扰动>128时不能正确分类，16时认为是小噪声。

二、对抗样本不起作用的概率（被破坏）公式

n是对抗样本数，Xk数据集，Xadv对抗图像，
ytrue正确分类的图像，C()函数，是否正确分类
论文笔记--Adversarial examples in the physical world (2016).

三、结论

1、FGSM生成的对抗样本的鲁棒性最好。
操作：对图片打印，拍照和剪切。

表1是正确分类的准确率，其中fast最低，攻击效果最好，而两种迭代效果不好。
表2是预过滤后分类的分类情况。
表3中预过滤的对抗样本损坏率更高，说明迭代方法为了保证置信度，丢弃了较多的损坏对抗样本。

2、人工修改对抗样本

对比度和亮度：无影响；
高斯模糊，高斯噪声和JPEG编码：最高80%损坏，没有达到100%。