您的位置: 首页 > 文章 > 【论文笔记】Generating Natural Adversarial Examples

【论文笔记】Generating Natural Adversarial Examples

分类: 文章 • 2024-01-21 13:51:04

Generating Natural Adversarial Examples. Zhengli Zhao, Dheeru Dua, Sameer Singh. ICLR 2018. decision[pdf][code]

文章目录

贡献
框架
解释样本
实验
结论

贡献

【论文笔记】Generating Natural Adversarial Examples

框架

【论文笔记】Generating Natural Adversarial Examples

【论文笔记】Generating Natural Adversarial Examples

【论文笔记】Generating Natural Adversarial Examples

解释样本

举例说明（使用算法1）
【论文笔记】Generating Natural Adversarial Examples

实验

【论文笔记】Generating Natural Adversarial Examples

结论

【论文笔记】Generating Natural Adversarial Examples
要点：

引入 $inverter$ （逆变器）。利用 $WGAN$ 策略训练出生成器 $G$ ，借助生成器训练逆变器 $I$ 。 $I$ 是 $G$ 的反向过程： $X——>Z$
输入空间&语义空间。不直接对输入样本进行扰动，而是借助隐层空间 $Z$ 。样本 $x$ 通过逆变器 $I$ 映射到该空间得到 $z'$ ，对 $z'$ 进行随机扰动得到 $z$ ^，然后通过生成器 $G$ 得到 $x$ ^{^}，使分类器原始标签发生变化。选择最接近 $z'$ 的 $z$ ^记作 $z*$ 。则对抗样本 $x* = G(z*)$ 。
随机扰动。提出两个搜索算法。算法一是由近及远进行搜索，每次按delta $r$ 扩大搜索范围。一次迭代随机采样 $N$ 个扰动，迭代次数越靠前与原样本的相似度就越高。该算法效率低。算法二是由远及近，每次迭代都要缩紧采样上界。在每次迭代中使用二分策略调整采样下界。该算法速度4倍于算法一，效果近似。但计算代价仍然高。
引入自编码器对离散的文本数据进行处理。编码成连续代码，解码成离散文本。
黑盒环境下，通过无标注的数据集衡量模型的鲁棒性（准确地说是准确率）。

思考：

文本：该方法+同义词选择方法+语言模型 = 高质量的对抗样本
该思想用于白盒环境下，结合梯度？