Multi-Adversarial Domain Adaptation

前面我们介绍完domain adaptation
论文链接:Multi-Adversarial Domain Adaptation
下面我们来看一篇论文《Multi-Adversarial Domain Adaptation》发表在2018年的AAAI上面,作者是清华大学龙明盛老师的学生。

在阅读过程中翻译了部分论文,在这也一并贴出。

论文翻译:
摘要
最近在深度域适应方面的进展表明,对抗性学习可以嵌入到深度网络中,以学习可转移的特征,从而减少源域和目标域之间的分布差异。现有的基于单域鉴别器的域对抗性自适应方法只对源和目标数据分布进行对齐,而没有利用复杂的多模结构。本文提出了一种多对抗性域自适应算法(MADA)方法,该方法捕获多模式结构,以支持基于多个域鉴别器的不同数据分布的细粒度对齐。利用线性时间内的反向传播计算梯度,通过随机梯度下降实现自适应。实证结果表明,该模型在标准域自适应数据集上的性能优于现有方法。
介绍
深度网络,当在大规模标记数据集上训练时,可以学习可转移的表示,这在不同的任务和应用领域中通常是有用的。然而,由于一种称为数据集偏置或域转移的现象,在一个大数据集中使用这些深度表示训练的预测模型不能很好地推广到新的数据集和任务。典型的解决方案是在特定于任务的数据集上进一步微调这些网络,然而,收集足够的标记数据来正确地微调高容量的深层网络常常代价高昂。因此,有很强的动机建立有效的算法,通过利用来自不同但相关的源域的现成标记数据来减少标记消耗。然而,这种有希望的迁移学习范式受到跨不同领域的数据分布变化的影响,这对使分类模型适应目标任务造成了主要障碍。

现有的迁移学习方法假设共享标签空间和不同的特征分布在源和目标域中。这些方法在不使用目标标签的情况下,通过学习域不变的特征表示,在不同的域之间架起桥梁,从源域学习的分类器可以直接应用于目标域。最近的研究表明,深度神经网络可以通过分解域背后变化的解释因素,学习到更多可转移的领域适应特征。最新的进展是通过在深度特征学习管道提取域不变表示。

最近,对抗性学习已经成功地嵌入到深层网络中,以学习可转移的特征,减少源域和目标域之间的分布差异。域对抗适应方法是性能最好的深层架构之一。这些方法主要对整个源分布和目标分布进行对齐,而不考虑数据分布下复杂的多模结构。其结果是,不仅来自源域和目标域的所有数据会被混淆,而且区分结构也会被混淆,从而导致错误的对齐对应不同分布的判别结构,直观示例如图1所示。因此,像前面一样匹配整个源和目标域没有利用判别结构的方法可能不适用于不同的领域适应场景。

实现域适应存在两个技术挑战:(1)通过最大限度地匹配跨域数据分布的多模式结构来增强正迁移;(2)通过防止跨域分布中模式的错误对齐来减轻负迁移。在这些挑战的激励下,我们提出一种多对抗域自适应(MADA)方法,它捕获多模式结构,以支持基于多个域鉴别器的不同数据分布的细粒度对齐。与以前的方法相比,一个关键的改进是能够同时促进相关数据的正迁移和减轻不相关数据的负迁移。利用线性时间内的反向传播计算梯度,通过随机梯度下降实现自适应。经验证据表明,提出的MADA方法在标准领域适应基准上优于现有方法。
相关工作
迁移学习连接了不同的领域或任务,减轻了机器学习、计算机视觉和自然语言处理的手工标记的负担。迁移学习的主要技术难点是在形式上减少跨领域的分布差异。深度网络可以学习抽象表示,分离数据背后不同的解释变量的解释因子,并显示出不同种群下的不变因子,这些不变因子能够很好地从原始任务转移到类似的新任务。因此,研究人员探索了用于转移学习的深层网络,multimodal和multi-task learning,与之前的浅迁移学习方法相比,该方法取得了显著的性能提升。

然而,最近的研究表明,深度网络可以学习抽象的特征表示,这只能减少而不能消除跨域差异。近期的一些工作架起了深度学习和领域适应的桥梁,将深度卷积网络(CNNs)扩展到域自适应,通过增加自适应层来匹配分布的平均嵌入;或通过添加子网络作为领域识别器,而学习到的深层特征在领域对抗训练范式中混淆了识别器。虽然性能得到了显著提高,但由于没有利用区分结构和复杂的多模结构对不同分布进行细粒度对齐,这些现有的方法可能会受到限制。

对抗性学习在生成对抗性网络(GANs)中已被探索用于生成建模。最近GANs解决了几个难点,如放松训练,避免模式崩溃。特别是生成式多对手网络(GMAN)将GANs扩展到包括强大的对手和宽容的老师在内的多个甄别者,极大地简化了模型训练,增强了分布匹配。
多对抗域适应
然而,在实际的领域适应问题中,源域和目标域的数据分布往往包含复杂的多模结构,既反映了监督学习中的类边界,也反映了非监督学习中的聚类边界。因此,以往的域对抗性自适应方法只匹配数据分布而不利用多模态结构,容易出现传输不足或负传输的情况。当分布的不同模式不能最大程度地匹配时,可能会发生迁移。当跨域分布的对应模式不正确对齐时,可能会发生负迁移。为了促进正迁移和对抗负迁移,我们应该找到一种技术来揭示多模态结构的潜在分布可以进行多对域自适应。


解析:

我们知道,在domain adaptation中存在两个挑战:
(1)加强正向转移
通过最大限度地匹配跨域底层数据分布的多模结构
(2)缓解负迁移
通过防止跨域不同分布模式的错误对齐

原来我们的domain adaptation是用一个域判别器来对样本进行判断,这篇论文提出将1个判别器变成k个判别器,总共有k个类,一个域判别器对一个类别进行判断。
Multi-Adversarial Domain Adaptation
但是总共有k个判别器,当你输出这个特征的时候,我们怎么知道把这个特征交给哪一个判别器进行判断呢?作者提出我们用一个概率进行衡量,其中每个数据点Multi-Adversarial Domain Adaptation仅由相关的域判别器根据其概率Multi-Adversarial Domain Adaptation进行匹配。
损失函数:
在domain adaptation中对域进行分类的损失是一个域判别器的损失,由于在MADA中提出了k个域判别器,这里我们对k个域判别器的损失进行相加。
Multi-Adversarial Domain Adaptation
Multi-Adversarial Domain Adaptation
这种方法的好处:
Multi-Adversarial Domain Adaptation结论:
Multi-Adversarial Domain Adaptation
参考文章:《小王爱迁移》系列之十一:部分迁移学习