Object Region Mining with Adversarial Erasing论文笔记


之前写的一些笔记,可能有些观点参考过其他博主,欢迎认领,侵删,转载请注明出处,谢谢

Abstract

  1. 提出一种对抗擦除的方法定位目标区域
  2. 为了提高发现的区域质量,提出一种**online prohibitive segmentation learning(PSL)**方法

Introduction

难点

如何为图像中的每个像素分配类标签,实现end-to-end分割图像

方法概述

为建立类标签和像素信息的对应关系,可将以往的方法分成proposal-basedclassification-based两类:

  1. proposal-based:通常会对生成的建议进行详细的检查,非常耗时
  2. classification-based
    利用一个分类模型来选择most discriminative region,并利用这些区域作为语义分割学习的像素级标注,但是,分类模型往往依赖于small and sparse discriminative region,它偏离了分割任务的要求

本文提出的Adversarial erasing(AE)方法

  1. 目的:使分类模型学习更加完整的目标区域
  2. 作用:建立一系列competitors,试图挑战分类网络使之不断发现特定类别的evidences
  3. 过程
    (1) 利用image-level label训练图像分类网络
    (2) 擦除分类网络发现的区域,从而破坏分类网络的性能,使其再去定位另外一个区域以正确分类。重复上述过程直至不能发现其他区域
    (3) 将擦除的区域进行合并得到pixel-level语义分割mask,用于训练分割模型
  4. 存在问题及解决方案
    (1) 可能会遗失一些object-related regions还有可能引入噪声
    (2) 提出一种==互补的线上prohibitive segmentation learning(PSL)==方法辅助AE方法提取更加完整的object regions
    (3) PSL使用predicted image-level 分类可信度来调制相应的类别特定响应图,并将其形成一个辅助的分割mask,该mask可以在线更新。禁止可信度较低的分割图,可以有效地降低噪声

Contribution

  • Adversarial Erasing framework
  • PSL method

Related Work

  1. 多示例学习(Multi-Instance Learning)、期望最大值(Expectation Maximization)算法、Constrained CNN
  2. Simple to Complex方法、SEC
  3. 同SEC相比,AE方法可获得dense object-related regions
  4. AugFeed方法利用GrabCut和选择性搜索方法生成了像素级标注

Proposed Method

框架

Object Region Mining with Adversarial Erasing论文笔记

Object Region Mining with AE

Object Region Mining with Adversarial Erasing论文笔记

  1. first operation:通过最小化平方标签预测损失来训练分类网络
  2. second operation:
    (1) 使用==类**映射(CAM)==方法为每个image-level label生成heatmap
    (2) 对heatmap进行阈值化得到discriminative object regions
    (3) 将该区域擦除并将processed image再次喂入分类模型中参与训练
  3. 重复上述过程直至没有其他区域能够辅助模型分类预测

online PSL for semantic segmentation

Object Region Mining with Adversarial Erasing论文笔记

  1. 理解:在线PSL方法利用图像分类结果识别可靠的类别分割图,形成噪声较小的辅助监控图,同时进行线上更新为AE的输出提供可靠的辅助信息。
  2. 过程
    (1) 建立了一个包含两个分支的框架,一个用于分类,另一个用于语义分割
    (2) 使用平方损失作为分类分支的优化目标,其产生的分类置信度被用于对特定类别的分割score maps进行加权
    (3) 将分类结果集成到分割mask上,抑制低置信度的分割图参与预测,从而缓解噪音的问题

Experiments

  • PASCAL VOC 2012数据集用于验证
  • 条件随机场(CRF)用于后处理
  • mIoU VOC2012数据集 test 55.7