实例分割

性能

模型 性能 评价
solov2 ResNet-101 and deformable convolutions achieves 41.7% in AP on COCO test-dev (without multi-scale testing). A light-weight version of SOLOv2 executes at 31.3 FPS on a single V100 GPU and yields 37.1% AP. 在Res101和可形变卷积上精度为41.7%,实际使用效果应该会大幅缩水。

SOLD:

主要思想:

利用位置信息来进行实例分割,将原图大致分为S*S个矩形框,分别对每个框进行分类和分割预测。流程如图:实例分割
输出共有两个分支,上面分支预测类别信息,输出尺寸为S * S * C:S为原图预设的分割矩形框数目;C为类别个数。下面分支预测实例mask,输出为H * W * S2 ,通道数S2对应原图所分的每个块,预测为该块对应的完整实例mask。

关键点:

  1. CoorConv:为不同通道输出的特征图引入空间位置信息。
  2. Local Loss 和 Dice Loss
  3. nms的矩阵实现:Matric NMS

solov2

主要优化的部分为mask生成分支

实例分割
图a为原始的solo网络maks分支,直接生成H * W * S2的预测特征图;图b为一种x和y方向上的解耦操作,作者发现x和y方向上的预测是相对独立的;图c为位置相关的一种解耦操作,上面分支预测S * S个anchor参数,每个anchor对下面分支进行卷积操作都会生成一张特征图,共可生成S2个,接下来就与图a一致了。