实例分割
性能
模型 | 性能 | 评价 |
---|---|---|
solov2 | ResNet-101 and deformable convolutions achieves 41.7% in AP on COCO test-dev (without multi-scale testing). A light-weight version of SOLOv2 executes at 31.3 FPS on a single V100 GPU and yields 37.1% AP. | 在Res101和可形变卷积上精度为41.7%,实际使用效果应该会大幅缩水。 |
SOLD:
主要思想:
利用位置信息来进行实例分割,将原图大致分为S*S个矩形框,分别对每个框进行分类和分割预测。流程如图:
输出共有两个分支,上面分支预测类别信息,输出尺寸为S * S * C:S为原图预设的分割矩形框数目;C为类别个数。下面分支预测实例mask,输出为H * W * S2 ,通道数S2对应原图所分的每个块,预测为该块对应的完整实例mask。
关键点:
- CoorConv:为不同通道输出的特征图引入空间位置信息。
- Local Loss 和 Dice Loss
- nms的矩阵实现:Matric NMS
solov2
主要优化的部分为mask生成分支
图a为原始的solo网络maks分支,直接生成H * W * S2的预测特征图;图b为一种x和y方向上的解耦操作,作者发现x和y方向上的预测是相对独立的;图c为位置相关的一种解耦操作,上面分支预测S * S个anchor参数,每个anchor对下面分支进行卷积操作都会生成一张特征图,共可生成S2个,接下来就与图a一致了。