医学分割论文:Multi-scale guided attention for medical image segmentation

目前存在的问题：

多尺度方法（encoder-decoder）会导致多次提取相似的低级特征，造成信息冗余
long-range feature dependencies are not efficiently modeled, resulting in nonoptimal discriminative feature representations associated with each semantic class. 宏观/整体特征没有得到有效建模，导致无法得到与之相关联的语义类（低级别标签）的最优特征表示

针对以上问题，作者提出了：使用引导式的自我注意力机制来获取更丰富的上下文信息来克服这些限制，该方法能够将局部特征与其对应的全局特征结合起来，并以自适应的方式突显之间的相互依赖关系。此外，通过附加损失函数来引导注意力机制忽略无关信息并聚焦于图像的鉴别区域

不同于常规的静态表示，注意力机制可以在无需额外监督的情况下集中于最相关的特征，避免了相似特征间的映射。在分割任务中，与常规的均值池化和最大值池化相比，注意力机制可调高多尺度预测性能

医学分割论文:Multi-scale guided attention for medical image segmentation
Fig1 网络结构
网络基本结构为2D-CNN网络，使用ResNet-101来提取图像特征

与现有技术（UNet，DANet，PAN（ResNet34），PAN（ResNet101），DAF，UNet attention）等对比，性能超过其他网络

医学分割问题可以抽象为像素分类问题，但目标像素比例较小，造成正负样本比例不平衡，导致训练困难。而attention机制则给予图像不同部分以不同的权重，将网络权重集中在roi区域内