文献阅读笔记【9】:基于深度卷积神经网络的隧道衬砌裂缝识别算法


该文章研究的内容与【略读】文献阅读笔记中的【基于图像识别技术的隧道衬砌裂缝检测系统研究】一文有些关系。文章中主要运用了深度卷积神经网络解决了裂缝识别问题,涉及到比较有参考价值的技术有:超像素分割、语义分割中的DeepLabv 3 分割框架、带权重的Softmax Loss 函数等。
文献中裂缝识别流程如下:

文献阅读笔记【9】:基于深度卷积神经网络的隧道衬砌裂缝识别算法
SLIC超像素分割技术:
超像素由一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成的小区域。这些小区域大多保留了进一步进行图像分割的有效信息,且一般不会破坏图像中物体的边界信息。

详细参考:

在对裂缝进行分割之前先利用 ResNet 18 网络对图像进行判断分类,将有裂缝的图像挑选出来。之后采用分割框架。

DeepLabv 3 分割框架:

DeepLabv 系列针对的是语义分割任务,对图像做密集的分割任务,分割每个像素到指定的类别上;将图像分割成几个有意义的目标;给对象分配指定的类别标签。
相关知识还未认真学习,先记录下来:

带权重的Softmax Loss 函数:
裂缝在每张图片上其像素只占有很小比例,而深度学习框架常用的 Softmax 损失函数可以看作为一个平均投票器, 这样就会导致像素更偏向于被预测为非裂缝的背景点。
故采用带权重的 Softmax Loss 函数, 该函数使有裂缝的像素值位置加权参与运算。该方法有效解决了裂缝数据不均衡的问题。

Comments:
该文章中的超像素分割技术很有参考意义,另外先进行分类,后进行DeepLabv 3 分割的流程可以参考,同时分割采用的框架此处可以和FCN和U-Net进行对比选择。对于图像中目标像素分布较背景占比较少的解决方法本文采用的带权重的 Softmax Loss 函数, 该函数使有裂缝的像素值位置加权参与运算的方法与之前的一篇文章【文献阅读笔记【7】:基于改进的全卷积神经网络的路面裂缝分割技术】中 OHEM算法可作比较。该文章在进行图片分类之前采用的图片统一缩放至 600×600 大小时,可能会对图像造成扭曲失真。