初步了解深度学习和图像分割

图像分割与深度学习

目录
0.简介
1.传统图像分割方法
1.1基于阈值的图像分割
2.基于深度学习的图像分割
2.1 FCN

0 简介
图像分割已成为图像处理领域的重要部分,其作用已经越来越明显。图像分割是指将图像划分成互不相交且有意义的子区域,在同一个区域的像素点具有一定的相关性,不同区域的像素点有一定的差异性,其实就是把图片中具有相同性质的像素整合在一起并给予标签。
将深度学习引入到图像分割领域后,使得分割的准确度不断提高,分割过程也更加智能。本文内容会列举部分传统的图像分割方法和基于深度学习的图像分割方法。

1 传统图像分割方法
传统分割方法大多简单有效,经常作为图像处理的预处理步骤,提出图像的关键信息。

1.1 基于阈值的图像分割方法
通过设定不同的灰度阈值,对图像灰度直方图进行分类,其灰度值在同一范围内的被认为具有一定相似性的同一类像素。
f(i,j)表示原始图像像素(i,j)的灰度值,通过设定阈值T,可将图像中的像素分为目标和背景两类:
1 , f ( i,j )≥ T
g ( i,j )=
0 , f ( i,j )< T
其中当g=1时为目标图像,g=0时为背景图像,由此可见,阈值分割方法的关键时选取合适的灰度阈值。
初步了解深度学习和图像分割
2 基于深度学习的图像分割
随着深度学习的发展与引入,计算机视觉领域因此有了较大的进展,而卷积神经网成为了图像处理的重用手段,可以充分利用图像的语义进行图像分割,且更加精确高效。

2.1 FCN
全卷积网络(FCN)[1]是用于语义分割(即对目标进行像素级别的分类)的首创,确立了图像分割的通用网络模型框架。
在FCN模型中,由于卷积过程让图像变得很小 ,为了得到原图大小的稠密像素,需要进行上采样。直观想法是进行双线性插值,但很容易用反向卷积,会损失很多细节。于是作者提出增加Skips结构将最后一层的预测和更浅层的预测结合起来,这样就能遵守全局的同时进行局部预测。
初步了解深度学习和图像分割
FCN仍有一些缺点,例如,得到的结果仍不够精细,对细节不够敏感,没有考虑像素与像素之间的关系,和缺乏空间一致性等。

参考文献
[1] LONG J,SHELHAMER E,DARRELL T. Fully convo⁃
lutional networks for semantic segmentation[C]//Pro⁃
ceedings of the 2015 IEEE Conference on Computer Vi⁃
sion and Pattern Recognition. New York:IEEE Press,
2015:3431-3440. DOI:10.1109/CVPR.2015.7298965.

文章链接:https://kns.cnki.net/kcms/detail/42.1674.N.20201116.0937.001.html