基于卷积神经网络的肺结节分类算法

算法结构
本文提出利用卷积神经网络对肺部CT图像进行分类,具体包括四个步骤:(1)通过使用数据库提供的说明文档,找出恶性肺结节和正常结节的CT图像;(2)利用最大类间方差法对 CT 图像进行分割得到二值图像;(3)设计的合适的卷积神经网络;(4)对数据集进行训练和分类,从而筛查出恶性肺结节的CT图像。
基于卷积神经网络的肺结节分类算法
卷积神经网络结构
本文自己建立了卷积神经网络,采用双通道的形式,每个通道的结构一样,但是所训练的数据集分别为原始CT图像和预处理后的图像。网络能充分提取存在于原始图像上的有效信息,对于预处理后的图像特征也能充分挖掘潜在有效特征。
基于卷积神经网络的肺结节分类算法
基于卷积神经网络的肺结节分类算法
实验
本文使用的CT数据集是来自LIDC数据库。最后选用820张(403个良性结节和417张恶行结节)的CT图像作为训练和测试。
基于卷积神经网络的肺结节分类算法
一、**函数的对比实验
对比了ReLU,Tanh和Sigmoid随着训练迭代次数的增加三种**函数的收敛情况。
基于卷积神经网络的肺结节分类算法
Sigmoid函数由于其自身的特点,离原点越远,梯度越平缓。所以当输入值很大时,网络也变得很难再训练下去。相对于 Sigmoid函数,Relu函数的单侧抑制性和稀疏**性到可以很好地避免上述状况,但是缺点是当
梯度较大时,Relu 函数在更新权值之后无法再次**。Tanh函数在**值较低时,训练更快更容易。3种**函数对数据集的测试准确率结果如下图所示。
基于卷积神经网络的肺结节分类算法
二、全连接层的数量实验
有训练卷积神经网络的经验表明,全连接层的特征图数量直接影响着网络对数据的拟合度。特征图的数量越多,学习能力越强,识别精度越高,但网络训练的时间也大大延长;特征图数量越少,结构越简单,网络的学习能力越差,但相应的学习时间在减少。本文对F8全连接层的数量进行研究。结果如下图展示。
基于卷积神经网络的肺结节分类算法
从实验结果可以看出,F8层特征图个数对肺部CT图的识别有着重要的影响。随着F8层特征图数量的增加,对于CT图的识别率也会有所提高。但是当将特征图的数量增加到60个时,准确率不再提高。这说明增加F8的特征图个数,可以提高网络的分类能力。但是准确率不会随着特征图数量的增加而无休止的提高,找到合适的数量不仅可以增加网络的识别率,还能节省训练的时间。
三、CNN学习率大小实验
CNN 的学习率对网络的训练至关重要,其大小直接影响到卷积神经网络的稳定性与收敛速度。如果学习率太大,网络会出现无法训练甚至发散的情况;如果学习率过小,网络的训练速度会减慢,甚至会出现训练时间成倍增加的情况,学习率变化的实验结果如下图所示。
基于卷积神经网络的肺结节分类算法
由实验结果可以看出随着学习率的增加,网络的准确率也在增加。当学习率达到[0.000 10,0.000 11]之间时,准确率不再增加并且随着学习率的继续提高呈现下降的趋势。
四、网络训练次数的实验
卷积神经网络的训练次数与准确率有着密切的关系。结果如下图所示。
基于卷积神经网络的肺结节分类算法
从上图中可以看到,测试样本的准确率随着训练迭代次数的增加而增加。但是当网络的训练次数超过2100次时,网络的正确率一直稳定在97%,并且训练的时间也在可承受范围内。
五、六折交叉验证实验
本文将原有的肺部CT数据集6等分,将其中一份用作测试集,其余剩下的部分用作训练集训练。分别做6组实验,其中良性肺结节为阳性,恶行肺结节为阴性。实验结果如下图所示。
基于卷积神经网络的肺结节分类算法
六、对比不同网络的分类能力实验
基于卷积神经网络的肺结节分类算法
可以看出本文的网络分类性能更高,AUC值最大,准确率也最高。
结论
本文做了很多对比实验,将处理后的 CT 图像送入卷积神经网络进行训练
识别,通过六折交叉验证,其平均分类准确率达到95.85%。从实验中得出了卷积神经网络的分类能力不仅与学习率和**函数、训练次数有关,F8 层特征图数量也对网络的性能有着重要影响。
通过在LIDC数据集上与LeNet-5、Alexnet两种卷积神经网络以及一些传统的方法进行对比,可以看出本文设计的网络无论是准确率还是AUC值均是最高的,可以为初步的肺结节筛查以及临床诊断提供参考。