Glioma Grading on Conventional MR Images: A Deep Learning Study With Transfer Learning论文记录

简介
本文是胶质瘤的常规MRI(核磁共振)分类:深度学习和迁移学习。

所用到的一些简称:世界卫生组织(WHO),低度胶质瘤(LGG),高级别胶质瘤(HGG)

作者通过分析MRI图像,训练CNN对LGG和HGG进行无创分类。(1)探索评估两种CNN架构(AlexNet和GoogLeNet)性能。(2)通过迁移学习评估影响。

进行了从头开始训练的网络性能与迁移学习网络的对比,结果迁移学习网络性能好。使用到迁移学习时,与以往不同的是在解决通道问题时,将预训练的网络第一层与最后一层随机初始化权重,保留其余层的权重,fine-tuning时全部层都进行调动。

近年来机器学习技术应用于胶质瘤分类,通过从不同的参数图中提取图像特征,包括临床特征,直方图特征和纹理特征。传统机器学习有两个弱点:(1)成像预处理过程复杂且耗时,很大程度上取决于操作者的经验。(2)判别模式的鲁棒性很低。

与自然图像不同,医学领域面临的主要挑战是训练数据量不够,迁移学习减少了训练数据和测试数据之间的数据分布不匹配问题。这是传统机器学习方法精度低的主要问题。

研究设计
病人接受了核磁共振成像检查(MRI)手术前。选取肿瘤切片,经图像格式转换后分割为感兴趣的矩形区域(ROI)。然后将数据分为训练数据集、验证数据集和测试数据集。在5倍交叉验证中使用的数据增加了14倍,并且保持测试数据集不变。最后,对AlexNet和GoogLeNet进行了从零开始的训练和预训练模型的微调。
Glioma Grading on Conventional MR Images: A Deep Learning Study With Transfer Learning论文记录
随机选取20%作为测试集,为了避免一个受试者的切片同时出现在训练数据和测试数据中,从而导致假阳性结果,分类任务使用剩余80%的数据和患者水平的五重交叉验证(CV)进行评估。
训练数据扩充14倍,测试的数据是原始的数据,每一次训练和测试图像都减去训练集的均值图像。

网络结构
Glioma Grading on Conventional MR Images: A Deep Learning Study With Transfer Learning论文记录
迁移过程

转移学习的过程。首先,下载在ImageNet数据集上训练的模型。其次,将预训练模型的大部分参数转移到新的目标任务模型中。第三,首先对卷积层和全连通层进行目标任务训练。
Glioma Grading on Conventional MR Images: A Deep Learning Study With Transfer Learning论文记录
结果
Glioma Grading on Conventional MR Images: A Deep Learning Study With Transfer Learning论文记录
GoogLeNet比AlexNet有更好的性能。GoogLeNet的验证精度、测试精度和测试曲线下面积的平均值分别为0.867、0.909和0.939。对于AlexNet,验证精度、测试精度和测试的平均值AUC分别为0.866、0.855、0.895。虽然GoogLeNet比AlexNet更深入,由于初始结构,它的参数更少,这可以减少过度拟合的风险。
总的来说,转移学习是提高分类性能的有效方法,GoogLeNet的分类性能优于AlexNet。

Glioma Grading on Conventional MR Images: A Deep Learning Study With Transfer Learning论文记录
上图可以看出,这是GoogLeNet前三层卷积层,在较低的卷积层中,网络仅从肿瘤中获取强度和形状信息。随着CNN结构的深入,特征从feature maps中提取出来,变得更加抽象。

结论
在AlexNet和GoogLeNet上评价了迁移学习的效果。因此,与手工特征或训练的性能相比,微调后的CNN图像特征在神经胶质瘤分级中的应用改善了性能。

以前的研究使用手工制作的临床和/或图像特征,然后是一个复杂的训练过程。深度学习简化了多步管道,通过直接从图像中学习分类特征来使用,允许更大的重现性。

由于自然RGB图像和医学灰度图像的维数不同,我们在神经胶质瘤分级任务中对第一卷积层和最后全连接层进行了微调。 ImageNet是三通道的自然图像,医学领域是单通道的灰度图像,我们的任务只需要导出两个类别。为了适应新的对象类别,对第一层卷积层和最后的全连接层进行了数据初始化和重新训练,在新任务的训练过程中,将预训练模型中其他层的初始值直接传递到新模型进行微调。

找到合适模型和随机大小之间的平衡是至关重要的。

医学分类任务的训练数据极为不足。将从大型数据库中获得的特征知识转移到特定医疗任务中是一种有效的方法。