【论文阅读笔记】CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
本文是吴恩达哈佛大学团队在2017年发表的文章,提出CheXNet技术,即一个使用ChestX-ray14数据集训练的121层的深度卷积网络,该网络通过胸片识别肺炎的准确率已经和人类放射科医生持平甚至更高。网络输入为人体正面扫描的胸片,输入时患肺炎的概率,为了更好的可视化,使用了热力图(Class activation mapping)。
1.数据
使用ChestX-ray14(2017),目前是最大的开源数胸片数据集,有来自30805个患者的112120个正面扫描X光片。文中将图片尺寸调整为224x224,同时根据在ImageNet中图片的均值和偏差进行规范化,使用了随机水平翻转来做数据增强。
2.损失函数
采用加权二进制交叉熵损失。
3.网络结构和训练
采用DenseNet结构,并将网络最后的全连接层替换为一个二进制输出,并连接一个Sigmoid单元输出概率值,采用16的mini-batch,Adam梯度下降。文中第二部分将单输出扩展为14维的输出, CheXNet 应用到对ChestX-ray14 数据集中 14 种疾病的检测上,也取得了顶尖的结果。
4.本文的一些局限
数据集本身提供的图片都是正面胸片,而背部扫描的胸片有时对诊断来说也很重要。另外通过前期的研究发现,对于放射科医生来说,不知道病人先前的病史对于判定准确性有帮助,所以对于模型和提供Gound of Truth的放射科专家本文中并不提供病人病史。
5.本本一些有用的东西:
本文其实从内容上说并不算特别充实,使用的是先前研究的网络结构。值得注意的是文章提到的其他论文,有时间值得阅读:
(1)DenseNet:《Densely connected convolutional networks》
下载:https://arxiv.org/pdf/1608.06993.pdf
(2)深度学习识别皮肤癌《Dermatologist-level classi_cation of skin cancer withdeep neural networks》
(3)深度学习CT出血检测《Radiologist level accuracy using deep learning for hemorrhagedetection in ct scans》
(4)糖尿病视网膜病变的深度学习检测《Development and validation of a deep learning algorithmfor detection of diabetic retinopathy in retinal fundus photographs.》
下载:https://pdfs.semanticscholar.org/1ea4/41b6f99a70d05d66b0cd331568507e7f822d.pdf
(5)Batch normalization:《 BatchNormalization: Accelerating Deep Network Training by Reducing InternalCovariate Shift》
下载:http://proceedings.mlr.press/v37/ioffe15.pdf
(6)CAM:《Learning deep features for discriminative localization.》
(7)ChestX-ray8数据集:https://nihcc.app.box.com/v/ChestXray-NIHCC
(8)ChestX-ray14数据集:https://arxiv.org/pdf/1705.02315.pdf