发表杂志:ORIGINAL RESEARCH ADULT BRAIN

Abstract

材料:259例低级别或高级别胶质瘤患者的MR影像资料(T2、FLAIR和T1WI的增强前后采集)和分子信息(从癌症基因组图谱获得)

训练卷积神经网络对异柠檬酸脱氢酶1(IDH1)突变状态、1p/19q共缺失状态和O6-甲基鸟嘌呤-DNA甲基转移酶

(MGMT)启动子甲基化状态进行分类。

最后的卷积神经网络层的主成分分析被用来提取对成功分类至关重要的关键成像特征。

结果:分类准确率高,IDH1突变状态为94%,1p/19q共缺失状态为92%,MGMT启动子甲基化状态为83%。每种遗传

类型与独特的影像学特征相关,如肿瘤边缘的定义、T1和FLAIR抑制、水肿程度、坏死程度和质地特征

结论:对于癌症影像档案数据集,机器学习方法可以对低级别和高级别胶质瘤的个体基因突变进行分类。通过增加降维技术获得的相关MR成像特征表明,神经网络能够学习关键的成像成分,而不需要事先的特征选择或人工指导的训练。

对恶性胶质瘤进行组织分类的标准化视觉解释的尝试得到了伦勃朗图像(Vasari)特征集,这是一个基于规则的词典,

以提高解释的再现性。然而,这种方法的局限性是需要先验的特征选择和人类视觉解释。

Image Preprocessing

对于每个患者,使用FMRIB线性图像配准工具(FLERTT)对所有成像模态进行联合配准。Registration是用线性仿射变

换算法实现的,该算法使用三线性插值和互信息代价函数。

  • 使用z-score进行归一化
  • 使用特定的的基于3D卷积神经网络的全自动全脑提取工具来移除颅外结构
  • 使用全自动脑瘤分割工具来识别病变边缘。在2016国际多模态脑瘤分割挑战赛中,该算法是性能最好的工具
  • 这些mask用来产生slice to slice的图片,然后再resize到32x32x4作为输入。

Feature Analysis

神经网络通过串行卷积产生的最终特征向量通常对冗余信息进行编码

对最终的特征向量进行主成分分析,识别出相对于最终分类具有最大绝对值幅度的主成分分析降维特征

Statistic Analysis

为了评估每个患者的总体准确性,汇集了所有图像切片的平均Softmax评分,阈值为0.5,用于确定突变分类

使用了5-cross-validation。对于每次迭代,20%的数据用于验证,其余80%的数据用于训练

Subject

共收集259例胶质瘤患者的5259个肿瘤轴位切片进行分析,其中男性135例,女性122例,不明原因2例,平均年龄53.2岁,平均生

存期18.8年。胶质瘤的分布情况为:II级21.2%(55/259),III级22.8%(59/259),IV级55.2%(143/259)。有2个胶质瘤有可获得的遗

传信息,但没有世界卫生组织的分级。IDH1突变型和野生型分别占45.9%(119/259)和54.1%(140/259);1p/19q codeletions and

nondeletions 分别占12.0%(31/259)和88.0%(228/259)。MGMT启动子甲基化和未甲基化分别占56.4%(146/259)和43.6%

(113/259)。通过自动分割掩膜确定的平均肿瘤大小为105.6 cm~3。

Result

在5次交叉验证中,该算法正确地预测了:

IDH1突变(平均94%;交叉验证之间的范围为90%-96%)

1p/19q共缺失(平均92%;范围为88%-95%)

MGMT启动子甲基化(平均为83%;范围为76%-88%)。

三者对应的曲线下面积也反映了高性能。

CNN在收敛之前接受了25000次迭代(大约3000个epoch,batch size大小从12到48)的训练。

每个患者的成像工作流程耗时5.12秒(4-5秒用于检测和预处理,其余0.0043秒用于分类)。