Radiogenomics

放射基因组学一直被用来指两种不同的东西:这个术语最早的用法是描述放射治疗的敏感性或有效性,以及正在治疗的肿瘤的基因组特性的影响。另一个定义,也是我们将在本文中关注的,是使用放射成像来预测组织的基因组特性。

大多数用于放射基因组预测的技术可以应用于其他成像任务,包括疾病的分类(良性、恶性、炎症性、传染性等)。或治疗反应的评估。

Current state of the art for radiogenomic predictions for brain tumours

在脑瘤中使用MRI预测分子生物标记物的机器学习

2

大多数经典的机器学习方法需要在胶质瘤周围放置感兴趣区域(ROI)来计算特征。使用这种方法计算的特征可以分为以下三类:

  • first order (intensity and shape based features)
  • second order
    (texture-based features such as grey level co-occurrence and grey level run-length)
  • higher-order features (filters are used to extract the features, e.g., wavelet, fractal and Laplacian of Gaussian)

在计算特征后,采用特征选择和分类技术。

3

将放射基因组分析应用于图像的步骤。这包括识别肿瘤和可能的其他感兴趣区域(例如,用作参考的正常组织)、特征提取、特征选择、分类,然后基于分类器进行预测

Challenges to adoption

典型的CNN架构由大量参数组成。这需要比传统机器学习更大的数据集,以确保系统是泛化的,而不是学习训练中使用的特定示例。为了解决这个问题,使用了两种常见的技术:迁移学习和数据增广。

实现迁移学习存在的挑战,包括:

(1)网络在具有特定大小的图像上进行预训练,从而迫使用于新任务的图像被变换成与该大小匹配;

(2)大多数预训练的网络是用于摄影图像的,因此三个通道被用作输入,因为摄影图像使用三个通道来表示颜色(红、绿、蓝);

(3)输入值的范围必须与在原始网络的训练期间使用的范围相同,即,如果图像强度被缩放到[-0.5,0.5] or [0,1]

在分割和分类任务中,在数据集有限或不平衡的情况下,数据增广是一种常用的技术。通常使用的技术包括:翻转、高斯噪声、抖动、缩放、模糊、旋转、剪切和修剪。还提出了基于生成性对抗性网络的技术