温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
T1
加权
磁共振
影像
胶质
分级
赵博涵
第 卷第期杭 州 电 子 科 技 大 学 学 报(自然科学版)年月 ():基于 加权磁共振影像组学的脑胶质瘤分级赵博涵,王训恒,厉力华(杭州电子科技大学自动化学院,浙江 杭州 )收稿日期:基金项目:国家重点研发计划资助项目()作者简介:赵博涵(),男,研究方向:智能生物医学。:。通信作者:厉力华,教授,研究方向:智能生物医学。:。摘要:为了有效辅助脑胶质瘤的精确分级,提出一种基于影像组学的脑胶质瘤分级方法。首先,提取脑胶质瘤患者的 加权磁共振图像的影像组学特征,在十折交叉验证框架下采用 算法进行特征筛选得到重要特征;其次,采用随机森林将筛选得到的重要特征构建脑胶质瘤预测分级模型;最后,对脑胶质瘤预测分级结果进行评价与分析,用统计学方法检验不同级别特征的差异性。实验结果表明,提出方法的平均准确率达到 ,平均特异性达到 ,平均敏感性达到 ,平均受试者操作特征曲线下面积(,)达到 。关键词:脑胶质瘤;影像组学;特征选择;随机森林;计算机辅助诊断中图分类号:文献标志码:文章编号:()引言胶质瘤是中枢神经系统中最常见的原发性脑肿瘤,具有发病率高、治愈率低的特点,严重影响患者的生存质量。年,世界卫生组织将脑胶质瘤分为低级别胶质瘤(,)和高级别胶质瘤(,)。经过综合治疗后,患者的中位生存期一般在 年,患者的中位生存期仅数月,故胶质瘤的准确分级对肿瘤的干预具有重要价值。随着无创脑影像技术的发展,磁共振成像已成为胶质瘤分级的重要手段,通过提取医学磁共振影像特征,量化肿瘤的异质性,可提高肿瘤诊断的准确性,辅助临床决策。受主观因素的影响,仅靠阅读磁共振图像不能完全反映肿瘤生理与病理特征,影像组学将传统影像诊断中的半定量描述转换为客观的定量化参数,正好弥补了该缺陷。机器学习作为一种人工智能算法,是影像组学中建模分析的重要环节,广泛应用于脑胶质瘤辅助分级诊断,常用的分类算法有随机森林(,)、支持向量机(,)、逻辑回归、人工神经网络等。研究表明,随机森林和支持向量机可以在 加权或 加权图像的影像组学特征中训练出较稳定的胶质瘤分级模型。等研发了一种基于灰度共生矩阵机器学习系统用于胶质瘤的分级,受试者工作特征曲线下面积(,)达到 ,准确度为。等 提出一种基于灰度邻域差分矩阵的胶质瘤分级模型,为 ,准确度为。以上研究仅采用某一类影像组学特征进行分级任务,未在全部的影像组学特征中选择特征构建模型,损失了部分影像的特征信息。从全部影像组学特征中筛选特征再进行模型的构建可提升分类器的分类效果 。等 采用基于支持向量机的特征递归消除算法进行特征选择,取得了 的;等 针对全部影像组学特征,提出一种基于最小冗余最大相关特征选择的支持向量机模型,其 为 ,精确度为。特征选择算法与分类器种类繁杂,其中,算法能筛选出所有与因变量相关的特征,获得最优的特征集合,且受随机波动的影响较小,适用于特征间关系复杂、具有一定随机波动的医学影像组学特征的筛选。随机森林作为一种集成学习的分类器,不容易过拟合,计算速度较快,同样适用于批量大的影像组学特征。故本文采用 算法结合 分类器构建了脑胶质瘤的分级模型 。数据集与特征提取 数据集影像数据来源于由国际医学图像计算和计算机辅助干预协会创办的 年脑肿瘤分割(,)竞赛。数据集包含个模态的影像,分别为 ,。数据集中的肿瘤区域分割图像经过专业医师手动划分,包含 样本和 样本。在肿瘤分割图像中,每个肿瘤被标注为肿瘤周围水肿区域、肿瘤非增强区域和肿瘤增强区域。数据来自多个机构,使用不同的磁共振扫描仪进行数据采集,扫描仪参数存在差异,故在实验前进行 偏置场矫正、配准以及分辨率的重采样。通过偏置场矫正减少因核磁共振设备磁场中不均匀性导致的图像亮度差异,通过配准,每张图像大小均调整为 ,重采样后的分辨率为。数据集中,例 样本数据来源于个不同的机构,占比约为,和。为了尽可能保持数据样本的均衡,选择 例 样本,其比例分布与 完全一致,和 共 例患者样本,且采用的图像兴趣区(,)是个标注类别的总和区域,即整个肿瘤区域。患者与 患者的轴位 加权图像示例如图所示。图 和 患者 加权磁共振影像示例 特征提取本文采用开源工具 对三维病灶进行提取,共提取 维特征,主要有一维特征(,),包括能量、峰度、熵等统计特征;灰度共生矩阵(,),包括聚类趋势、对比度、差熵等;灰度大小区域矩阵(,),包括区域熵、区域方差、区 域 百分 比 等;灰度依 赖 矩 阵(,),包括相关熵、低灰度偏好、相关方差等;灰度游程长度矩阵(,)和 以及 的形状特征等。提取过程中,对原始磁共振图像进行离散非抽样三维小波变换,在长、宽、高这个维度中分别进行小波变换,最终获得级结果,分别为 ,和,其中表示低通滤波器,表示高通滤波器,对得到的级结果进行计算,最后得到全部纹理特征和形状特征的值。模型本文采用 算法结合随机森林分类器构建脑胶质瘤的分级预测模型,对 例胶质瘤患者的 加权序列磁共振影像提取影像组学特征,在十折交叉验证框架下,运用 算法对影像组学特征进行筛选,构建分级模型,实现对胶质瘤级别的准确分级。模型架构如图所示。杭州电子科技大学学报(自然科学版)年图 模型架构图 算法高维特征易出现过拟合,且计算开销过大,考虑到特征之间的相关性等特性,本文采用 算法结合随机森林分类器来构建脑胶质瘤的分级模型。算法是一种全相关的特征选择算法,其目的是找到所有携带可用于预测信息的特征。等 的研究表明,在多种基于随机森林的特征选择算法中,算法具有计算速度快、受随机波动和相关性误导影响小等优点,有利于处理特征之间具有强相关性的生物医学数据。对于每个原始属性,算法先是通过跨对象混洗得到混洗后的“影子属性”,再对所有属性进行分类,计算所有属性的重要性。运用随机森林方法计算属性重要性,通过比较袋外数据误差等指标判断每个属性在随机森林每棵树上的贡献大小。同时,算法采用分数()作为重要性度量指标,由于影子属性的重要性受随机波动影响甚微,所以影子属性的集合被用于决定哪些原始属性是真正重要的。算法的主要流程 如下:()对特征矩阵的各个特征取值进行混洗,将打乱后的特征(称之为影子特征)与原始特征进行拼接构成新的特征矩阵;()使用新特征矩阵作为输入,用随机森林训练模型;()计算原始特征和影子特征的 ,并在影子特征中找到最大的 ,记为 ;()将 大于 的原始特征标记为“重要”,将 小于 的原始特征标记为“不重要”,并且从特征集合中永久剔除;()重复步骤到步骤,直到所有特征都被标记为“重要”或者“不重要”。随机森林 随机森林属于机器学习的一大分支 集成学习,是利用多棵树对样本进行训练并预测的一种分类器。随机森林是一种有监督的学习算法,训练速度较快,可处理庞大的高维数据。随机森林不易陷入过拟合,具有一定的抗噪能力,能很好地处理分类问题。模型实验与分析 模型评价指标准确率(,)表示所有预测结果中样本被准确预测的概率,特异性表示阴性样本被准确预测的概率,敏感性表示阳性样本被准确预测的概率。受试者操作特性曲线(,)表示假阳性率(,)与真阳性率(,)之间的关系曲线,表示阴性样本中被误判为阳性的概率,表示阳性样本中正确判别为阳性的概率,的计算公式与敏感性相同。表示 曲线所覆盖的区域面积,越接近,表示分类的效果更优。本文采用准确率、特异性、敏感性、作为模型的评价指标。第期赵博涵,等:基于 加权磁共振影像组学的脑胶质瘤分级 性能图 模型的平均 曲线图本文采用十折交叉验证框架将 例患者样本随机分为 组,其中组用于训练,组作为测试集。首先,采用 算法对组训练集进行特征选取,根据特征重要性模型输出重要、待定、非重要这种特征类别,删除非重要和待定的特征,使用 对重要特征进行脑胶质瘤分级模型的训练;然后,用剩余的组测试集进行模型验证,依次循环 次,预测得到共 例分级结果。模型经过 次十折交叉验证得到的平均 曲线图如图所示。从图可以看出,运行 次的 模型平均 曲线偏向左上角,平均 为 ,通过计算得到,模型的平均准确率为 ,平均特异性为 ,平均敏感性为 ,说明模型具有良好的分级效果。同时,的标准差只有 ,精确率标准差只有 ,敏感性的标准差为 ,特异性的标准差为 ,说明 的结果十分稳定,拥有较好的鲁棒性。特征分析从 节可知,模型具有较好的分级效果,说明 算法选择的重要特征对辅助诊断具有价值,故本研究对原始特征的整体数据进行 特征选择,探讨这些重要特征对辅助诊断的意义。采用 工具提取到的共 维特征中的个灰度共生矩阵特征,个一阶纹理特征,个灰度游程长度矩阵,个灰度大小区域矩阵以及个原始图像特征,共计 维影像组学特征。运用统计学方法检验方法对筛选出的 维特征在 与 患者中做显著性检验,其中有多维重要特征值均远小于 ,表列出其中维差异更显著的重要特征。表 与 显著差异的重要特征特征参量 体素数量(原始图像特征)灰度最大值(原始图像特征)小区域灰度优势(灰度大小区域矩阵)四分位距(一阶纹理特征)均匀度(一阶纹理特征)逆差矩(灰度共生矩阵)逆差(灰度共生矩阵)依赖非均匀归一化(灰度大小区域矩阵)区域非均匀性归一化(灰度大小区域矩阵)从表可以看出,一阶纹理特征和灰度共生矩阵的差异最显著,如均匀度、四分位距、逆差矩等,在所有特征种类中占比最高,说明这类特征对胶质瘤分级诊断的指导作用至关重要。一阶纹理特征可描述病灶区的灰度值分布,灰度共生矩阵特征则可以反映图像体素灰度之间的空间排列关系,与影像学中图像均匀度强化、混杂密度、占位效应等关联密切。另外也有一些灰度大小区域矩阵特征有较显著的差异,如依赖非均匀归一化与区域非均匀性归一化。综上分析可知,与 在所选重要特征上均表现出显著统计学差异,表明 算法筛选出的特征重要具有诊断意义。不同方法比较为初步验证 算法对分类器的性能提升效果,分别采用原始特征()、检验特征选择方法和 算法结合 构建脑胶质瘤分级模型,种模型的 曲线如图所示。从图可以看出,的 最大,说明 具有更好的分级效果。杭州电子科技大学学报(自然科学版)年图种模型的 曲线图为了综合分析 算法对不同分类器的效果,进一步使用以上种特征选择方法分别结合不同分类器进 行 实 验,分 别 采 用 支 持 向 量 机(,)、回归、这种分类器按照 相似流程构建模型。支持向量机是一种快速可靠的 线 性 分 类 器,适 合 少 量 数 据 的 二 分 类 任 务。回归将线性模型得到的连续结果映射到离散模型上,同样适合二分类任务。最终得到种不同组合方法。分别采用种分类器各自运行 次,得到种不同方法的准确率、敏感性、特异性、的平均值,如表所示。表不同方法的性能指标方法类型准确率敏感性特异性 从表可以看出,采用原始特征直接构建的 ,和 模型的性能均低于其他方法,对胶质瘤分级基本没有效果;采用检验特征选择后,种分类器的性能均得到一定提升,但提升的幅度有限,说明检验筛选特征的方法不够先进,对模型分级的帮助仍然有限;采用 算法后,种分类器性能均有大幅度提升,其中 的各项性能指标最高,标准差较小,更加稳定。实验结果表明,算法不仅适用于多种分类器,同时可筛选出具有显著差异、诊断意义的重要特征,是一种可行的、性能良好的基于影像组学脑胶质瘤的分级方法。独立数据集验证将 数据集中剩余的 例 数据在 模型上进一步验证,胶质瘤分级的精确率达到 ,表现较好。测试数据的分析发现,例数据组成的测试集中有 余例数据来自宾夕法尼亚大学生物医学图像计算中心,而之前的训练模型过程中采用的 例数据无该中心采集数据,所以将该中心数据剔除后再次在 模型上进行实验,分级结果精确率为 ,表明 在独立验证中同样取得不错的效果,具有一定的泛化能力。结束语本文提出一种基于影像组学的脑胶质瘤分级方法。采用影像组学的方法,运用 算法结合 构建模型的方式对胶质瘤分级任务进行训练和测试,准确预测了胶质瘤的分级,具有良好的鲁棒性,为脑胶质瘤的临床分级诊断提供一定的参考信息。但是,本研究未在边缘、水肿区域或肿瘤核心区域单独提取影像组学特征,后续计划在以上区域提取影像组学特征并构建分级模型,扩大数据集进行实验验证。参考文献 ,:,():,第期赵博涵,等:基于 加权磁共振