放射组学中的机器学习与深度学习:挑战、机遇与RADIoT框架
1. 放射组学中的机器学习模型
机器学习(ML)主要分为监督学习和无监督学习两大类。监督学习旨在将输入向量映射到相应的目标向量,主要任务包括分类和回归,但该学习方式存在标记数据稀缺的问题,因为手动标记数据既昂贵又费力。无监督学习则仅对输入向量的数据进行建模,从无输出向量的数据中挖掘相关信息和关系。
1.1 传统机器学习模型
传统的放射组学监督式机器学习主要包括基础分类器和元学习器。常见的基础分类器有决策树(DT)、人工神经网络(ANN)、朴素贝叶斯(NB)、支持向量机(SVM)、逻辑回归(LR)和k近邻(k - NN)。元学习器主要包括同质和异质集成,如Bagging、AdaBoost、随机森林和堆叠。无监督学习类别主要分为聚类、密度估计(DE)、可视化和投影三大部分。
这些模型多年来已被研究并应用于放射组学,主要集中在疾病的预后和诊断以及数据管理方面。例如,线性SVM被用于头颈部肿瘤的预后,基于手工和深度学习提取的特征,在多模态CT和PET图像上进行评估,MCC和准确率分别达到0.848和0.965;LR用于通过CT图像检测肾癌,基于手工特征提取,ROC_AUC值达到0.878;随机森林(RF)、AdaBoost、CART决策树(DT)和XGBoost(XGB)被用于通过CT图像诊断肺癌,其中RF结合LBP在准确率、AUC、精确率和召回率方面表现出色,分别为77.89、76.92、74.19和90.20。
1.2 深度学习(DL)模型
深度学习网络是受人类大脑启发的多层前馈神经网络,能够接收3D图像作为输入并进行端到端训练,同时学习极具区分性的图像特