医学图像计算中的随机森林算法
1. 上下文信息的不同运用方式
机器学习(ML)算法自医学图像计算领域诞生之初,就一直是该领域的重要工具。监督学习方法用于物体和病理结构的定位与检测,无监督学习则是统计形状建模的基石,这两种方法在神经影像学研究中都有广泛应用。然而,在2009年之前,在解剖结构分割和感兴趣区域定义这两项医学图像计算的关键任务上,ML算法难以与基于图谱的方法相抗衡。当时,常见的做法是先用基于图谱的方法缩小视野,再用ML方法进行后续分析。
在早期的ML方法中,缺少对上下文信息的整合。但在医学图像中,上下文信息极为重要。尽管不同个体的解剖结构在形状和强度上存在差异,但器官的位置关系相似。例如,在进行肝脏分割时,可以利用周围结构进行粗略初始化和详细的体素级语义分割。对于特定病理结构的检测和分割也是如此,特定病变往往出现在特定位置,可通过上下文信息识别。
基于图谱的方法通过图像配准利用个体间的解剖学相似性。它先手动标记一组图谱图像,分析新图像时,将图谱与新图像对齐,找到对应点,再根据对应关系传播标签,并使用标签融合策略得到最终分割结果。不过,这种方法存在两个问题:一是配准精度有时难以令人满意,尤其是新图像与图谱差异较大时;二是图像配准计算成本高,限制了其在大规模研究中的应用。
随机森林(RFs)是最早在ML方法中引入上下文信息整合重大变革的算法之一。其重要发展在于内部特征选择和投票机制,这使其成为检测、定位、分割和基于图像预测的重要工具。
2. 特征选择与集成
在随机森林之前,基于ML的图像分析方法大多使用从图像中精心提取的明确定义的特征,如神经影像学中常用的形态学测量(海马体积、皮质厚度)。这些特征对开发自动诊断方法很有用,
超级会员免费看
订阅专栏 解锁全文

4

被折叠的 条评论
为什么被折叠?



