随机森林在医学图像计算中的应用
1. 随机森林与上下文信息整合
随机森林(RF)在医学图像计算中展现出强大的性能,即使仅采用一种随机化策略,也能有良好表现。在医学图像计算里,RF 如何利用上下文信息是一个关键问题。
1.1 特征提取与选择
在解决语义分割等任务时,为了确定绿色区域所属的器官,需要考虑其上下文信息,如红色矩形内的图像信息。RF 的做法是用从图像周围提取的特征来表示绿色区域。然而,在大图像区域中提取何种特征并不明确,这时内部特征选择就显得至关重要。
决策树训练时的节点优化实际上就是在进行特征选择。它会筛选所有特征(或其随机子集),根据任务(由成本函数定义)选择最优特征来划分训练数据。在 RF 中,会从绿色区域周围的大空间区域提取大量易于计算的特征,形成特征集。训练过程会在决策树的不同节点选择最有助于优化分割成本的上下文特征。
常见的易于计算的特征类型是使用积分图像计算的类 Haar 特征。这些特征定义为图像中两个矩形区域的平均强度差异。为了用上下文特征表示局部区域,会使用从该区域不同随机偏移处的区域来计算类 Haar 特征。训练时会提取并考虑大量此类特征(即特征池)。
对于强度未校准的图像,如磁共振成像(MRI),有人提出提取类似于积分特征的局部二值模式。
1.2 多树集成与聚合
整合上下文信息的另一个关键部分是多棵树的集成及其聚合。虽然特征选择可以筛选大量特征,但在每个节点只能探索有限数量的特征,因此单个树的预测可能不太准确。经验表明,聚合多棵不同树的预测结果能得到更准确的预测。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



