系统级别的手动排名分析
1 系统级别评估的重要性
在医学图像处理中,高准确性和高可重复性的分割方法是主要目标。因此,评估分割算法的准确性和质量至关重要。系统级别的评估是对不同分割算法的综合性能进行全面评测的过程。通过系统级别的评估,我们可以更好地理解各个算法在多个测试案例上的表现,从而为选择最适合实际应用场景的算法提供依据。
2 数据集和评估方法
为了提供系统级别的手动排名,医学专家从解剖学2基准参与者算法的输出中挑选了483个分割结果。这个分割集具有以下特性:
- 器官/结构 :这些分割对应于六个器官/结构,分别是肝脏、胰腺、膀胱、主动脉、左肺和右肾。这些结构由医学专家选定,以覆盖不同的大小、形状和边界复杂性。
- 医学案例 :这些分割对应于110个不同的体积,每个体积代表一个医学案例,其中医学案例被定义为特定真实体积中的一个解剖结构(例如,每个真实体积中的肝脏被认为是一个不同的医学案例)。
- 参与算法 :这些分割是由七个参与算法产生的。然而,不同的体积(医学案例)由不同数量的算法进行分割。这意味着对于某些体积,有七个分割可供使用,但对于其他体积,分割的数量少于七个。对于排名分析,只考虑