PET分割大块肿瘤:改善观察者间变异性的策略和工作流程
-
目的:基于PET的肿瘤分割。减少分割中用户交互的数量可能有助于促进分割任务,特别是在标记庞大和复杂的肿瘤时。因此,本研究报告了分割工作流/策略,可以减少具有复杂形状的大型肿瘤在用户交互水平不同的观察者之间的差异。
-
方法:使用四种策略分别描绘了二十个大块肿瘤PET图像的轮廓
- 人工分割
- 基于阈值的交互式
- 基于阈值的交互式分割以及PET梯度图像的附加表示
- 选择最佳方法(从四种已建立的半自动分割算法中选择最合理的结果)
使用Jaccard系数(JC)和百分比volume差异进行分割比较
计算了包括所有经验丰富的观察者的分割的多数投票(MV)分割当作参考标准/金标准。将执行结果与MV分割的阳性预测值(PPV)、敏感性(SE)和百分比volume差异进行比较
介绍
为了评估肿瘤的分期和对治疗的反应,最常用的测量指标是最大标准化摄取值SUV( S U V M A X SUV_{MAX} SUVMAX)、平均SUV( S U V M E A N SUV_{MEAN} SUVMEAN)和病灶总糖酵解(TLG), TLG定义为肿瘤体积乘以 S U V M E A N SUV_{MEAN} SUVMEAN。
难点:由于患者的运动、图像噪声和变化的固有对比度,在PET图像中没有清楚地定义肿瘤边界,这使得分割具有挑战性。。特别是对于形状不规则和复杂的大型肿瘤(代谢活性肿瘤体积(metabolic active tumor volume, MATV) > 300mL),人工分割非常耗时,且容易出现分割错误。
为了减少观察者之间的变异性和克服自动分割算法的局限性,在不使分割完全自动化的情况下,减少分割过程中的用户交互可能是有利的。为此,本研究评估了三个新的分割工作流,旨在减少用户交互,从而潜在地改善观察者之间的变异性。在第一个引入的工作流中,要求用户交互式地改变 S U V M A X SUV_{MAX} SUVMAX阈值的百分比,而不是通常使用的固定的预定义阈值,直到实现满意的分割。第二种策略:观察者同时展示PET强度和PET梯度图像,突出了肿瘤边界。接下来,要求用户按照上面描述的交互式方式更改阈值的百分比。该工作流程的实现是为了减轻选择的强度窗口对分割结果的影响,因为梯度图像显示肿瘤边界是独立于强度窗口的。在最后一个新工作流中,用户需要根据四种已知的轮廓算法从四种预定义的分割中选择首选的结果。
方法
四种策略
-
人工分割
设置个百分比阈值 S U V M A X SUV_{MAX} SUVMAX。强度值高于该阈值的所有体素都被包含在分割的体积中。观察者通过添加或删除体素人工修改这个分割。
-
基于阈值的交互式分割
用户可以交互式地(如上所述)更改 S U V M A X SUV_{MAX} SUVMAX的百分比阈值(范围从0%到100%),直到在视觉检查中认为分割令人满意为止。
-
包括梯度图像的基于阈值的分割
使用相同的基于阈值的交互式方法,但是这次,所显示的CT图像被PET梯度图像取代,强调高摄取区域的边界。用户设置百分比阈值,以便VOI的边界与梯度图像中的边界发生碰撞。在梯度图像中,肿瘤边界的显示与观察者设置的强度窗口无关。因此,选择此工作流程是为了减轻观察者使用不同强度窗口对分割结果的可能影响。
-
从四种自动分割算法中选择最佳结果
41% S U V M A X SUV_{MAX} SUVMAX:产生SUV的体素高于 S U V M A X SUV_{MAX} SUVMAX 的41%
SUV4:SUV值高于4的体素
SUV2.5:SUV值高于2.5的体素
Auto:所有SUV值高于具有局部背景校正的 S U V P E A K SUV_{PEAK} SUVPEAK的50%的体素
显示“选择最佳方法”方法的示例。用户从自动获取的四个分割中选择最佳结果
从这些分割中,用户选择了他/她认为最像肿瘤边界的分割
获得分割算法的金标准
我们对每幅图像计算了多数者投票分割(MV)。MV比较相同对象的分割,并将超过一半分割标记的体素视为VOI[33]的一部分
-
比较参考和执行
计算每个肿瘤的PPV/SE值。此外,计算MV与每次分割之间的百分比MATV差异
Kruskal-Wallis检验将所有方法的JC和MATV值一起排名。然后通过不同的方法对这些排名进行比较,来比较观察者之间的差异和两种指标的范围
为了评估用户体验的影响,使用Wilcoxon符号秩检验比较观察者之间的MATV差异百分比
结果
图5显示了JC值的变异性和百分比的MATV差异。随着用户交互的增加,这两个指标的可变性也会增加。
Kruskal-Wallis检验结果表明,最佳选择策略和梯度选择策略的JC和MATV差异百分比显著高于其他两种策略(p值<0.01)。而最佳选择、梯度和交互式阈值分割、手工分割相比,差异不显著
图6显示了执行的PPV/SE值和MV参考分割的变异性。“选择最佳”和“梯度”工作流产生相似的值,其中“选择最佳”方法的值略高(选择最佳:IQR:0.91–0.99;梯度:IQR:0.90–0.97)。这些策略和其他两种策略之间的差异更明显(基于阈值的:IQR: 0.88-0.97;人工:差:0.86-0.92)。选择最佳策略和梯度策略的较高值支持这两种策略导致更可靠的分割的假设
图7分别显示了每个观察者的MATV差异百分比以及执行和参考分割的PPV/SE值。
-
选择最佳比较
SUV4分割算法最常被认为是最好的分割算法,其次是41MAX算法,SUV2.5和AUTO方法
一些结论
在分割过程中,用户交互越少,观察者之间的变异性就越好。(半)自动分割的调整比完全手动分割更可靠,结果仍然优于完全手动分割。
为是最好的分割算法,其次是41MAX算法,SUV2.5和AUTO方法
一些结论
在分割过程中,用户交互越少,观察者之间的变异性就越好。(半)自动分割的调整比完全手动分割更可靠,结果仍然优于完全手动分割。
对于这些复杂的肿瘤,对于每种肿瘤类型,都应该对最稳定的分割方法进行单独的验证,因为没有一种方法能够在所有情况下均产生良好的结果。但是,基于梯度的策略或最佳选择策略的使用均优于其他方法。因此,这两种策略中的一种似乎更适合于大块肿瘤,对于这些大块肿瘤,分割始终需要用户监督/互动