基于深度学习的黑色素瘤自动检测与分期技术
1. CNN 核分割与分类
在医学图像分析中,将输入图像分割为活跃核、被动核和背景是一项重要任务。这里采用 SegNet 架构对 Ki - 67 染色图像进行三类分割,即背景、被动核和活跃核。SegNet 在内存和计算时间方面具有很高的效率。
PI - SegNet 架构由两个编码器(#1 和 #2)、两个解码器(#1 和 #2)以及一个 softmax 层和像素分类层组成。每个编码器包含两个卷积层和一个池化层,每个解码器包含一个上采样层和两个卷积层。在解码器端,使用 softmax 对每个像素属于指定类别的概率进行分类。
以下是 CNN 架构各层的详细信息:
| 层 | 通道数 | 滤波器数量 | 输出图像大小 |
| — | — | — | — |
| Encoder - 1
Conv - 1 | 3 | 64 | 64×K×L |
| Encoder - 1
Conv - 2 | 64 | 64 | 64×K×L |
| Encoder - 1
Pooling | 64 | 64 | 64×K×L |
| Encoder - 2
Conv - 1 | 64 | 64 | 64×(K/2)×(L/2) |
| Encoder - 2
Conv - 2 | 64 | 64 | 64×(K/2)×(L/2) |
| Encoder - 2
Pooling | 64 | 64 | 64×(K/2)×(L/2) |
| Decoder - 1
Upsampling | 64 | 64 | 64×(K/2)×(L/2) |
| Decoder - 1
Conv - 2 | 64 | 64 | 64×(K/2)×(L/2) |
| Decoder - 1
Conv - 1 | 64 | 64 | 64×(K/2)×(L/2) |
| Decoder - 2
Upsampling | 64 | 64 | 64×K×L |
| Decoder - 2
Conv - 2 | 64 | 64 | 64×K×L |
| Decoder - 2
Conv - 1 | 64 | M | K×L×M |
| Softmax 层 | M | - | K×L×M |
输入图像大小为 K×L 像素(彩色)。
下面详细介绍池化和上采样层:
-
池化
:在池化层中,使用平均或最大操作对特征图进行下采样,以减少参数数量并控制网络过拟合。这里使用大小为 2×2、步长为 2 的最大池化层。第一次池化后,有 64 个大小为 (K/2)×(L/2) 的特征图;第二次池化后,特征图大小为 (K/4)×(L/4)。
-
上采样
:在解码器端,使用记忆的池化索引对特征图进行两次非线性上采样操作。在使用的 SegNet 架构中,进行大小为 2×2 的上采样。
mermaid 流程图如下:
graph LR
A[输入图像] --> B(Encoder - 1)
B --> C(Encoder - 2)
C --> D(Decoder - 1)
D --> E(Decoder - 2)
E --> F(Softmax 层)
F --> G(像素分类层)
B1(Conv - 1):::gray --> B2(Conv - 2):::gray --> B3(Pooling)
C1(Conv - 1):::gray --> C2(Conv - 2):::gray --> C3(Pooling)
D1(Upsampling) --> D2(Conv - 2):::gray --> D3(Conv - 1):::gray
E1(Upsampling) --> E2(Conv - 2):::gray --> E3(Conv - 1):::gray
classDef gray fill:#gray,stroke:#000,stroke - width:2px
2. PI 值计算
训练完成后,训练好的 CNN 模块将输入图像分割为背景、活跃核和被动核三类。PI 值是在使用 SegNet 架构获得的分割图像上计算的,且是针对淋巴结上的黑色素瘤区域,使用 Ki - 67 染色图像进行计算。
具体步骤如下:
1. 首先在 MART - 1 染色图像上生成黑色素瘤掩码,然后将其映射到对应的 Ki - 67 染色图像上。
2. 假设通过特定算法获得黑色素瘤区域 Ri(i = 1, 2, …, NDR)。
3. 在每个黑色素瘤区域内,为一些活跃核密集的区域计算 PI 值。
4. 将每个黑色素瘤区域划分为大量重叠的矩形块,对应物理尺寸为 0.1×0.15 mm²,计算每个块的 PI 值。
5. 选择具有最高 PI 值的块供医生查看,这些块可能包含密集的活跃核区域。
例如,在一个全切片图像(WSI)中有三个黑色素瘤区域(NDR = 3),每个区域可能有两到三个非重叠窗口,表明 PI 值较高。可以用红色轮廓标记具有最高 PI 值的三个块,用黑色轮廓标记其他高 PI 值的块,红色轮廓的块可供医生用于黑色素瘤分期查看。
基于深度学习的黑色素瘤自动检测与分期技术
3. 结果与讨论
在这部分,将对深度学习算法和经典基于特征的技术的性能进行评估,主要从分割性能和 PI 计算性能两方面展开。
3.1 分割性能评估
将 PI - SegNet 技术与两种基于特征的技术(FCM + KM 和 Otsu + SVM)进行分割性能比较。
-
FCM + KM 技术
:Mungle 等人使用 FCM 将输入图像分割为背景和核,然后使用 KM 算法将核分类为被动核和活跃核。
-
Otsu + SVM 技术
:使用 Otsu 阈值将输入图像分割为背景和核,然后使用 SVM 作为分类器。
通过主观比较和客观指标评估,PI - SegNet 技术表现出色。主观上,PI - SegNet 提供了出色的核分割结果,而 FCM + KM 和 Otsu + SVM 技术在分割结果中显示出粗糙的边界,且在阳性核边界周围有一些像素被错误分割为阴性核。这主要是因为这两种技术基于阈值,在分割过程中未考虑核的形状特征。
客观指标方面,使用准确性度量和 BF 分数进行评估,结果如下表所示:
| 技术 | 准确性(背景) | 准确性(活跃核) | 准确性(被动核) | BF 分数(背景) | BF 分数(活跃核) | BF 分数(被动核) |
| — | — | — | — | — | — | — |
| FCM + KM | 0.83 | 0.97 | 0.82 | 0.99 | 0.80 | 0.97 |
| Otsu + SVM | 0.84 | 0.95 | 0.82 | 0.98 | 0.97 | 0.93 |
| PI - SegNet | 0.87 | 0.97 | 0.86 | 0.99 | 0.96 | 0.98 |
从表中可以看出,PI - SegNet 技术在所有类别上提供了平均 97% 的 BF 分数和 88% 的准确性。
3.2 PI 计算性能评估
将 PI - SegNet 技术与 FCM + KM、Otsu + SVM 和 GMM + CNN 技术进行 PI 计算性能比较。通过比较不同图像索引下的 PI 值与真实值,发现 PI - SegNet 提供了最佳结果。
| 图像索引 | 真实值 | FCM + KM | Otsu + SVM | GMM + CNN | PI - SegNet |
| — | — | — | — | — | — |
| 1 | 11 | 16.08 | 10.21 | 8.75 | 11.81 |
| 2 | 9 | 12.56 | 7.923 | 7.36 | 8.30 |
| 3 | 11 | 14.58 | 9.63 | 8.96 | 10.17 |
| 4 | 9 | 12.97 | 8.53 | 8.52 | 8.60 |
| 5 | 10 | 15.09 | 9.57 | 9.54 | 9.91 |
| 6 | 9.8 | 10.45 | 6.74 | 6.41 | 10.40 |
| 7 | 16 | 25.05 | 15.93 | 13 | 16.53 |
| 8 | 18 | 28.83 | 18.19 | 15.20 | 17.50 |
| 9 | 19 | 28.25 | 18.51 | 16.25 | 17.56 |
| 10 | 13 | 20.88 | 9.67 | 9.50 | 13.79 |
| 11 | 13 | 20.98 | 11.74 | 10.10 | 13.97 |
| 12 | 16 | 25.93 | 15.00 | 12.22 | 15.70 |
GMM + CNN 技术虽然能完美分离两个核,但无法对同时包含活跃核和被动核的斑块进行分类,且有时在检测非块状核时会失败,其 PI 值往往低于真实值。
在整体性能比较方面,使用 MAE 和 RMSE 指标,结果表明 PI - SegNet 实现了 0.73 的 RMSE 和 0.65 的 MAE,远小于其他技术。
mermaid 流程图展示不同技术的性能比较:
graph LR
A[PI - SegNet] --> B(RMSE: 0.73)
A --> C(MAE: 0.65)
D[FCM + KM] --> E(RMSE: 较大)
D --> F(MAE: 较大)
G[Otsu + SVM] --> H(RMSE: 较大)
G --> I(MAE: 较大)
J[GMM + CNN] --> K(RMSE: 较大)
J --> L(MAE: 较大)
3.3 运行时间复杂度比较
比较 PI - SegNet 技术与 FCM + KM、Otsu + SVM 和 GMM + CNN 技术的运行时间复杂度。所有技术均使用 Matlab R2018a 与神经网络工具箱实现,实验在 Windows 10 计算机(Intel i7 - 4790 CPU,12 GB RAM)上进行,CNN 架构使用 NVIDIA GeForce GTX 745 显卡训练。结果如下表所示:
| 技术 | 执行时间(秒) |
| — | — |
| FCM + KM | 89.4 |
| GMM + CNN | 129.6 |
| Otsu + SVM | 15.7 |
| PI - SegNet | 13.8 |
FCM + KM 和 GMM + CNN 技术计算密集,执行时间长。FCM + KM 主要由于 FCM 和 KM 算法的大量迭代;GMM + CNN 主要因为 GMM 用于核检测的时间占总执行时间的约 90%。PI - SegNet 技术在四种技术中计算复杂度最低,在 PI 准确性和计算复杂度方面均表现出色。
4. 总结
在黑色素瘤的自动检测和分期中,基于 CNN 架构的深度学习算法展现出了卓越的性能。通过 CNN 架构的核分割与分类模块,能准确地将图像分割为背景、活跃核和被动核。PI 值的计算为黑色素瘤的分期提供了重要依据,通过对分割图像的处理和区域选择,能为医生提供有价值的信息。
实验结果表明,PI - SegNet 技术在分割性能、PI 计算性能和运行时间复杂度方面均优于经典的基于特征的技术。随着深度学习技术的不断发展,相信在医学图像分析领域将有更广泛的应用和更出色的表现,为黑色素瘤的诊断和治疗提供更有力的支持。
超级会员免费看
35

被折叠的 条评论
为什么被折叠?



