22、黑色素瘤自动检测与分期技术解析

黑色素瘤自动检测与分期技术解析

1. 引言

传统上,病理学家使用显微镜检查组织切片来诊断黑色素瘤,但这种方法存在观察者间和观察者内的差异,且手动检查高分辨率全切片图像(WSI)既困难又耗时。随着WSI分析系统的发展,计算机辅助技术能够解决这些问题,提供高效的诊断。

2. 数据描述

用于评估黑色素瘤检测和增殖指数(PI)计算技术的数据集来自阿尔伯塔大学开发的WSI图像数据集。该数据集包含皮肤和淋巴结活检样本,这些样本是在加拿大埃德蒙顿的十字癌症研究所按照皮肤黑色素瘤标本检查方案收集的。

  • 样本处理 :活检样本的组织块经过福尔马林固定和石蜡包埋后,用安装在切片机上的钢刀切成薄片(如4μm用于光学显微镜),然后安装在载玻片上,并用一种或多种显微镜染色剂染色。
  • 图像采集 :使用Aperio Scanscope(CS)扫描系统在40倍放大下捕获数字图像,分辨率为0.25μm/像素,采用默认校准和照明设置。典型图像大小约为30,000×50,000(彩色),每个图像包含数千个需要分析的细胞核。
  • 数据集构成 :数据集包括64张皮肤组织WSI和39张淋巴结组织WSI。所有皮肤活检图像仅来自H&E染色的切片,淋巴结图像的染色情况如下表所示:
    | 染色剂 | 图像数量 |
    | ---- | ---- |
    | H&E | 9 |
    | MART - 1 | 9 |
    | CD - 45 | 5 |
    | S - 100 | 7 |
    | Ki - 67 | 9 |
3. 黑色素瘤检测

CAD系统检测黑色素瘤通常依赖于皮肤组织中黑素细胞的分布、数量、大小和位置。正常皮肤组织的黑素细胞通常位于基底层,约占细胞总数的5% - 10%,且形状规则呈椭圆形。而在黑色素瘤病变中,黑素细胞形状不规则,也可出现在真皮或表皮中层。黑色素瘤检测技术通常包括以下步骤:

graph LR
    A[表皮/真皮分割] --> B[细胞核分割]
    B --> C[黑色素瘤分类]
  • 表皮/真皮分割
    • Haggerty等人提出通过对WSI应用颜色空间归一化、增强和阈值处理,然后进行形态学操作来分割表皮区域。
    • Xu等人提出使用形状和颜色强度特征来识别H&E染色图像中的表皮区域。
  • 细胞核分割
    • 传统方法 :许多技术使用细胞核种子检测,然后进行基于种子的分割。一些研究人员提出使用阈值技术来识别和分割细胞核,但这些技术无法分割聚集的细胞核。Cheng和Rajapakse提出使用内距离图检测细胞核种子,并使用自适应H - 极小值变换指示细胞核区域,然后进行合并。Parvin等人提出使用投票技术检测细胞核种子,该技术使用细胞核簇的初始掩码,并在簇边界上生成多个投票点。Xu等人提出使用椭圆描述符检测细胞核簇,并使用具有高斯核权重的投票区域检测细胞核种子。这些技术虽然提供了较好的细胞核分割性能,但计算复杂度高,需要调整大量预定义参数。
    • 基于形态特征的方法 :为了降低复杂度,一些技术结合细胞形态特征和基于阈值的技术来分割细胞核。Xu等人提出应用广义高斯拉普拉斯(gLoG)滤波器进行细胞核种子检测,通过将不同方向和尺度的gLoG滤波器与WSI卷积,然后基于特征图的局部最大值检测细胞核种子。Xu等人还提出了基于gLoG技术检测的细胞核种子进行细胞核分割的技术,该技术使用从细胞核种子发出的多条径向线的梯度强度,结合高梯度像素位置和形状信息准确分割细胞核。
  • 深度学习方法 :近年来,使用卷积神经网络(CNN)的深度学习算法在医学图像分析中取得了成功。不同的CNN模型架构可用于不同的任务,如分类或分割。
    • Ciresan等人提出了一种基于CNN的技术来分割电子显微镜图像中的神经元膜,该CNN包含四个卷积层和两个全连接层,通过对每个像素周围的方形区域进行分类来进行分割,但计算复杂度高。
    • Long等人提出了一种低复杂度的基于CNN的对象分割技术,该技术包含多个卷积层、几个(最大)池化层和全连接层,但使用一个可学习的上采样层代替全连接层,有助于重建与输入图像大小相同的类概率图,然后通过阈值处理得到分割图像,但在边界/边缘处会丢失一些信息。
    • Badrinarayanan等人提出了SegNet架构用于高效对象分割,该技术使用与最大池化层数量兼容的多个上采样层,并将最大池化索引转移到上采样层以减少边界/边缘的模糊。
    • Ronneberger等人提出了U - Net架构用于生物医学图像分割,该架构由编码器和解码器两侧组成,使用大量滤波器,通过编码器侧的池化层和卷积层提取上下文信息,然后在解码器侧使用卷积层和上采样层结合上下文信息返回与输入图像原始大小相同的分割图像。
4. 黑色素瘤检测技术模块详解

为了检测皮肤组织中的黑色素瘤,开发了一种使用CNN分割H&E染色图像中的细胞核,然后将分割的细胞核分类为正常和黑素细胞的技术。该技术由三个模块组成:
- 表皮区域识别
- 初步分割 :通过对H&E染色图像应用全局阈值和表皮区域的形状特征进行表皮区域分割。
- 精细分割 :如果估计的表皮掩码厚度低于预定义阈值,则认为分割准确,结果传递到下一个模块;否则,应用精细分割模块,使用K - 均值算法对表皮掩码进行处理,以细化表皮分割结果。表皮分割是基于组织病理学图像进行皮肤癌诊断的重要步骤,诊断可以通过首先分析表皮/真皮或交界区的分割细胞特征,然后对病变进行分级和分类来完成。
- 基于CNN的细胞核分割
- NS - Net架构 :使用一种新的CNN架构(NS - Net)将H&E染色图像分割为细胞核和背景两类。该架构由五个卷积层、一个softmax层和一个像素分类层组成。
- 卷积层 :每个卷积层包括卷积、批量归一化和整流线性单元(ReLU)激活三个操作。
- 卷积 :卷积操作的输出通过将输入(I)与多个滤波器卷积计算得到,公式为$x_j = I * W_j + b_j$,其中F是滤波器数量,$x_j$是第j个卷积滤波器的输出,$W_j$是第j个滤波器的权重,$b_j$是第j个偏置。在NS - Net中,每层滤波器数量为64,滤波器大小从3×3到11×11不等。
- 批量归一化 :用于加速NS - Net的训练并减少初始化的影响,通过减去小批量的均值并除以其标准差来归一化每个输入通道,然后对归一化值进行缩放和偏移,公式为$y_i = \sigma\hat{x} i + \beta$,其中$\sigma$和$\beta$是在网络训练期间可学习的缩放和偏移因子。
- ReLU :使用ReLU作为激活函数,将所有负特征值替换为零,公式为$f = max(0, y)$,与tanh和sigmoid激活函数相比,ReLU具有加速训练和诱导隐藏单元稀疏性的优点。
- Softmax层 :应用于最后一个卷积层之后,用于生成每个像素分类结果的概率分布。最后一个卷积层的输出由大小为K×L的C个特征图组成,通过计算特征图的指数求和$\phi(k, l) = \sum
{i = 1}^{M} exp(\phi_i(k, l))$,然后计算每个像素在第i类的概率$P_i(k, l) = \frac{exp(\phi_i(k, l))}{\phi(k, l)}$,在本部分中,所有输入像素被分类为两类:细胞核和背景。
- 像素分类层 :根据相应的类概率对图像像素进行分类,每个像素被分配到概率较高的类。
- CNN训练
- 数据集划分 :使用24张高分辨率淋巴结图像(1920×2500彩色像素)进行训练,每张图像被划分为重叠的64×64彩色像素块,得到458个块图像,总共10,992个块图像被划分为70%训练(7694张图像)、15%验证(1099张图像)和15%测试图像(1099张图像)。地面真值图像通过在医生监督下手动分割获得。
- 损失函数 :使用交叉熵作为多类分类的损失函数,对于训练图像中位置为(k, l)的像素,损失函数$X(k, l) = \sum_{i = 1}^{M} T_i(k, l) lnP_i(k, l)$,其中$T_i(k, l)$是第i个地面真值类概率,$P_i(k, l)$是第i类概率(由softmax层预测)。损失函数在一个小批量的训练图像上进行聚合,公式为$E = \sum_{s = 1}^{S} \sum_{k = 1}^{K} \sum_{l = 1}^{L} X_s(k, l)$。由于两类像素的分布不同,对损失函数进行加权,权重$\phi_i = \frac{median freq}{freq(i)}$,其中$freq(i)$是代表第i类的像素数量与训练数据集中总像素数量的比率,$median freq$是类频率的中位数。
- 优化器 :使用带动量的随机梯度下降(SGDM)优化器来最小化损失函数E,网络参数在第n次迭代结束时更新公式为$\theta_{n + 1} = \theta_n - \alpha\nabla E(\theta_n) + \mu(\theta_n - \theta_{n - 1})$,其中$\theta$是参数向量,$\nabla E(\theta)$是损失函数的梯度,$\alpha$是学习率,$\mu$是动量。在每个小批量上计算训练准确率和损失,每250次迭代结束时在验证数据集上计算验证准确率和损失。当验证准确率在之前的五次验证中没有增加时,网络训练停止。

5. 细胞核分类

使用NS - Net架构分割得到的细胞核将被分类为黑素细胞细胞核和其他细胞细胞核,该过程包含以下两个步骤:
- 特征提取 :从分割得到的细胞核中提取相关特征,这些特征将作为后续分类的依据。不过传统的细胞核特征提取方法通常依赖于一些手工特征,需要进行参数调整,并且处理时间较长。
- 特征分类 :依据提取的特征对细胞核进行分类。在这方面,深度学习算法展现出了优势。例如,卷积神经网络(CNN)在医学图像分析中取得了成功应用。其特征提取过程在许多应用中表现出高绩效和低计算复杂度。

6. 技术总结与对比
技术类型 代表方法 优点 缺点
传统细胞核分割方法 阈值技术、基于种子的分割技术等 部分方法原理简单 无法分割聚集细胞核,计算复杂度高,需大量参数调整
基于形态特征的细胞核分割方法 gLoG滤波器相关方法 结合形态特征降低复杂度 仍需一定的参数调整
深度学习CNN方法 Ciresan法、Long法、SegNet架构、U - Net架构、NS - Net架构 特征提取高效,复杂度低或分割效果好 部分方法计算复杂度高或边界信息丢失
7. 实际应用与效果

在实际应用中,使用上述技术对黑色素瘤进行检测和分期具有重要意义。通过对数据集的训练和测试,NS - Net架构在细胞核分割方面表现出了较好的效果。例如,在训练过程中,训练和验证准确率曲线总体上保持一致,表明网络训练的稳定性。

graph LR
    A[输入H&E染色图像] --> B[NS - Net架构处理]
    B --> C[输出细胞核掩码图像]

从实际的图像结果来看,输入的H&E染色图像经过NS - Net架构处理后,能够得到清晰的细胞核掩码图像,为后续的细胞核分类和黑色素瘤诊断提供了基础。

8. 未来展望

随着技术的不断发展,黑色素瘤的自动检测和分期技术有望进一步提升。一方面,可以进一步优化现有的CNN架构,减少计算复杂度,提高分割和分类的准确性。另一方面,可以结合更多的医学知识和数据,如患者的临床信息、基因数据等,提高诊断的全面性和准确性。同时,随着人工智能技术的不断进步,有望实现更智能化的诊断系统,为医生提供更准确、高效的诊断辅助。

综上所述,基于CNN的黑色素瘤检测和分期技术为黑色素瘤的诊断提供了一种高效、准确的方法。通过不断地研究和改进,相信这些技术将在未来的医学领域发挥更大的作用,为患者带来更好的治疗效果。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值