基于深度学习的智能医疗物联网乳腺癌自动检测与分类模型
在当今社会,乳腺癌已成为全球女性健康的重大威胁,是女性中最常见的癌症之一,占癌症患者总数的 23%,因癌症死亡人数的 14%。早期发现乳腺癌对于提高患者的生存率至关重要,而医疗物联网(IoMT)和数字乳腺摄影技术在乳腺癌的早期有效诊断中发挥着重要作用。本文将介绍一种基于深度学习的智能 IoMT 乳腺癌检测与诊断模型——LBP - DNN 模型。
医疗物联网与乳腺癌诊断
医疗物联网(IoMT)是医疗设备和应用程序的集成,它通过网络技术将医疗信息技术系统连接起来。通过将患者与医生相连,IoMT 减少了不必要的医院就诊次数,减轻了医疗系统的负担,并实现了医疗数据在安全网络上的通信。
在乳腺癌诊断方面,乳腺摄影检查是医生准确分析乳腺癌的重要手段。乳腺摄影筛查计划的目标是通过在疾病早期进行诊断来降低乳腺癌的死亡率。然而,传统的人工诊断方式存在一定的局限性。放射科医生在筛查过程中观察乳腺摄影图像,但即使是经验丰富的医生也可能会出现误诊,将患者误诊为正常情况。计算机辅助诊断(CAD)系统则可以作为医生的辅助工具,减少误诊率,提高诊断的准确性。CAD 系统包含分类、特征提取、分割和预处理等多种处理方法,每个处理阶段在诊断中都同样重要。
深度学习在乳腺癌诊断中的应用
深度学习技术为解决 CAD 系统中的分类问题提供了新的思路。深度卷积神经网络(DCNN)是一种深度学习架构,可用于解决计算机视觉应用中的分类问题。与传统的分类技术如支持向量机(SVM)、随机森林(RF)相比,DCNN 能够通过不同的卷积滤波器提取特征,从而解决分类问题。传统的分类技术高度依赖训练数据的类别,并且选择特定数量的特征进行测试和选择是一项繁琐的操作。而深度学习技术通过大量的数据库获取应用领域的更多信息,克服了这一问题。
尽管从头开始训练 DCNN 由于梯度消失和收敛问题而具有一定的复杂性,但它能够在无需人工干预的情况下获得高度有用的描述,提高特征提取和分类的性能。然而,由于乳腺摄影图像的同质性,自动对乳腺肿块进行分类仍然是一项具有挑战性的任务。目前,许多研究技术在乳腺癌诊断领域中应用了手工制作的特征和传统的机器学习分类技术。
LBP - DNN 模型的工作原理
LBP - DNN 模型的工作流程包括 IoMT 图像采集、预处理、基于 K - 均值聚类的分割、基于局部二值模式(LBP)的特征提取以及基于深度神经网络(DNN)的分类。以下是该模型各步骤的详细介绍:
1.
IoMT 图像采集
:通过 IoMT 技术收集数字乳腺摄影图像。
2.
预处理
:对采集到的图像进行预处理,以消除图像中的伪影,提高图像质量。
3.
K - 均值聚类分割
:
-
选择聚类数量和初始质心
:选择聚类数量 $J <$,并确定初始聚类质心 $v_i$,$i = 1, 2, … k$。
-
分配数据点到聚类
:使用欧几里得距离 $d_{ij} = \left\lVert x_j - v_i \right\rVert$ 将输入数据点 $x_j$ 分配到最近的聚类质心 $v_i$,其中 $X = {x_1, x_2, … x_n}$ 表示输入数据集。
-
计算聚类分配矩阵
:计算聚类分配矩阵 $U$,表示数据点的划分以及第 $j$ 个数据点到第 $i$ 个聚类的二进制隶属值,其中 $U = \left[ u_{ij} \right]$,$u_{ij} \in {0, 1}$ 对于所有 $i, j$,$\sum_{i = 1}^{k} u_{ij} = 1$ 对于所有 $j$ 且 $0 < \sum_{j = 1}^{n} u_{ij} < n$ 对于所有 $i$。
-
重新估计质心
:根据隶属值重新估计质心 $n_i = \frac{\sum_{j = 1}^{n} u_{ij} x_j}{\sum_{i j = 1}^{n} u_{ij}}$ 对于所有 $i$。
-
迭代更新
:如果聚类质心保持不变,则停止迭代;否则,返回步骤 2。
-
目标函数
:K - 均值聚类模型的目标函数为 $J_w(U, v) = \sum_{i = 1}^{h} \sum_{j = 1}^{n} \left\lVert x_j - v_i \right\rVert^2$。该模型对初始聚类分配和距离度量的选择非常敏感,可以在目标函数中添加额外的聚类方差标准,以优化目标函数。
4.
LBP 特征提取
:
-
LBP 原理
:LBP 是一种用于纹理定义的算子,它基于相邻像素与中心像素之间的差异符号。对于图像中的每个像素值,通过使用中心像素对邻域进行阈值处理,获得一个二进制代码,即二进制模式。如果邻域像素值高于阈值,则为 1;否则为 0。
-
特征向量生成
:将直方图组合成一个单独的向量,该向量被视为模式向量。当 LBP 使用 8 个像素时,直方图的数量为 $2^8 = 256$。
-
LBP 函数
:LBP 的函数可以表示为 $LBP(u_c, v_c) = \sum_{n = 0}^{7} 2^n g(I_n - I(u_c, v_c))$,其中 $LBP(u_c, v_c)$ 定义了中间像素 $(u_c, v_c)$ 的 LBP 值,$I_n$ 和 $I(u_c, v_c)$ 分别是相邻像素和中心像素的值,$g(u)$ 在 $u < 0$ 时为 0,在 $u \geq 0$ 时为 1。
5.
DNN 分类
:
-
人工神经网络(ANN)与深度学习
:ANN 机制应用了不同层次的隐藏单元和输出,即深度学习。它包括预训练和微调两个阶段。
-
预训练阶段
:使用深度信念网络(DBN)从输入层到输出层生成多个隐藏层。DBN 中的隐藏单元区分网络并生成激活函数,同时使用受限玻尔兹曼机(RBM)解决可行激活函数的生成问题。
-
受限玻尔兹曼机(RBM)
:RBM 属于马尔可夫随机域,由单层随机隐藏单元和单层随机可见单元组成。训练 RBM 向量的能量函数为 $F(v, h) = - \sum_{k = 1}^{K} \sum_{l = 1}^{L} W_{kl} v_k h_l - \sum_{k = 1}^{K} \alpha_k v_k - \sum_{l = 1}^{L} \beta_l h_l$,其中 $W_{kl}$ 是可见单元 $v_k$ 和隐藏单元 $h_l$ 之间的对称交互,$\alpha, \beta$ 是偏置项,$K, L$ 分别是可见单元和隐藏单元的数量。隐藏单元 $h_l = 1$ 给定可见单元 $v$ 的概率为 $\rho(h_l = 1|v) = \delta(\sum_{k = 1}^{K} W_{kl} v_k + \alpha_l)$,其中 $\delta(x)$ 是逻辑 sigmoid 函数。
-
更新过程
:在给定可见单元和隐藏单元的情况下,扩展隐藏单元。更新权重的公式为 $\Delta W_{kl} = \theta (v_k h_l)
{data} - (v_k h_l)
{reconstruction}$。通过多层模型堆叠不同的 RBM,将输入可见层排序为向量,使用分布式方法在最近的权重和偏置中分布 RBM 层有效开发的单元质量。获得的 DNN 权重将用于微调阶段。
-
微调阶段
:基于反向传播(BP)模型进行微调。在 DNN 的顶部安排输出层,在深度学习方法中使用 $N$ 个输入神经元和 3 个隐藏层。在训练阶段获得改进的权重,并使用预训练阶段获得的权重初始化 BP。最后,应用公式 $\Delta W_{kl}$ 确定最小误差值,并使用最佳权重实现更高的深度学习分类准确性。
下面是 LBP - DNN 模型的整体流程 mermaid 图:
graph LR
A[IoMT 图像采集] --> B[预处理]
B --> C[K - 均值聚类分割]
C --> D[LBP 特征提取]
D --> E[DNN 分类]
实验评估
为了验证 LBP - DNN 模型的性能,使用了 MIAS 数据库进行实验。MIAS 数据库是由英国研究小组对乳腺摄影图像进行研究而生成的数字乳腺摄影图像数据库,包含 322 张数字化胶片,图像分辨率为 50 - µm 像素边缘,每个像素用 8 位表示。数据库还包含放射科医生对可能存在异常的位置标记。
通过对 LBP - DNN 模型与现有模型进行详细的比较研究,从敏感性、特异性和准确性三个方面评估了模型的性能。以下是不同模型在这三个指标上的表现对比表格:
| 模型 | 敏感性 | 特异性 | 准确性 |
| — | — | — | — |
| Energy - NB | 26.4% | 74% | 50.2% |
| 混合特征 - NB | 28% | 67.2% | 47.6% |
| Homogeneity - NB | 32% | 72% | - |
| Homogeneity - SVM | 37.6% | 66.8% | - |
| HIG - NB | 38% | - | - |
| HIG - NN | 38.4% | - | - |
| HOG - DNN | 38.4% | 55.6% | 47% |
| Homogeneity - NN | 54.4% | 39.2% | 49.2% |
| Homogeneity - DNN | 54.4% | 59.2% | - |
| Energy - NN | 56.8% | 56.4% | - |
| Energy - DNN | 56.8% | 60.8% | - |
| HOG - SVM | 57.6% | 32.8% | 45.2% |
| 混合特征 - SVM | 58% | 48.4% | - |
| 混合特征 - NN | 58.4% | 64.4% | - |
| 混合特征 - DNN | 58.4% | 60.8% | - |
| Energy - SVM | 69.6% | 38.8% | - |
| LBP - DNN | 71.64% | 75.87% | 70.53% |
从实验结果可以看出,LBP - DNN 模型在敏感性、特异性和准确性方面均表现出色,具有较高的性能优势。在敏感性方面,LBP - DNN 模型达到了 71.64%,明显高于其他模型;在特异性方面,其值为 75.87%,也优于大多数对比模型;在准确性方面,LBP - DNN 模型达到了 70.53%,展现了其在乳腺癌检测和分类中的有效性。
综上所述,LBP - DNN 模型为乳腺癌的早期检测和诊断提供了一种有效的方法,有望在临床实践中发挥重要作用,帮助医生更准确地诊断乳腺癌,提高患者的生存率。未来,随着深度学习技术和医疗物联网的不断发展,相信会有更多更先进的模型和方法应用于乳腺癌的诊断和治疗中。
基于深度学习的智能医疗物联网乳腺癌自动检测与分类模型
敏感性分析
敏感性是衡量模型正确识别出真正阳性样本的能力,即模型能够检测出实际患有乳腺癌患者的比例。在与其他模型的对比中,LBP - DNN 模型展现出了显著的优势。
从实验数据来看,许多传统模型的敏感性相对较低。例如,Energy - NB 模型的敏感性仅为 26.4%,这意味着它只能检测出约四分之一的实际乳腺癌患者,存在大量的漏诊情况。而混合特征 - NB 模型、Homogeneity - NB 模型等的敏感性也处于较低水平。
随着模型的不断改进,一些模型的敏感性有所提高。如 Homogeneity - NN 和 Homogeneity - DNN 模型达到了 54.4%,Energy - NN 和 Energy - DNN 模型达到了 56.8%,这些模型在检测乳腺癌方面有了一定的进步,但仍有提升空间。
相比之下,LBP - DNN 模型的敏感性达到了 71.64%,这表明该模型在检测乳腺癌患者方面具有较高的准确性,能够有效地发现更多的阳性病例,减少漏诊的可能性。以下是部分模型敏感性对比的柱状图 mermaid 示例:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
A(71.64% LBP - DNN):::process --> B(69.6% Energy - SVM):::process
B --> C(58.4% Hybrid Features - DNN):::process
C --> D(56.8% Energy - DNN):::process
D --> E(54.4% Homogeneity - DNN):::process
E --> F(38.4% HOG - DNN):::process
F --> G(26.4% Energy - NB):::process
特异性分析
特异性是指模型正确识别出真正阴性样本的能力,即模型能够准确判断出未患乳腺癌患者的比例。在特异性方面,不同模型也存在较大差异。
HOG - SVM 方法的特异性较低,仅为 32.8%,这意味着该模型在判断未患乳腺癌患者时存在较高的误诊率。而 Energy - SVM 方法和 Homogeneity - NN 技术的特异性分别为 38.8%和 39.2%,处于中等水平。
一些模型在特异性方面表现较好,如 Energy - NB 模型达到了 74%,而 LBP - DNN 模型的特异性更是高达 75.87%。这表明 LBP - DNN 模型在区分正常患者和乳腺癌患者方面具有很强的能力,能够有效地减少将正常患者误诊为乳腺癌患者的情况。以下是部分模型特异性对比的表格:
| 模型 | 特异性 |
| — | — |
| LBP - DNN | 75.87% |
| Energy - NB | 74% |
| Homogeneity - NB | 72% |
| Hybrid Features - SVM | 48.4% |
| HOG - SVM | 32.8% |
准确性分析
准确性是综合考虑敏感性和特异性的指标,反映了模型整体的分类性能。在准确性方面,LBP - DNN 模型同样表现出色。
许多传统模型的准确性较低,如 HOG - NB 方法的准确性仅为 42.6%,HOG - SVM 方法为 45.2%。随着模型的发展,一些模型的准确性有所提高,如 Hybrid Features - NB 达到了 47.6%,HOG - DNN 达到了 47%。
而 LBP - DNN 模型的准确性达到了 70.53%,明显高于大多数对比模型。这说明该模型在整体上能够更准确地对乳腺摄影图像进行分类,无论是判断正常患者还是乳腺癌患者,都具有较高的可靠性。以下是部分模型准确性对比的折线图 mermaid 示例:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px
A(70.53% LBP - DNN):::process --> B(50.2% Energy - NB):::process
B --> C(49.2% Homogeneity - NN):::process
C --> D(47.6% Hybrid Features - NB):::process
D --> E(47% HOG - DNN):::process
E --> F(45.2% HOG - SVM):::process
F --> G(42.6% HOG - NB):::process
模型优势总结
LBP - DNN 模型在敏感性、特异性和准确性三个关键指标上均表现优异,具有以下显著优势:
1.
高敏感性
:能够准确地检测出更多的乳腺癌患者,减少漏诊情况,为患者的早期治疗争取时间。
2.
高特异性
:可以有效地将正常患者与乳腺癌患者区分开来,降低误诊率,避免患者接受不必要的进一步检查和治疗。
3.
高准确性
:综合了敏感性和特异性的优势,在整体上对乳腺摄影图像进行准确分类,为医生的诊断提供可靠的依据。
实际应用展望
LBP - DNN 模型在乳腺癌检测和分类方面的出色表现使其具有广阔的实际应用前景。
1.
临床诊断辅助
:可以作为医生的辅助诊断工具,帮助医生更准确地判断患者是否患有乳腺癌。在面对大量的乳腺摄影图像时,模型能够快速进行初步筛选,提高诊断效率。
2.
大规模筛查
:在乳腺癌的大规模筛查中,LBP - DNN 模型可以发挥重要作用。通过对大量人群的乳腺摄影图像进行分析,能够快速发现潜在的患者,提高筛查的准确性和效率。
3.
个性化医疗
:结合患者的其他信息,如年龄、家族病史等,LBP - DNN 模型可以为患者提供更个性化的诊断和治疗建议,实现精准医疗。
未来发展方向
虽然 LBP - DNN 模型已经取得了较好的效果,但仍有进一步发展的空间。
1.
数据扩充
:使用更多的乳腺摄影图像数据对模型进行训练,尤其是不同种族、不同年龄段的图像数据,以提高模型的泛化能力。
2.
模型优化
:不断改进模型的结构和算法,进一步提高模型的性能。例如,可以尝试使用更先进的深度学习架构,或者结合其他特征提取方法。
3.
多模态融合
:将乳腺摄影图像与其他医学检查数据,如超声、磁共振成像等进行融合,综合分析患者的病情,提高诊断的准确性。
总之,LBP - DNN 模型为乳腺癌的检测和诊断提供了一种有效的解决方案,随着技术的不断发展和完善,相信它将在乳腺癌的防治中发挥越来越重要的作用。
超级会员免费看
31

被折叠的 条评论
为什么被折叠?



