基于信号处理的脉搏诊断方法研究
1. 特征选择原理
在进行脉搏信号分析以诊断疾病时,每个特征在健康人和特定疾病患者之间的统计差异,反映了该特征对疾病的敏感性。这一统计差异决定了该特征是否应被选择用于分类。如果某个特征的统计差异较大,那么它就是该疾病的良好指标,应被选作分类特征;反之,则不宜使用。
2. FCM 聚类用于模式分类
- 原理 :聚类是统计数据分析的常用技术,旨在将数据点分组,使同一类中的项目尽可能相似,不同类中的项目尽可能不同。模糊聚类有多种算法,模糊 C 均值(FCM)算法是应用最广泛的算法之一。
- 应用 :在本研究中,选择对疾病敏感的特征后,使用 FCM 进行模式分类。FCM 能够对属于两个或多个组的数据进行分类,并且其使用的隶属函数允许一个对象同时以不同程度属于多个聚类,这一特性对疾病诊断非常重要。
3. 实验过程与结果
- 数据收集 :与哈尔滨 211 医院合作,使用多普勒超声血液分析仪收集了 100 份健康人以及 88 份不同疾病患者的手腕脉搏信号。随机选取一半数据用于训练,其余用于测试。测试数据集包括 50 份健康人信号(H 组)、23 份胰腺炎患者信号(P 组)和 21 份十二指肠球部溃疡患者信号(DBU 组)。
-
信号处理
- 波形划分与拟合 :将这些信号划分为单周期波形,然后使用改进的高斯模型拟合每个单周期波形。
- 特征计算与筛选 :计算高斯拟合参数 (A_1)、(A_2)、(\tau_1)、(\tau_2)、(\sigma_1)、(\sigma_2) 和波形长度 (L)。通过互相关分析找出紧密相关的特征,发现幅度相关特征(如 (A_2/A_1))与时间相关特征(如 (\tau_2/\tau_1) 和 (\sigma_2/\sigma_1))不相关,且三组数据中都存在紧密相关的两对特征:((\tau_2/\tau_1, \tau_1/L)) 和 ((\sigma_2/\sigma_1, \sigma_2/L))。因此,可消除两个特征,得到包含五个特征的特征向量:(A_2/A_1)、(\tau_2/\tau_1)、(\sigma_2/\sigma_1)、(\tau_2/L) 和 (\sigma_1/L)。
- 特征选择 :计算所选特征的统计差异,结果表明 (\sigma_2/\sigma_1) 的统计差异最大,是区分 H 组和 P 组的最佳参数;(\tau_2/L) 和 (A_2/A_1) 也因在三组数据中统计差异较大而被选中。最终选择三个特征((\sigma_2/\sigma_1)、(\tau_2/L) 和 (A_2/A_1))用于分类。
-
分类结果
:使用 FCM 分类器对测试数据集进行分类,结果如下表所示:
|样本类别|测试样本数|分类结果|准确率(高斯模型)|准确率(AR 模型)|准确率(WT 方法)|
| ---- | ---- | ---- | ---- | ---- | ---- |
|H 组|50|48(2)|96.0|94.5|88.9|
|P 组|23|21(2)|91.3|80.6|80.5|
|H 组|50|42(8)|84.0|85.9|82.3|
|DBU 组|21|19(2)|90.4|74.3|77.1|
|P 组|23|21(2)|91.3|90.9|87.3|
|DBU 组|21|19(2)|90.4|88.9|83.7|
|H 组|50|48(2)|84.0|85.1|78.9|
|DBU 组|21|21(2)|76.2|77.1|72.7|
|P 组|23|42(8)|95.7|73.5|60.0|
从结果可以看出,单独使用特征 (A_2/A_1) 区分 H 组和 P 组的准确率达到 94.5%,仅 2 名健康人和 2 名胰腺炎患者被误分类。将三组数据混合后,分类准确率仍能达到 85%,且该方法比之前的小波变换方法和自回归方法具有更高的分类准确率,显示出在脉搏诊断方面的巨大潜力。
4. 改进自回归模型分析脉搏信号
- 方法概述 :提出一种新颖的时间序列分析方法来分析手腕脉搏信号。首先进行数据归一化,从健康人记录的信号集合中选择与新获得信号“最接近”的参考信号;然后从该参考信号构建自回归(AR)模型;最后,将新信号的实际测量值与参考信号建立的 AR 模型预测值之间的残差误差定义为对疾病敏感的特征。
-
特征提取步骤
-
数据归一化
:对于使用多普勒超声设备收集的手腕脉搏信号 (f(t)),在拟合 AR 模型之前进行归一化处理:
[
\hat{f}(t) = \frac{f(t) - m_f}{\delta_f}
]
其中 (m_f) 和 (\delta_f) 分别是 (f(t)) 的均值和标准差。 -
构建参考 AR 模型
:通过对所有可用健康人训练样本的归一化脉冲信号 (\hat{f}(t)) 求平均得到参考信号 (\bar{f}(t))。具有 (n) 项的参考 AR 模型构建如下:
[
\bar{f}(t) = \sum_{i = 1}^{n} a_i \bar{f}(t - i) + \epsilon_f(t)
]
其中 (a_i)((i = 1,2,\cdots,n))是第 (i) 个 AR 系数,(\epsilon_f(t)) 是表示建模误差的项。AR 模型的阶数由赤池信息准则(AIC)确定,AR 系数使用最小二乘法计算。 -
计算预测误差
:对于未知健康状态的手腕脉搏信号 (g(t)),用参考 AR 模型进行拟合:
[
\epsilon_g(t) = g(t) - \sum_{i = 1}^{n} a_i g(t - i)
]
其中 (\epsilon_g(t)) 是预测误差。计算 (\epsilon_g(t)) 的均值和标准差,分别记为 mean_ (\epsilon_g) 和 std_ (\epsilon_g)。由于健康人的脉搏信号能被参考模型准确预测,预测误差的均值和标准差相对较小;而患者的脉搏信号参考模型难以准确预测,预测误差的均值和标准差会增大,因此这两个值是对 (g(t)) 进行分类的重要特征。
-
数据归一化
:对于使用多普勒超声设备收集的手腕脉搏信号 (f(t)),在拟合 AR 模型之前进行归一化处理:
-
SVM 分类
- 原理 :支持向量机(SVM)是一种监督学习分类方法。给定一组形式为 (D = { (x_i, y_i) : x_i \in R^p, y_i \in { -1, 1 }, i = 1, \cdots, n }) 的点,其中 (y_i) 表示点 (x_i) 所属的类别,SVM 的目标是找到一个分离超平面 (w \cdot x - b = 0),使两类点之间的间隔最大。
-
软边距 SVM
:当不存在能完全分离两组数据的超平面时,软边距 SVM 会选择一个尽可能干净地分离两组数据的超平面,同时最大化到最近干净分离示例的距离。软边距 SVM 引入松弛变量 (\xi_i) 来衡量数据点 (x_i) 的误分类程度:
[
y_i (w \cdot x_i - b) \geq 1 - \xi_i, \quad \xi_i \geq 0
]
5. 实验验证与结论
使用多普勒超声设备收集的手腕脉搏信号数据库验证了该方法的适用性。在区分健康人和急性阑尾炎患者时,分类准确率超过 82%;对于其他疾病,分类准确率超过 90%。这些结果表明,该方法在区分健康人和特定疾病患者方面具有很大的潜力,有望为脉搏诊断提供更准确、客观的方法。
以下是整个分析流程的 mermaid 流程图:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([开始]):::startend --> B(收集脉搏信号):::process
B --> C(信号预处理):::process
C --> D{特征选择}:::decision
D -->|统计差异大| E(选择特征):::process
D -->|统计差异小| F(舍弃特征):::process
E --> G(FCM 聚类分类):::process
E --> H(构建 AR 模型):::process
H --> I(计算预测误差):::process
I --> J(SVM 分类):::process
G --> K(评估分类结果):::process
J --> K
K --> L([结束]):::startend
综上所述,无论是基于 FCM 聚类的方法,还是改进的自回归模型结合 SVM 分类的方法,都在脉搏诊断中展现出了良好的性能和应用前景。这些方法有望为传统中医的脉搏诊断提供科学的量化依据,推动脉搏诊断技术的现代化发展。
基于信号处理的脉搏诊断方法研究
6. 方法对比与优势分析
- 与传统方法对比 :传统的脉搏诊断主要依赖医生的主观经验,不同医生可能给出不同的诊断结果,缺乏客观性和标准化。而上述介绍的基于信号处理的方法,通过对脉搏信号进行量化分析,能够提供更准确、客观的诊断依据。例如,在区分健康人和患者的实验中,这些方法的分类准确率较高,明显优于传统的主观诊断方法。
- 不同信号处理方法对比 :在信号处理方法中,基于 FCM 聚类的方法和改进的自回归模型结合 SVM 分类的方法各有特点。FCM 聚类方法通过选择对疾病敏感的特征,利用模糊 C 均值算法进行模式分类,能够处理数据属于多个类别的情况,并且考虑了对象属于不同类别的程度。而改进的自回归模型结合 SVM 分类的方法,通过构建参考 AR 模型,将预测误差作为疾病敏感特征,利用支持向量机进行分类,能够有效区分健康人和患者。从实验结果来看,两种方法都具有较高的分类准确率,但在不同的疾病类型和数据集上可能表现不同。例如,在区分健康人和急性阑尾炎患者时,改进的自回归模型方法分类准确率超过 82%;而在区分健康人和胰腺炎患者时,FCM 聚类方法单独使用特征 (A_2/A_1) 区分的准确率达到 94.5%。
7. 实际应用中的考虑因素
- 数据质量 :在实际应用中,数据质量对诊断结果的准确性至关重要。使用多普勒超声设备收集手腕脉搏信号时,可能会受到各种因素的影响,如设备的精度、操作的规范性、环境的干扰等。因此,在数据收集过程中,需要确保设备的正常运行,规范操作流程,尽量减少环境干扰,以提高数据的质量。
- 特征选择 :特征选择是脉搏诊断方法中的关键步骤。选择合适的特征能够提高分类的准确率,而选择不当的特征可能会导致误分类。在进行特征选择时,需要考虑特征的敏感性、相关性和稳定性。例如,在上述研究中,通过互相关分析找出紧密相关的特征,消除冗余特征,选择具有较大统计差异的特征,从而提高了分类的准确性。
- 模型泛化能力 :在构建模型时,需要考虑模型的泛化能力。模型不仅要在训练数据集上表现良好,还要在测试数据集和实际应用中具有较高的准确性。为了提高模型的泛化能力,可以采用交叉验证、正则化等方法,避免模型过拟合。
8. 未来发展方向
- 多模态数据融合 :目前的研究主要基于手腕脉搏信号进行分析,未来可以考虑将多种模态的数据进行融合,如心电图、血压、体温等。通过融合多种数据,可以获取更全面的人体健康信息,提高诊断的准确性。
- 深度学习应用 :深度学习在图像识别、语音识别等领域取得了显著的成果,未来可以将深度学习技术应用于脉搏诊断中。例如,使用卷积神经网络(CNN)、循环神经网络(RNN)等模型对脉搏信号进行特征提取和分类,可能会进一步提高诊断的准确率。
- 个性化诊断 :不同人的身体状况和生理特征存在差异,未来可以根据个体的特点,如年龄、性别、体质等,进行个性化的诊断。通过建立个性化的诊断模型,可以提高诊断的针对性和准确性。
9. 总结
本文介绍了两种基于信号处理的脉搏诊断方法:基于 FCM 聚类的方法和改进的自回归模型结合 SVM 分类的方法。这两种方法通过对脉搏信号进行特征提取和分类,能够有效区分健康人和患者,具有较高的分类准确率。在实际应用中,需要考虑数据质量、特征选择和模型泛化能力等因素。未来,脉搏诊断方法有望朝着多模态数据融合、深度学习应用和个性化诊断等方向发展,为传统中医的脉搏诊断提供更科学、准确的方法,推动脉搏诊断技术的现代化发展。
以下是实际应用中考虑因素的表格总结:
|考虑因素|具体内容|
| ---- | ---- |
|数据质量|确保设备正常运行,规范操作流程,减少环境干扰|
|特征选择|考虑特征的敏感性、相关性和稳定性,消除冗余特征|
|模型泛化能力|采用交叉验证、正则化等方法,避免模型过拟合|
以下是未来发展方向的 mermaid 流程图:
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A([未来发展方向]):::startend --> B(多模态数据融合):::process
A --> C(深度学习应用):::process
A --> D(个性化诊断):::process
超级会员免费看
300

被折叠的 条评论
为什么被折叠?



