用于实时心电图监测的个性化即时护理平台
摘要
随着个性化医疗技术的进步,用于持续监测和分析长期生物医学信号(如心电图(ECG))的可穿戴设备的使用已呈爆炸式增长。然而,现有的心电图监测设备性能有限,例如仅能存储心电图数据、准确率较低,并且无法在数据采集现场实现逐事件诊断。因此,个性化医疗需要一种高效的即时检测(PoC)平台,能够向用户和受试者提供实时反馈。本研究开发并基于商用32位微控制器测试平台构建了一种新型心电信号分析方法原型,该方法采用离散余弦Stockwell变换进行特征提取,并使用人工蜂群(ABC)优化的最小二乘孪生支持向量机(TSVM)作为分类器。该原型在类别方案和个性化方案两种评估方案下进行评估,并在基准MIT-BIH心律失常数据上进行了验证。在上述两种评估方案中,该原型分别实现了96.14%和86.5%的较高整体准确率,优于现有研究。该平台可用作家庭护理环境中的预警系统,用于检测异常心电图,达到先进诊断水平。
索引词 —心电图,人工蜂群,余弦斯托克韦尔变换,32位微控制器,支持向量机,即时护理(PoC)。
一、引言
INCREASING 健康意识和快速的技术进步推动了一个新兴领域的显著增长:智能医疗。预计到2020年底,智能医疗设备的总数将达到8.089亿台(其中6.46亿台为非可穿戴设备,其余为可穿戴设备),以提升医疗技术[1],[2]。对心电图(ECG)等生物医学信号的持续监测有助于心脏病专家高效诊断心血管疾病(CVDs)。心血管疾病(CVDs)是全球死亡的主要原因。心电图(ECG)是一种广泛使用的工具,用于记录和解读心脏电现象,以诊断心血管疾病[3]。由于心电图的非平稳性,长期心电图记录的分析繁琐且耗时。即使存在心脏异常或心律失常也可能被忽略,因此,心脏病专家必须依赖患者自我监测和报告的症状来进行诊断。由于以下因素:i) 对大量生物医学数据的存储需求增加;ii)用于远程医疗服务的新兴基于移动的技术;iii)开发低成本、低能耗、高速、长寿命设备的需求在工业应用中发挥着重要作用[4]。由于患者依从性提高、增强护理以及检测率提升,此类设备在市场上的采用呈现出爆炸式增长[4]。尽管如此,市场上仍不断涌现出各种新型设备,旨在诊断心血管疾病;这些设备包括:(a)医疗机构中的心电图监测系统;(b)用于短时间存储心脏活动的事件监测器;(c)可长期捕捉心脏活动的可植入式循环记录仪;(d)遥测心电图数据解决方案[4],[5]。
可能存在三种类型的心电图解决方案,具体如下:1)仅提供数据存储,由心脏病专家在离线模式下进行诊断;2)通过独立服务器实现远程实时诊断;3)在受试者所在位置的设备内进行实时分析。第一类解决方案中,霍尔特监测仪和循环记录仪较为突出,例如维塔丰、Alive技术、Ventracor PocketView或韦尔奇·艾伦 Micropaq等。这些系统仅记录、查看和存储心电图数据[6],[8],而分析则由心脏病专家[6],[7]离线完成。第二类解决方案包括MobiHealth、TeleMediCare、Osiris-SE、MOLEC[7]和PhMon等设备,它们利用智能手机或个人数字助理(PDAs)结合可穿戴无线传感器来采集心电图数据[8]。这些解决方案不在本地处理数据,而是将数据持续发送至监控中心或医院[8],从而实现远程实时监控。第三类系统中,研究人员已提出一些中间水平的本地实时分类方法,例如使用最新的智能手机或个人数字助理(PDAs)[9],进行心跳分类,但这些方法并未提供完整的心血管疾病诊断解决方案。所有这些解决方案均存在一定的局限性,例如受试者必须局限于家中、未进行逐搏分析、受试者无法了解自身心脏状况,且数据未在受试者所在位置进行分析[6]。鉴于这些因素,医疗技术迫切需要开发一种本地实时心电图诊断平台,以提供通用解来应对上述问题。高性能微处理器的持续进步使研究人员能够为手持设备开发相关应用。这些设备需要集成高效的信号处理技术,以实现心电信号的自动监测与检测[6]–[18]。特征提取与分类工具[6]–[21]是实现心电信号自动分析的关键组合工具。
二、现有方法
特征提取与分类技术在心电图心跳自动识别领域已得到深入研究,但仍存在一些问题需要进一步探索以实现高效分析。特征提取技术用于捕捉输入信号的特性,并突出其显著特征,从而用较少的系数实现更具意义的表示。特征提取技术包括频谱或频域技术[18],、心跳间期技术[22]–[24],、心电图形态[22],[23],[25],、埃尔米特多项式[26],、统计方法[27],以及离散S变换(DOST)[28],[29],用于从心电信号中提取显著特征。传统技术即傅里叶变换(FT)无法提供关于时域输入信号中频率成分出现时间的任何信息。短时傅里叶变换(STFT)通过提供固定窗口克服了FT的模糊性,但由于其窗口长度固定,仅适用于平稳信号。小波变换(WT)克服了STFT的局限性,但输入信号的分解依赖于最优小波的选择、特征子带以及分解层数的确定。这些局限性在离散S变换(DOST)[30]中得以克服,其中采用高斯窗进行心电信号检测;然而,窗口参数的选择需优化以保留心电信号的时频信息。对于希尔伯特-黄变换(HHT)[31],,该方法极易受输入信号噪声的影响。因此,上述特征提取工具在其分析领域内仍不足以捕捉具有显著区分能力的有意义系数或特征。这些特征提取工具通常与神经网络[32], 、线性判别、k-近邻(k-NN)[32]和支持向量机[32],[33]等机器学习技术结合,用于实现心电信号的自动识别。
本文提出了一种通用解决方案,通过使用32位微控制器平台开发硬件原型,实现心电图异常的本地实时检测与监测。提出了一种新的高效特征提取方法,即离散余弦Stockwell变换,并结合人工蜂群优化的最小二乘孪生支持向量机在该平台上实现。该平台在标准MIT-BIH心律失常数据库[34]上进行了验证,并在两类分析方案下进行评估,即类别(情况I)和个性化(情况II)评估方案。个性化心电图分析(情况II)方案更适用于实际场景,因为训练和测试数据集包含不同受试者的记录,由于个体间差异,数据之间不存在相似性。
本研究旨在(a)从心电信号中提取显著特征;(b)利用最佳学习参数提出一种高效的分类方案;(c)在实际场景中评估本文提出的方法,即用于个性化方案;(d)在硬件平台上实现本文提出的方法,以进行心电信号的实时监测。
本文的结构安排如下:第三节介绍了特征提取技术的理论。第四节描述了提出的方法及硬件实现,而第五节重点介绍了结果与讨论。最后,第六节对全文进行了总结。
III. 理论
本节重点介绍在本文提出的方法中用于从心电信号中提取显著特征的离散正交Stockwell变换技术的理论。
A. 离散正交Stockwell变换(DOST)
Stockwell变换(ST)[28]–[30]对时间域信号 z(t)的定义为信号的傅里叶变换(FT) z(t)与高斯窗的乘积,即:
$$
S(\tau, f)=|f|
2\pi
\int_{-\infty}^{\infty} z(t)e^{- (t-\tau)^2 f^2}{2} e^{-i2\pi ft}dt \quad (1)
$$
其中窗口大小由 $\sigma(f)= T= 1 |f|$给出。此外,ST的离散版本具有高度冗余性[30]。因此,采用离散S变换[30]来利用正交基函数集高效地表示输入信号,该基函数集可局部化频谱并保留相位特性。离散S变换对低频信号以较低速率采样,对高频信号以较高速率采样,即其在空间上局部化并降低了时间局部性。因此,离散S变换可表示为:
$$
S{z[qT]}= S(\tau T, \nu NT)=
\sum_{q=0}^{N-1}
z[qT]S[\nu,\beta,\tau][qT] \quad (2)
$$
$$
S[\nu,\beta,\tau][qT]=
\frac{ie^{-i\pi\tau}}{\sqrt{\beta}}
\frac{e^{i2\pi( \frac{q}{N}-\frac{\tau}{\beta})(\nu- \frac{\beta}{2}-\frac{1}{2})} - e^{-2\pi( \frac{q}{N}-\frac{\tau}{\beta})(\nu+ \frac{\beta}{2}-\frac{1}{2})}}{2\sin[\pi( \frac{q}{N} - \frac{\tau}{\beta})]}
\quad (3)
$$
其中,$[qT]$是时间序列 $a[qT]$的基函数。遵循一组规则以确保正交性来采样时频空间。这些规则是:(i) $\tau= 0, 1, \cdot \cdot \cdot, \beta - 1$;(ii) 参数 $\nu$和 $\beta$被选择为使得每个频率样本仅使用一次。这里,$\nu$是一个频带的中心,$\beta$是频率分辨率,而$\tau$是局部时间。
IV. 提出的方法
本文提出的方法包含五个阶段,用于实现心电信号的自动分类。这些阶段包括预处理、R波峰值检测、心电图分割、特征提取和分类阶段。表示各个阶段的框图如图1所示。
A. 预处理
预处理步骤对于高效的心电信号基准点检测至关重要。原始ECG信号中存在多种噪声,包括由肌肉收缩引起的伪影、基线漂移、高频噪声和工频干扰。通过对含噪心电信号进行滤波,以去除其中的各种噪声,并提高其信噪比(SNR)。首先,使用中值滤波器去除心电信号中的基线漂移。第一个200ms的中值滤波器用于消除QRS波群和P波,而第二个600ms的中值滤波器则用于消除心电图信号中的T波。第二个滤波器的输出信号包含与心电信号相关的基线,因此将其从原始信号中减去,从而生成baseline校正信号。此处采用一个截止频率为35赫兹、通带和阻带具有相等纹波的12阶FIR低通滤波器,以去除高频噪声和工频干扰。最后,将滤波后的心电图信号用于处理与分析。
B. R波检测和心电图信号分割
在实际场景中,自动检测R波峰值[35]对于完全分析本文提出的方法在心电图信号分析中的应用至关重要。为此,采用了一种著名的方法,即潘-汤普金斯(PT)方法[36],用于后续心电信号中的R波峰值检测,因其涉及的计算复杂度低且灵敏度高达99.87%。图2展示了PT方法所包含的各个阶段。
PT技术由一组级联带通滤波器组成。因此,使用截止频率分别为11赫兹和5赫兹、增益分别为36毫伏/毫伏和单位增益的低通滤波器和高通滤波器,其表达式如下:
$$
y(n)= 2y(n - 1)- y(n - 2)+ x(n)- 2x(n - 6)+ x(n - 12) \quad (4a)
$$
$$
y(n)= 32x(n - 16)-[y(n - 1)+ x(n)- x(n - 32)] \quad (4b)
$$
这里,$x(n)$和$y(n)$是后续阶段的输入和输出。在微分阶段,对信号进行微分以获取QRS波斜率的信息,表示为$y(nT)=(1/8)[-x(n - 2) - 2x(n - 1)+ 2x(n+ 1)+x(n+ 2)]$。平方阶段通过$y(nT)=[x(nT)]^2$识别微分后频率响应曲线的斜率,并抑制因T波具有较高谱能量而引起的假阳性。移动窗积分阶段用于获取除QRS波群斜率和宽度信息之外的波形特征信息,表达式为$y(nT)=(1/N)[x(N-1))+x(n-(N-2))+\cdot \cdot \cdot+x(n)]$。最后,积分波形的上升沿对应于期望的QRS波群。
在本研究中,取大小为0.512毫秒的窗口覆盖每个R波峰值,以固定每个心电图信号的长度。此处,每个心电图信号由256个样本组成,即在检测到的心跳R波峰值之前110个样本和之后145个样本。R波峰值检测阶段之后是特征提取和分类阶段,以高效识别心跳。
C. 本文提出的方法的特征提取方法
本研究提出了一种新方法,可克服现有特征提取技术的局限性。所提出的方法涉及在离散S变换(DOST)中应用离散余弦变换(DCT),以研究心电图信号的时频分布。使用余弦函数的优势在于其不存在不连续性。在DCT中,信号能够承受更多的系数截断,即保持输入信号所需的形状。此外,DCT是实值的(即计算实数系数),且不包含负频率,从而降低了整体复杂ity。在DOST中应用DCT能够将能量集中,并在低频分量中表示最重要的系数。
本研究中,采用余弦Stockwell变换来捕捉相应心电图信号中的非对称特征,以识别潜在异常。由于输出系数在频带内均匀分布,即系数中不存在对称性(这是由于仅存在正频率所致),因此这些系数被称为非对称系数。
CST算法的数据流如图3所示。
应用余弦Stockwell变换可得到所选心跳类别的时频形态学系数。计算CST系数的步骤如下:
- 步骤1 :对长度为$N$的输入心电图信号$z(n)$应用$N$点离散余弦变换以计算其余弦谱。
- 步骤2 :将矩形窗函数$V[p]=\Pi -\beta/2,\beta/2-1 $与$z[n+p]$相乘。
- 步骤3 :对每个中心频率$m=0, 1, 3, \cdot \cdot \cdot, 3\beta/2, \cdot \cdot \cdot$应用一个$\beta$点逆离散余弦变换到$V[p]z[n+p]$,以计算CST系数,其中$p= 0, L/\beta, 2L/\beta, \cdot \cdot \cdot,(\beta - 1)L/\beta$,确保分解是正交的。
- 步骤4 :在逆CST情况下,对$s[q,p]$关于时间索引$q$应用一个$\beta$点DCT,以获得每个中心频率$m= 0,1,3,\cdot \cdot \cdot,3\beta/2,\cdot \cdot \cdot$的加窗余弦谱$V[p]z[n+p]$。
这里,$s[q,p]$是对应于点$[q,p]$的CST系数。注意,$V[p]= 1$,对于返回$z[p]$的$n\epsilon[-\beta/2, \cdot \cdot \cdot,-\beta/2 - 1]$,$p= \beta, \beta+1, \cdot \cdot \cdot, 2\beta -1, \beta$为信号的余弦系数。对$z[n]$应用$N$点逆离散余弦变换以恢复原始信号$z[l]$。最后,提取不对称系数作为特征,用作每个心电图信号的代表,并直接用于通过双支持向量机分类模型将其识别到特定类别中。
D. 特征分类
一种基于最优有向无环图的最小二乘双支持向量机(DAG-LSTSVM)分类器[37]被采用并开发,用于在两类即基于类别的(情况I)和个性化的(情况II)评估方案下高效识别所选的心电信号。DAG方法适用于实际应用,因为其涉及的测试时间少于一对一和一对所有方法[37]。在最小二乘双支持向量机中的二分类问题中,会生成两个超平面用于分类。本研究中,这两个超平面的成本函数被视为相等,即(c1和c2=C),以显著降低计算负载。在DAG-最小二乘双支持向量机的训练阶段,$A(A−1)$为总共$A$个类别构建了非平行超平面和二分类器。在构建DAG-LSTSVM分类器模型时,选择准确率最高的分类器作为根节点,准确率较低的分类器作为第二层节点,依此类推。因此,分别针对十六类(即情况I)和五类(即情况II)生成了120个和10个二分类器。而在测试阶段,使用一个二叉有向无环图,包含$A(A − 1)= 2$个内部决策节点(二分类器)和$A$个叶节点。为简便起见,图4展示了四类分类问题。DAG-最小二乘双支持向量机分类器的计算复杂度为$O(A−1)l^3/A^2$(其中$A$为类别数量,$l$为输入向量的长度),显著低于传统支持向量机,即$4(A−1)l^3/A^2$。
在本研究中,采用径向基函数(RBF)核(即由$K(x_i , x_j) = \exp(-\gamma|x_i - x_j|^2)$给出)对表I中提供的心电图数据集进行非线性识别。分类器模型的最优学习参数,即核参数“γ”和正则化参数$C$将提供最佳的泛化能力。在训练阶段,惩罚参数$C$和核函数参数$\gamma$的搜索范围分别设为$[2^{-5}, 2^{10}]$和$[2^{-10}, 2^5]$。采用人工蜂群(ABC)技术[38]来搜索分类器模型的最佳学习参数。
ABC算法的实现步骤总结如下。ABC通过在每次迭代时评估特定的食物源来确定最优网络。此外,使用$C$和$\gamma$的最佳学习参数值在整个数据集上进行十折交叉验证[39],以达到最大准确率。在测试阶段,由所有训练好的二分类器组成的DAG-SVM模型用于推导出测试样本的结果。通过实时测试,以更高准确率预测每份心电图的类别。
算法1:分类器学习参数的选择
1. 初始化一个随机的解种群,即$x_{ij}, i= 1, 2, \cdot \cdot \cdot, SN, j= 1, 2, \cdot \cdot \cdot, V$,是一个$d$维向量,其中$d$表示优化参数。
2. 评估种群的适应度。
3. cycle= 1
4. Repeat
5. 针对每个雇佣蜂,使用$v_{ij}= x_{ij}+\varphi_{ij}(x_{ij} - x_{kj})$生成新解,并通过贪婪选择方法进行评估。
6. 对于每个解$v_{ij}$,使用$p_{ij} = \text{fit} i / \sum {j=1}^{SN} \text{fit} j$计算其概率值$p {ij}$。
7. 基于概率$p_{ij}$,针对每个观察蜂,从选定的解$x_{ij}$生成新解$v_{ij}$,并采用贪婪选择方法进行评估。
8. 若侦查蜂存在被放弃的解,则用一个新的随机生成的解$x_{ij}$替换,该解由$x_{ij} = x_{j}^{\min} + \text{rand}(0,1)(x_{j}^{\max} - x_{j}^{\min})$生成。
9. 记录迄今为止获得的最优解。
10. cycle= cycle+ 1。
11. 直到达到最大循环次数(MCN)。
12. 在本研究中,将重复执行以下步骤,直至达到最大循环次数(MCN)(即MCN = 1000)。
13. 选择食物源的新位置$x_{\text{new}}$。进一步地,利用在相同位置由$x_{\text{new}}$映射的特征向量,并结合$C$和$\gamma$参数的取值,训练分类器模型。
14. 使用训练好的分类器对测试数据集进行验证。
第五节 系统架构与硬件原型
本研究旨在开发一种基于微控制器的平台技术,能够实现心电图信号的实时接收、特征提取和识别。为了验证该想法的可行性并评估提出的方法的实时性能,在实验室实验装置中使用商用32位微控制器平台开发了一个概念验证原型,用于心电信号分析。
A. 硬件系统架构
使用本文提出的方法对心电信号的处理在商用32位微控制器平台上实现,以进行本地实时检测与分析。选择该平台是由于gcc编译器和Linux环境提供了灵活的设计高级描述方式,能够针对不同架构方案对平台进行编程。该平台包含一个具有高度优化指令集的32位RISC微处理器。频率指令循环为400兆赫,最大频率容量为533兆赫,并配有外部SD卡插槽。
32位微控制器平台的模拟端口A(即引脚0)用于接收串行数据,即输入的心电信号。该平台包含一个10位模数转换器(ADC)。此外,端口E和端口F用于连接外部液晶显示器(LCD)模块,该模块采用4位模式进行编程。将输出文件传输到微控制器板的波特率为115200比特每秒(bps)。图5展示了用于心电信号顺序处理以实现心律失常实时检测的架构和方法的框图表示。
B. 实验室原型
实验在实验室真实场景下通过在硬件测试平台实现提出的方法进行实施和评估。该硬件平台包含一个32位 RISC处理器,通过个人计算机(PC)使用DB9 RS232电缆对其进行编程。采用#C++编程语言对处理器进行编程,调试环境为Linux。使用gcc编译器编译程序以生成输出文件。通过Cutecom软件实现处理器与个人计算机之间的通信,并将程序的输出文件传输至处理器以执行本文提出的方法,原型随即开始预测心电信号。实时心电图信号由任意函数发生器产生,其检测出的类别(文本形式)显示在与微控制器平台连接的液晶显示器(即 16 × 2)上。此外,信号的形态可在混合信号示波器上观察到。图6展示了该硬件测试平台的实验室实验装置。
C. 硬件原型验证
采用包含48条患者心电记录的基准MIT-BIH心律失常数据[34]来验证所提出的方法。这些数据(即110109个心搏)在0.1Hz-100Hz范围内进行带通滤波,以360Hz的采样率采集,分辨率为11位分辨率,范围为±10mV。此外,采集的数据在0.1-100Hz范围内进行了带通滤波,数据库共包含110109个心跳标签。数据库中的数据提供了类别标注。在本研究中,使用改良肢体导联II(MLII)信号进行验证。该方法在两种方案下进行评估,即基于类别和基于记录的方案。
表I:情况I中的训练和测试数据集
| 心电信号类型 - 标注 | 总计 | 训练 | 测试 |
|---|---|---|---|
| 正常(NOR)- N | 75017 | 11253 | 63764 |
| 左束支传导阻滞(LBBB)- L | 8072 | 2825 | 5247 |
| 右束支传导阻滞(RBBB)- R | 7255 | 2539 | 4716 |
| 房性早搏(APC)- A | 2546 | 891 | 1655 |
| 室性早搏(PVC)- V | 7129 | 2495 | 4634 |
| 起搏心搏(PACE)- P | 7024 | 2458 | 4566 |
| 异常传导的房性早搏(AP) - a | 150 | 75 | 75 |
| 心室扑动(VF) - ! | 472 | 236 | 236 |
| 室性与正常心搏融合(VFN) - F | 802 | 401 | 401 |
| 受阻的房性早搏(BAP) - x | 193 | 97 | 96 |
| 结性(交界性逸搏) - j | 229 | 115 | 114 |
| 起搏与正常心搏融合(FPN) - f | 982 | 491 | 491 |
| 室性逸搏(VE) - E | 106 | 53 | 53 |
| 结性(交界性)早搏(NP) - J | 83 | 42 | 41 |
| 房性逸搏(AE) - e | 16 | 8 | 8 |
| 无法分类的心搏(UN) - Q | 33 | 17 | 16 |
| 总计 | 110109 | 23996 | 86113 |
情况I(面向类别的方案) :在此方案中,使用数据库中受试者的全部48条记录进行分析。实验在训练和测试数据集上进行,这些数据集通过从每个ECG信号类别中随机选择部分心电信号构成,并进一步划分为十六个簇,其中每个ECG信号类别代表一个簇。表I列出了实验所使用的训练和测试数据集。此外,通过对训练数据集进行14折交叉验证来确定分类器的最优参数,而测试则在表I所示的测试数据集上进行。最终准确率通过计算所有折次准确率的平均值得出。图7展示了训练和测试数据集使用交叉验证的流程。
情况II(个性化方案) :在此方案中,遵循AAMI标准[40],准备数据集时排除四条记录即102、104、107和217,即实验在剩余的44条记录上进行。训练和测试数据集通过平均分割记录构成,即每个数据集包含22条记录。MIT-BIH数据库中的ECG信号类别映射到AAMI标准如表II所示。在基于类别的评估方案中,执行22折交叉验证以避免分类器模型过拟合。
表II:情况II中的训练和测试数据集
| AAMI类别 | MIT-BIH类别 | 训练 | 测试 | 总数 |
|---|---|---|---|---|
| N | NOR, LBBB, RBBB, AE, NE | 45845 | 44238 | 90083 |
| S | APC, AP, BAP, NP | 1000 | 1972 | 2972 |
| V | PVC, VE, VF | 4260 | 3220 | 7480 |
| F | VFN | 414 | 388 | 802 |
| Q | FPN, UN | 8 | 7 | 15 |
D. 所提方法的实现
最初,硬件测试平台的训练在离线模式下进行。在离线模式下,所有参数均通过安装在PC上的仿真软件包[][R2014a;版本7.14.0.739]计算得出。一旦确定了模型,即对模型进行训练,并将支持向量(SVs)、alphas(αi)和变量等参数通过串口存储到硬件测试平台的内存中。在情况I和情况II两种方案下,于第V-C节中提出的两个数据集上进行的实验将得到不同的$C$和$\gamma$值。该平台将在测试数据集信号上进行评估,以估计其性能。
测试数据集中的心电信号经过随机化、重新注释后生成文本文件,并传输至任意函数发生器以产生实时输入。在MIT-BIH心律失常数据库中,可用的心电图数据最大动态范围为±5毫伏。通过AFG将数据转换为0-5伏范围内,以便典型的10位模数转换器(ADC)进行处理。模数转换器的采样率设置为500赫兹。此外,添加了一个暂停,以确保数据包以与模数转换器相同的采样率到达。信号采集意味着采集样本(在本例中,以500样本/秒的频率(相当于每分钟30000个样本)进行采样,将数字样本转换为平台其余部分(信号预处理器和分类器)可理解的格式,并将其分组为具有固定大小的信号包。数据采用定点运算并通过32位表示进行编码。随后,应用提出的方法处理采集到的输入信号。对原始ECG信号进行预处理,以去除噪声并提高心电信号的信噪比。在图8中,显示了双通道混合信号示波器(MSO),其中通道I和通道II分别观察到含噪声的和滤波后的心电图信号。
因此,使用PT算法[36]检测相应滤波后的ECG信号的R波峰值,并在数字信号示波器上显示,如图9所示。R波峰值检测阶段之后是在每个R波峰值两侧选择长度为256个样本(即0.512毫秒)的窗口,以确定心电图片段的长度。
此外,心电图片段会经过特征提取和分类阶段。在特征提取阶段,提取时频特征。双生支持向量机模型在离线模式下进行开发并用于训练。利用人工蜂群算法在优化过程中收敛时展示支持向量机分类器的性能。在测试数据集上进行实时测试,一旦特征到达该阶段,计算即开始,测试平台对输入的心电信号进行识别。在测试过程中,检测到的心电信号类别显示在液晶显示屏(即16X2 LCD)模块上,其形态则显示在图6所示实验实验室装置的混合信号示波器上。在图6中,某一时刻检测到一个右束支传导阻滞(RBBB)信号,相应地,其他类别的心电信号也由测试平台检测。即时检测(PoC)平台的性能在测试数据集上进行评估,并存储在文本文件中,该文件与标注文件进行比较以生成结果。结果将在后续部分以混淆矩阵的形式呈现。
E. 统计指标
每类心电图信号的分类性能通过五个标准参数进行计算,即灵敏度(SE)、阳性预测率(PP)、准确率(AC)、错误率(ER)和F-值(Fs)。灵敏度是指在所有事件中正确分类事件的比例,$SE= TP/(TP+FN)$。PP是指在所有检测到的事件中正确分类事件的比例,$PP= TP/(TP+FP)$。AC是指正确分类模式数与总分类模式数之比,$AC= (TP+TN)/(TP+ TN+ FP+ FN)$,F值(Fs)定义为$2TP/(2TP+ FN+ FP)$。上述三个参数针对MIT-BIH数据库中的每一类心电图信号,在两种评估方案下分别进行计算。
VI. 实验结果与分析
本文提出的方法在32位微控制器测试平台(即400兆赫,Linux环境)上实现,用于在基于类别的(情况I)和个性化的(情况II)两种评估方案下对不同类别的心电信号进行本地实时检测。为了验证提出的方法的性能,在第V-C节中描述的MIT-BIH心律失常数据上进行了实验。该即时检测(PoC)测试平台在训练数据集上进行训练,并在测试数据集上实时评估其性能。
在两种评估方案中,每类心电图信号的测试结果分别如表III和表IV所示。该矩阵利用本文提出的方法,将正确分类和错误分类的信号映射到其对应的类别中,以评估即时检测(PoC)平台对PoC平台所检测到的特定类别心电图信号的分类性能。在该矩阵中,列表示使用本文提出的方法进行分类的信号数量,行表示数据库中提供的参考标注作为真实值。在情况I,即基于类别的评估方案中,混淆矩阵如表III所示,用于详细研究。在86113个测试信号中,有82789个信号通过本文提出的方法被正确检测,达到96.14%的高准确率,错误率为3.86%。在此方案下,“e”类和“q”类准确率较低的原因是用于训练的信号数量较少。
然而,情况II(即个性化方案)的分类性能如表IV所示,其准确率为86.5%。在49825个测试信号中,原型系统正确检测到了43099个信号。表III中类别‘e’和‘Q’的准确率非常低,原因是这两个类别的训练数据量较少。需要注意的是,这两个类别的所有数据均用于进行实验。
表III:案例I的混淆矩阵
| 预测标签 | N | L | R | A | V | P | a | ! | F | x | j | f | E | J | e | Q | 总计 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 真实值 | |||||||||||||||||
| N | 61977 | 102 | 0 | 1126 | 325 | 0 | 67 | 27 | 59 | 0 | 39 | 23 | 0 | 0 | 14 | 5 | 63764 |
| L | 137 | 4991 | 0 | 38 | 81 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 5247 |
| R | 163 | 0 | 4409 | 84 | 41 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 19 | 0 | 0 | 4716 |
| A | 47 | 29 | 0 | 1452 | 31 | 0 | 0 | 7 | 89 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1655 |
| V | 91 | 13 | 0 | 0 | 4371 | 0 | 0 | 78 | 64 | 0 | 0 | 17 | 0 | 0 | 0 | 0 | 4634 |
| P | 30 | 102 | 0 | 0 | 0 | 4353 | 0 | 0 | 0 | 0 | 0 | 81 | 0 | 0 | 0 | 0 | 4566 |
| a | 16 | 0 | 0 | 9 | 2 | 0 | 47 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 75 |
| ! | 17 | 29 | 0 | 0 | 21 | 0 | 0 | 169 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 236 |
| F | 39 | 0 | 8 | 0 | 17 | 0 | 0 | 0 | 337 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 401 |
| x | 13 | 0 | 0 | 7 | 0 | 0 | 0 | 3 | 0 | 73 | 0 | 0 | 0 | 0 | 0 | 0 | 96 |
| j | 15 | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 0 | 0 | 89 | 0 | 0 | 7 | 0 | 0 | 114 |
| f | 27 | 13 | 0 | 0 | 0 | 7 | 0 | 0 | 0 | 1 | 0 | 443 | 0 | 0 | 0 | 0 | 491 |
| E | 11 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 41 | 0 | 0 | 0 | 53 |
| J | 5 | 0 | 0 | 4 | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 29 | 0 | 0 | 41 |
| e | 2 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 3 | 0 | 8 |
| Q | 4 | 0 | 1 | 1 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 5 | 16 |
| 总计 | 62594 | 5280 | 4418 | 2721 | 4895 | 4361 | 117 | 284 | 549 | 76 | 128 | 567 | 41 | 55 | 17 | 10 | 86113 |
正确分类的实例:82789
准确率:96.14%
错误分类的实例:3324
错误率:3.86%
表IV:案例II的混淆矩阵
| 预测标签 | n | s | v | f | q | FN | FP | 总计 |
|---|---|---|---|---|---|---|---|---|
| Reference | ||||||||
| N | 39034 | 985 | 1319 | 2803 | 97 | 5204 | 899 | 44238 |
| S | 425 | 1303 | 223 | 15 | 6 | 669 | 1121 | 1972 |
| V | 282 | 124 | 2709 | 74 | 31 | 511 | 1653 | 3220 |
| F | 189 | 12 | 109 | 52 | 26 | 336 | 2893 | 388 |
| Q | 3 | 0 | 2 | 1 | 1 | 6 | 160 | 7 |
| 总计 | 39933 | 2424 | 4362 | 2945 | 161 | 6726 | 3975 | 49825 |
使用本文提出的方法,在两种分析方案(即情况I和情况II)下,针对每类心电信号计算统计指标。为了确定这些统计指标,需要计算每类心电信号的真阳性(TP)、假阳性(FP)和假阴性(FN)参数,这些参数分别在表III和表IV中列出。在情况I中,总体SE, PP, Fs参数基于表III进行计算,对于所有16类心电信号均为96.14%,结果如表V所示。
表V:每个类别的统计指标
| 类别 | 训练心搏 | 测试心搏 | TP | FN | FP | SE | PP | Fs |
|---|---|---|---|---|---|---|---|---|
| N | 63764 | 11253 | 61977 | 1787 | 617 | 97.20 | 99.01 | 98.1 |
| L | 5247 | 2825 | 4991 | 256 | 289 | 95.12 | 94.53 | 94.82 |
| R | 4716 | 2539 | 4409 | 307 | 9 | 93.5 | 99.8 | 96.54 |
| A | 1655 | 891 | 1452 | 203 | 1269 | 87.73 | 53.36 | 66.36 |
| V | 4634 | 2495 | 4371 | 263 | 524 | 94.32 | 89.3 | 91.74 |
| P | 4566 | 2458 | 4353 | 213 | 8 | 95.34 | 99.82 | 97.52 |
| a | 75 | 75 | 47 | 28 | 70 | 62.67 | 40.17 | 48.96 |
| ! | 236 | 236 | 169 | 67 | 115 | 71.61 | 59.51 | 65 |
| F | 401 | 401 | 337 | 64 | 212 | 84.04 | 61.38 | 70.95 |
| x | 96 | 96 | 73 | 23 | 3 | 76.04 | 96.05 | 84.88 |
| j | 114 | 115 | 89 | 25 | 39 | 78.07 | 69.53 | 73.6 |
| f | 491 | 491 | 443 | 48 | 124 | 90.22 | 78.13 | 83.74 |
| E | 53 | 53 | 41 | 12 | 0 | 77.36 | 100 | 87.23 |
| J | 41 | 42 | 29 | 12 | 26 | 70.73 | 52.72 | 60.42 |
| e | 8 | 8 | 3 | 5 | 14 | 37.5 | 17.65 | 24 |
| Q | 16 | 17 | 5 | 11 | 5 | 31.25 | 50 | 38.46 |
| O.A | 86113 | 23996 | 82789 | 3324 | 3324 | 96.14 | 96.14 | 96.14 |
A. 心脏摘要报告和存储
该原型在两种方案(即情况I和情况II)下检测到的心电信号类别均存储在一个文本(‘.txt’)文件中,可用于生成关于心脏状况的每日心脏摘要报告。该报告还提供了原型检测到的心电图信号总数以及每个类别中心电图信号的数量。此外,当平台检测到心律失常时,会触发一个警报,即弹出消息警告通知,以提醒用户或消费者。这使得用户无需持续监测心脏摘要报告,并能够在早期阶段检测到心律失常,从而为用户/消费者提供无紧急情况的状态,预防心血管疾病的严重疾病。
此外,提供1GB内存SD卡以存储由PoC平台设置生成的心脏摘要报告和已处理的心跳数据,从而允许心脏病专家进行离线分析。在离线分析中,专家可以分析平台检测到的心电图数据(即数字形式)及其类别,从而减少分析长期心电图信号所需的时间消耗。需要注意的是,1GB卡可存储40天的心电图数据[10],而实际记录时长取决于所用SD卡的内存大小。
B. 与现有方法的比较
在两种评估方案下报告的这些结果与文献中报道的现有方法的结果进行了直接比较,并在表VI和表VII中列出。特别是在情况II中,根据ANSI/AAMI标准,从表IV计算FP和FN参数,以测量五类心电图信号每一类的统计度量参数。从表VI和表VII可以看出,原型监测系统在两种分析方案中均表现出更优的分类性能和更高准确率。此外,在基于类别的方案中,本研究分类的心电图信号数量多于文献中报道的一些工作。
表VI:情况I的比较表
| 研究 [参考文献] | 类别 | 方法 | 准确率(%) |
|---|---|---|---|
| Rodriguez等[9] | 所有麻省理工学院 | 决策树 | 96.128 |
| Oresko等[10] | 5 | RR间期+ ANN | 90 |
| Cvikl等[13] | 2 | RR间期 +OSEA | 92.36(Sp) |
| Nambakhsh等[14] | 3 | 小波 +模糊 | 85(平均值) |
| 本文提出的方法 | 所有麻省理工学院 | DCT+CST + ABC-SVM | 96.14 |
†ANN:人工神经网络,OSEA:开源心电图分析软件,ABC:人工蜂群,SVM:支持向量机。
正如预期,由于记录之间患者生理特征的个体间差异,在情况II(即面向患者的)方案下评估的32位微控制器平台性能比情况I(即面向类别的)方案更差。这种个性化分析方案适用于实际应用,因为训练和测试数据集中包含了不同患者的记录,即它们彼此完全独立。
表VII:情况II的比较表
| 指标 | Ye[41] | De Chazal[22] | 本文提出的方法 |
|---|---|---|---|
| 准确率(%) | 86.4 | 81.9 | 86.5 |
| Se(%) 类别’N’ | 60.8 | 75.9 | 66.08 |
| +P(%) 类别“N” | 52.3 | 38.5 | 53.75 |
| 类别’S’的F(%) | – | 59.28 | – |
| Se(%) 的类别 ’V’ | 81.5 | 77.7 | 84.13 |
| +P(%) 的类别 ’V’ | 63.1 | 81.9 | 62.10 |
| Fs(%) 的类别’V’ | – | 71.46 | – |
†注:Fs:F值,a指交叉验证技术
由于用于训练和测试的各种类别中心搏数量存在巨大差异,因此计算出的统计度量参数具有高度显著性。报告的更高准确率隐含地表明,使用余弦Stockwell变换技术提取的不同类别心跳的判别特征,以及所开发的分类器模型,对于心电信号的有效检测与分类具有重要意义。该平台不仅存储信号以供离线分析,还提供增强型界面,向用户实时反馈信息。因此,用户或患者可以在本地持续记录异常的基线水平,并评估自身的生活方式。所开发的硬件平台可用于家庭护理应用中的临床分析,供医院内外的用户和患者监测不同类型的心律失常(即基于类别的十六类和个性化方案中的五类),并实现更高准确率。本研究通过将数字数据生成为模拟域中的实时信号来进行处理与分析,展示了临床环境场景。此类实现为心血管疾病提供了一种辅助诊断解决方案,可供用户采用以促进健康生活方式。
七、结论
本研究提出并开发了一种高效方法,该方法基于余弦Stockwell变换和人工蜂群优化双最小二乘支持向量机(ABC-LSTSVMs),并在32位微控制器测试平台上实现,用于个性化心电图信号的实时监测。该平台的性能通过两种分析方案(即类别方案和个性化方案)在MIT-BIH心律失常数据库上进行评估。在类别方案和个性化方案中分别报告了96.14%和86.5%的更高准确率。原型在个性化方案下的评估适用于实际应用。因此,所开发的平台可被用户及患者在家用于心律失常的实时监测。该平台通过在早期阶段检测心律失常,提供无紧急情况的预警,以防止用户发展为严重疾病,助力先进的心血管疾病(CVDs)诊断。
本研究的未来展望是增加可检测的心律失常数量,并开发更高效的心律失常自动分析方法。本研究提供的解可以被制作为可穿戴设备或用于即时检测的手持设备,可向用户实时反馈其心脏状况。
9571

被折叠的 条评论
为什么被折叠?



