Nature Medicine文章Cardiologist-level arrhythmia detection and classifcation细节记录

Nature Medicine发表文章介绍了一种深度学习方法,能够达到心脏病专家水平的心电图异常检测与分类。该方法基于大规模数据集,利用34层的深度卷积神经网络,实现了对12类心电异常的精准诊断,其性能与心脏病专家委员会的共识标注相当。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Nature Medicine 文章 Cardiologist-level arrhythmia detection and classifcation 细节记录


全文链接

标题及出处
摘要

前言

  1. 心电图是临床的基本工具,每年3亿份 ,诊断心电异常
    有提出特定种类的算法,但没有完整12类的研究
    现有的数据集数量太少 <PhysioNet 47subjects>
  2. 本文建立了又大又新的数据集。
  3. 数据采集通过Zio监视器,FDA批准的,单导联
    平均携带10.6~13.0天,平均年龄69±16. 43%女性
  4. 测试集328病人,328心电记录,专家共识标注。平均年龄70±17,38%女性。人类平均一致度72.8%
    在心脏病专家委员会共识标注之外,由6个独立的心脏病专家<不在专家委员会>

结果

  1. 人类和算法的结果具有一致度,差的都差。

  2. AUC和F1的结果,验证集和测试集具有一致性。
    分出10%的训练集,结果具有一致性。
    新的测试集标注为经认证的技术人员。

  3. ROC曲线和PRC曲线,达到或者超过人类专家水平
    混淆矩阵。显示预测和标注的差异

  4. 在额外数据集上的泛化能力。PhysioNet。在公开数据集上训练
    N=8528, 10%早停数据。隐藏测试集n=3658. 超过竞赛最好成绩。

结论

  1. 第一个综合分类的深度学习方法,用于广泛的心电节律诊断。
  2. 更进一步的可学习健康系统。
    强调数据集大到足够评估端到端的深度学习方法。验证超过高标准的心脏病专家委员会共识<每个只精通几类>

方法讨论

  1. 标准的方法用到了信号处理,特征提取,特征选择/降维,分类。 每一步都有手动的启发(heuristics)和推导(derivation)

  2. 深度学习方法具有本质的不同,单个算法完成所有步骤,端到端实现,没有基于类别的特征提取。即接收原始输入,输出诊断概率。
    数据驱动,学习所有的特征。手动特征只能学一部分。

  3. 不同于其他的方法,主要在于大数据量,34层端到端网络,没有傅里叶变换或者小波变换的前处理。

  4. 方法具有重大的临床影响力。在基于机构的数据上训练,可以具有基于机构或者基于人口的应用。适用于多种临床设定。

局限性

  1. 需要基于特定应用。否则
    长记录上会出现重要的假阳性诊断。心脏病专家从额外的流行病学知识或者增加的上下文提高性能。
  2. 在临床应用前,方法需要额外的算法步骤或者后处理。
  3. DNN出错跟人类专家类似
    出错都是有原因的
  4. 局限性:单导联ECG。标准12导联
    标注的系统性差异降低性能下降
    设置了标准标注操作。
    回顾分类错误的,正确标注存疑
    测试集只有328病人,置信区间较窄
    子类分析(年龄,性别)弱
    需要获取足够的稀有类别数据
    依赖患者的F1不具有人口泛化能心
    提高准确率,效率,可解释性。

数据和方法

1. 研究对象和采样规则

数据集:可回溯,去标志(根据Health Insurance Portability and Accountability Act Safe Harbor ),大于18岁的成年人 ,使用Zio monitor(iRhythm Tech) 从13年一月到17年三月

根据(iPhythm Tech)隐私协议,去标记的数据可用于研究
病人可选择,书面协议不需要(完全去标记)
斯坦福大学审查委员会后该研究审查和豁免。

采取平均30s每个病人作为训练集。
经该公司的初步标注算法(FDA批准)初步标注

从每种节律病人中随机采样。30秒中包含目标节律。大部分记录包含多种节律。
为了平衡,稀有类别过采样。平均每病人2个30s。
训练,验证,测试集完全去相关(无相同病人)

2. 标注步骤

训练集测试集独立标注。
保留专家(resource-intensive)标注作为测试集金标准
对于训练集,一组年长的ECG技术人员回顾所有记录,
标注节率起始时间。每个记录随机分配给一个该类任务专家。所有标注者经过特殊训练,保证标注一致性
随机采取10%,作为验证集参与DNN超参数微调

8个认证的电生理学家从业者,一个经认证的心脏病学家,标注测试集。测试集初始标注完全去除。
平均分为3组,每组标注1/3.(112个)
每组讨论达到共识,作为标注金标准。(剩下6个人独立标注每个记录,作为评估单个专家性能的标准)
每个记录三人共识标注,6人独立标注。
影响结果的作为噪声标注,具有相似临床结论的归为一类

3. 算法开发

DCNN检测节律,原始ECG输入(200hz),每1.28秒输出一个结果。(输出间隔)
仅输入原始信号,无其他相关特征和信息
34层网络,类似ResNet. 包含16个残差块,每块两个卷积层,。。。
随机初始化权重,Adam优化,默认变量,mini batch size 128. 初始学习率0.001, 验证集Loss不下降时*0.1。选择验证集上最低错误率的模型
在这里插入图片描述
超参数网格搜索和手调,网络结构主要调卷积层数,卷积核大小和数量。
深度超过8层后残差连接有效。RNN没有效果,放弃。
手动调学习率使得最快收敛。

4. 算法评估

每30秒输出24个结果。将标注在输出间隔间取整。作为“序列”级的结果。每记录一个结果作为“set”级结果。集合级的结果不考虑记录内的时间不匹配。
。。。

5. 数据分析

ROC曲线,和AUC曲线。One VS all
双边置信区间(AUC scores) 敏感性特异性 2值阈值

PR曲线。
F1-score 多类别,
混淆矩阵


代码开源,数据开源
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

### 卷积神经网络与安全穿戴设备数据集 对于卷积神经网络(Convolutional Neural Network, CNN)在安全穿戴设备中的应用,通常涉及时间序列数据分析以及人体活动识别的任务。这类研究领域中常见的数据集可以分为以下几个类别: #### 数据集概述 1. **UCI Human Activity Recognition Using Smartphones Dataset**: 这是一个广泛使用的公开数据集,用于智能手机传感器信号的时间序列分类任务。该数据集包含了通过加速度计和陀螺仪记录的人体活动信息,适用于训练基于CNN或其他深度学习模型的分类器[^1]。 2. **PAMAP2 Physical Activity Monitoring Data Set**: PAMAP2 是另一个常用的数据集,提供了更丰富的多模态传感数据,包括心率监测、加速度计和其他生理参数。这些数据非常适合用来开发针对健康监控的安全穿戴设备算法。 3. **WISDM Dataset (Wireless Sensor Data Mining)**: WISDM 提供了一个大规模的移动电话运动传感器数据集合,支持对人体日常行为模式的研究。此数据集特别适合测试不同架构下的卷积层效果及其性能优化策略。 4. **ECG Heartbeat Categorization Dataset**: 虽然主要面向医疗诊断用途,但 ECG 数据同样能够体现可穿戴技术保障个人隐私的重要性。例如,在论文《Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks》中提到的设计方案展示了如何利用深层卷积结构处理连续的心电图输入流并实现高精度预测[^3]。 #### 技术挑战与解决方案 当采用卷积神经网络解决上述问题时,可能会遇到过参化现象导致计算资源浪费的情况。对此已有多种方法被提出以提高效率,比如剪枝(pruning)技术和量化(quantization)[^2]。此外还可以考虑引入轻量级模块如MobileNetV2或者ShuffleNet来降低整体复杂度而不牺牲太多准确性。 以下是简单的Python代码片段展示加载其中一个典型数据集的方式: ```python import pandas as pd # 加载 UCI HAR 数据集示例 url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00240/UCI%20HAR%20Dataset.zip' data = pd.read_csv(url) print(data.head()) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

vcbe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值