基于区块链的数字孪生技术预测心脏病发作
1. 引言
远程健康监测(RHM)是一个备受研究界关注的领域,它能根据患者的过往病史、遗传因素以及实时健康指标,为每个患者提供针对性治疗和预防性护理。用于远程健康监测的数字孪生是人体的虚拟表示,能为RHM用例带来巨大价值,它通过虚拟复制人体参数,主动监测疾病的发生。
此前已有一些关于数字孪生的研究,部分聚焦于特定身体器官,如心脏的数字孪生可通过超声扫描、计算机断层扫描等技术获取;还有一些研究讨论了构建缺血性疾病和高血压数字孪生的模型。然而,这些研究大多未涉及数据隐私和安全问题,且多为基本的RHM用例,只能进行被动治疗。
为解决这些问题,我们提出了一个基于区块链的数字孪生应用(BDT app),使用基于优化XGBoost的心脏病发作机器学习模型来预测心脏病发作。该应用使用无头架构,确保即使未来数据来源发生变化(如使用可穿戴设备传输患者健康数据),也无需对BDT app代码进行大量修改。同时,我们使用区块链技术来解决数据隐私和安全问题,只将患者元数据存储在区块链上,减轻了区块链的负担。此外,我们还运用混沌工程来测试BDT app的安全性,以确保其在实际生产环境中的可靠性。
2. 文献综述
2.1 腹主动脉瘤(AAA)
- Auricchio等人的研究 :比较了使用特制移植物预测的数字孪生植入术前模拟与特定患者术后结果,结果显示术后分析与模拟预测在定量和定性上高度一致,表明使用数字孪生进行患者特定模拟研究主动脉腔内修复具有很大潜力。
- Hemmler等人的研究 :提出通过在术前选择阶段为支架移植物的尺寸和材料创建数字孪生,来减轻肾下血管内修复相关的并发症。他们使用变形算法和患者特定的术前数据,帮助预测壁应力和术后移植物的配置。
- Larrabide等人的研究 :开发了一种工具,用于辅助寻找支架置入的替代方案。通过对虚拟人体进行体外实验和计算流体动力学分析,并与虚拟血管造影进行比较,结果表明数字孪生可用于进行与支架置入相关的实验。
- Biancolini等人的研究 :讨论了降阶模型框架,该框架旨在降低计算流体动力学技术中血流预测所需的计算成本。通过创建的检查工具,可实时查看形状参数变化对整个流场的影响,为手术规划、治疗和预防提供患者特定数据。
- Chakshu等人的研究 :使用虚拟患者数据库,提出了一种检测AAA并进行严重程度分类的模型。他们应用循环神经网络和逆分析系统预测血流,以对AAA的严重程度进行分类。
2.2 闭塞性(缺血性)心脏病和高血压
- Parr等人的研究 :使用机器学习模型检测狭窄和动脉瘤,通过分析已有数据集中的模式和生物标志物,提出了一种利用特定身体位置动脉网络中的流速测量和压力来量化动脉疾病分类准确性的模型。
- Martinez - Velazquez等人的研究 :创建了一个基于边缘计算的应用程序,使用通过蓝牙连接和5G网络连接的身体传感器来检测缺血性心脏病。该应用使用卷积神经网络对非心肌和心肌状况进行分类,实现了85.77%的准确率,每个样本分类耗时4.8秒。
- [10]中的研究 :开发了一个基于双腔心脏和压力反射血压控制的数字孪生,可在动脉粥样硬化和健康状态下产生合成生理数据。还提出了一种使用专门为心血管系统创建的数字孪生生成合成光电容积脉搏波信号的方法,并通过聚类冠状动脉疾病和非冠状动脉疾病的光电容积脉搏波数据进行了初步验证。
2.3 心律失常
- Peirlinck等人的研究 :研究了一种新的计算模型,利用基于心脏磁共振成像的建模、模拟和非侵入性心电图数据,有效量化与特定受试者心室激活相关的特性。使用顺序蒙特卡罗近似贝叶斯方法同时估计根节点、心内膜和心肌传导速度,并通过20个虚拟受试者的队列量化了恢复这些激活特性的准确性。
- [3]中的研究 :指出生成高保真心脏数字孪生包括解剖学和功能孪生两个阶段,但这两个阶段存在一些限制,影响了其临床应用的准确性和效率。为解决这些挑战,作者提出了一个概念验证,利用参数向量和快速前向心电图模型等技术,提高复制心室电生理的生物物理详细数字孪生的价值。
- Pagani等人的研究 :讨论了几种有前景的数学模型,这些模型可用于预测意外健康事件并再现患者特定的临床指标。但作者也指出,在结合心脏电生理学的临床信息(如节律和成像)以开发用于患者特定预测的数值模型时存在一些问题,需要进一步研究。
- [31]中的研究 :提出需要一个具有机电反馈和双向耦合的框架来模拟心脏的自然行为。通过该框架可实现离子通道在器官水平的个性化,用于建模数字孪生。作者展示了一个具有电生理参数化和闭环循环模型的全耦合多尺度人体心脏模型,并通过对使用健康人磁共振成像数据开发的定制心脏几何形状进行模拟,验证了该模型的有效性。
2.4 心力衰竭
- Winokur等人的研究 :讨论了使用可穿戴心脏监测设备主动检测心血管疾病的方法。他们开发了一个概念验证,将可穿戴心脏监测设备像助听器一样插入耳朵,通过无线连接到笔记本电脑记录数据并进行分析。该设备使用三轴微机电系统加速度计测量头部的心冲击图运动。
- Chakshu等人的研究 :提出了一种逆分析方法来创建心血管数字孪生。对于非线性系统(如循环系统中的血流),传统逆分析方法往往失效或效果不佳。为解决这个问题,作者使用虚拟患者数据库,并采用循环神经网络开发了一种用于心血管系统的逆分析方法,实现了较高的准确性,能够准确识别AAA等问题,并以97.79%的准确率确定其严重程度。
- [13]中的研究 :使用耦合的血流和头部振动,创建了一个用于RHM的数字孪生模型,通过人类面部视频评估颈动脉狭窄的严重程度。该数字孪生作为概念验证,以部分主动模式运行,使用患者面部图像检测颈动脉的阻塞百分比。
3. 基于区块链的数字孪生架构
BDT app的架构如图1所示:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(数据馈送接口):::process --> B(XML文件):::process
B --> C(控制器):::process
C --> D(以太坊Ganache私有区块链):::process
D --> E(智能合约):::process
E --> F(机器学习模型):::process
F --> G(数字孪生实用程序):::process
G --> H(医生邮箱):::process
I(可穿戴设备):::process --> B
J(上传模块):::process --> K(PostgreSQL数据库):::process
D --> J
L(Chainlink数据馈送):::process --> E
图1:基于区块链的数字孪生架构
3.1 数据馈送接口
我们创建了一个数据馈送接口,用于模拟数字孪生参与者的通信,如创建新的数字孪生(添加新患者)或更新现有数字孪生(更新现有患者数据)。使用无头架构,将数据馈送与后端服务分离。数据馈送指的是患者的实时数据,如身体质量指数、高血压水平、心电图或ST段斜率等。通过数据馈送接口输入的数据会写入XML文件。未来,数据馈送接口可替换为可穿戴设备,只需将设备配置为直接将数据写入XML文件,BDT app即可无缝运行,无需修改代码。
3.2 控制器与区块链交互
控制器会持续监控XML文件,一旦检测到文件有变化,就会调用以太坊Ganache私有区块链上的智能合约。为管理区块链账户,我们使用了ethereumjswallet模块。在首次访问时,会动态生成密钥对并存储在BDT app缓存中供后续使用。通过Web3.JS库将包含私钥的签名交易发送到Ganache区块链上的智能合约。控制器通过WebSocket连接到Ganache区块链节点,WebSocket连接比HTTP连接性能更好,因为它提供了以太坊节点和客户端之间的双向通信通道,无需为每个请求创建单独的HTTP连接。设备代理使用WebSocket订阅智能合约事件,采用发布 - 订阅方法,有助于同步数据。在开发过程中,切换到基于WebSocket的远程过程调用连接显著提高了数据加载速度。
3.3 数据存储
我们提出了一种链下解决方案来存储患者数据,因为将患者的完整健康记录存储在区块链上会增加整个链的大小和每个节点的存储负担。因此,我们仅使用区块链技术作为账本记录事件,而患者数据(即关联交易)存储在链下数据存储(如云端的PostgreSQL数据库)中。我们创建了一个上传模块,使用区块链账户将链下数据上传到PostgreSQL数据库。PostgreSQL的标识系统经过修改,使用以太坊账户。对于动态内容,我们使用Chainlink数据馈送,其地址由用户(以太坊账户)和主题(任何SHA3哈希)确定,只有通过公钥签名才能修改,确保了数据的安全性。
3.4 机器学习模型
数据存储在Ganache私有区块链和PostgreSQL之后,智能合约会调用训练好的心脏病发作机器学习模型。我们最初使用基本版本的随机森林分类器来预测心脏病发作,将数据分为训练集和测试集,训练因变量以预测结果,随机森林分类器的预测准确率约为71.4%。为提高准确率,我们采用了增强技术,选择预测率最高的决策树模型,并进行超参数调优。在分割节点时,超参数可以选择随机森林中的多个决策树或每个树中的多个特征。我们还提出使用自动数据可视化来发现数据中的差异,并通过特征选择选择最佳树特征。最终,我们获得了最佳随机状态的心脏病发作机器学习模型,将预测准确率从71.4%提高到了97.1%。对于每个患者,机器学习模型会被调用,结果会发送到数字孪生实用程序,如果模型确定患者有心脏病发作风险,数字孪生实用程序会向注册医生的邮箱发送邮件。
4. 实验评估
4.1 系统设置
- 服务器 :使用基于x86的弹性计算云实例的Linux服务器,搭载英特尔第八代3.2 GHz酷睿i7处理器,配备32 GB内存,Mac实例托管在亚马逊网络服务上。
- 开发环境 :使用ReactJS版本18、NodeJS版本18和Python 3.10开发应用程序,使用PostgreSQL版本12作为关系数据库。
- 机器学习模型 :用于检测心脏病发作的机器学习模型使用优化的XGBoost,该模型经过调整以预测心脏病。在数据预处理阶段,使用独热编码技术对分类特征进行编码,然后使用贝叶斯优化技术进一步提高预测结果。该模型使用Kaggle上的心力衰竭预测数据集进行训练,该数据集是通过合并五个心脏数据集创建的,包含11个共享特征,是可用于研究目的的最大数据集之一。
- 区块链 :使用Ganache私有区块链确保数据安全,Ganache配置简单且轻量级,可在笔记本电脑或台式机上运行。使用Solidity面向对象编程语言实现智能合约,采用Clique权威证明作为共识算法。Clique是基于Go语言的权威证明以太坊实现,是一种广泛用于许可区块链环境的共识算法,可加速共识过程,使我们能够实现更快的数据存储,满足应用程序的需求。
4.2 实验结果
通过一系列实验,我们验证了BDT app的有效性和可靠性。优化后的机器学习模型在预测心脏病发作方面取得了较高的准确率,同时区块链技术确保了数据的安全性和隐私性。混沌工程测试也证明了应用程序在实际生产环境中的稳定性。
综上所述,基于区块链的数字孪生应用在心脏病发作预测方面具有很大的潜力,能够为医疗保健领域提供更安全、高效的解决方案。未来,我们可以进一步优化模型,扩大数据集,提高预测的准确性和可靠性,为患者提供更好的健康监测和预防服务。
5. 讨论
5.1 技术优势
- 数据安全与隐私 :采用区块链技术是本应用的一大亮点。仅将患者元数据存储在区块链上,避免了将大量健康数据存储在链上导致的链体积过大和节点存储负担过重问题。同时,使用Chainlink数据馈送确保动态内容的安全性,其固定地址由用户和主题确定,且只有通过公钥签名才能修改,有效保护了患者数据的隐私。
- 架构灵活性 :无头架构的使用使得数据馈送与后端服务分离,未来可轻松将数据馈送接口替换为可穿戴设备,只需简单配置设备将数据写入XML文件,BDT app即可无缝运行,无需修改代码,大大提高了系统的可扩展性和适应性。
- 机器学习性能 :通过对随机森林分类器进行增强和超参数调优等优化操作,将心脏病发作预测的准确率从71.4%提高到了97.1%,显著提升了模型的性能,为准确预测心脏病发作提供了有力支持。
5.2 面临的挑战
- 数据质量与一致性 :虽然使用了大规模的心力衰竭预测数据集进行训练,但实际应用中患者数据的质量和一致性可能存在差异。不同数据源(如不同品牌的可穿戴设备)采集的数据可能存在偏差,这可能会影响机器学习模型的准确性。
- 计算资源需求 :优化的XGBoost模型和区块链技术的使用可能需要较高的计算资源。在大规模应用场景下,服务器的计算能力和存储容量可能成为瓶颈,需要进一步优化系统架构以降低资源消耗。
- 法规与合规性 :医疗数据涉及患者的隐私和安全,受到严格的法规监管。确保BDT app符合相关法规要求,如数据保护法规和医疗行业标准,是应用推广过程中需要解决的重要问题。
6. 结论
基于区块链的数字孪生应用为心脏病发作预测提供了一种创新的解决方案。通过结合区块链技术的安全性和隐私保护特性、无头架构的灵活性以及优化的机器学习模型的高性能,该应用在实验中取得了良好的效果,能够准确预测心脏病发作并及时通知医生。
然而,该应用仍面临一些挑战,如数据质量、计算资源需求和法规合规性等问题。未来,需要进一步研究和改进,以解决这些挑战,提高应用的可靠性和实用性。例如,可以通过建立数据质量评估机制、优化算法以降低计算资源需求、加强与法规部门的合作等方式,推动该应用在医疗保健领域的广泛应用,为患者提供更好的健康监测和预防服务。
总结表格
| 方面 | 详情 |
|---|---|
| 技术优势 | 数据安全与隐私保护、架构灵活性高、机器学习性能提升 |
| 面临挑战 | 数据质量与一致性问题、计算资源需求大、法规与合规性要求高 |
| 未来方向 | 解决挑战,提高可靠性和实用性,推动广泛应用 |
未来改进流程图
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A(建立数据质量评估机制):::process --> B(提高数据质量):::process
C(优化算法):::process --> D(降低计算资源需求):::process
E(加强与法规部门合作):::process --> F(确保法规合规性):::process
B --> G(提升应用可靠性):::process
D --> G
F --> G
G --> H(推动广泛应用):::process
总之,基于区块链的数字孪生技术在心脏病发作预测领域具有广阔的发展前景,随着技术的不断进步和完善,有望为医疗保健行业带来革命性的变化。
超级会员免费看
53

被折叠的 条评论
为什么被折叠?



