探索雾‐云架构中智能办公室医疗保健的时序分析
1 引言
信息与通信技术(ICT)的潜在进步已彻底改变了人们的日常生活 [1–3]。在医疗保健、物流、交通及其他工业领域的各种应用的发展,体现了其重大影响。图 1 由 [4] 提供,简要概述了不同工业领域(横向和纵向领域),其中信息与通信技术(ICT)已被有效应用以增强服务交付。此外,随着高端计算设备时代的到来,形成了雾计算层,全球研究人员正在持续为不同工业领域的用户开发创新应用。
在医疗保健领域,此类技术提升了服务交付水平,推动了移动医疗和远程医疗的发展。更重要的是,这一理念扩展了其应用范围,实现了远程患者护理与最优医疗资源利用之间的平衡[5]。此外,远程健康监测和紧急救援期间的数据共享是移动医疗最具成效的应用,而在过去由于技术使用有限,这些几乎无法实现[6, 7]。
远程医疗的概念使医疗保健服务交付能够随时随地进行[8]。
进入数字化时代,人们将全部精力集中在提升生活方式上,却缺乏足够时间关注个人医疗保健,这种前瞻性理念使人们能够随时随地无缝获得医疗保健服务 [6, 7, 9]。
根据《世界就业和社会展望报告》,全球就业人口占全球总人口的59%,其中33.33%的人每周工作超过48小时[10]。如此庞大的就业人口和持续增长的工作时间,使得人们容易遭受健康损失,并带来短期和长期的负面影响。此外,许多研究表明,长时间办公室工作对医疗保健有严重影响。
事实上,根据一项综述[11], 51.9%的人员因长期待在办公室而登记有健康问题。此外,许多研究人员提出了多项调查,表明人员在工作时间内的各种活动中容易患上疾病或与健康相关的问题。此外,在其他任何环境中,患有健康问题且身体免疫力低下的人员由于这些活动而更容易出现健康严重程度加剧的情况[12]。
然而,在这种情况下,利用物联网技术高效监控医疗保健为维持最佳医疗保健环境增添了新的维度[5, 13]。
用户端高计算设备的日益使用,推动了雾计算、物联网技术和云存储的发展,从而改变了信息感知、存储与分析的进程[9]。事实上,[14]所提供的定义1详细阐述了基于雾计算平台的若干技术方面。
定义1(雾计算) 它是一个高度虚拟化的平台,可在终端设备和传统云数据中心之间提供计算、存储和网络服务,通常但并非仅限于位于网络边缘。
由物联网技术支撑的雾‐云范式是一种强大的平台,可在人员工作时间内实现对健康相关生命体征的自动监控与分析。这得益于小型、相对便宜且高度可靠的计算传感器 [15]。通过将这些联网硬件设备嵌入智能可穿戴设备、智能办公桌及周围环境中,已能够分析医疗保健的微观和宏观生命体征 [16, 26,38]。表1列出了部分市面上可用于健康监护的物联网设备。此外,利用生物传感器、智能手机和智能路由器等多任务计算设备汇总健康数据统计信息并提供个人医疗保健建议,显著提升了医疗服务水平。对事件层面的健康数据采集及其对健康影响的分析,已成为基于雾计算的医疗保健的一项战略性工具 [17, 34, 35]。
1.1 新颖性贡献
本节对所提出的时序医疗模型进行了简要概述。受物联网技术、雾‐云计算和实时数据分析巨大能力的启发,本文提供了一个全面的基于雾‐云计算的分层架构,用于监控物联网设备配备的办公室内人员的日常活动。(a)在初始层中,该架构旨在监控办公室内的各种活动(包括物理活动和环境活动),这些活动直接或间接与人员健康相关。这些活动通过安装在办公室不同位置的无线物联网传感器进行监控,具体位置取决于其感应区域。(b)在第二层中,采用贝叶斯分类模型,根据称为严重程度度 (DoV)的健康严重性参数,将获取的每个数据值划分为两类之一。(c)在基于雾计算分析的第三层中,对活动进行聚合,并利用时态挖掘技术实时进行时序分析,以评估健康严重性。此类评估将通过一种称为严重性指数(SI)的概率参数来分析这些活动。(d)最后,为了展示系统在云平台上的有效性,提出了一种应用情景,即在智能办公室内使用时序朴素贝叶斯 (TNB)预测模型对健康严重性进行时序预测监控。
该预测模型包含两个阶段,即(i)时序学习和(ii)时序预测。此外,提出了一种基于时态数据粒的预警系统,以便在医疗紧急情况下向相关医生提供有用信息。
本文分为多个部分。第2节综述了研究人员在基于物联网的健康监护领域所完成的一些重要工作。第3节介绍了智能办公室中健康监测的提出框架。第4节讨论了提出模型的实验评估及相关结果。最后,第5节总结了全文,并对未来的科研挑战进行了若干重要讨论。
2 相关工作
本节概述了基于物联网(IoT)的远程监测系统领域的一些重要研究工作。此外,还设置了一个小节,用于回顾基于物联网的医疗保健服务递送方面的一些重要贡献。
2.1 基于物联网的远程监测
物联网技术已被全球研究人员有效用于不同应用中各种特征的监测。方等人 [18] 提出了一种基于物联网 (IoT)、云计算和地理信息学的集成信息系统(IIS),用于环境监测与管理。多个嵌入式传感器并使用数据库获取数据。在各种环境因素之间确定了高精度的相关性,表明了所提系统的效率。纳贾等人 [19]利用物联网技术监测老年人日常身体活动(坐着、行走和站立)。为了进行运动分析,使用了运动学传感器以及小波变换。在三种不同环境中实施后获得了高效的结果。方等人[20]提出了一种通过结合遥感技术、地理信息和云服务来管理水资源的综合方法。基于该方法,作者提出了一个包含数据采集、数据管理与共享、建模和知识管理在内的水资源管理企业信息系统。孙等人[21]提供了一种基于物联网和云计算技术的尾矿坝监测与预警系统。该系统旨在通过实时监测饱和线、水位和坝体变形来提高尾矿坝的安全性。
该系统已在多个大坝成功部署,并取得了高效的结果。
贝伦特和基弗[22]提出了一种用于从电动助力自行车实时采集数据的电动自行车监控系统。该电动自行车系统配备了多种无线传感器和GPS设备,以高效地提供上下文数据。在30辆自行车上实施所提模型后,实现了对实时数据感知的有效结果,从而展示了将物联网应用于骑行场景中的效率。徐等人[2]调查了用于监测的各种物联网技术,并提供了该技术已用于高效监控的多个工业应用。
2.2 物联网在医疗保健中的应用
物联网已在医疗行业各个领域得到高效应用[41]。研究人员已开发出不同的模型以提升整体服务交付能力。
徐等人[5]提出了一种用于存储和解读物联网数据的语义数据模型。此外,该提出模型被应用于急救医疗服务中,以提供高效的医疗保健环境。在基于云的环境中实施该系统所获得的结果表明系统具有高有效性和效率。巴蒂亚和苏德[44]提出了一种基于物联网的智能ICU架构,通过无线传感器实现对患者远程监测。
作者将提出模型部署于多个ICU中,获得了高效的结果。杨等人在[23]中开展了有趣的研究工作。作者提出了一种家庭健康物联网框架,其形式为嵌入多种传感器和互联网连接功能的智能药盒。具体包括射频识别标签和生物贴片用于采集和传输数据,这些数据随后被用于分析。在实际环境中部署该系统后,取得了高效的结果。
Catarinucci 等人[24]提出了一种面向物联网的架构,用于在医疗中心和医院内对患者、医护人员及生物医学设备进行自动监控与追踪。该系统融合多种技术,以获取关于患者状况和相应环境属性的实时数据。此外,作者还讨论了此类系统在实现智慧医院愿景中的重要性。Suciu 等人[25]分析了将大数据处理安全集成到基于云的物联网远程遥测单元的各种组件和方法。
此外,作者提出了一种安全的电子健康架构,以高效地监控和分析健康数据。Mata 等人[27]提出了一种移动医疗监控应用的开发框架。所提方法包含多种目标服务,以高效监控健康指标。作者通过在实际场景中部署该框架进行评估,结果显示医生和患者均具有较高的系统可行性。Wang 等人[43]提出了一种基于兴趣的简化变邻域搜索队列架构,用于高效分析大型电子健康数据。该提出模型包含三层,每层执行特定的预定义任务。具体而言,在初始的数据采集层,提供了一种基于兴趣匹配的容错机制,以确保电子健康数据的完整性;其次,在数据整合层,对数据的准确性进行评估,以便进一步处理;最后,在数据分析层,采用RVNS队列实现快速数据处理并输出高效结果。仿真结果表明,该提出模型在处理大量电子健康数据方面表现出更优性能。Wang 等人[42]也开展了类似研究,旨在本地服务器上处理大规模健康数据,以获得时间敏感的结果。作者提出了一种三层医疗保健模型,包括数据采集层、数据过滤层和最终的数据分析层。最初,数据采集层将数据存储在本地服务器上,然后在数据过滤层中对数据的准确性进行过滤。最后,数据分析层用于确定健康相关的风险因素,并进一步用于向相关医生生成警报信号。
3 提出模型
图2展示了在智能办公室中提出的基于物联网的医疗模型的整体架构。通过嵌入各种智能传感器和联网硬件设备,该系统能够获取并传输关于可能直接影响或间接影响个人健康的各类活动的数据[47]。换句话说,该系统旨在分析人员在办公室房间内的各项活动对健康严重程度的影响,并为各种医疗应用提供一个高效环境。整体框架由四个独立层组成,即感知层(SL)、分类层(CL)、挖掘层(ML)以及最终的应用层(AL)。
每一层都执行特定的任务,从而为相邻层提供必要的服务。接下来将详细讨论所提出模型的体系结构。
3.1 感知层(SL)
它是所提出架构的数据采集层。它包括各种嵌入在办公室设施内的无线传感器、联网硬件设备和执行器。
这些物联网设备采集的数据具有异构特性,因为其包含数值型和非数值型数据。因此,需要将其转换为统一格式前的格式化。关于人员生命体征的数据由智能可穿戴设备、智能手表以及嵌入在人员周围环境中的生物传感器获取。免疫力低下患者对房间环境敏感。因此,通过各种专用传感器获取有关空气质量、噪音、温度和清洁度的数据。研究指出,长时间办公室工作可能导致人员身体虚弱。使用多种传感器来监测站立、行走、坐着和躺卧等身体活动。在办公室长时间工作常常导致饮食忽视。此外,患有严重健康状况的人群对食物较为脆弱。因此,通过嵌入在智能可穿戴设备上的吞咽传感器获取与饮食相关的数据,如营养价值、时间和数量。对于大多数人来说,工作时间常常是压力大的,由于高工作负荷,最终会导致健康相关问题。
物联网设备如生物传感器能够以高效且时间敏感的方式获取压力、焦虑和不安等数据。获取的信息根据传感器规格,利用不同的无线技术传输至远程位置。表 2列出了部分无线通信技术及其不同特性,适用于部署。然而,异构物联网设备具有不同的内部时钟结构。
Clarke 等人[28]已将物联网设备按同步需求分为多个类别,如表3所示。由于在当前背景下,时间是一个重要属性,因此它成为每项活动的组织基础。因此,智能网关被编程用于在传输前对各个数据集提供时间同步。此外,由于异构性,数据必须经过预处理,以便进行深入分析。表4概述了各种数据预处理以及特征抽象机制。采集的数据通过网络通道传输到连接的云。为了在传输过程中保障数据安全,该通道采用安全套接层(SSL)协议进行保护。然而,存储在云中的数据仍然容易受到各种安全攻击。因此,为了在云级别提供数据存储,整合了数据加密、用户认证和凭证映射等多种安全程序[29]。
3.2 基于雾计算的分类层(CL)
感知层采集的数据被传输到基于用户的计算设备。这些数据包含多种异构活动或事件。这些数据值包括生命体征,如心率、血压和体温,以及非生命体征事件,如室温、空气质量和噪音水平。整合这些健康相关事件后,得到以下五个数据集。
(a) 健康数据(DaH)
健康数据集包含以健康为导向的数据值。这些数据包括体温(温度传感器)、血压(智能手表和动脉传感器)、心率(智能手表和智能可穿戴设备)以及其他与个人健康直接相关的生命体征。当人员有糖尿病等既往健康状况时,DaH 可扩展以包含此类数据集,从而实现个人医疗保健的目的。
(b) 环境数据(DaE)
在办公室工作的人,尤其是在长时间工作的情况下,常常受到房间工作条件的影响。对办公室房间的清洁度、房间温度和噪音对于防止任何永久性健康损害至关重要。根据工作条件,其他重要的数据值还可包括氧气水平和有毒废物。化学传感器、温度传感器和其他智能设备等物联网设备能够高效地获取此类数据。
(c) 关于餐食的数据
与饮食相关的数据包括人员在办公室停留期间关于食品的数据以及用餐消耗情况。由于当前快节奏的生活方式,人们通常在饮食健康方面较为疏忽,尤其是在工作时间内。若长期处于这种状态,在长时间工作的情况下可能导致严重的健康严重程度。该数据集包含有关营养价值、餐食类型和餐食数量的数据。吞咽传感器、射频识别标签和智能监控器能够有效获取此类数据。
(d) 关于身体姿势的数据 (DaP)
在企业环境中,大多数人员被限制在desk工作中。换句话说,由于长时间的desk job,身体活动几乎可以忽略不计。长期缺乏身体活动可能导致永久性健康问题。因此,诸如站立、行走、坐着和躺卧等数据值由嵌入周围办公环境中的各种物联网设备进行感知。
(e) 关于行为的数据 (DaB)
办公室中的繁重的工作量可能影响人员的心理健康。在工作时间内承受繁重工作负荷的人员经常被记录有高度焦虑、压力和不安的抱怨。因此,关于行为的数据值被汇编成DaB数据集。嵌入在智能可穿戴设备和智能手表上的物联网传感器能够高效地有效获取此类数据。
表4提供了所有采集的数据集及其用于感知的物联网技术的概览。所有这些数据集都直接或间接地与个人健康相关。此外,此类数据值在工作时间诊断医疗紧急情况时可能发挥关键作用。
基于这一点,数据分类将这些事件划分为两类以健康为导向的类别,即严重类 (Sc) 和非严重类 (Nsc)。
严重类包含那些在工作时间可能对健康产生不利影响并导致严重健康问题的事件。另一方面,非严重类包括那些符合人员健康状况且对健康无显著影响的活动。
各类活动分别归类到相应类别的过程采用一种名为贝叶斯信念网络 (BBN) 的概率模型进行。[30] BBN是一种预测建模技术,用于分析事件的行为以预测未来结果。
图3显示了一个实例基于BBN分类器对活动进行分类。每个活动都关联一个概率值,该值取决于以健康为导向的参数,即严重性程度(DoS)。
定义2(严重程度(DoS)) :给定在办公室中事件 d的发生,事件d的严重程度定义为事件d对人员健康造成的对抗行为。
该定义提供了用于评估事件对个人健康敏感性的方法。定义2中的“不良影响”描述了在办公室发生活动d所引起的与健康相关的不适。例如,高血压和高心率是用于确定事件不良影响的一些参数。
3.3 挖掘层(ML)
挖掘层负责从云数据库中执行信息提取任务。各种数据集以时间实例的形式存储,因此在当前场景下,信息挖掘通过时态挖掘技术来完成[31, 36, 39]。此外,由于事件具有时间多样性,即某些事件需要连续感知 (如心率和温度),而其他事件则需要瞬时感知(如饮食和清洁度),因此利用时态挖掘进行数据抽象将从更广泛的角度获得有用信息。时态挖掘是一种数据挖掘技术,能够以时间序列模式的形式进行数据抽象。
定义3(非连续事件的时间序列模式(TSP NCE)) 给定一个事件E在时间点t1,发生,则非连续事件的时间序列模式事件(TSP NCE)定义为在时间 t1 时由目标传感器针对事件E所感知的值。其表示为:(t1, E)。
(1) 定义3 为每个非连续事件提供瞬时值。(2) 类似地,基于特定时间单位对各种非连续事件进行关联。
定义4 (连续事件的时间序列模式(TSP CE)) 给定一个时间窗口 Δt 和时间实例 t1,t2,…tN,使得 ti →Δt ∀ i,则连续事件E的时间序列模式(TSP CE)定义为在每个时间实例 ti 下由指定传感器感知的事件E的n个值的集合,表示为:[(t1, E1),(t2, E2),…(tN,EN)]
(1) 在定义4中, Δt 表示时间窗口的大小,使得 Δt =(tN‐t1)。(2) 对于每个时间实例,每个值对应于该时间单位的数据值。(3) 形式上,TSP CE 是事件的各种数据值的一种时态数据粒。
3.3.1 基于雾计算的严重性分析
从数据中挖掘的信息包括以时间实例表示的事件模式。这些事件包含属于严重性类别和非严重性类别的事件。因此,必须在严重性等级上对其进行分析。对各类事件的时间序列模式进行严重性分析将:1)确定对周围办公环境中个人健康状况的影响;2)提供关于人员所处情境的严重性水平的洞察;3)有助于针对健康相关问题进行高效决策。基于这些方面,以一种称为严重性指数(Severity Index, SI)的概率参数来对各类事件进行严重性分析。
定义5 (严重性指数(SI)) 给定一个属于严重性类别的事件E,则事件E的严重性指数被定义为基于严重程度的对患者健康产生不利影响的概率因子。
换句话说,严重性指数(SI)值提供了在严重性等级上分析办公室环境事件的概率度量。此外,由于健康状况的严重性由人员的生命体征(心率和血压)决定,因此严重性指数可以方便地用条件概率表示,如公式 1 所示。
SIE= P( S | E1 U E2 U … EN) (1)
其中S表示健康状态(安全或不安全)。Ei表示各种事件的严重性指数值,可通过严重性指数评估确定。
过程。各种活动的适当阈值由系统管理员或领域专家预先设定。
3.4 应用层(AL)
在智能办公环境中,对各类事件的严重性指数进行评估将是多种医疗应用的重要方面。利用物联网设备进行医疗保健不仅能够为人们提供更高水平的个人医疗服务,还有助于以信息密集方式分析个人健康状况。
应用层的主要目标是为用户提供一个高效的高服务质量医疗环境。尽管基于所提出的框架可以构建大量应用,如个人健康推荐系统、远程健康分析系统和个人健康维护系统,本文提出了一种基于移动医疗视角的新型远程健康严重性预测与警报生成系统。
3.4.1 应用场景:时序信息丰富的移动健康预测系统
时序移动健康监测已被许多研究人员和医生被视为医疗保健行业的一次重大突破。利用时序分析来分析患者的健康状况,为移动医疗和远程医疗增添了新的维度。
传统的医疗保健监测仅局限于健康相关的数据值,而环境属性和饮食消耗等其他重要信息则被忽略。在此背景下,提出了一种信息密集型监控流程,以协助监测医生进行高效决策。然而,先前层级中呈现的时间序列模式并未包含各类事件的协同信息。因此,对时间序列模式进行了扩展,以纳入办公室内的其他健康相关事件。
定义6 (时序关联数据粒(TA DG(t))) 给定一个在大小为 N个时间单位的Δt时间窗口内包含M个事件的时间序列模式,则时序关联数据粒被定义为在Δt时间窗口内发生的各个事件的协同集合,并表示为:[DID1,( E1 1, E1 2..E1 N) ],[DID2,(E2 1,E2 2..E2 N ]..[ DIDM, (EM 1, EM 2..EM N )]
(1) 在定义6中,DIDi表示在时间窗口Δt内发生的第i 个事件值的数据标识符。th(2)M和N分别为事件数量和时间窗口大小。(3)图4展示了涉及健康数据和环境数据的时序数据粒化示例,其中呼吸频率和湿度被用于严重性分析。
此外,时序关联数据粒将向相关医生提供密集的信息。除此之外,所提出的系统能够根据SIE值预测人员的健康状态。因此,本文定义了一种新颖的时序健康状态预测系统,以向医生生成主动警报,如图 5所示。
为了实现预测,定义了时序朴素贝叶斯模型(TNB模型)以实时生成主动健康警报。TNB模型是传统朴素贝叶斯预测模型的扩展,包含两个阶段,即时序学习和时序预测。
阶段1:时序学习
在学习阶段,系统持续分析特定时间窗口 Δt内 某事件E的严重性指数(SIE)值。已预先确定适当的事件特异性阈值,用于判断对人员健康状态的不良影响。根据基于雾层的计算设备的存储容量,系统将在给定的时间窗口长度内将严重性指数存储在本地内存中。
阶段2:时序预测
该阶段对给定时序关联数据粒中各个事件的严重性指数进行数学计算。换句话说,预测过程基于数据粒中各事件健康严重程度的朴素贝叶斯条件预测。从数学上讲,用于预测人员健康状态的TNB模型由公式 2定义
P(Severity Δt )= Max ∏_{t=1}^{N} P(E t i| SIE) (2)
其中,n 表示给定的时态数据粒中各种异构事件,N 表示该数据粒的时间窗口长度。
3.4.2 数学分析
本节介绍了TNB模型在预测健康严重程度方面的数学分析。具体而言,设P(ST/E)和P(SF/E)表示在时间ΔT下,观测属性E> λ(预设阈值)对应的经历健康严重程度的“真”和“假”概率值,w为属性E的关联权重。TNB模型将加权先验概率Pw(E>λ/ST)定义如下:
P Δt w(E/ST)= P(E) ∗ P(E/ST) / 概率预测
加权后验概率Pw(ST/E)是一个概率函数,基于加权先验的定义概率 Pw(E/ST)。相应地,我们可以推断概率 Pw(ST/E) 如下:
→ PΔt w(ST/E)= Pw(E/ST) ∗ P(ST)/P(E) → PΔt w(ST/E)= w(E) ∗ P(E/ST) ∗ P(ST)/P(E),
其中,
→ P(E)= Pw(E/ST)P|(ST)+ P(E/SF)P(SF)
→ P(E) = w(E)P(E/ST)P(ST)+ P(E/SF)P(SF)
然后,在考虑给定数据集在时间窗口Δt内的n个属性后,严重性指数(SIEΔt)值被评估为
→ SIΔt E= 1/n ∑_{E} PΔt w(ST/E)
聚合异构事件,我们得到
→ P(SeverityΔt)= Argmax_{i=1..n}P(SIΔt E) ∏_{t=1}^{N} P(Et i|SIE)
3.4.3 数值示例
在本节中,我们以健康数据(包括心率、呼吸频率和体温)以及关联的加权函数为例,说明如何评估在给定时间段Δt内的严重性指数(SI)值。最初,通过嵌入人员周围环境中的物联网传感器获取数据值。假设各属性超过阈值的频率为:呼吸频率为2,体温为1,心率为1。然后计算每次观测的权重如下
w(“HeartRate”)= (1/(0+1)) ∗ (1/(1+1)) ∗ (0/(1+1)) = 0.67
w(“BreathRate”)= (1/(0+1)) ∗ (0/(2+1)) ∗ (2/(2+1)) = 0.33
w(“BodyTemperature”)= (1/(0+1)) ∗ (0/(1+1)) ∗ (1/(1+1)) = 0.33
假设先验概率如概率矩阵的表5所示,那么这三个属性的后验概率计算如下
P(Severity/Heartrate)= (0.67 ∗ 0.1 ∗ 0.26) / (0.67 ∗ 0.1 ∗ 0.26+ 0.01 ∗ 0.74) = 0.701
P(Severity/Breathrate)= (0.33 ∗ 0.2 ∗ 0.26) / (0.33 ∗ 0.2 ∗ 0.26+ 0.19 ∗ 0.74) = 0.108
P(Severity/BodyTemp.)= (0.33 ∗0.18 ∗0.26) / (0.33 ∗0.18 ∗0.26+ 0.02 ∗0.74) = 0.510
4 性能评估
在本节中,对所提系统进行了性能评估分析。如前所述,该框架包含四个主要步骤。第一步,获取每个事件对应的数据值并存储到数据库中。第二步,在雾层利用贝叶斯分类模型根据严重程度级别对每个事件进行分类。第三步,执行时态挖掘以从云数据库中提取各种事件数据集。最后,为了实现远程医疗监控的目标,提出了一种带有信息呈现的警报系统。基于上述内容,从以下几个方面分析了所提系统的性能。
1) 评估BBN分类器在雾层的事件分类效率。2) 分析从云数据库进行数据抽象的时间挖掘效率。3) 对所提出的TNB模型预测过程进行统计评估。4) 确定大规模数据集下的整体系统稳定性。
4.1 实验环境
为了实现提出模型,我们在两种不同类型的静态数据集上进行了实验,分别是健康数据和环境数据。健康数据集来自UCI数据仓库,包含19,908个数据实例,涵盖多个时间段的心率、呼吸频率及其他生命体征信息。环境数据来自美国环保署数据仓库,包含超过18,000个数据集,其属性包括室温、压力、湿度。从这些不同数据集中获取的数据存储在亚马逊EC2云中 [32, 40],并在其中使用STATA [33]工具包进行分析。
针对各种数据集获得了结果,并与多种最先进的基线技术进行了比较。
4.2 活动分割
活动分割用于分析从在线数据存储库获取的在给定时间窗口 Δt内的数据集。对于以健康为导向的数据集,我们通过回归方法进行跨模态搜索,以识别在给定时间窗口内的各种严重性属性。根据[31]指定的适当参数进行了调整,以获得数据集的高效结果。此外,使用隐含条件随机场模型[48]来确定行为中的压力和焦虑。
至于环境数据集,我们使用符号聚集近似(SAX)算法[49]进行严重性分析。SAX评估环境在给定时间窗口内提供属性,并实时提供高效结果。
基于数据集的分割,将评估如下所述的不同性能方面。
4.3 数据分类效率
数据分类效率通过贝叶斯分类模型将数据值划分为两类之一。为评估提出模型的分类效率,采用了多种统计指标,包括准确性、特异性、敏感性和F值[37]。
为了进行对比分析,引入了多种先进的基准分类器。
作为用于比较的基线分类器模型,采用了三种不同的分类器模型,即K‐近邻(K‐NN)、人工神经网络(ANN)和支持向量机(SVM)。然而,需要强调的是,为了比较目的,仅改变分类器模型,而系统的其余部分保持完全相同。针对不同分类器模型获得的结果如图6所示。
(i) 图6a–d 展示了面向健康的数据实例在准确性、特异性、敏感性和F值方面的比较结果。这些比较结果是与其他最先进的分类器模型进行对比得出的。然而,由于活动数量可变,因此仅列出了贝叶斯(BBN)分类器模型的最终结果。根据结果可以看出,在当前场景下,基于BBN的分类模型性能优于其他分类技术。
具体而言,BBN在准确性方面表现更优,达到近 96.5%,而K‐NN(94.4%)、ANN(91.3%)和 SVM(90.1%)则较低。在特异性方面,BBN获得了 96.7%的更高值,优于K‐NN(91.3%)、ANN( 92.3%)和SVM(91.1%)。敏感性是BBN另一项取得近93.6%数值的参数,相比其他分类器模型也更高。
最后,在F值评估中,BBN分类器同样表现出更优性能(94.3%),而K‐NN、ANN和SVM分别仅为 90.3%、91.2%和91.5%。因此可以得出结论:在当前场景下,BBN分类器在分析以健康为导向的数据集方面非常有效。
(ii) 图6e–h 展示了环境数据集在统计评估中的各项比较结果。根据针对不同数量环境数据实例所获得的结果,BBN分类器在统计评估方面效率很高。从统计角度看,在评估准确性时,BBN取得了近96.9%的数值,高于K‐NN的93.1%、ANN的91.1%以及SVM的90.2%。
从特异性测量来看,BBN在大量环境数据集上登记了 91.9%的高值,相较其他最先进的分类器模型更高。
此外,在敏感性和F值方面,BBN也优于其他分类器模型,分别获得95.9%和92.9%的数值。因此可以得出结论:对于环境数据集,BBN在评估各种活动方面非常有效。
4.4 基于TNB模型的预测效率
预测效率涉及对数据集进行实时严重性评估的分析。如前一节所述,考虑了大量不同类型的数据集,因此确定预测模型的准确性至关重要。然而,需要指出的是,这些异构数据集在预测分析之前已被聚合。通过多种统计指标来评估此类效率。具体而言,使用[51]中提供的数学计算方法确定了三个重要的统计指标,即皮尔逊相关系数(r²)、平均绝对误差(AAE)和平均平方误差(ASE)。这些参数对于评估提出模型的整体准确性和有效性均至关重要。
为了进行比较,考虑了两种不同的先进预测模型,即神经网络[45]和 IDEEA [46]。然而,在结果评估过程中,仅更改了预测模型,而模型的其余部分保持不变。根据实验评估,获得了各种结果,如表6所示。
由于用于评估预测效率的数据集数量庞大,仅展示了最终结果。从表6中可以看出,对于皮尔逊相关系数(r²),TNB模型的值接近0.88(标准差0.07),相较于IDEEA(获得值0.82,标准差0.13)和神经网络(获得值0.80,标准差0.10)具有相对更好的表现。
对于平均绝对误差(AAE)值,TNB模型能够优于其他预测模型并取得更低的值。在与 IDEEA 的 0.41(SD 0.04)和神经网络的 0.41(SD 0.08)相比时,其性能表现更佳,数值接近 0.30(SD 0.04)。
至于ASE,TNB模型能够优于其他预测模型并取得更低的值。在统计上,其平均平方误差(ASE)达到了0.24(标准差0.13),而 IDEEA和神经网络获得的值分别为0.47(标准差0.15) 和1.03(标准差0.20)。根据这些结果可以得出结论,在当前场景下,TNB模型表现出更好的结果,因此具有高度的适用性和准确性。
4.5 时间挖掘效率
提出模型由四个阶段组成。在初始阶段,信息被获取并存储在云数据库中。然后,使用贝叶斯分类器将这些数据集分析为不同类别,随后在数据挖掘阶段进行进一步分析。最后,使用TNB模型预测办公室内各种活动的严重性指数值。由于引入了异构数据集,因此分析提出模型的时间行为非常重要。时间效率关注的是提出模型从云数据库中进行数据抽象到最终预测生成所花费的时间。在当前涉及两个不同数据集的情况下,针对不同数量活动实例所获得的结果如图7所示。
在图7a 中可以看出,对于大量数据值,从云数据库中抽象健康相关数据值并预测严重性指数的整体运行时间为约19.2秒。类似地,图7b 展示了关于环境数据集的结果。它显示基于TNB模型的预测运行时间大约为5.3秒,这是高度可接受的,尤其是在涉及大量数据集时。这使得针对可变数量的环境实例的平均总体运行时间为24.7秒。这表明提出模型在提供评估各种活动的实时结果方面非常高效。因此,基于这些评估可以得出结论:提出模型在时间效率上表现优异,并且在评估大量异构数据集方面具有高度可行性。
4.6 整体系统稳定性
除了前几节获得的结果外,还对所提系统进行了稳定性测量评估。由于严重性分析中包含了大量数据集,因此确定系统在不同数据值下的系统稳定性变得必不可少。通常,系统稳定性通过平均绝对偏移(MAS)来衡量。MAS值越高,系统稳定性越低;反之,MAS值越低,则表明系统随时间具有高稳定性。稳定性测量结果如图8所示。较低的MAS值(平均为0.42)表明所提系统对于可变数量的数据集保持稳定,因此非常有效。
4.7 对比分析
本节通过将所提出的模型与当前医疗行业领域的前沿相关研究进行比较,以评估其性能。如前几节所述,健康严重性指数是一个依赖于多个参数的复杂度量。
然而,本研究提出了一些新颖的方面,以描述其在医疗行业的实用性。具体而言,选取了五项具有挑战性的研究进行比较,分别是杨等人 [23], 巴蒂亚和苏德 [44], 马塔等人 [27], 苏奇乌等人 [25], 和徐等人 [5]。这些研究将基于下述的不同参数进行比较。比较结果的汇总见表7。
-
适用领域
该参数提供了关于特定医疗保健领域的概述,说明了某项研究的具体应用范围。换句话说,它描述了本研究的适用领域。 -
主要贡献
这将提供关于该研究主要贡献的深入信息。换句话说,它描述了所提出的研究在医疗行业中的重要影响方面。 -
所使用的基线传感技术
由于研究的核心方面是医疗数据的获取,因此必须确定研究人员在各自研究中所采用的底层传感技术,以提供有效的医疗服务。 -
所使用的医疗数据分类模型
如前几节所述,在进行漏洞评估之前对医疗数据分类的效用进行了讨论,该参数提供了关于在不同研究中用于有效确定漏洞的数据分类器模型具体类别的信息。 -
数值量化
医疗数据的数值量化是本研究的另一个显著特征。然而,仍需基于此参数与其他研究进行比较,以确定所提出模型在医疗保健领域的有效性。 -
雾计算层
此类比较提供了关于所提议研究中利用最先进的雾计算范式的信息。 -
特征提取机制
异构数据采集需要高效的特征提取技术,以确保系统的整体有效性。该参数基于所提出的模型中采用的特征提取机制,将提出模型与其他相关研究进行比较。 -
数据挖掘技术
实时医疗评估需要持续从数据库中提取数据。因此,有必要根据所采用的数据挖掘技术对提出模型进行分析,以支持数据提取。 -
医疗数据存储
数据存储指的是有关数据在数据库中如何存储以供评估的信息。换句话说,它提供了各种研究人员用于存储实时异构健康导向数据所采用的数据存储机制的相关信息。 -
输出呈现
此参数用于根据结果输出向目标用户呈现的方式,将提出模型与其他相关研究进行比较。此外,它还将提供有关医疗用户界面的信息,以供用户进行健康评估。 -
决策模型
这是一个重要参数,构成了所提出模型与其他研究之间可区分性的基础。换句话说,它提供了关于不同研究人员如何分析医疗数据以增强医生和相关护理人员实时决策能力的信息。 -
异构数据集
此参数涉及在特定研究中所感知的数据类型。如前所述,健康是一个复杂的参数,因此评估不同的参数对于有效决策至关重要。 -
安全机制隐含
由于所获取的数据包含个人医疗保健数据,因此在存储之前必须采用必要的安全机制。此参数提供了不同研究人员用于保护医疗数据的各种安全技术的相关信息。
| 参数 | Yang et al.(2014) | Bhatia and Sood 2016 | Mata et al. | Suciu et al. | Xu et al. | Proposed Model |
|---|---|---|---|---|---|---|
| 适用领域 | Home-based Healthcare | ICU based Health monitoring | Health monitoring from remote site | Big data processing for e-health services | Semantic data model for emergency medical services | Smart office based predictive healthcare services |
| 主要贡献 | Intelligent Medicine box for home based healthcare services | Temporal abstraction of health oriented datasets in real time | Remote Health Monitoring | Big data analytics for processing e-health data | Real time healthcare servicing using semantic data model | Monitoring office activities for providing healthcare servicing during working hours of a person |
| 基线传感技术 | IoT | IoT | Body Sensor Network | Bio-sensors | Body Sensor Network | IoT |
| 医疗数据分类模型 | Not Applicable | Bayesian Classification Model | Not Applicable | Not Applicable | Not Applicable | Bayesian Classification Model |
| 数值量化 | No | Partial | No | No | No | Yes |
| 雾计算层 | No | No | No | No | No | Yes |
| 特征提取机制 | Not Applicable | Heterogeneous | Not Applicable | Not Applicable | Heterogeneous | Heterogeneous |
| 数据挖掘技术 | Not Applicable | Temporal Data Mining | Multiple | Multiple | Not Applicable | Temporal Data Mining |
| 医疗数据存储 | Local | Cloud storage | Local | Local | Statistic | Fog and Cloud storage |
| 输出呈现 | No | Yes | No | Yes | Yes | Yes |
| 决策模型 | Not Applicable | Alert Based | Not Applicable | Not Applicable | Alert Based | TNB-Model based predictive alert system |
| 异构数据集 | Yes | Yes | Yes | No | Yes | Yes |
| 安全机制隐含 | No | Yes | Yes | Yes | Yes | Yes |
5 结论
本文提出了一种基于物联网的智能办公室远程医疗监控的分层雾‐云架构。该提出模型从不同事件的角度整合了办公室环境的各个方面。每个事件均通过严重性等级进行分析,以确定其对个人健康状况的影响。此外,针对各种事件的时态实例通过严重性指数进行挖掘。作为应用环境,提出了具有自动警报生成可行性的预测性医疗环境,以应对健康严重程度问题。此外,构建了时态数据粒,通过提供关于严重事件的详细信息来增强医生的决策能力。为了验证系统的实用性与有效性,使用从在线资源库获取的两个具有挑战性的数据集进行了评估。根据所得结果可以得出结论:所提系统在提供适宜的医疗保健服务环境方面具有高效率和有效性。然而,仍有许多重要挑战需要在未来的研究中加以解决。这些挑战包括将异构事件转换为通用可传输格式,以及实现最优网络负载效率以高效利用医疗保健资源。这些方面对于系统的系统化部署至关重要。
1463

被折叠的 条评论
为什么被折叠?



