智能环境医疗系统中的人类活动模式挖掘与监控
9.1 引言
数据挖掘是从大型数据集中发现模式的计算过程,涉及机器学习、统计学和数据库系统。它通过应用智能方法提取数据模式,将数据转化为可理解的结构以供进一步使用。数据挖掘的参数包括序列或路径分析、分类、聚类和预测。数据挖掘的概念涵盖统计学、人工智能和机器学习。
智能环境可以包括智能家居、智慧城市、智能电表、智能停车和智能治理,以及多种传感器。智能环境能够以上下文感知方式响应居民的需求。智能环境配备了不同类型的传感器,使系统能够收集居民活动和环境状况的数据。在智能家居中的活动可以通过环境传感器(如红外运动传感器)来收集,以跟踪居民的移动。此外,环境传感器还可以包括温度传感器、压力传感器、接触开关传感器和智能电表,这些传感器提供上下文信息。
智慧城市是一个多个部门协作以实现可持续成果的城市化地区。这是通过对情境信息和实时信息进行分析来实现的。此外,智慧城市能够对各种日常需求提供智能响应,包括人民生计、安全系统、公共交通和环境、公共卫生以及工业和商业活动。由于智慧城市数据具有数据量大、速度快和种类多的特点,因此带来了诸多挑战。这些数据最初是非结构化的,因为它们可能以音频、图像、日志文件、推特、文本等形式存在,必须与结构化数据进行整合。
数据来源可以是传统来源、新技术来源、物联网(IoT)设备,或人工录入。物联网传感器在某些位置可能无法正常工作,导致产生错误数据或缺失数据。因此,此类数据需要进行主要的预处理。智慧城市数据成为大数据,这是一个技术术语,用于描述大量结构化和非结构化数据。
大数据是指传统数据处理方法难以应对的大量或复杂数据集的集合。大数据面临的挑战包括数据采集、数据存储、数据分析、搜索、共享、传输、可视化、查询、更新以及信息隐私。其他主要挑战还包括信息共享、隐私、安全、新数据格式和数据质量。因此,智慧城市和智能家居面临着大数据所面临的所有挑战。此外,它们还面临与安全和隐私相关的挑战。例如,可以安装智能电表来监测家庭中的活动。各种电器被监控并用于测量单个电器的使用情况。智能电表与智能电源插座共同收集数据,通过将用户按电器使用情况进行分类,定期跟踪人们的行为活动。
大数据在医疗机构中的应用提供了显著的好处,包括更早地检测疾病以及更简便有效地开具处方。智慧城市的工具和技术进步改善了医疗服务,而智慧城市的基础架构和技术促使人们突破现有医疗系统的局限进行思考。远程医疗领域也推动了一个新的普适概念——智慧健康的发展,该概念融合了普适计算和环境智能的理念,应用于预测性、个性化、预防性和参与式的医疗系统。智慧健康与健康和福祉的概念密切相关,其中包括从生物医学传感器收集的大量数据。因此,大数据通过基因组驱动、支付方与服务提供方以及社交媒体数据执行器来观察和预测患者的身心状况。
智慧健康是一个新兴但前景广阔的领域,涉及医学信息学、公共卫生以及商业的交叉,指的是通过物联网提供的智能医疗服务或增强的认知能力。医疗服务受到人口向城市迁移的影响,而数字化转型是当前的一种新趋势。为了提供更健康的环境,家庭正通过智能设备进行全面组织,这有助于使城市变得更加智慧。如前所述,智慧城市能够产生大量数据,这些数据需要被处理、提炼并转化为有用的结构化数据。
9.2 文献综述
阿塔卜和周提出了一种智能电源插座,这是一种用于跟踪和控制电器行为的显著信息物理系统。在现有的智能插座中,具有在线学习、电器分类与诊断等先进自动化功能。由于存储和计算限制,未包含行为。因此,开发了独立的智能插座以提供高效的分类和跟踪。物联网框架用于使用本地内存跟踪均匀分布任务的性能和感知[1]。
郝等人提出了一篇论文,其中利用智能家居支持下的硬件和软件来预测活动。智能家居配备了智能服务,为用户提供高效的生活环境。通过环境传感器监测人类行为,并挖掘智能家居中发生的多模态交互[2]。然后可以根据识别出的行为向老年人提供反馈。
智慧城市是一种旨在提高生活质量[3]的城市创新。它利用技术推动社会和经济方面的发展。智能电表的一些应用包括能源管理、绿色建筑、太阳能利用、智能停车、智能交通管理、废物管理、犯罪监控与管理、水质监测和泄漏识别,以及创建适宜步行的区域,使地区更不易受到犯罪和灾害的影响,实现智能治理。智慧城市倡议中采集的数据用于改善城市的宜居性。这些数据包括政府数据以及社会数据,用于分析市民在重要城市事件期间的情绪[3]。
金达尔等人提出了一篇论文,重点关注信息与通信技术领域的医疗保健进步,这些进步增加了使用远程医疗应用的用户数量。这些应用中收集的患者数据在体量、速度、多样性、真实性与价值方面各不相同。处理如此大规模的异构数据是一项重大挑战,需要采用专门的方法。为解决这一问题,采用了一种新的基于模糊规则的分类器来处理大数据,并结合称为医疗即服务的基于云的基础设施[4]。另一项由亚辛等人开展的研究涉及医疗服务,这是一个极具挑战性的领域,深受大量人口涌入城市中心的影响。城市居民正趋向于更健康的环境,这将成为智慧城市服务数字化转型的一部分[5]。智能家居产生的海量数据将进一步推动智慧城市的发展。
文卡特斯等人的一项研究基于物联网探讨了智慧健康。物联网设想创建由无处不在的环境与用户感知以及分布式低容量计算构成的智能互联城市,从而提供有关各种智能环境中市民的充分信息。通过提供智慧城市基础设施,可以利用以人为核心的信息来改善智慧健康应用[6]。
普拉马尼克等人的研究涉及大数据领域的近期技术发展,推动了信息与通信技术(ICT)的增长。他们讨论了技术发展如何带来移动计算,其中通信起着主要作用,而普适计算甚至为政府和私营部门提供了诸多机会,尤其是在医疗行业。大数据如今似乎是医疗行业的支柱。采用了一种范式转变的三维结构,并提取出三个广泛的技术分支(3T),以促进医疗系统的发展[7]。
陈等人开展的研究着眼于生物医学和医疗保健领域的大数据增长,提供了针对老年人疾病检测的医疗数据分析。当预测数据出现错误时,医疗细节会变得不完整且看似无用。由于每种疾病都有其独特的症状和相应的处理措施,因此即使医疗数据在缺乏主动预测的情况下也可能成为异常值。机器学习算法被用于有效的预测和挖掘[8]。
霍赛因和拉赫曼研究了新兴的网络物理系统(CPSs),以在智能家居中为老年人提供服务。CPS用户交互从智能家居内部收集并感知,这些交互可用于监控能源效率等任务。所提出的工作是一种利用云计算和大数据技术实现的节能型CPS,用于监控老年人[9]。刘等人提出了基于智能电网的数据采集方法。通过智能电表收集用电数据,并根据成本和负载对数据进行区分。智能电表读数可能因开关状态而有所不同[10]。
福斯蒂娜等人对发展中国家的城市化进行了研究,考虑了大型建筑和高能耗区域,以衡量能源效率。实时持续监控电器的电力消耗并非易事。智能家居中需要一个总功率监控系统[11]。
Moreno和Terroso描述了智慧城市中的分类。智慧城市是大数据的一项应用,代表着重要的研究机遇。其贡献包括为智慧城市应用设计并实例化一种基于物联网的架构、智能建筑中的能源管理,以及扩展数据分析以检测城市模式,这些可被用于改进应用于公共有轨电车服务的公共交通[12]。
施魏策尔和泽恩德提出了挖掘和使用模式。通过学习基于使用模式的偏好,利用频繁序列模式挖掘算法对实时智能家居数据进行处理,使智能家居实现节能。该研究详细阐述了使用不同算法在性能上的比较[13]。辛格等人讨论了与用户活动相关的电力消耗的关键要素。在智能家居中,电器之间的相互依赖性仍然是确定单个电器耗电量的主要缺陷。通过大数据预测提取单个电器的信息[14]。
陈等人研究重点在于,由于广泛应用的传感器技术的出现,居民能够轻松收集家用电器使用数据。以往关于使用模式发现的研究主要集中在挖掘模式上,而忽略了对挖掘结果的增量维护。本研究采用的新方法是动态关联挖掘器,该方法旨在增量式地捕捉和维护智能家居中电器之间的使用关联环境。此外,有效采用了多种优化技术以减少搜索空间[15]。另一项由威尔逊等人开展的工作关注活动,这是一个描述家庭在烹饪、洗涤和其他任务上花费时间的常见方式的术语。为了生成活动时间,使用了对家庭有意义的智能电表数据。获取并报告来自活动的反馈,以便于理解,并为老年人提供所需的特征更新[16]。
表9.1 聚类算法的参数比较
| 序号 | 聚类算法 | 效率 | 质量 | 鲁棒 | 隐私 | 安全 |
|---|---|---|---|---|---|---|
| 1 | K均值 [1] | High | 中等 | Low | Very high | 中等 |
| 2 | 期望最大化 [3] | High | High | Nil | Nil | 中等 |
| 3 | 基于脉冲的模型 [5] | High | High | 中等 | High | High |
| 4 | 启发式聚类 [10, 12] | Low | Low | 中等 | 中等 | Nil |
| 5 | 遗传算法 [12, 13] | 中等 | 中等 | Low | Low | Nil |
| ## 9.3 基于脉冲的马尔可夫模型 |
用于医疗应用的智能家居大数据与人类活动模式(基于脉冲的马尔可夫模型)的提出架构如图9.1所示。智能电表数据来自数据库。随后对数据进行预处理,以获得用于降维的清洗后的集成数据。数据预处理完成后进行数据分类。所使用的分类算法是基于半马尔可夫模型的逻辑回归。分类数据通过基于脉冲模型的聚类进行聚类。
聚类后的数据可用于活动预测和模式分析。分析后的数据存储在数据库中。当智能环境中预测到活动时,会立即生成警报。系统通过活动预测和频繁模式分析提供医疗服务。智能环境使用环境与移动感知以及半马尔可夫模型,并结合逻辑回归用于检测个体居住者的数据。准确性与性能通过绝对预测来确定。
智能电表用于测量电器的使用情况及使用时长。利用智能电表数据,通过贝叶斯网络进行活动识别与预测。数据被提取出来,用于识别多种电器,并在电器层面上分析随时间变化的能耗。通过对数据进行聚类,检测人类活动中的突发变化。
基于脉冲模型的聚类也用于从电器的开关状态中检测使用模式。聚类分析用于基于时间发现电器使用情况,包括时间戳。如前所述,活动预测和识别在贝叶斯网络中进行,该网络使用有向无环图(DAG)并包含因果关系的概念。贝叶斯网络确定缓解缺失数据的方法,用于学习随机变量与历史数据及变化之间的关系,同时避免过拟合。准确率预测和性能分析在图9.2和图9.3中以图表形式展示。基于用户项目在挖掘和数据预测中获得高性和准确性。
数据挖掘用于挖掘智能家居中常用的热门项目,即常用电器。基于用户项包括电视、洗衣机和风扇,这些是老年居民最常使用的电器。通过频繁模式挖掘获取反馈。每隔30分钟可根据从数据库中获取的电器数据生成一次警报。反馈应基于主动监控提供。这些数据可用于改进医疗应用。最后,将数据集成以构建本体模型,展示电器之间的属性和关系。
图9.1 基于脉冲的马尔可夫模型
图9.2 性能分析
图9.3 准确率预测
9.4 总结与结论
从上述比较表中可以明显看出,基于脉冲的模型是最适合的数据聚类算法,而基于逻辑回归的半马尔可夫模型最适合用于数据分类。活动预测通过识别人类行为和频繁模式挖掘来实现。挖掘包括机器学习算法,这些算法可能是有监督、半监督和无监督算法。基于活动预测的模式挖掘通过半马尔可夫模型和脉冲模型进行时间上分析。
所提出的模型是一种基于脉冲的马尔可夫模型,该模型将用户行为预测作为服务,基于单个电器应用于实时场景。智能电表无法在同一时间识别多个使用预测,因此可以使用智能电源插座。虽然已识别出医疗相关问题,但缺乏向患者或护理人员发送警报的功能,而所提出的模型克服了这一不足。
提出了一种利用智能电表识别人类活动模式的绝对模型,而模式挖掘和预测则基于用户进行协同过滤方法。构建了一个本体模型,用于将电器映射到任意时间单位上的活动操作。获得了随机、流行和基于用户项的性能和准确性值。项目可能随电器而变化。可以通过使用与老年人关联较少的其他项目进一步提高准确性。
在智能家居中对老年人的活动进行监控,一旦发生紧急情况,通过挖掘分析预测值,并向老年用户生成结果。

被折叠的 条评论
为什么被折叠?



