揭秘医疗领域的大数据与机器学习
在医疗领域,从分析 1.0 向分析 2.0 和 3.0 过渡,需要成功利用大数据。要做到这一点,了解大数据的定义、作用以及常被提及的“3V”概念很有帮助。
大数据与“3V”概念
早期,大数据的定义主要关注数据存储的规模。2001 年,Laney 定义了构成大数据的 3V,即 Volume(大量)、Velocity(高速)和 Variety(多样)。一种流行的大数据定义反映了这种演变:“高容量、高速度和/或高度多样化的信息资产,需要具有成本效益的创新信息处理形式,以增强洞察力、辅助决策和实现流程自动化”。也有人将大数据定义为“新旧技术的结合,帮助企业获得可操作的见解”以及“在合适的速度和时间范围内管理大量不同数据的能力,以实现实时分析和反应”。
虽然有人试图在原有的 3V 基础上添加新的“V”,但这里主要关注由基本特征(Volume、Variety、Velocity)和使用资格(Value 和 Veracity)驱动的大数据定义。同时,要避免陷入“千 V 致死”综合征,这是一种对“大数据含义”的过度语义探讨,对组织的数字健康有害。为防止这种情况,下面将为医疗大数据中的每个“V”提供特定领域的定义、指南和框架。
Volume:大数据中规模为何重要
信息过载和人类处理信息的认知局限几乎与文字记载的历史一样久远。公元 1 世纪,塞内加指出:“既然你不可能读完所有拥有的书,那么拥有你能读完的数量就足够了”。13 世纪,博韦的樊尚描述过载的原因是“书籍众多、时间有限和记忆力不佳”。印刷术出现后,16 世纪的学者担心在众多书籍中找不到所需信息。20 世纪,在现代计算机出现之前,就已经开始讨论大量信息的规模、存储和管理问
超级会员免费看
订阅专栏 解锁全文
540

被折叠的 条评论
为什么被折叠?



