大数据在医疗与公共部门的应用与发展
1. 医疗领域大数据技术需求
1.1 医疗数据语义丰富化
医疗数据语义丰富化需要在以下技术方面取得进展:
- 医学文本信息提取 :从医学文本中提取信息给经典信息提取技术带来了新挑战,需要考虑否定、时间性和更多上下文特征。目前研究多集中于英文临床文本,还需适应其他欧洲语言。
- 图像理解算法 :需要能正式捕捉自动检测到的图像信息(如解剖结构、异常结构和语义图像注释)的算法,要针对人体复杂性和不同医学成像技术开展更多研究。
- 标准化医学注释框架 :需要包含标准化医学文本处理并支持注释技术集成的框架,现有框架(如 UIMA)需进行调整以满足医疗领域的特定挑战和要求。
1.2 数据共享与集成
高效的数据集成和无缝共享依赖于标准化编码方案、术语和数据模型。目前标准化编码系统存在局限性,许多信息未以编码形式存在。为推进数据集成和共享,需要改进和标准化以下方面:
- 语义数据模型 :现有模型(如 HL7 RIM)存在实施困难的问题,相关研究(如 MCI)正在进行。
- 语义知识模型 :如生物医学领域本体和术语,与语义数据模型结合使用,有助于实现语义互操作性,但需要进一步研究改进现有标准并开发新标准。
- 上下文信息 :需要标准来描述数据来源、使用或所有权等上下文信息。
1.3 数据隐私与安全
为满足大健
超级会员免费看
订阅专栏 解锁全文
1492

被折叠的 条评论
为什么被折叠?



