临床数据集分析工具:黑盒视角下的技术探索
在医疗数据日益丰富的今天,如何安全、高效地分析临床数据集成为了一个关键问题。本文将介绍一种将临床数据集视为黑盒进行分析的工具,探讨其相关技术和应用。
1. 相关工作回顾
在医疗数据安全和分析领域,已有众多研究成果。一些现有技术在处理临床数据集时各有特点。
- caGrid 1.0 :2006 年发布(现 caGrid 2.0),它通过互联网络为生物医学研究提供了复杂的技术基础设施,旨在支持生物医学研究中各种信息源、分析方法和应用的发现、表征、集成访问和管理。不过,它最初仅针对癌症研究,且未专注于从医疗数据集中推断细节的明确查询机制。
- SYSTOMONAS :该项工作考虑了数据库结构和内容的持续更新问题,提出了用于假单胞菌系统生物学的新型数据库 SYSTOMONAS,将数据仓库概念与 Web 服务相结合。
- 数据去标识技术 :统计学家为解决统计数据的完整性和机密性问题,开发了多种医疗数据去标识技术,如 CAT(康奈尔匿名化工具包)、µ - Argus 和 sdcMicro 等。然而,定量分析表明,数据去标识并不能保证数据的匿名性,使用数据去标识的组织仍存在不同程度的重新识别风险。
- 其他查询工具 :如为印第安纳波利斯/Regenstrief 共享病理信息网络(SPIN)开发的特殊查询工具,可使用复杂逻辑和自动编码的最终诊断检索去标识数据集,并支持多种统计分析,但许多技术细节未公开。
总体而言,保障医疗数据集安全的努力主要集中在两个方面:一是设计
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



