生物医学数据管理与关联开放数据挖掘
在生物医学领域,数据的有效管理和挖掘对于推动研究进展至关重要。本文将介绍生物医学数字资产管理系统(BDAM)以及关联开放数据(LOD)的挖掘方法。
1. BDAM 系统概述
BDAM 系统旨在解决生物医学研究中数据集成、组织和管理的难题。它包含多个关键组件和功能,以下是详细介绍。
1.1 数据摄取框架(IOBox)
IOBox 是一个事件驱动的摄取框架,用于将数据集成到目录和虚拟存储库中。其工作流程如下:
1. 文件扫描阶段 :生成源目录的清单。
2. 文件统计读取 :读取文件的基本统计信息,如文件大小、最后修改日期等。
3. 文件解析与元数据提取 :解析新文件并提取描述性元数据。
4. 元数据转换 :运行用户定义的规则,将原始元数据转换为用户定义的 BDAM 目录元数据模型。
5. 元数据存储 :将规则输出整理后,通过批量更新接口将元数据字段与目录中的适当项关联并存储。
IOBox 具有可插拔架构,支持集成第三方解析器,能够处理各种生物医学数据格式,包括常见的基因组学、显微镜学和放射学格式,以及许多不太常见的格式。目前已开发了多种格式的适配器,如下表所示:
| 数据格式类型 | 具体格式 |
| — | — |
| 通用数据格式 | HDF5、NetCDF、DICOM、NIfTI、Microsoft Excel |
| 专有
超级会员免费看
订阅专栏 解锁全文
42

被折叠的 条评论
为什么被折叠?



