数据网格虚拟化服务与语义网格:未来电子科学基础设施
1. 数据网格虚拟化服务
1.1 语义数据集成
在信息集成跨越具有不同术语或本体的数据源时,语义数据集成是必要的。例如,在地球科学领域,需要将地球物理学数据与地层学、地质年代学和引力数据等进行集成。在 BIRN 项目中,需要整合来自多个人类大脑和小鼠大脑实验室的信息,还要将人类大脑和小鼠大脑数据库从结构 MRI 图像层面进行整合,同时也需要将结构 MRI 图像与功能 MRI 数据进行集成。
不同的人类大脑实验室可能专注于人类大脑的不同方面,因此会使用不同的术语。例如,一个实验室可能比另一个实验室更详细地描述大脑的某个方面。在跨物种集成的情况下,即使描述的是相同的大脑结构,用于描述小鼠大脑和人类大脑的术语也可能有很大差异,因为大脑研究人员属于不同的子学科,各自可能发展出了自己的术语。
信息集成基于为每个数据源开发“概念模型”,并将这些模型与一个全局知识表示结构相链接,该结构代表了该领域的百科知识(或其适当子集)。知识表示的形式化方法使系统能够使用基于逻辑和基于规则的系统推断看似不同的术语和本体之间的联系。
以下是语义数据集成基础设施的相关元素:
| 元素 | 说明 |
| ---- | ---- |
| CM-wrapper | 概念模型包装器 |
| S1, S2, S3 | 数据源 |
| CM (integrated view) | 集成视图的概念模型 |
| Integrated view definition IVD | 集成视图定义 |
| Mediator Engine | 中介引擎 |
| F
超级会员免费看
订阅专栏 解锁全文
4682

被折叠的 条评论
为什么被折叠?



