数据网格虚拟化服务与语义网格:未来电子科学基础设施
1. 数据网格虚拟化服务
1.1 语义数据集成
在信息集成涉及不同术语或本体的数据源时,语义数据集成显得尤为必要。例如,在地球科学领域,需要将地球物理学数据与地层学、地质年代学和引力数据等进行集成。在BIRN项目中,要求整合来自多个人类大脑和小鼠大脑实验室的信息,还要将人类大脑和小鼠大脑数据库从结构MRI图像层面进行整合,同时也需要将结构MRI图像与功能MRI数据进行集成。
不同的人类大脑实验室可能专注于人类大脑的不同方面,因此会使用不同的术语。即使描述的是相同的大脑结构,由于大脑研究人员属于不同的子学科,各自可能发展出了自己的术语,所以描述小鼠大脑和人类大脑的术语也可能大不相同。
这种情况下的信息集成是基于为每个数据源开发“概念模型”,并将这些模型与一个全局知识表示结构相连接,该结构代表了该领域的百科知识(或其适当子集)。知识表示的形式化方法使系统能够使用基于逻辑和规则的系统推断看似不同的术语和本体之间的联系。
语义数据集成基础设施的架构如下:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
S1(数据源1):::process --> CM-wrapper1(CM包装器1):::process
S2(数据源2):::process --> CM-wrapper2(CM包装器2):::process
S3(数据源3):::process --> CM-wra
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



