数据网格中的使用控制:架构与策略解析
1 引言
数据网格是一种创新技术,它融合了文件系统、数据库系统和网格计算等计算机科学概念。它能提供服务,帮助用户发现、传输和处理存储在分布式存储库中的大型数据集,并创建和管理这些数据集的副本。数据网格具备两个基本功能:高性能可靠的数据传输机制和可扩展的副本发现与管理机制。
不同的网格应用程序可能有不同的安全需求。高能物理实验类应用可能对安全性要求不高,更注重速度;而化学或生物信息学领域的应用则可能有更严格的安全要求。随着越来越多的研究人员和虚拟组织(VO)的出现,他们可能会提出新的安全需求。为了满足这些多样化的安全需求,我们需要一个灵活的系统,而使用控制技术则是朝着这个方向迈出的重要一步。
2 数据网格抽象
分布式系统包含各种数据资源,这些资源在数据模型、存储介质、管理软件、描述模式以及访问协议和接口等方面可能存在差异。数据网格中有两种资源需要管理:网格数据(GD)和网格存储空间(GSS)。
- 网格数据(GD) :任何可以定位、传输、复制和操作的数据。客户端服务可以通过数据网格管理系统(DGMS)独立于其物理位置访问分散的GD。DGMS是一个软件系统,通过多种抽象机制管理数据网格,使用户能够使用高级逻辑标识符引用物理存储系统中的特定数据资源。
- 网格存储空间(GSS) :由多个VO共享的存储空间,由网格存储元素(SE)管理。SE是大容量存储系统的接口,提供统一的控制接口,使网格能够高效使用存储。
OGSA工作确定了数据资源的三级命名方案:
| 命名
超级会员免费看
订阅专栏 解锁全文
2236

被折叠的 条评论
为什么被折叠?



