数据网格虚拟化服务解析
1. 数据网格功能概述
在数据管理领域,数据网格技术发挥着重要作用。在七个数据管理系统中,至少有两个系统实现了120项功能。其中,三分之二的功能已在SRB和EDG数据网格中实现或计划开发。约三分之一(50项)的功能已在至少五个数据网格中实现,这50项功能构成了当前数据网格的核心特性。
1.1 逻辑命名空间
数据网格的一个重要共性是实现了逻辑命名空间,它支持在多个存储系统间构建统一的命名约定。逻辑命名空间独立于特定站点使用的物理文件名进行管理,并维护逻辑文件名与物理文件名之间的映射。各数据网格为命名空间添加了属性,以支持位置透明性(在不知文件物理位置的情况下进行访问)、文件操作和文件组织。多数网格支持在逻辑命名空间内以分层目录结构组织数据文件,并支持通过社区或集合ID来确定文件的所有权。
逻辑命名空间的属性通常包括副本存储位置、本地文件名和用户定义的属性。系统提供了自动生成文件大小和创建时间等属性的机制。文件注册到逻辑命名空间时,属性会同步创建,但许多网格也支持属性的异步注册。
1.2 副本创建与数据访问
多数网格支持同步副本创建,并通过并行I/O提供数据访问。网格会检查传输状态,并支持在应用层重启数据传输。对系统的写入操作是同步进行的,会向用户返回标准错误消息。不同网格提供的用于报告问题的错误消息数量差异很大,例如SRB的错误消息数量从少于10条到超过1000条不等。网格会静态调整广域网传输的网络参数(窗口大小和缓冲区大小),并且多数网格提供了与GridFTP传输协议的接口。
1.3 访问API与架构
数据网格最常见的访问API包括C++ I/O
超级会员免费看
订阅专栏 解锁全文
31

被折叠的 条评论
为什么被折叠?



