高能物理数据库的关键回顾
1. 数据库在网格服务中的核心地位
在高能物理的宏观视角中,虽未明确提及数据库,但实际上它是网格中几乎所有服务的基础。许多数据库相关服务在大型正负电子对撞机(LEP)时代就已存在,而像工作负载管理和网格证书处理等则是新出现的,并且在相关组件正确处理角色和组时,可视为网格的定义性元素。
2. 欧洲数据网格RLS部署
欧洲数据网格(EDG)的副本位置服务(RLS)是最早需要Oracle数据库(实际上还需要Oracle应用服务器)的网格服务之一。该服务至关重要,若不可用,运行中的作业将无法访问现有数据,且无法在所需数据所在站点调度作业,这会严重影响网格性能。
在设计服务部署策略和程序时,充分考虑了这些因素。除了努力定义高可用性服务并测试和记录所有可能的恢复场景外,还尝试将软件与底层Oracle组件打包,以便在欧洲核子研究组织(CERN)实例和外部一级站点(Tier 1)轻松安装。然而,这是一项极具挑战性的任务,因为许多相关站点当时对这些技术缺乏经验。此外,尽管多次尝试创建无需人工干预的“设备”,但自管理、自修复的数据库系统至今仍未实现,就像十多年前首次提出时一样遥远。目前,除了依靠内部专业知识,“托管应用程序”是一种可能的选择,例如CERN的Oracle*HR服务就成功采用了这种方式,但能否将其扩展到网格中间件服务仍不确定。
3. Jim Gray的建议
2001年,Jim Gray访问了CERN,他多年来一直关注高能物理领域数据库在物理应用中的进展,并试图说服大家“将所有数据在线存储在数据库中”。
他提出了一个具体建议,即地理集群(geoplex):将数据在线存储在两个或
超级会员免费看
订阅专栏 解锁全文
63

被折叠的 条评论
为什么被折叠?



