高能物理计算20年:技术、协作与语言的演进
1. 高能物理计算概述
高能物理(HEP)研究离不开计算机。数据的统计特性、待处理数据的巨大规模以及算法的复杂性,使得高能物理研究需要大量的计算能力。同时,从数据中提取物理结果所需的数据处理、数据格式和算法都具有学科特殊性,这导致HEP物理学家大多需要自行开发代码,很少依赖商业产品,进而推动了HEP领域开发出用于数据模拟、重建和分析的大型复杂软件系统。
此外,HEP实验具有独特性,每个实验都各不相同,这阻碍了代码在不同实验间的复用,也对框架提出了额外的约束。而且,HEP是一项“计算机资源密集型”活动,科学研究受限于可用预算所能购买的计算资源。因此,物理学家必须能够将代码迁移到市场上性价比最高的新硬件和操作系统上。
2. 高能物理计算的主要组成部分
高能物理计算主要包括模拟、重建和分析三个部分:
- 模拟 :是继理论和实验之后的第三种科学认知途径。现代HEP探测器是庞大的工程,如LHC的ATLAS探测器,长约45米,高超25米,重约7000吨。在探测器建造前,需要在计算机上进行模拟,有时模拟时间长达数年。模拟程序会模拟基本粒子在预期实验条件下的碰撞,并将反应中产生的粒子“传输”通过探测器物质,利用蒙特卡罗方法重现核辐射与探测器材料相互作用的细节及其统计波动。探测器建成后,模拟仍然至关重要,需将模拟结果与实际实验结果进行比较和“验证”,以估计因探测器几何形状和效率而“丢失”的数据。模拟主要是“CPU密集型”活动,输入数据为小配置文件,输出类似于探测器的输出。
- 重建 :目的是将探测器输出的电信号处理为粒子特征,如质量、电