2008年6月24日,中国科学院计算技术研究所、中国服务器领先厂商曙光和上海超级计算中心在北京联合举行“曙光5000落户上海”签约仪式。这标志着中国用户即将拥有国产品牌的百万亿次超级计算机,届时上海超级计算机中心也将成为世界最大的通用计算平台。
曙光5000的第一套超大型系统将于11月落户上海超级计算中心,系统峰值运算速度达到每秒230万亿次浮点运算(230TFLOPS),LINPACK运算速度超过每秒160万亿次浮点运算,是目前国内速度最快的商用高性能计算机系统。
这样的“大块头”到底拥有怎样的大智慧?本报记者为您一一道来。
曙光5000使中国成为继美国之后第二个能制造和应用超百万亿次商用高性能计算机的国家,也表明我国生产、应用、维护高性能计算机的能力达到世界先进水平。可惜的是,曙光5000错过了上半年全球超级计算机TOP500的排名时间,否则以其运算速度,可以排在全球第六。
该系统在大规模机群计算和网格使能技术方面有所突破,形成了鲜明的技术特色,将我国通用高性能计算机系统的研制水平提升到一个新高度。
曙光5000
可以用来做什么?
曙光5000这样的超级计算机,到底可以有哪些实际用途?下面的一组数据,可以帮助我们近距离地了解曙光5000:
它可以在1秒钟内实时完成1万个5000万瓦以上的并网发电机组和22万伏变电站构成的全国电网的电力安全评估,为避免类似美、加大停电的电力故障提供决策支持,保证供电系统的稳定;
它可以在30秒内完成上海证交所10年的1000多支股票交易信息的200种证券指数的计算,能够实时提供金融衍生产品;
它可以在3分钟内,同时完成4次36小时的中国周边、北方大部、北京周边、北京市的2008年奥运会需要的气象预报计算,包括风向、风速、温度、湿度等,即可精确到每个奥运会场馆;
它可以在6分钟内,同时完成20次上海黄埔江过江隧道三维结构的地震数值分析的计算,精细评估隧道的抗震性能。
具体说来,作为面向国民经济建设和社会发展的重大需求的战略装备,曙光5000适用于各种大规模科学工程计算、商务计算。
在大规模科学工程计算方面,可以担纲电力电网安全评估、汽车碰撞、电磁辐射、石油勘探开发、气象预报、核能与水电开发利用、各类航天器及飞机汽车舰船设计模拟、各类大型建筑工程安全性评估、生物信息处理等重任。
在大规模商务计算方面,它可以为证券、税务、银行、邮政、社会保险等行业和电子政务、电子商务等提供服务。在大规模信息服务方面,它可以在各类游戏网站、门户网站、信息中心、数据中心、流媒体中心、电信交换中心和大型企业信息中心中发挥作用。对基于海量存储的数据大集中应用,完全兼容32位计算的具有64位地址空间的曙光5000网格超级服务器更可大显身手。
同时曙光5000还可广泛的应用于信息服务、电子政务、网络游戏等商业应用。在这些领域,它可以作为Web服务器、应用服务器、数据库服务器。
曙光5000
有哪些技术特性?
和4年前的曙光4000相比,曙光5000超级计算机在体积、节能、软件效率和可管理性方面有很大幅度的提高,性能是曙光4000的20倍,体积只有2/3,耗电只增加了50%,拥有全自主、高性能、高效能、高密度、低功耗等十大特点,而其中的任意一项都处在国际领先水平。
1.高性能
曙光5000采用国际高性能计算机主流的机群结构,整个系统规模达到1650个节点,每个节点为4CPU的4核SMP系统,采用AMD Barcelona 2.0GHz处理器,峰值运算速度为230TFLOPS。整个系统通过两套网络互连,包括Infiniband、千兆以太网。
2.全自主
中科院计算所联合曙光公司自主设计了包括主板、体系结构、刀片服务器、刀片机箱系统、网络交换系统、水冷散热系统在内的全部系统。曙光5000的设计也完全符合中国刀片服务器标准。在自主创新的研制过程中,曙光在业界实现多个第一:
首次实现了4路16核的高密度刀片系统;
首次实现了单刀片机箱40颗CPU的高密度机箱设计;
首次实现了基于DDR的Infiniband的交换结构,实现了20GB高速互联和小于1.3us的低延迟;
首次采用了水冷散热系统,降低了高性能计算机对机房系统的要求,降低了系统功耗。
3.高效能
由于采用高密度服务器,曙光5000能在大约75平方米的占地面积内聚集230万亿次的计算能力,而其满负载运行时不带水冷系统功耗只有700千瓦,带水冷系统的功耗仅为1000千瓦。这一方面提高了机群系统的可扩展性,另一方面降低了整个系统的运行成本。
4.高密度
对于大规模高性能计算机系统而言,如何提高系统密度并降低功耗是研制人员面临的关键问题之一。为提高曙光5000的系统密度,中科院计算所联合曙光公司,研制了具有自主知识产权的4CPU 4核高密度刀片主板和基于该主板的世界上第一款7U高度的10片4路4核64位CPU的工业标准刀片服务器。该刀片服务器可以实现单机箱40CPU,160核的超高计算密度,并实现了单节点内部的并行计算。
5.高速互联
曙光5000采用基于DDR的 Infiniband高速网络实现计算网络和存储网络合一。它实现了20GB的节点间传输速度,实现业界最快的小于1.3us延时。
6.应用广泛
在高性能计算领域,曙光5000可广泛运行证券指数计算、电力安全评估、建筑工程抗震性评估、天气预报、石油地震资料处理、核能开发利用、汽车碰撞、电磁辐射、计算流体力学、基因匹配与拼接、蛋白质结构分析和材料科学等20多个应用领域。在商业应用方面,由于曙光5000使用Suse Linux 和WCCS,可广泛运行目前Linux和Windows下的主流的行业软件。
7.节能
曙光积极响应世界环保组织节能减排的号召,在曙光5000中采用了多项节能措施:采用了低功耗的CPU,每年节电55万度;采用了低功耗的内存,每年节电5万度;采用了刀片结构,电源效率优化,每年节电100万度;采用了水冷散热体系,每年节电200万度;采用了曙光自主研发的自适应功耗管理软件, 每年节电200万度。
8.高性价比
通过选择AMD Barcelona和自行研制的主板,曙光5000大幅降低了成本,具有很好的性能价格比,实现230万亿次的计算速度的曙光5000总造价约2亿元。
9.高效冷却系统
曙光5000首次采用了水冷系统,通过使用水冷系统,降低了高性能计算系统对客户机房的要求,同时提高了冷却效率。水冷系统的设计实现了水电分离,保证了系统的安全性。同时水冷系统还包括备份的被动散热系统,可以在水冷失效的情况下保证系统的正常运行,提高了系统的稳定性。
10.自主创新的管理软件
曙光5000中,曙光自主开发了Grid View集群管理管理系统。曙光新一代Grid View大型机综合管理系统提供统一的集中式监控平台,具备可扩展性、集成性、可靠性和易用性,提供对各种商用、自己研发的管理工具的集成接口,包括直接以Portal的方式集成和抽取各已有管理工具的监控数据,以便上层平台能够分析利用,从而满足同时对分布式广域/局域网高效能百万亿次可扩展计算机的环境、硬件、软件等各方面进行监控的需求。
曙光Grid View大型机综合管理系统具有高可靠性,具有一定容错性和健壮性。当运行环境等发生异常时,系统能够运行在可控的范围内,并进行准确的异常定位提示。
系统具有易用性,提供简单灵活的系统部署,人性化的界面和功能设计,方便最终用户的使用,包括灵活方便的个性化设置、多样的内容展现形式。管理系统同时提供个性化、自定义报表输出功能。曙光新一代Grid View可有效解决大型机管理的复杂性问题,保障了管理的扩展性、可靠性、自主性和贴近应用需求。
Grid View管理系统不仅适用于曙光5000大型群集系统,也适用于全系列的曙光服务器。