在本周于亚特兰大召开的SC24大会上,最新发布的11月Top500超级计算机榜单成为焦点。这份榜单的变化比5月ISC24大会期间公布的榜单要大得多,新上榜的机器中涌现出许多引人注目的发展。
最大的新闻无疑是由惠普企业(HPE)打造、采用AMD混合CPU-GPU计算引擎的“El Capitan”系统正式上线。这台备受期待的超级计算机毫无悬念地登顶榜单,且远超美国国内竞争对手以及传闻中的中国千万亿次级计算机的规格。
El Capitan:榜单新霸主
El Capitan系统的一部分(目前尚未完全测试)包含43,808块AMD“Antares-A”Instinct MI300A计算设备,已经由劳伦斯利弗莫尔国家实验室进行了多个基准测试,包括自1993年以来用于排名超级计算机的高性能Linpack(HPL)测试。
测试结果表明,El Capitan的这部分系统理论峰值性能达到2,746.4千万亿次浮点运算(petaflops),远高于此前预测的2.3至2.5百亿亿次(exaflops)。其HPL测试的峰值持续性能为1,742千万亿次,计算效率为63.4%。这接近加速系统初上市时的预期效率水平(65%左右)。未来,随着系统的全面测试和优化,这一效率和性能可能会进一步提升。
MI300A处理器于2023年12月首次亮相,其兄弟型号MI300X则专注于GPU计算,未包含CPU核心。而MI300A结合了三颗芯片封装的24核“Genoa”Epyc核心和六颗Antares GPU流处理器芯片,主频1.8 GHz。通过HPE的“Rosetta”Slingshot 11以太网互连技术,这些计算设备被无缝连接起来。
测试中的部分El Capitan系统包含约105万颗Epyc核心和近1,000万GPU流处理器。这种并发计算能力的规模虽然庞大,但并非前所未见。例如,中国无锡国家超级计算中心的“太湖之光”超级计算机就拥有1,065万颗核心,自2016年上榜以来仍排名全球第15位。
榜单趋势:AMD崭露头角
最新榜单的61台新机器中,AMD成为最大的赢家,新增的计算能力主要来自搭载AMD Instinct MI300A的系统。这些系统总共贡献了5,211.6千万亿次的新增理论峰值性能,其中60.1%来自El Capitan及其小型版本。这让AMD在新增计算能力中占比达到72.1%,彻底击败了Nvidia。
相比之下,Nvidia在榜单中的新增能力显得逊色许多:基于Grace-Hopper架构的新系统仅占新增计算能力的3.8%;搭载Nvidia GPU的系统总共贡献了39%的新增能力,包括Intel Xeon CPU和Nvidia GPU组合,以及AMD Epyc CPU和Nvidia GPU组合的多个系统。
值得注意的是,其他基于AMD CPU与MI250X GPU的系统,如意大利Eni SpA公司部署的HPC6,也对榜单做出了重要贡献,这些系统总共提供了619.3千万亿次性能。
榜单全貌:AMD领先Nvidia
当前榜单中共有209台加速系统,这些系统占榜单总机器数量的41.8%,但贡献了83.4%的总计算能力。在这些加速系统中,AMD GPU驱动的系统仅占9.1%,但其贡献的64位浮点性能占比高达44.9%。相比之下,Nvidia GPU尽管占据87.6%的加速系统,但其贡献的性能仅占40.3%。
从整体来看,榜单中的加速系统拥有55.4%的总核心数和流处理器,总计约1.286亿个核心。
突破与挑战:超算的未来
尽管El Capitan的出现标志着超算迈向新高度,但突破千万亿次级计算仍然面临预算和功耗的限制。尽管中国的“天河-3”和“海光”超级计算机据传早已实现千万亿次性能,但未正式提交HPL测试结果,因此未能进入榜单。
目前,入榜Top500的门槛已提高到2.31千万亿次,Top100的门槛则达到12.8千万亿次。然而,小型HPC中心新增计算能力的速度远不及大型系统,难以支撑榜单的整体性能翻倍增长。未来,要让更多超算进入榜单,不仅需要技术突破,更需要降低系统的成本和功耗。
AMD的强势表现标志着一个新时代的开始,但超级计算的竞争格局仍在不断演变。