世界上最快的超级计算机的一天 |
来源:一起赢论文网 日期:2024-09-06 浏览数:321 【 字体: 大 中 小 大 中 小 大 中 小 】 |
世界上最快的超级计算机的一天 田纳西州橡树岭
世界上最快的超级计算机是一台名为 Frontier 的机器,但即使是这台拥有近 50,000 个处理器的 speedster 也有其局限性。在 4 月一个阳光明媚的星期一,它的功耗正在飙升,因为它试图跟上世界各地科学小组要求的工作量。
Frontier 位于田纳西州橡树岭国家实验室 (Oak Ridge National Laboratory) 的科学主任布朗森·梅塞尔 (Bronson Messer) 说,电力需求峰值约为 27 兆瓦,足以为大约 10,000 户家庭供电。Messer 的声音中带着自豪,他用了一个当地术语来描述超级计算机的工作效率:“他们像一只被烫伤的狗一样运行着机器。
Frontier 以创纪录的速度处理数据,超过了 100,000 台笔记本电脑同时工作的速度。当它于 2022 年首次亮相时,它是第一个突破超级计算的百亿亿次级速度障碍(执行 exaflop 或 10 的能力)的产品18浮点运算数。橡树岭(Oak Ridge)庞然大物是数十年来全球推动大型超级计算机发展趋势的最新榜首(尽管军事实验室或其他秘密设施中可能存在更快的计算机)。
尖端计算机芯片如何加速 AI 革命
但速度和规模对于 Frontier 的主要目标——突破人类知识的界限——来说是次要的。Frontier 擅长创建模拟,以捕获具有小尺度细节的大尺度模式,例如微小的云滴如何影响地球气候变暖的速度。研究人员正在使用超级计算机创建从亚原子粒子到星系的所有事物的尖端模型。一些项目正在模拟蛋白质以帮助开发新药,对湍流进行建模以改进飞机发动机设计,并创建开源大型语言模型 (LLM) 以与 Google 和 OpenAI 的人工智能 (AI) 工具竞争。
来自世界各地的研究人员登录 Frontier。2023 年,这台超级计算机在 18 个国家/地区拥有 1,744 名用户。而且,到 2024 年,Oak Ridge 预计 Frontier 用户将根据机器上执行的计算发表至少 500 篇论文。
“Frontier 与詹姆斯韦伯太空望远镜没有什么不同,”橡树岭国家实验室的生物物理学家 Dilip Asthagiri 说。“我们应该把它看作是一种科学仪器。”
机器内部
Frontier 的大脑位于一个仓库大小的房间里,到处都是稳定的电子嗡嗡声,轻柔到可以交谈。房间里有 74 个相同的亮黑色机架,总共容纳 9408 个节点。这些是超级计算机的主力。每个节点由四个图形处理单元 (GPU) 和一个计算机处理单元 (CPU) 组成。
制造超级计算机的惠普公司 (Hewlett Packard Enterprise) 的技术人员科里·埃德蒙兹 (Corey Edmonds) 说,工程师团队会持续监控机器是否有故障迹象。Edmonds 住在橡树岭,这一天正在 Frontier 进行维护手术。在修复其中一个节点上损坏的连接器后,他将注射器中的灰色导热硅脂挤到一个银色矩形上,这是该节点的四个 GPU 之一。这有助于 GPU 快速散热并保持凉爽。
Frontier 的速度主要归功于它对 GPU 的广泛使用。这些芯片最初是为计算机游戏玩家渲染逼真的图形而开发的,现在正在通过机器学习应用程序推动 AI 的进步。
“他们可以跑得非常快,”Messer 说。“他们也非常愚蠢。”GPU 擅长一次处理多个数字,而其他数字则不多。“它们可以一遍又一遍地做一件事,”他说,这使得它们对于快速进行超级计算机计算非常有用。
研究人员必须自定义他们的代码才能利用 Frontier 的 GPU。Messer 将第一次使用 Frontier 的科学家比作郊区司机征用赛车。“它有一个方向盘、油门踏板和一个刹车,”他说。“但试着让普通车手坐上一级方程式赛车,然后让他们从这里到那里。”
大科学
研究人员要有机会使用 Frontier 并不容易。Messer 和三位同事将在 4 月的这个星期一聚在一起,评估该机器的研究提案。平均而言,他们批准了大约四分之一的提案,去年为 131 个项目分配了时间。特别是,申请人需要证明他们的项目可以利用超级计算机的整个系统。
他们提供的最常见分配是大约 500000 个节点小时,相当于连续运行整个机器三天。他们最大的分配量是 4 倍。Messer 说,获得 Frontier 时间的研究人员获得的计算资源大约是他们在其他任何地方获得的十倍。
今天,他的团队每周发放一次大约 20,000 个节点小时的较小奖励。许多项目利用 Frontier 的功能同时对各种空间和时间尺度进行建模。Frontier 每年总共有大约 6500 万个节点小时可用。 |
[返回] |