伊利诺伊大学团队正在研发解决人工智能芯片散热问题的方案

频道:人工智能 日期: 浏览:24

          伊利诺伊大学厄巴纳-香槟分校的机械工程师们开发了一种冷却计算机芯片的新方法,该方法可大幅降低数据中心在热管理方面的能耗占比。这项研究成果发表在《细胞报告·物理科学》(Cell Reports Physical Science)期刊上,它将一种数学设计算法与电化学3D打印工艺相结合,用于制造纯铜冷板——这种组件直接安装在芯片上,用于带走热量。与传统空气冷却系统相比,该技术可将数据中心用于冷却的能耗从总消耗的30%以上降至约1.1%。

     “冷却问题一直是计算机芯片设计的瓶颈,”论文第一作者、机械工程研究生贝赫努德·巴兹米(Behnood Bazmi)表示,“通过弥合计算设计与制造能力之间的差距,我们的方法为芯片及其他电子设备实现更节能的液冷提供了途径。”

五十年来无人攻克的物理难题

         在过去四五十年里,循环空气一直是防止处理器过热的标准方法。问题在于,现代芯片产生的热量远远超出了空气所能高效处理的范围。随着数据中心数量激增,以满足生成式人工智能和云存储等服务需求,其总能耗正急剧上升——据预测,到2028年,数据中心可能占到美国全国电网负荷的12%。液冷直触芯片技术已成为一种更具可行性的替代方案。在这类系统中,冷板直接安装在芯片上,冷却液流经密集排列的金属凸起结构(称为翅片),这些翅片增大了液体与发热组件之间的接触面积。该技术的商用版本已经存在,但它们是以成本而非性能为中心设计的。这项新研究正面解决了这一权衡问题。

铜基上制造的拓扑优化(TO)鳍片阵列照片

铜基上制造的拓扑优化(TO)鳍片阵列照片。照片由伊利诺伊大学厄巴纳-香槟分校提供

拓扑优化与“不实用”形状的艺术

       核心创新在于一种名为“拓扑优化”的计算技术。算法从一个简单的矩形翅片形状开始,通过迭代不断优化几何形状,并在每一步评估翅片能传递多少热量,以及推动冷却液流过它需要消耗多少能量。这个过程最终会收敛到一个热性能最优的形状,但该形状具有尖锐的顶部和不规则的锯齿状边缘,过于复杂,无法通过传统机械加工制造。

       为了弥合这一差距,研究团队与Fabric8Labs合作,采用了电化学增材制造(ECAM)技术。该工艺通过电化学沉积而非熔化或铸造,逐层构建铜结构。这使得特征分辨率可低至30到50微米,并且能够使用纯铜制造——这种材料因其加工难度而在3D打印中很少使用,但其导热性能备受青睐。“ECAM能够以非常精细的细节制造纯铜零件,精度可达30到50微米,比人类头发的宽度还要小,”创始人教授内纳德·米尔科维奇(Nenad Miljkovic)表示。

从实验室基准到数据中心计算

       与标准矩形翅片冷板的直接对比测试表明,优化后的设计冷却能力提升了高达32%,同时在同等热性能下,压降(即泵推动流体时必须克服的阻力)也降低了多达68%。压降的降低直接转化为更低的泵送能量需求。

如果将其扩展到1吉瓦的数据中心,数据非常直观:传统空气冷却仅用于热管理就需要消耗约550兆瓦电力,使设施总功耗达到1.55吉瓦。“采用我们的冷板,数据中心只需使用11兆瓦用于冷却,而不是550兆瓦,”米尔科维奇说。

除了数据中心,研究人员指出,同样的设计与制造工作流程也可适用于不同规模和行业的冷却挑战。

所制造的针翅的扫描电子显微镜(SEM)图像

所制造的针翅的扫描电子显微镜(SEM)图像。比例尺200微米。图片由伊利诺伊大学厄巴纳-香槟分校提供

行业一直在努力的方向

         用3D打印纯铜进行热管理并非新课题,但以高性能冷却所需的几何复杂度来生产纯铜部件一直难以实现。铜材料的高反射率和高导热性使其在传统的激光加工方法中极难处理,这是该行业多年来一直试图攻克的难题。在更具体的实践中,Fabric8Labs曾被AEWIN Technologies选中,为其下一代边缘人工智能系统提供热管理组件。AEWIN部署了基于ECAM的3D微网沸腾板,将换热器表面积扩大了900%以上,并且与其它传统方案相比,每100瓦功耗可实现超过1.3°C的散热性能提升。这一合作证明了ECAM的商业可行性,但并未将算法形状优化集成到设计流程中。

      此外,Alloyed公司开发了一款用于数据中心等高温计算系统的3D打印铜冷却板,其采用晶格几何结构,在保证性能的同时减少了材料用量。在被动冷却方面,丹麦技术研究所(Danish Technological Institute)与Heatflow公司开发了一款用于数据中心的3D打印冷却组件,旨在降低能耗。该系统采用基于蒸发的设计,无需泵,并将蒸发器以铝材一体式3D打印成型。

     伊利诺伊大学这项研究的贡献在于补上了缺失的一环:建立了一个工作流程,其中几何形状本身源自优化算法,而非近似设计,并且最终使用纯铜制造(大多数增材工艺无法可靠生产这种材料)。拓扑优化与ECAM的结合,弥补了此前各种尝试仅从单一方向努力而无法弥合的鸿沟。

     来源:南极熊


关键词:人工智能

0 留言

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。