随着计算需求的持续攀升,尤其是人工智能(AI)与高性能算力(HPC)的指数级增长,数据中心与工业系统正面临着全新的热管理挑战。现代计算基础设施能耗巨大,会产生大量热量,而这些热量在传统意义上多被视为废弃物。然而,液冷技术、智能热设计以及一体化能源系统等技术的进步,正为行业带来新的机遇,帮助企业将原本的运营负担转化为可利用的资源。
重新考量高性能计算的热管理
AI 与云计算不断攀升的热负荷,正在将传统的冷却策略推向极限。
沿用数十年的传统风冷方式已难以满足当前需求,因为机架功率密度超过 50 千瓦已经成为常态化现象,而这一水平曾被视为数据中心设计的上限。
AI 工作负载是这一趋势的主要驱动力,预计未来几年机架密度将显著攀升。英伟达预测,到 2027 年,AI 机架功率可达 600 千瓦,而目前已出现 1 兆瓦机架的早期试点项目。超大规模数据中心与芯片制造商正协力研发新的架构与标准,以支持这一演进,预计在本十年结束前,1 兆瓦机架将得到更加广泛的部署。这些为高性能算力与 AI 设计的超高密度系统将消耗巨量的电力,同时产生远超于传统冷却方式所能应对的热量。
液冷:余热再利用的核心基础
液冷技术已成为应对这一挑战的核心技术之一。与将热量散发到空气中的风冷方式不同的是,液冷系统通常是在芯片或电路板层面的热源处直接吸收热量,并通过封闭循环系统将其传输出去。
尽管液冷并非全新概念,但 AI 数据中心的需求以及近期技术的进步推动了液冷的复兴,使其成为高优先级、快速增长的市场。与传统的空气冷却系统相比,液冷具备多项显著优势,其中最大的优势在于效率。液体,尤其是工程流体或介电流体,其比热容远高于空气,能够在热源处实现更高效的热传导。这不仅降低了对大型暖通空调(HVAC)系统的依赖,从而减少能耗运营成本,还能支持更加紧凑、高效的数据中心设计。
尽管液冷应用日益普及,但大多数数据中心的设计仍需兼顾多种类型的工作负载——而不是仅服务于AI。这些设施通常同时运行传统 IT、云服务以及高性能算力任务。因此,混合冷却方案吸引了越来越多的关注,即在高热负荷区域采用高效液冷,而在低负荷系统中使用成本较低的风冷。这类混合方案在可持续性、性能和资金支出之间取得精妙了平衡,使数据中心运营商能够灵活应对不断变化的工作负载。
冷却、供电与计算架构的一体化设计
为支持下一代工作负载,尤其是由 AI 驱动的任务,数据中心必须将计算密度、供电系统与热管理深度融合成为一个协调一致的系统。目前,新兴技术正推动着这一转变,实现更加智能、响应更快的基础设施设计。
一个关键的进展是电源感知型热设计,该技术使数据中心能够更好地管理高性能组件产生的热量。AI 工作负载,尤其是涉及 GPU 的任务,可能引发不可预测的功率波动和局部热点。通过对热系统与电源系统进行智能协同设计,工程师可以提前预判这些波动,从而最大限度减少低效运行,并降低数据中心及其周边基础设施设备的压力。
模块化高密度机架系统的兴起也正在重塑可扩展性。这类机架被设计用于承载远超 125kW 的功率负载,部分方案已着手研发可支持高达 1MW 的设计。其模块化特性使运营商能够在无需全面改造的情况下扩展容量,同时还能在多个运行阶段更有效地捕获和再利用热量。
直连芯片冷却与先进供电技术正将热效率推向新高度。诸如微对流冷却等精密系统,能够直接从关键硅芯片上移除热量。当与垂直供电(VPD)等新技术结合时,这些方案不仅降低了能量损耗,还能保持更高质量的余热。
AI 与机器学习的作用
在热能与能源优化领域,机器学习是最具变革性的力量之一。预测分析能够以细致的粒度监测能源使用和热负载,预测高峰需求时段并调整负载以优化热量捕获,同时还能动态调节冷却系统,以提升效率和性能。
AI 还可用于模拟基础设施升级的长期影响,使运营商在对复杂集成系统进行投资时更有信心。
要应对未来的可扩展性与能效挑战,需要采取系统层级方法,即所谓的“从电网到芯片”策略。这一整体模型从电网接口开始,经由电源分配单元(PDUs),进入机架级架构,再到电路板与芯片级,最后循环回热能回收系统。更重要的是,这种方法提升了系统的韧性与灵活性,使运营商不仅能够有效管理热量,还能保障电能质量、冗余能力及应对电网干扰。
实现能源浪费的闭环管理
除了技术效率提升,向智能化热管理的转型还为企业带来显著的可持续性优势。
传统上,数据中心和高性能计算(HPC)环境产生的热量被视为昂贵的副产品。但随着液冷与余热再利用技术的进步,这些废热可以被回收,用于提升能源效率并减少总体碳排放。
液冷系统采用封闭回路设计,与蒸发式空气冷却相比需水量更少,有助于在资源紧张地区实现节水目标。此外,通过在更小的空间与能耗下实现更高的计算密度,这些系统可帮助数据中心实现事半功倍的效果,减少对新基础设施的需求。
将冷却策略与实际部署场景相结合,并同时关注水与能源利用效率,这些改进不仅能支持可持续发展计划,还能帮助企业达成净零排放目标,并在可持续创新领域展现领导力。
展望未来
随着更多数据中心与行业探索余热再利用,政府与监管机构已经开始关注这一趋势。尤其在欧洲,欧盟已将余热再利用纳入其可持续发展议程之中,相关激励政策也正在逐步出台。对于大型设施,合规要求可能很快会从自愿转为强制。
为实现更广泛应用,还需要标准化的热接口单元、交互操作的冷却回路以及废热质量评估指标。
跨行业协作涵盖技术供应商、能源公用事业单位、监管部门及设施运营商,他们也将是建立这些框架的关键。
总体而言,新兴技术正在从根本上重塑数字与工业基础设施中热量的管理与再利用方式。液冷技术、智能机架系统以及“从电网到芯片”集成方案为未来企业提供了切实可行的路径。
通过拥抱这一新范式,数据中心与工业设施不仅能够减少碳足迹、提升能源韧性,还能在数字化纵深发展与节能意识觉醒的世界中释放新的价值。







.jpg)




关注本刊微信订阅号