蔡司中国区授权总代理商

马路科技电子行业解决方案-AI服务器液冷与MLCP液冷技术趋势

马路科技电子行业质量解决方案

生成式 AI 的高速发展推动算力需求持续攀升,进而带动芯片功耗显著上涨。英伟达下一代 Rubin/Rubin Ultra 芯片的功耗预计将大幅提升,从当前 GB300 芯片的 1400W 突破至 2000W 以上。然而,当前主流的单相冷板方案存在明显瓶颈,其散热能力上限约为 1500W,已难以满足 Rubin 系列算力芯片的散热需求。这一供需差推动液冷技术加速迭代,具备更强散热能力的两相式冷板与微通道水冷板Micro-Channel Liquid Cooling Plate(MLCP)为解决超高功耗芯片散热问题而指定的技术路径,正成为更具潜力的解决方案。

 

(来源WCCFTECH NVIDIA Might Switch Up Cooling Solutions With Next-Gen Rubin Ultra as It Battles Thermal Constraints)

 

马路科技工业质量解决方案商,是蔡司官方授权代理商,业务涵盖:蔡司三坐标测量机、工业CTX-RAY断层无损测量,光学三维3D扫描仪、工业显微镜等设备。

参数及报价请咨询马路科技顾问股份有限公司 / 马尔软件技术开发(上海)上海有限公司 ,助力全面解决客户面临质量挑战与痛点。

 

当前液冷与MLCP液冷技术趋势

传统单相冷板方案存在三大明显局限:

  1. 热阻较高,多层热界面材料叠加会导致热阻累积,影响热量传导效率;
  2. 流道为毫米级尺寸,冷却液流速相对较慢,进而拉低整体换热效率;
  3. 难以实现芯片表面温度均匀分布,局部易出现高温点。

因此,尽管传统冷板方案的散热效率较风冷有显著提升,但面对 1500-2000W 乃至更高的散热需求时,其效率已显不足,无法完全满足高功耗芯片的散热要求。

(来源:数据中心液冷技术的应用研究进展)

但液冷板量产仍面临显著工艺挑战。微米级水道的加工精度要求极高,实际生产中,微米级水道的加工难度、液体渗透率的精准控制以及规模化生产的良率提升,都是需要突破的关键环节。若任一工艺环节出现偏差,都可能引发漏液、散热不均等问题,直接影响产品性能与可靠性。

 

尽管 MLCP 技术前景广阔,但目前仍处于 “测试验证期”,距离量产至少需要 3-4 个季度,核心瓶颈在于液体渗透与泄露:一次失误即 “百万损失”。因为MLCP 的冷却液直接接触芯片,一旦密封件老化或微通道破损,泄漏的液体可能瞬间摧毁价值数十万至数百万美元的服务器。在服务器 5-8 年的使用寿命中,如何保证密封材料的完整性、避免长期使用后的渗透风险,是生产商需突破的首要难题。

质量挑战1

翅片弯折

MLCP 微通道制造过程(如蚀刻、冲压、焊接)中的工艺控制不当,或组装时的外力冲击。内部翅片弯折会直接导致以下影响:

  1. 破坏微通道流道的均匀性,造成冷却液局部流速异常,降低换热效率,甚至引发芯片局部过热;
  2. 严重弯折可能堵塞部分流道,进一步加剧散热瓶颈,同时增加冷却液循环系统的压降,影响整体运行稳定性。

ZEISS METROTOM蔡司高分辨率无损扫描技术,精准识别内部翅片的弯折位置与程度,避免常规检测遗漏的隐患。

 

▲图示为翅片弯折

 

质量挑战2

微通道堵塞

MLCP 的微通道宽度仅 50-150μm(约为传统流道的 1/10),直接承担芯片热量交换功能,堵塞会从散热性能、系统可靠性到成本控制形成连锁,形成以下负面影响:

  1. 散热效率骤降,触发芯片故障堵塞会压缩冷却液流通截面,导致局部流速异常、换热面积锐减,直接打破MLCP低至 0.03℃・cm²/W的低阻散热优势。堵塞区域的热量无法及时传递,会引发芯片局部过热,轻则触发降频、性能衰减,重则导致芯片烧毁;
  2. 系统压力失衡,加剧设备损耗微通道堵塞会导致冷却液循环阻力激增,迫使水泵负载升高以维持流量,不仅增加能耗,还会加速泵体老化;
  3. 长期可靠性存隐忧即使是微小堵塞,也可能成为杂质堆积的 “核心”,在长期运行中逐渐扩大堵塞范围;同时,堵塞区域的局部高温会加速材料老化,增加通道腐蚀、开裂风险,缩短 MLCP 5-8 年的设计使用寿命。

ZEISS METROTOM蔡司高分辨率无损扫描技术,具备较大的行程,同等尺寸的工件可以实现更大的放大倍率,获取更高分辨的图像,即使是微小的堵塞也不会放过,精确定位堵塞区域。

 

▲图示为放大倍率逐渐增加,微通道堵塞

 

 

马路科技拥有丰富的产品线包含显微镜,蓝光扫描仪,三坐标,工业CT,助力全面解决电子客户面临质量挑战与痛点。

 

 

资讯中心

NEWS