解决人工智能数据中心 PSU 的功率密度问题

时间:2024-11-28
  标准化给数据中心环境带来许多好处。无论供应商是谁,它都可以轻松更换电源(和其他组件),几乎没有停机时间。然而,它也对零部件制造商提出了挑战,他们必须在受到几年前制定的规格限制的同时实现创新飞跃。

 

  如果我们查看内部冗余电源的 M-CRPS 规范,就可以看出这一点,该规范构成开放计算项目的 DC-MHS(数据中心 - 模块化硬件系统)标准化接口和外形尺寸系列的一部分,这些规范包括:用作从控制面板连接到计算机主机处理器模块和高速数据接口等一系列功能的构建块。
  M-CRPS 电源模块有多种外形尺寸,其中的包括 CRPS185 (185 x 73.5 x 40 mm) 和 CRPS265 (265 x 73.5 x 40 mm)。输出电压可设置为 12 V 或 54 V,使用后一种 54 V 标准可提高高功率超大规模/AI 工作负载的分配效率。
  近年来,生成式人工智能的能力和需求都在快速增长。因此,这对服务器电源网络提出了特殊的要求。
  支持一代人工智能处理器的进步,例如 NVIDIA 的 Grace Hopper 和 Blackwell GPU 以及 AMD 的 Instinct“Antares”MI300X GPU,与前代产品相比,能效显着提高,每 petaFLOPS 千瓦数显着下降,尽管它应该是表示尽管如此,每个处理器消耗的原始功率同时显着增加。
  根据图 1 所示,NVIDIA 的这两代改进使处理能力提高了 14 倍以上,而这仅是在功率增加一倍的情况下实现的,这是巨大的飞跃。
  图 1.  NVIDIA 的 AI 处理器产品的功效。注意:  NVIDIA Rubin 处理器的规格尚未公布,但预计将遵循表中的趋势。图片由博多电力系统提供
  但同样清楚的是,为了从标准 CRPS 外形尺寸中提供改进的执行性能,需要提高 PSU 功率密度……而且需要尽快提高。
  NVIDIA 的数据中心 SuperPOD 参考设计包含六个 1U CRPS PSU 插槽。对于 DGXH100 SuperPOD 设计,PSU 配置为 4+2 冗余。但是,如果我们查看 DGX B200 (Blackwell) SuperPOD 参考文档,我们会发现冗余减少了,六个中的五个需要在任何给定时间通电:“如果单个内部电源单元被解除,系统就可以运行。 - 通电,但如果多个电源装置断电,则无论上游电力冗余如何,都不会运行。”
  由于当前一代的冗余度已降至,因此可以肯定的是,电力的挤压只会加剧。

  将功率密度从 98 W/In 提高至 137 W/In 3

  随着硅达到其物理极限,宽带隙半导体,特别是碳化硅 (SiC) 和氮化镓 (GaN),可以应用于 PSU 中,以提供更高密度的电源设计。今年早些时候,Navitas Semiconductor 开发了 54 V CRPS PSU 的参考设计,使标准 CRPS185 外形尺寸内的输出功率增加了 40%(4.5 kW 与现有的 3.2 kW)。这将参考设计的功率密度从 98 W/in 3 (3.2 kW PSU) 增加到 137 W/in 3。
  图 2.  4.5 kW 参考设计与市售 3.2 kW CRPS185 PSU 的功率密度和效率。图片由博多电力系统提供 [PDF]
  当然,数据中心的电源必须满足效率规范,80PLUS Titanium 要么是自愿采用,要么是通过强制立法(对于欧盟的数据中心)。为了证明合规性,PSU 需要满足整个负载范围(10%、20%、50% 和 100%)的效率目标,标准规定 50% 负载时的效率为 96%。该参考设计超出了整个负载范围的要求,在 50% 负载时达到了 97% 以上。 80PLUS Titanium 还规定 PSU 在较低负载水平下的功率因数至少为 0.95,因此需要有源功率因数校正 (PFC)。
  无桥交错图腾柱 PFC
  如图 3 所示,Navitas Semiconductor 在参考设计中采用了无桥交错图腾柱 PFC,其中包括带有转向开关的升压级。与传统的桥式整流器相比,这具有大大降低元件损耗的优点。

  SiC MOSFET 因其的开关和反向恢复损耗而得到使用,使 PFC 能够以远远超出仅通过硅所能承受的损耗预算运行。


  图 3. 采用 SiC 无桥图腾柱 PFC 和 GaN 全桥 LLC 的 4.5kW 参考设计。图片由博多电力系统提供
  LLC 谐振转换器
  该 PFC 级反过来为带有全桥方波发生器的 LLC 谐振转换器供电,以激励谐振回路电路,并通过 CR 滤波器和 GaN 整流器在变压器的次级侧提供稳定的 54 V 输出。
  我们可以通过在储能电路的谐振频率下使用全桥晶体管的零电压开关(ZVS)来进一步提高效率。然而,谐振组件以及相关电路和输出滤波器必须在相同的整体外形尺寸内处理更大的电流,输出电流为 54 V PSU,提供 4.5 kW、83 A 的满载功率。

  4.5 kW 参考设计的全桥是使用 650 V GaNSafe IC 构建的,该参考设计的功率密度需要选择 300 kHz 的开关频率。这大约是强大的硅基 CRPS 单元(约 150 kHz)的两倍,虽然硅的开关频率不能显着超过 150 kHz,但 GaN 功率晶体管的输出电容和栅极电荷等特性使其能够有效运行远超过 300 kHz。

  图 4. 集成驱动器允许控制栅极环路电感。图片由博多电力系统提供
  GaN 栅极脆弱性
  此时,应该注意GaN脆弱的栅极结构。栅极驱动电路的设计对于缓解这种情况并防止负电压尖峰和振铃至关重要。
  GaNSafe IC 集成了优化的驱动器来保护栅极,从而能够仔细控制输出和栅极之间的电感和电阻。这也可以通过分立元件来实现,但这样做会带来额外的设计挑战,并且需要增加 PCB 面积(从而降低功率密度)。
上一篇:汽车用高功率密度 SiC 功率模块的技术方法
下一篇:了解交流电三极管 ,其结构、电路特性、应用和测试程序

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料