載入廣告中...

輝達推出Rubin CPX架構,提升AI伺服器效能與成本效益

輝達於九月發布新一代VR200NVL144CPX機櫃,全面升級印刷電路板(PCB)設計、材料與散熱方案,為AI伺服器供應鏈帶來新一波成長動能。

Rubin系列目前已公開的產品包括VR200、VR300(Ultra)以及CPX擴充卡。新一代VR200延續「十八個compute trays加九個switch trays」的基本架構,其中運算托盤整合了CPU/GPU、記憶體、網路模組及散熱裝置等核心元件,作為AI伺服器的「心臟底座」。

AI推理過程分為預填充(prefill)和解碼(decode)兩個階段。預填充階段需要高計算能力但對記憶體頻寬要求低,而解碼階段則相反。過去使用同一種GPU處理兩個階段導致資源浪費,因此非輝達陣營開發出ASIC規格以降低成本。

針對這一挑戰,輝達推出Rubin CPX擴充卡,專為預填充階段設計。雖然CPX將HBM換成GDDR7使性能有所下降,但原物料成本僅為VR200的四分之一,同時提供約60%的算力。GDDR7相較HBM可節省80%成本,使同樣的預填充任務總擁有成本從VR200的每小時0.9美元降至CPX的0.16美元,明確針對ASIC競爭對手。

Rubin系列機架設計也全面升級,解決了前代產品的痛點:首先採用無電纜設計,使用安飛諾(Amphenol)的板對板連接器配合PCB中板,所有訊號都通過電路板傳輸;其次實現全液冷方案,將CPX與CX-9網路卡疊放並共享液冷板,冷卻板數量從兩片增至五片,快接頭數量從六顆提升至十二顆,使液冷散熱零組件產值較GB300NVL72約有倍增;最後提供客製化布建選項,允許客戶通過InfiniBand或乙太網路連接單獨的CPX機架,自行調整預填充和解碼比例。

欣興、定穎等廠商為此架構供應HDI板。輝達的CPX架構明確針對AMD、Google、AWS等競爭對手,迫使他們必須加速開發新的預填充專用晶片以維持競爭力。


現正直播
APP 下載