在2025年 AWS re:Invent 大會上,亞馬遜云科技(AWS)正式發布了最新一代的人工智能訓練芯片 ——Trainium3。這款芯片在多個方面都實現了顯著的進步,給 AI 模型訓練帶來了全新的可能性。
根據 AWS 的介紹,Trainium3芯片采用先進的3納米制程,其性能相比于第二代產品提升了4倍,內存容量同樣增加了4倍,能效則提高了40%。這一系列的改進使得 Trainium3能夠更好地滿足高負載推理和 AI 訓練的需求。
此次發布的 Trainium3UltraServer 系統能夠支持大規模集群的構建,最多可以連接100萬顆 Trainium3芯片,這個數字是前一代系統的10倍。每臺 UltraServer 最多可以容納144顆芯片,極大地提升了數據處理能力。亞馬遜表示,該系統將幫助客戶在使用 AI 云服務時顯著降低推理成本,進一步促進了 AI 技術的應用。
此外,AWS 還透露了 Trainium4的開發計劃,表示這一新一代芯片將支持與英偉達的 GPU 協同工作。通過支持英偉達的 NVLink Fusion 高速互連技術,Trainium4不僅能夠擴展整體性能,還能利用亞馬遜自研的低成本服務器架構。這一舉措將可能降低將現有英偉達優化的 AI 應用遷移至亞馬遜云平臺的門檻。
劃重點:
?? Trainium3性能提升4倍,內存和能效分別增至4倍和40%。
?? UltraServer 系統可搭載100萬顆芯片,支持超大規模集群。
?? Trainium4將支持與英偉達 GPU 協同工作,降低 AI 應用遷移門檻。

