智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西10月13日報道,剛剛,在圣何塞OCP全球峰會上,英偉達展示了十億瓦AI工廠的未來,并宣布Meta和甲骨文將使用英偉達Spectrum-X以太網網絡交換機來增強其AI數據中心網絡,加快大規模部署,實現AI訓練效率的指數級增長。

英偉達創始人兼CEO黃仁勛說,Spectrum-X不僅僅是更快的以太網,更是“AI工廠的神經系統”,使超大規模計算企業能夠將數百萬張GPU連接到一臺巨型計算機中,以訓練有史以來最大規模的模型。

專為萬億參數模型時代而設計的英偉達Spectrum-X以太網平臺由Spectrum-X以太網交換機和Spectrum-X以太網超級網卡組成,是首個專為AI打造的以太網平臺

Spectrum-X以太網已展現出創紀錄的效率,其擁塞控制技術使全球最大的AI超級計算機實現了95%的數據吞吐量。相比之下,現成的大規模以太網會遭遇數千次流量沖突,導致吞吐量限制在60%左右。

這一效率飛躍標志著AI可擴展網絡在經濟性和性能方面的突破。英偉達Spectrum-XGS以太網技術是Spectrum-X以太網網絡平臺的一部分,能夠實現跨規模擴展,將跨城市、國家、大洲的數據中心連接成龐大的十億級AI超級工廠。

Spectrum-X基于英偉達全棧平臺(包括GPU、CPU、NVLink和軟件),提供從計算到網絡的無縫性能。其先進的擁塞控制、自適應路由和AI驅動的遙測功能可確保大規模AI訓練和推理集群的效率和可預測性。

甲骨文將建設通過Spectrum-X以太網互連的十億級AI工廠。

“通過采用Spectrum-X以太網,我們能以突破性的效率互連數百萬張GPU,從而使我們的客戶能夠更快地訓練、部署并受益于下一波生成式和推理式AI。”甲骨文云基礎設施執行副總裁Mahesh Thiagarajan說。

Meta將把Spectrum以太網交換機集成到其Facebook開放交換系統(FBOSS)的網絡基礎設施中。FBOSS是一個專為大規模管理和控制網絡交換機而開發的軟件平臺。此次集成將加速大規模部署,從而提升AI訓練效率并縮短洞察時間。

據Meta網絡工程副總裁Gaya Nagarajan分享:“Meta的下一代AI基礎架構需要業界前所未有的規模的開放高效網絡。通過將英偉達Spectrum以太網集成到Minipack3N交換機和FBOSS中,我們可以擴展我們的開放網絡方法,同時釋放訓練更大規模模型所需的效率和可預測性,并將生成式AI應用帶給數十億人。”

英偉達NVLink Fusion也正快速發展,使企業能夠將其半定制芯片無縫集成到高度優化且廣泛部署的數據中心架構中,從而降低復雜性并加快產品上市時間。

英特爾和三星代工廠正在加入NVLink Fusion生態系統。該生態系統包括定制芯片設計者、CPU和IP合作伙伴,以便AI工廠能夠快速擴展,以處理模型訓練和Agentic AI推理的苛刻工作負載。

全新NVLink Fusion生態伙伴包括:

  • CPU合作伙伴:富士通,英特爾,高通。
  • 定制芯片合作伙伴:AIchip,Astera Labs,GUC,Marvell,聯發科,三星。
  • 技術合作伙伴:楷登電子(Cadence),新思科技(Synopsys)。

作為最近宣布的英偉達和英特爾合作的一部分,英特爾將構建使用NVLink Fusion集成到英偉達基礎設施平臺的x86 CPU。

三星代工廠已與英偉達合作,以滿足對定制CPU和定制XPU日益增長的需求,為定制芯片提供從設計到制造的體驗。

如今,十億瓦AI集群已經成為AI芯片龍頭企業們共同的目標。英偉達Spectrum-X以太網和Spectrum-XGS結合了OCP的開放性和領先性能,被Meta和甲骨文兩大科技巨頭選用部署。

這些旨在實現跨規模擴展的技術,將為大規模AI訓練及推理帶來更可觀的效率,進而加速生成式AI應用的開發與普及。