芯東西(公眾號:aichip001)
作者 | ?高歌
編輯 | ?云鵬
芯(xin)東西(xi)4月13日報道,今日,被(bei)英(ying)特爾收購的(de)知(zhi)名以色列AI芯(xin)片(pian)公司Habana Labs在(zai)北京分(fen)享了其云端芯(xin)片(pian)在(zai)超算(suan)(suan)(suan)領域的(de)最新(xin)落地(di)進展:其AI訓練芯(xin)片(pian)及推(tui)理(li)芯(xin)片(pian)將被(bei)搭(da)載于美(mei)國加(jia)州大學圣(sheng)地(di)亞哥分(fen)校圣(sheng)地(di)亞哥超級(ji)計(ji)(ji)算(suan)(suan)(suan)機中心(SDSC)的(de)Voyager超級(ji)計(ji)(ji)算(suan)(suan)(suan)機,計(ji)(ji)劃在(zai)2021年(nian)秋(qiu)季投入(ru)使用。
期間,Habana Labs中國區總經理(li)于(yu)明(ming)揚與芯東西等(deng)媒體(ti)進行深入交流(liu)。除了披露(lu)更多此(ci)次(ci)落(luo)地(di)進展的細節(jie)外,于(yu)明(ming)揚還回應了被英特爾收(shou)購(gou)后的業務路(lu)線變化,并透露(lu)下一代云端訓練芯片的性能表現。

一、美國超算中心采用,打入科研領域
Habana Labs創立于(yu)2016年,總部位于(yu)以(yi)色列特拉維夫,2019年被英(ying)特爾以(yi)20億美元收(shou)購,成(cheng)為英(ying)特爾數(shu)據產品集團獨立運營的(de)業務部門。
此(ci)前,其自研云端AI推(tui)理芯片Goya和(he)云端AI訓練芯片Gaudi已被云計算巨頭亞馬遜AWS應(ying)用(yong)。
如今,兩(liang)款芯片迎來新(xin)的落地進展,加州大學圣地亞哥分校的圣地亞哥超級(ji)計算機(ji)中心(SDSC)將在其Voyager超級(ji)計算機(ji)中采用(yong)這(zhe)兩(liang)款芯片,這(zhe)也是Habana Labs在科研領域的一次(ci)突破(po)。
Voyager超算由(you)美(mei)國國家科學(xue)基金(NSF)資助,從事天文學(xue)、氣候(hou)科學(xue)、化(hua)學(xue)、粒子物(wu)理(li)學(xue)等跨(kua)學(xue)科和(he)工程領域(yu)的AI研究。例如在天文學(xue),AI可(ke)以被用于(yu)對(dui)比外太空圖像和(he)判斷(duan)是(shi)否有(you)新(xin)的太空物(wu)質(zhi)出(chu)現。
而Habana Labs的訓練及推(tui)理芯(xin)片將為這些研究起(qi)到(dao)加速計算的作用。
Voyager集群(qun)采(cai)用(yong)(yong)了336片(pian)(pian)Gaudi芯片(pian)(pian)用(yong)(yong)于(yu)AI訓(xun)練,每個訓(xun)練節點使用(yong)(yong)了6個400GbE RoCE的高速互(hu)聯,推理預測采(cai)用(yong)(yong)了16片(pian)(pian)Goya芯片(pian)(pian),預計今年10月可供(gong)研(yan)究人員使用(yong)(yong)。
據于(yu)明揚分(fen)享,Gaudi和(he)Goya提升了Voyager超算AI工(gong)作的性能(neng)和(he)效率,使(shi)研究人員能(neng)夠使(shi)用可(ke)編程張量處理(li)器內核和(he)內核庫定制(zhi)模型。
其中,Gaudi內(nei)置集成了10個支持RoCE v2(RDMA over Converged Ethernet)100G以太網端口,可以提升(sheng)擴(kuo)展(zhan)的靈(ling)活性,避免擴(kuo)展(zhan)能(neng)力(li)受于限(xian)吞吐量。如果搭配(pei)Habana的SynapseAI軟件平臺(tai),使用者(zhe)操作起來將更加便捷。
于明揚提到,作為一家初創公司,Habana Labs的產品(pin)細節還有待提升,其市場(chang)戰略基本是選擇主(zhu)流的云廠商進行合作,通過與有代表性的用(yong)戶(hu)進行合作,來(lai)打磨(mo)、完善產品(pin)。

二、背靠英特爾生態,仍獨立運營
在被問到與英特爾相關的(de)問題時(shi),于明揚回應(ying),Habana Labs仍然作為一家獨立(li)公司運營,其市場戰略依舊比較獨立(li),也可以及(ji)時(shi)對(dui)用戶的(de)問題進(jin)行反饋(kui)。英特爾為Habana Labs提供了很多客戶資源,也使Habana Labs在業內的(de)口碑(bei)有所上升。
同時,客(ke)戶在(zai)選(xuan)擇AI芯片時,往往優先選(xuan)擇符合其處理器(qi)架構的(de)芯片。在(zai)英(ying)(ying)特爾收購Habana Labs后,雙方在(zai)生態上(shang)有(you)所協同,英(ying)(ying)特爾的(de)x86處理器(qi)也為Habana Labs帶來(lai)了部分用戶。
Habana Labs在(zai)被收購后,其(qi)技術(shu)路線圖也沒有(you)發生太大的(de)(de)改(gai)變,其(qi)軟件生態也會在(zai)模型(xing)、工具等方面有(you)很大的(de)(de)進步,還將(jiang)提供預(yu)處理等新功能(neng)。
于明(ming)揚還特(te)別講到,因為英(ying)特(te)爾(er)的代工業務剛剛起步(bu),所(suo)以近兩年(nian)Habana Labs暫時不會選擇英(ying)特(te)爾(er)代工,雙方(fang)會逐步(bu)開展更多的合作。
三、預告下一代訓練芯片,性能提升超2倍
此前(qian),在(zai)AI芯片的(de)訓練(lian)端,英偉達旗下的(de)GPU(圖形處(chu)理器(qi))可謂一家獨大。而Habana Labs的(de)Gaudi則(ze)對(dui)這一現狀發起了挑(tiao)戰。
于(yu)明揚稱,Habana Labs的Gaudi芯(xin)片與(yu)英偉達的旗艦(jian)GPU A100相(xiang)比,雖然性(xing)能上(shang)還略(lve)有(you)(you)不如,但是在性(xing)價比上(shang)已經(jing)(jing)實(shi)現了超(chao)越。他提到,Habana Gaudi基(ji)本上(shang)已經(jing)(jing)能夠達到A100 70%的性(xing)能,而價格則只(zhi)有(you)(you)A100的一半,這使得(de)很(hen)多客戶在實(shi)際體驗后選擇了Habana Gaudi。
Habana Labs預計將(jiang)(jiang)于明年上半年推出下(xia)一代AI芯(xin)片(pian),代號為Gaudi 2,將(jiang)(jiang)采用臺積電7nm制程工藝。與現有(you)(you)的Gaudi芯(xin)片(pian)相比,Gaudi 2將(jiang)(jiang)會有(you)(you)兩倍以上的性能提升。
最后,于明揚談到了未來(lai)AI芯片(pian)(pian)的發(fa)展趨勢(shi)。他(ta)認(ren)為,異構計(ji)算將會是未來(lai)芯片(pian)(pian)的發(fa)展方(fang)向,GPU、FPGA、ASIC等各類芯片(pian)(pian)將會根據特點(dian)不(bu)(bu)同,在計(ji)算集群中擔任(ren)不(bu)(bu)同的任(ren)務。而未來(lai)的挑戰就是如何將不(bu)(bu)同的任(ren)務,部署到最合適的架構上。
結語:背靠英特爾,提升市場競爭力
在(zai)加入(ru)英特爾(er)的(de)整個生態體(ti)系后,Habana Labs的(de)客戶資源得到了提升,在(zai)產品性價比不(bu)錯(cuo)的(de)前(qian)提下,為當今的(de)AI芯(xin)片(pian)市(shi)場提供了一種(zhong)新的(de)選擇(ze)。而英特爾(er)也借此豐(feng)富了自己(ji)的(de)武(wu)器庫,加強(qiang)了自己(ji)在(zai)AI芯(xin)片(pian)領域(yu)的(de)實力。在(zai)于明揚(yang)看來,SDSC作為美國少數超(chao)算中(zhong)心之一,選擇(ze)Habana Gaudi、Goya,某種(zhong)程度上說明SDSC看好ASIC芯(xin)片(pian)在(zai)超(chao)算集(ji)群中(zhong)的(de)應(ying)用前(qian)景,也證明Habana Labs的(de)產品在(zai)科(ke)研(yan)領域(yu)有一定的(de)發展潛力。
隨(sui)著Habana Labs產品(pin)細(xi)節的完(wan)善(shan),其(qi)AI芯片的市場競爭力也在不斷提升,可能會對(dui)英偉達(da)在AI訓練等(deng)領域的地位發起(qi)挑戰。