智東西(公眾號:zhidxcom)
文 |?季瑜生
導語:用十秒,Atlas 900就能從20萬顆星星中找到你的那一顆。
智東西9月18日上海消息,今日早晨,華為在上海世博中心舉行了2019華為全聯接大會,智東西帶來現場一手干貨報道。
會上,華為輪值董事長胡厚崑發表了《共創智能新高度》的演講,同時還發布了由數千顆昇騰910組成,只需60秒就可以完成典型網絡的訓練的全球最快AI集群Atlas 900。
此外,胡厚崑還首次從架構創新、產品布局、商業策略、開放生態四個角度全面對外公開了華為的整體計算戰略。
最后,胡厚崑還透露出幾個數據,2023年,全球計算產業市場空間將達兩萬億美元,到2025年,AI計算將占算力總量80%以上。
一、華為很好,就像上海的天氣,秋高氣爽、云淡風輕
上場伊始,華為輪值董事長胡厚崑先向在場的所有朋友們親切的打了招呼。

他表示,今年的全聯接大會上比去年的人來的更多,而且也有很多老朋友的出席,這說明大家對于華為都是非常關心。
緊接著他表示,“今天一早,很多朋友問我你們還好嗎?你們還不錯吧?”
對此,胡厚崑回應:過去半年頂著巨大的壓力走過來,不過華為現在過的還不錯,就像今天上海的天氣,秋高氣爽、云淡風輕。而且華為一定不會讓所有人失望的!

二、華為整體計算戰略首次公開:將5年投入15億美元構建開放生態
剛一上場,胡厚崑就向我們強調了兩個詞語“計算”與“聯接”。基于華為兩年前發布的新愿景——構建萬物互聯的智能世界,計算與聯接是其中最重要的兩個孿生兄弟。長期以來,哪里有聯接,哪里就有計算。

此外,胡厚崑也表示,向來以通信行業巨頭形象出現在我們面前的華為,其實對計算的投入已經超過十年的時間。
長期以來,計算模式一直在發生著變化,從基于規則的計算到基于統計的計算,再到如今計算進入智能時代。
而在智能時代,有幾個因素不可忽略,此外,胡厚崑還提出一個趨勢預判——智能時代,具備三大特征:

(1)端邊云高效聯動的協同計算將成為未來的最大趨勢。
(2)計算將無處不在,在終端側、邊緣側、中心側都將存在,甚至在智能手機、智能眼鏡、智能耳機都應該有計算能力。
(3)基于中心節點對通用模型進行訓練量、計算量極大的暴力計算將無處不在。
緊接著胡厚崑公布了幾個數字:2023年,全球計算產業市場空間將達兩萬億美元,到2025年,AI計算將占算力總量80%以上。

基于這一認知,華為也首次公布了其在智能計算領域的整體戰略,借此來讓所有人了解華為的想法與戰略,共同將市場做大。
華為智能計算的戰略整體分為四部分:架構創新、產品布局、商業策略、開放生態。
1、架構創新。華為這些年一直在長期投資基礎研究,打造出了達芬奇架構,重點解決全場景智能的架構問題。達芬奇架構是全行業唯一一個覆蓋端邊云全場景的架構。

2、投資全場景處理器族。包括面向通用計算的鯤鵬系列,面向AI的昇騰系列,面向智能終端的麒麟系列,以及面向智慧屏的鴻鵠系列,將來還有一系列處理器,面向更多的場景。

3、商業策略-有所為有所不為。胡厚崑重點強調,華為處理器不直接對外銷售,而是會以云服務和部件為主面向客戶,并開放硬件框架、數據庫、AI計算框架部件給合作伙伴,優先支持合作伙伴發展整機。在這一過程中,華為有三個堅持:堅持硬件開放、堅持軟件開源、堅持使能應用開發和遷移。在這一過程中,華為不做應用,而是幫助合作伙伴做應用。
4、構建開放生態。未來5年,繼續投入15億美元,匯聚500萬開發者,使能全球合作伙伴開發應用及解決方案。

關于華為的生態構建以及選擇,在會后的媒體專訪中,華為方面向包括智東西在內的媒體進一步闡釋了為什么鯤鵬處理器選擇ARM架構的原因:
鯤鵬之所以兼容ARM架構,是因為客戶有多樣性的需求與選擇。ARM架構在新的時代有它的優勢所在,華為選擇ARM是為了客戶需求考慮,而不是為了不同而不同。
此外,一個計算產業的成功不只是靠一個好的架構,很多企業有了好的架構還是走了彎路最后失敗。架構只是基礎,要成功還需要開放生態、務實的商業策略。
比如華為剛剛在會上宣布的新的開放生態構建計劃,以及不做應用等策略,這都是華為緊緊圍繞上面兩點所做出的探索。
另外需要補充的一點是,此前,ARM處理器一直被認為具有非常好的終端以及應用但是不適合在中心側進行計算,但是到了今天,邊緣側的優勢將會向中心側延伸,性能問題也已經能夠很好的解決。比如華為鯤鵬920在SPEC?benchmark測試成績超過930分,位居第一,超越業界主流CPU25%。
此外,胡厚崑也宣布了華為面向通用計算領域的最新業務策略。依舊是從產品創新、產品生態、開放生態、商業策略四個方面進行解讀。
1、打造有競爭力的通用計算處理器。長期以來,華為一直持續投入鯤鵬生態,借此來打造最有競爭力的產品。
2、投資板卡、服務器、操作系統、數據庫、編譯器等關鍵技術和產品,打通生態全鏈條,完成系統級驗證,幫助合作伙伴更好地銷售整機。
3、目前鯤鵬生態已落地北京、上海、重慶、深圳、成都等城市,在平臺搭建、人才培養、應用示范等領域全面開展合作。華為將持續與伙伴合作共同打造鯤鵬產業生態基地,與各地的政府、合作伙伴一起,結合當地的優勢,打造鯤鵬計算產業的創新基地和孵化平臺。以平臺為載體,聚合生態伙伴,開展應用示范,培養產業人才,孵化產業標準。
4、上市節奏,基于鯤鵬處理器的系列產品、解決方案和服務,將面向全球市場;當前先聚焦中國市場,后續將基于客戶需求、生態建設等有節奏在其他不同區域、國家/地區逐步上市。
關于AI計算,胡厚崑也向我們宣布了華為的最新進展。他表示,華為的全棧全場景AI解決方案已經全面落地。

去年全聯接大會上,華為發布了全棧全場景的AI解決方案。不過胡厚崑也坦言,“當時我們只交付了用于推理的昇騰310處理器和ModelArts應用開發平臺。”
但是今年,華為用于訓練的昇騰處理器和AI計算框架MindSpore都已經發布了。至此,華為的全棧全場景AI解決方案全面落地。
最后,胡厚崑表示:“大家可以放心地和我們來開展合作!”
三、最快AI訓練集群Atlas 900發布:60秒完成典型網絡訓練
在大型數據集上進行訓練的神經網絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統等各個方面,訓練這些神經網絡模型需要大量浮點計算能力。
近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規模分布式AI集群環境來提升神經網絡訓練系統的浮點計算能力。
基于這一認知,作為本場大會最大的驚喜——胡厚崑發布了全球最快AI訓練集群Atlas 900。

根據現場解讀,Atlas 900由數千顆昇騰910組成,總算力達256-1024PFLOPS@FP16,相當于50萬臺PC的計算力。

昇騰910 AI有多強?每顆昇騰910 AI處理器內置32個達芬奇AI Core,單芯片就可以提供比業界高一倍的算力(256TFLOPS@FP16)。而AI訓練集群Atlas 900,則直接將數千顆昇騰910 AI處理器互聯,打造出了業界第一的算力集群。
值得關注的是,昇騰910 AI處理器采用的是SoC設計,集成了“AI算力、通用算力、高速大帶寬I/O”,可以大幅度卸載Host CPU的數據預處理任務,充分提升訓練效率。
那么它到底有多快?只需59.8秒就可以完成基于ImageNet數據集訓練ResNet-50模型,在同等精度下比第2名(70.2秒)快15%。

這是什么概念,基于這種測試,就像頂尖的短跑選手測試,區別在于第一名沖線還喝了瓶水,第二名才姍姍來遲。
除了超快之外,Atlas 900還具備最佳集群網絡、系統級調優、優秀散熱系統兩大特性。
1、最佳集群網絡。Atlas 900整合了“HCCS、PCle4.0、100G以太”三類高速互聯方式。通過百TB全互聯無阻塞專屬參數同步網絡,降低網絡時延,梯度同步時延縮短10~70%。
通過華為自研HCCS片間互聯240Gbps單端口速率業界領先;最新的PCIE4.0接口則在速率上達到了當前業界的2倍;100G RoCE高速集群互聯網絡進一步讓傳輸速率一快再快。
在AI服務器內部,昇騰910 AI處理器之間通過HCCS高速總線互聯;昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯,其速率是業界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍,使得數據傳輸更加快速和高效。
在集群層面,采用面向數據中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率,將集群內的所有AI服務器接入高速交換網絡。
此外,華為還獨創了iLossless 智能無損交換算法,對集群內的網絡流量進行實時的學習訓練,實現網絡0丟包與E2E μs級時延。
2、Atlas 900系統級調優。通過HCCL通信庫+網絡拓撲+訓練算法級調優,可實現線性度大于80%。
3、散熱。華為方面表示,Atlas 900還具備業界頂尖的散熱系統。Atlas 900采用的是大于95%的液冷占比,可以大幅減少對外散熱。高效節能也是Atlas 900的一大特性,單液冷柜支持50KW超高散熱,實現PUE小于1.1。
那么通過Atlas 900的強大算力究竟能做什么?
胡厚崑表示,Atlas 900可廣泛應用于科學研究與商業創新。比如天文探索、氣象預測、自動駕駛、石油勘探等領域,這些領域都需要進行龐大的數據計算和處理,原來可能花費好幾個月的工作,現在交給Atlas 900,就是幾秒鐘的事情。
緊接著,胡厚崑分享了一個天文探索的案例,這是華為聯合上海天文臺與SKA共同打造的。天文研究高度依賴于海量的數據分析和計算,離不開超強的算力支持。
以下是一張南半球的星空圖,這張圖上有20萬顆星星,用人眼是看不見這么多星星的,這些畫面來自于SKA射電望遠鏡的數據。

當前條件下,天文學家要從這20萬顆星星中,找出某種特征的星體,相當困難,需要169天的工作量。現在用上Atlas 900,只用10秒,就從20萬顆星星中檢索出了相應特征的星體。

最后,胡厚崑表示,為了讓所有人能夠盡快用上Atlas 900的超強算力,華為已經把它部署到華為云上,并以極優惠的價格向全球科研機構和大學開放。
結語:華為的管道與水庫,左手5G,右手云邊端計算
如果說長期以來,我們對于華為的定義還只是一個能做手機的通信設備巨頭,那么這十年多來華為在計算領域的發力逐漸浮出水面,則讓我們重新定義了這個全行業的商業巨無霸。
左手是風頭無兩的5G與領先的6G,建立起了數據傳輸的最大管道。
右手是聯接到管道兩端的水庫與毛細血管。在云端,華為是Atlas 900集群與鯤鵬生態,在邊緣側昇騰生態則構建起了毛細血管層面的計算。
隨著AI與5G的雙重催化,計算與聯接已經成為全行業所共通必須的基礎設施。不過如何共同推進整個產業的發展,華為在做好黑土地之后,還需要更多的產業應用角色參與其中。或許正如胡厚崑所言“這是計算產業新的大航海時代,我們期待的是千帆競發,而不是獨舟奮進。”