芯東西(公眾號:aichip001)
作者 | ?GTIC峰會

芯東西8月26日報道,今日,GTIC 2022全球AI芯片峰會在深圳市南山區正式開幕!

這場高規格產業會議由芯東西與智東西公開課聯合主辦,以“不負芯光 智算未來”為主題,匯集了來自國內外AI芯片領域的產學研專家及創業先鋒代表,暢談前沿技術創新與最新落地進展。

經過一天精彩的干貨分享與思想交鋒,峰會全場座無虛席,人氣爆棚,現場交流氛圍熱烈,全網直播人數高達100萬+人次。

深圳市南山區科技創新局黨組書記、局長曹環出席峰會開幕式并致辭。北京大學集成電路學院院長蔡一茂教授分享了存算一體與類腦計算芯片的創新路徑與技術挑戰。

值得一提的是,在峰會現場,上海交通大學計算機科學與工程系教授梁曉峣宣布,正式推出第一代開源GPU——“青花瓷”架構,打造開源通用智能算力芯片平臺,“做人人都用得起的GPU”。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了

本屆峰會覆蓋當前AI芯片產業的核心議題,涉及領域專用架構、通用GPU、存算一體、類腦計算、光子計算、量子計算等技術路線和EDA工具、Chiplet等上游技術創新,并縱覽云端數據中心、車路協同、自動駕駛、邊緣計算、智能家居等主流的落地應用場景。

在上午的AI芯片高峰論壇期間,NVIDIA、壁仞科技解讀了最新旗艦通用GPU的架構創新;瀚博半導體、地平線、后摩智能分享了用AI芯片助力車路協同與自動駕駛的心得;智一科技聯合創始人、總編輯張國仁現場對話臨芯投資董事長李亞軍、和利資本董事總經理肖鵬、天數智芯CTO呂堅平,暢聊對AI芯片企業創新與生存的思考。

在下午的云端AI芯片專題論壇上,Graphcore、墨芯人工智能、昆侖芯科技、鯤云科技從不同維度分享了在技術創新與量產落地的經驗之談,芯行紀、奇異摩爾分別從EDA創新和3DIC Chiplet角度探討了破解高性能計算挑戰的思路。

下面,我們來看看AI芯片峰會首日的演講精華。

一、開幕致辭:聚焦集成電路與人工智能有機結合的最前領域

在開幕式上,深圳市南山區科技創新局黨組書記、局長曹環發表致辭:“AI芯片峰會交流聚焦的邊緣計算、存算一體芯片等主題代表著集成電路和人工智能有機結合的最前領域,與深圳市南山區的戰略新興產業的布局高度契合。”

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲深圳市南山區科技創新局黨組書記、局長曹環

曹環談道,南山區在具有雄厚的集成電路產業基礎和突出的創立優勢,2021年南山區的集成電路企業超過200家,年銷售額超過700億元,同比增長逾68%,培育了中興微電子、國微集團、奧比中光等一批行業領軍企業。未來,南山區將繼續全力推動集成電路產業集群的高質量發展。

智一科技聯合創始人、CEO龔倫常代表主辦方為本次峰會致辭。在簡要復盤了近年中國半導體行業面臨的挑戰后,他指出挑戰的另一面是機遇,中國是全球最大的單一市場,改革開放的戰略并未改變,同時在全面推進產業升級和生產生活的數字化,需求并不會因人為的限制而消失,企業在砥礪奮進中創新、創造至關重要。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲智一科技聯合創始人、CEO龔倫常

創新需要良好的產業環境,這也是今年AI芯片峰會選址深圳南山的重要考量。深圳是創新之都,南山則是深圳這片創新熱土的核心區,在研發投入、硬科技數量、獨角獸和投資機構數量等方面都居深圳之首。龔倫常希望AI芯片峰會成為前沿技術交流和產業落地對接的重要平臺。

今年是智一科技成立的第6個年頭。智一科技堅持技術和產業雙輪驅動,聚焦以人工智能、集成電路為代表的前沿技術及其行業應用,構建產業媒體與企業服務兩大業務體系。

智一科技擁有以芯東西、智東西、車東西為代表的產業媒體矩陣,已成為國內定位獨特且具有較高影響力和公信力的產業媒體;同時針對產業升級需求,發展出以智東西公開課為核心的企業服務體系,與產業優秀公司、全球頂級高校的專家學者合作,舉辦系列talk及新青年講座,并與國內外頂級企業合作舉辦定制公開課,截至目前已完成的課程超過600節,收獲良好口碑。

二、北京大學蔡一茂:新型存儲器是AI芯片的重要助推器

隨著AI技術逐漸獲得廣泛應用,智能計算正呈現從提高性能到降低能耗、從計算密集型到數據密集型、從結構化數據到半結構化或非結構化數據的趨勢。進入軟硬件并進時代的AI,對硬件提出高算力、高并行、低功耗等需求。

在上午舉辦的AI芯片高峰論壇期間,北京大學集成電路學院院長蔡一茂教授分享道,新型存儲器與先進封裝技術是AI芯片的重要助推器,其中大容量、高速、高帶寬存儲器是瓶頸,AI時代正帶動存儲器接口標準的持續創新。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲北京大學集成電路學院院長蔡一茂教授

基于存算分離架構的傳統智能芯片受制于器件、架構、能耗瓶頸,存在低效率、高功耗的問題,而存算一體芯片能消除數據搬運造成的算力瓶頸,顯著降低功耗,提高計算能效。

借鑒人類大腦體系結構的類腦仿生芯片,同樣采用新型存儲器,通過片間互連運行大規模的脈沖神經網絡是一個重要的智能芯片技術。蔡一茂教授認為,相比采用傳統器件,采用RRAM憶阻器等神經形態器件的類腦仿生芯片具有多重優勢,是突破算力瓶頸與實現更高智能的重要技術,但目前還面臨工藝不成熟和底層器件性能有待提高,集成密度受限等挑戰。

目前,北京大學研發的類腦計算芯片已具備高集成度、高擴展性、高通用性等特征,支持運行圖像識別、音頻識別、人臉識別與跟蹤等常見DNN/BNN模型。

三、上海交大梁曉峣:推出通用智能算力芯片平臺,宣布首個開源GPU架構

上海交通大學計算機科學與工程系教授梁曉峣在會上宣布,正式推出開源通用智能算力芯片平臺,將第一代GPU架構“青花瓷”免費開源,“做人人都用得起的GPU”。

“青花瓷”的架構和指令兼容(或二進制轉譯或兼容)NVIDIA,支持SIMT為主體的可擴展性架構以保證強大可編程性,并支持超薄的軟件棧設計,通過極簡的API封裝將硬件細節暴露給程序員,降低軟件開發難度。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲上海交通大學計算機科學與工程系教授梁曉峣

談及國產自主云端GPGPU的發展機遇,梁曉峣教授金句頻出,比如將國內格局總結成:昇騰,北昆侖平頭當中坐,東西齊上陣(分別代指華為昇騰、百度昆侖芯、阿里平頭哥、眾多創業公司)

縱觀云端AI芯片產業發展路徑,是要做得更專業還是通用?梁曉峣幽默地談道,摩爾定律已經被“社死”了很多次,但仍然頑強地活著,而且是GPU歷史上對沖2P風險的最強武器,數據并行計算作為可擴展性最強的并行方式,與摩爾定律是“佳偶天成”。

他直言市場需要的不是“好”芯片,而是“好用”的芯片,“不好用”是自主芯片公司的通病,是目前行業的最大痛點。

據他分享,商業化市場最希望做到與NVIDIA兼容,做到無縫切換,但要做一款能與NVIDIA完全兼容的芯片,需要至少3000人的團隊、花費10年時間、付出超過100億美元的投資。

其中最根本的問題是軟件。從舊世界發展起來的傳統軟件架構和層次要經歷巨大的變革。當下國內芯片產業在軟件層面存在“重復造輪子”問題。

梁曉峣教授說,云端大算力芯片的投資,要的是“細水長流”,憑的是“天荒地老”,第一層次投資金,第二層次投團隊,第三層次投時間。要后來居上,需要以免費解決“錢”的問題,以開放解決“人”的問題,以開源解決“時間”的問題。

他認為國產芯片生態弱小的時候,需要學術界雪中送碳。這也是為什么其團隊打造了三個“一”工程(一本GPGPU架構和芯片設計專業教材、一門核心課程、一個開源通用智能算力芯片平臺),形成四大支柱(行業人才支柱、知識產權支柱、產業聯盟支柱、開放生態支柱)。

四、巔峰對話:一半火焰一半海水,AI芯片企業要學會向客戶要錢

圍繞AI芯片的趨勢變化,智一科技聯合創始人、總編輯張國仁,與臨芯投資董事?李亞軍、和利資本董事總經理肖鵬、天數智芯CTO呂堅平進行了一場以“創新與?存,AI芯?的現在和未來”為主題的巔峰對話。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲巔峰對話環節,從左到右依次是:智一科技聯合創始人、總編輯張國仁,臨芯投資董事長李亞軍,和利資本董事總經理肖鵬,天數智芯CTO呂堅平

臨芯投資董事?李亞軍曾參投過許多半導體項目,但對AI芯片項目一向謹慎,直至觀察到AI芯片走到了創新發展“S曲線”的第二波小高峰,他才開始出手,陸續投資黑芝麻智能、昆侖芯等知名AI芯片獨角獸企業。

“一半火焰,一半海水。”李亞軍談道,參考“過剩經濟學”的說法,AI芯片領域高端的人才及產品仍然稀缺,但一些中低端領域的芯片創業公司已顯過剩。AI芯片是一個周期性行業,當下貿易戰、疫情把周期拉長了周期長度,既然是周期,低谷也會回歸到正常周期,全球化浪潮不可阻擋。

現階段,從投資角度來看,他更看好有軟硬結合和場景應用結合能力的企業,看重核心團隊的本身素質,以及公司生態朋友圈的打造。

和利資本同樣長期重視半導體投資,從2019年至今投了30多個半導體項目。和利資本董事總經理肖鵬也重視對AI芯片團隊的考察,對于大芯片賽道,他會更看重核心團隊的同類芯片成功經驗,團隊完整性以及團隊配合的默契程度;對于技術門檻相對低的小芯片賽道,他會看重這家企業的核心指標是否有10倍于競爭對手的優勢,團隊的缺點是否容易補齊。同時,他也非常重視公司生態“朋友圈”,認為整個團隊的學習能力和邊界延展性強,能夠通過上下游伙伴補齊短板。

談及“創新與生存”問題,肖鵬認為,AI芯片企業需要著重想清楚“萬物+AI”還是“AI+萬物”這個問題,即企業要想清楚AI的附加值到底是在產品中占80%還是20%,不同占比做法完全不一樣。不管是采用哪種技術路徑去實現AI的功能,AI芯片企業都要更加關注“向客戶要錢”。

在他看來,今年AI創企或許不能再像前兩年那樣活得很輕松,需要考慮三個關鍵問題:1、如果行業還是像前幾年那么火熱,公司CTO、合伙人還會不會接著跟你干?2、熱度降下來的時候,正好可用來思考團隊怎么建設,產品如何,服務客戶等關鍵問題。3、做好現金流的管理。

天數智芯是國內通用GPU高端芯片的代表企業之一,今年7月剛宣布完成超10億元C+輪及C++輪融資。天數智芯CTO呂堅平從被投資者的角度分享了他的洞察。

呂堅平說,天數智芯已走過尋找客戶的階段,公司的創新變成與客戶合作適配中突破。比如在當下備受關注的大模型領域,他認為從客戶需求來看,當下智算中心的底層算力建設不但要通用,而且要有多維度的效能指標,如穩定度等,而不僅僅是強調高算力。

五、突破云端AI芯片算力瓶頸!架構創新、全棧能力、落地心經

2017年,NVIDIA(英偉達)發布Tesla V100領銜炸場,掀起了全球AI芯片的創新狂瀾。如今五年過去,NVIDIA GPU始終是云端AI訓練芯片的“標桿”,與此同時,國內外多家創企摩拳擦掌,基于不同架構路線向云端AI芯片市場發起沖鋒。

今天,來自NVIDIA、壁仞科技、Graphcore、墨芯人工智能、昆侖芯科技、鯤云科技等知名云端AI芯片企業以及EDA新秀芯行紀、Chiplet創企奇異摩爾的技術專家及創業領袖,聯袂奉上了從技術創新、量產落地到生態構建的深度見解。

1NVIDIA賴俊杰:揭秘英偉達最強Hopper架構

今年3月,全球AI計算巨頭NVIDIA在GTC大會上重磅推出基于全新Hopper架構的新一代旗艦GPU計算芯片H100,將多種精度下的AI算力最高提升至上一代A100的3~6倍。

NVIDIA中國區工程及解決方案高級總監賴俊杰對Hopper架構進行了詳細解析。實現性能提升的關鍵是新一代流式多處理器(SM)和新型線程塊集群技術。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲NVIDIA中國區工程及解決方案高級總監賴俊杰

SM引入了FP8張量核心(Tensor Core)相較FP32/BF64吞吐量翻倍,與其Transformer引擎結合更是能大幅提升AI大模型的訓練效率;還引入新指令集DPX,可加速動態編程算法,能解決路徑優化、基因組學等算法優化問題。新的線程塊集群機制可實現跨單元進行協同計算,為大模型加速運算提供更好的支撐。

隨后賴俊杰分享了GNN(圖神經網絡)分布式訓練的一些研究進展。對于大規模的GNN問題,圖形結構和特征可能不適合單獨的GPU內存,對此需要分區。利用能實現多GPU高速互連的NVIDIA NVSwitch系統,可以更好地處理大規模GNN計算問題。

2、壁仞科技洪洲:對數據流深度優化,滿足大模型全棧能力需求

近兩三年,萬億參數的大模型優越性更加明顯,同時對計算機體系結構和訓練框架帶來巨大挑戰。壁仞科技聯合創始?、CTO洪洲認為,大模型需要從集群、平臺到框架的全棧能力,壁仞科技的新品BR100系列通用GPU芯片應運而生。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲壁仞科技聯合創始?、CTO洪洲

BR100采用7nm制程,容納近800億顆晶體管,在BF16精度下達到1024TFLOPS性能,在INT8數據精度下支持2048TOPS算力。這款芯片在國內率先采用Chiplet技術、PCIe5.0接口和CXL互連協議,創下了國內GPU互連帶寬紀錄。

如何實現計算效率的提升?洪洲說,這主要來自對數據流的深度優化。針對通用大算力GPU面臨的內存墻、功耗墻、并行性、互連和指令集架構等挑戰,壁仞科技設計了訓推一體的原創芯片架構“壁立仞”,在數據流精度、存取加速、并行、搬移、隔離等方面實現了優化。

壁仞科技不僅有通用GPU架構、高算力的Tensor Core,還通過張量數據存取加速器提高數據存取效率;并采用NUMA/UMA訪存機制,根據深度學習訓練和通用并行計算的數據流特點分配內存,從而實現“數據跑到哪里,計算就在哪里”,提高計算效率。

3Graphcore金琛:利用IPU構建高能效AI計算平臺

“訓練圖像識別模型時,2012年AlexNet模型完成訓練需要6天,如今只需要幾分鐘就可以完成這項任務。”Graphcore中國工程副總裁、AI算法科學家金琛在發表演講時談道。

▲Graphcore中國工程副總裁、AI算法科學家金琛

大規模AI計算的發展有三大趨勢,分別是通過優化硅技術實現專業化變得更難、對越來越大的模型的需求并未放緩、計算系統和軟件提升的空間仍然很大。

為了適應AI框架的發展,Graphcore正不斷豐富軟件生態系統,其模型花園已涉及計算機視覺、自然語言處理、圖神經網絡等領域。在具體應用效果上,Graphcore的產品在保險業中使用計算機視覺來幫助評估、維修以及保護汽車和房屋,使得結果效率提升了5倍。

AI大模型的參數規模暴漲帶來許多挑戰,包括計算系統的提升及模型本身應該變得更加聰明。在此過程中,數萬億參數的密集神經網絡不可行,需要稀疏模型架構。因此,Graphcore正在設計一個系統,可以支持百萬億級的模型訓練。

4、墨芯人工智能王維:稀疏化推動AI計算向超高算力、更低成本發展

大模型是AI的下一個必爭之地,隨著AI芯片受限于摩爾定律,硬件升級逼近物理極限,處理AI大模型算力瓶頸突破迫在眉睫。

墨芯人工智能創始人兼CEO王維認為,稀疏化計算是AI計算的未來。稀疏化計算,是一種以人腦得到靈感的模型壓縮方法。簡單來說,就是通過底層創新、軟硬協同設計,讓神經網絡模型消減冗余,以提高計算效率。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲墨芯人工智能創始人兼CEO王維

稀疏化計算相較于業內其他AI加速技術,并不是微量的差異化創新,而是能夠讓性能帶來十倍、百倍的創新。王維拿標志性的AI大模型——GPT-3來舉例說明稀疏化計算的驚人性能表現。GPT-3有1700多億參數,如果放在GPU上去做推理的話,需要內存量是要幾百G,也就是需要很多張80G的GPU,且會有明顯時延;但通過稀疏化計算,用一張墨芯S30計算卡,就可以跑通GPT-3,并且計算速度還變快了很多。

目前,墨芯基于自研稀疏化云端AI芯片Antoum推出了對應的S4、S10和S30三款AI計算卡,對標國際大廠主流AI推理卡,算力可達6倍以上。其中S30運算ResNet-50算力超90000FPS。

王維透露,流片成功僅半年,墨芯已在核心細分市場獲得幾家客戶。在互聯網市場,墨芯已在一些頭部互聯網公司進入適配階段;在行業市場,墨芯也與生命科學領域部分企業項目落地。

在未來一個階段中,墨芯將圍繞互聯網、泛政府行業及垂直行業三大方向進行市場推廣。在定價上,會將整個算力服務器的TCO(總擁有成本)達到現有主流產品的1/2,甚至1/3。

9月,墨芯人工智能將公布S4和S30在業內權威AI基準測試MLPerf上的性能測試結果,王維說,這有望代表國產AI芯片達成一個新里程碑。

5、昆侖芯科技漆維:規模化部署通用AI芯片,攻克4大難點

空前繁榮的AI生態、場景與時局正驅動AI芯片快速發展,同時,行業也面臨算法多樣化、巨頭生態壁壘、客戶需求苛刻、部署環境復雜等眾多挑戰。面向這一趨勢,脫胎于百度的昆侖芯團隊于2017年推出了自研架構昆侖芯XPU,目前已推出兩款通用AI芯片。

昆侖芯科技芯片研發總監漆維談道,其自研新一代昆侖芯XPU-R架構采用自研高效SIMD指令集,在國內業界率先支持GDDR6,支持片上共享內存,采用軟件定義神經網絡引擎,并配合昆侖芯SDK全棧軟件工具,實現更通用、易編程、高性能、低成本和自研創新的新特征。基于自研昆侖芯XPU-R架構,昆侖芯科技目前已推出了采用7nm工藝的昆侖芯2代AI芯片,算力達256 TOPS(INT8)。以昆侖芯AI加速卡R200為例,經過業務規模部署的實際測試,對典型AI負載的性能相較業界主流150W GPU提升在1.5倍左右。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲昆侖芯科技芯片研發總監漆維

漆維說,昆侖芯2代AI芯片是國內唯一款經過互聯網大規模核心算法考驗的云端AI芯片,目前已落地搜索、Online learning(在線學習系統)、自智慧交通、智算中心等眾多領域。下一步,對標業界最前沿產品的昆侖芯3代AI芯片將在不久之后面世。

6、鯤云科技蔡權雄:定制數據流架構,實現更優算力性價比

鯤云科技聯合創始人&CTO蔡權雄談道,數據流將成為解決性能瓶頸的關鍵技術。數據流芯片就是依托數據流流動次序控制計算次序,把數據的運算和搬運重疊起來,消除空閑計算單元。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲鯤云科技聯合創始人&CTO蔡權雄

芯片利用率決定芯片的實測性能,即芯片實際性能占其峰值算力的比例。數據流架構可有效提高芯片利用率,采用指令集架構的芯片利用率能達到7%~32%,而鯤云定制數據流架構的實測芯片利用率可以達到65%~95.4%。

“我們采用成熟制程工藝的芯片,能夠達到先進制程芯片的效果。”蔡權雄說。鯤云科技的高性能數據流AI芯片CAISA,將運算單元通過可編程的單元連接在一起,并通過算子的配置和數據流網絡的編程保障芯片的通用性。目前,其產品已經應用于智慧化工、智慧油田、智慧電力等多個行業。

7、芯行紀丁渭濱:用AI優化EDA,大幅提升芯片設計效率

AI芯片能加速運行AI算法,反過來,AI算法也能助力更高效的AI芯片設計。芯行紀資深研發副總裁丁渭濱分享了AI優化芯片設計工具的兩類應用——預測性能,幫助EDA工具更自動化。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲芯行紀資深研發副總裁丁渭濱

AI算法在設計前期就可以預測芯片的性能,并能實現5~10%的PPA提升。用AI幫助EDA工具更自動化方面,當客戶在反復跑某一個設計時,AI能基于此前參數的性能進行參數推薦。國際EDA巨頭在探索這些應用,其效果已優于人工調參。

他也分享了芯行紀在用AI構建數字實現EDA平臺的進展,其AmazeFP智能化布局規劃方案能實現同時觀測宏單元和標準單元的擁塞度并控制擁塞模型的穩定性。該智能布局工具還能使機器自動擺放的宏單元更加整齊,并使其客戶在某一案例的布局規劃工作時間從以周為記縮短至以小時為記。

8、奇異摩爾祝俊東:用“3D樂高芯片技術,滿足大算力需求

很多關注芯片創新的人,都會對英特爾今年發布的GPGPU 3D Chiplet技術印象深刻,英特爾將47顆Chiplet拼接在一起,成功實現在算力大幅提升的同時,兼顧了面積與成本的平衡。

奇異摩爾即是一家專注于2.5D/3DIC Chiplet技術研發的產品和服務公司。奇異摩爾產品及解決?案副總裁祝俊東說,在當前高性能計算面臨顯著挑戰:如芯片良率隨著面積上升呈現指數級下降趨勢;單芯片面積受限;先進制程設計量產成本高等等。3D Chiplet設計因有助于解決高性能計算挑戰,受到了更多AI芯片廠商的關注。在制程不變的情況下,基于異構計算的Chiplet能帶來算力的持續增長,實現大芯片存儲容量和連接性能的快速持續提升;通過異構靈活堆疊,使多顆拼在一起的Chiplet像一個整體,同時也有效降低IP研發硬核支出。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲奇異摩爾產品及解決?案副總裁祝俊東

祝俊東談道,3DIC Chiplet常被比喻成“積木”,但“拆”和“拼”也面臨著不少工程化挑戰。為此,奇異摩爾面向芯片開發者提供2個硬件:3DIC Chiplet通用底座和高速接口芯粒;1個軟件:Chiplet專用設計工具,從而幫助客戶實現從芯片設計到實現量產的全流程。

六、助攻智聯汽車,AI芯片新勢力崛起

高度自動駕駛涉及人與車、車與車、車和路之間的默契協同,是實現暢通智慧交通的一大關鍵發展方向,多家AI芯片企業正致力于通過優化加速計算能力,為車路協同提供更好的算力支撐。

國產AI芯片如何助力車路協同突破落地瓶頸?怎樣滿足汽車智能化對算力提出的更高要求?解決智能駕駛芯片發展的核心矛盾,有哪些可行的創新思路?瀚博半導體創始人兼CTO張磊、地平線聯合創始人&CTO黃暢、后摩智能創始人&CEO吳強分別分享了他們的思考與探索。

此外,汽車業務進展飛速的移動芯片巨頭高通,也拿出將AI能力從終端側擴展至邊緣側、賦能智能網聯邊緣的心得。高通技術公司產品管理副總裁Ziad Asghar還分享了對元宇宙趨勢的觀察。

1、瀚博半導體張磊:AI芯片助力車路協同,性能超主流GPU 2倍以上

進入大算力時代,眾多智能應用加速落地,車路協同作為支撐交通強國目標達成的關鍵措施,是其中一大代表。這對智慧的路、實時的云、聰明的車、精確的圖提出更高的要求。邊緣計算是其中重要一環,從技術層面來看,需要多元化算力、更低的時延、更精準的計算。

創立于2018年的瀚博半導體主攻AI推理芯片,其推出的邊緣端SV100芯片能充分應對車路協同新需求。瀚博半導體創始人兼CTO張磊稱,GPU延時下降時,吞吐量也大大下降,使其在車路協同場景受限。SV100芯片在性能及延時方面進行優化,比如處理點云數據性能是業界主流GPU 2倍以上,延時大大降低。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲瀚博半導體創始人兼CTO張磊

瀚博半導體和客戶一起在廣州智慧高速三元里收費站、廣州國際生物島智能網聯基地項目等場景落地相關產品。瀚博半導體為車路協同打造了邊緣AI推理加速卡、智能MEC,具備100TOPS INT8峰值算力,支持多路多模態傳感器接入,能靈活部署,勝任各種邊緣部署復雜環境。

2、地平線黃暢:智能計算架構2.0時代,以高性能AI計算為核心

范式級智能算法的革新推動了汽車智能化的發展。地平線聯合創始人&CTO黃暢談道,智能汽車是堪比“計算機誕生”級的顛覆式創新,隨著自動駕駛技術新范式的出現和發展,需要相匹配的計算架構,從而讓機器更自主、讓開發更簡單、讓計算更智能。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲地平線聯合創始人&CTO黃暢

他指出,智能計算架構2.0時代,以高性能AI計算為核心,讓范式級智能算法的革新,和支持智能算法的硬件體系相結合,加速實現機器自編程和應用自適應。地平線自主研發的BPU貝葉斯計算架構,是先進處理器技術的集大成者,實現高效的AI計算,為軟件定義汽車提供強勁AI性能,加速人機共駕時代的到來。

黃暢說,地平線通過軟硬協同編譯優化,實現性能持續提升,地平線的AI計算架構仿真平臺是其在尋找軟硬件協同優化上的有效路徑之一。采用BPU貝葉斯架構的地平線征程5,專為高等級自動駕駛打造,擁有128TOPS大算力、計算性能達到1531FPS、60ms業界超低延遲和30W超低功耗,搭配端到端全套硬件加速方案,能滿足多樣化開發需求。

他還分享了對于自動駕駛技術和行業趨勢的六大判斷:一是中國成為全球頂級汽車智能芯片的“角斗場”;二是自動駕駛走向量產落地,算力需求持續提升;三是高等級自動駕駛落地,大規模并行化AI計算成趨勢;四是自動駕駛逐步由數據驅動替代傳統基于規則的計算;五是AI計算逐步取代邏輯計算,成為車載計算的核心;六是統一神經計算架構,滿足智駕場景各種應用需求。

3、后摩智能吳強:破解智能駕駛芯片核心矛盾,存算一體成為金鑰匙

智能駕駛的普及和商用對智能駕駛芯片提出了新的要求。后摩智能創始人&CEO吳強談道,智能駕駛芯片發展的核心矛盾在于算力需求不斷增長,但供給側的傳統方案成本昂貴,且依賴于少數國際大廠IP,再加上高功耗和較為封閉的方案,也不利于未來的算法演進和OTA升級。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲后摩智能創始人&CEO吳強

“具有天生優勢的存算一體,就成為了解鎖算力和功耗難題的金鑰匙。”吳強說。存算一體的實現可類比為廚師炒菜,為了壓縮廚師在廚房和倉庫之間拿菜、切菜、炒制的過程,要讓倉庫和廚房變成一個整體。對應到計算機系統架構中,就是將運算步驟和參數一起集成在內存上,這種架構能用低成本方式實現大算力、能效比、低延時,同時對先進工藝依賴較弱,能夠用成熟制程做出先進制程的性能效果。

后摩智能研發的首款“存算一體”大算力芯片已于去年成功流片,成功跑通了一些主流的自動駕駛算法,今年年底有望給客戶試用。

4、高通Ziad Asghar:終端側AI助力打造智能網聯邊緣

高通技術公司產品管理副總裁Ziad Asghar提出,邊緣側AI將依舊是AI發展的主要方向之一。高通公司致力于不斷增強終端側AI能力,讓數據在產生的地方進行處理,在既定功耗下不斷實現處理能力突破,實現快速響應,并保障數據隱私安全。

AI芯片峰會燃爆深圳南山!17位大咖演講萬字精華來了▲高通技術公司產品管理副總裁Ziad Asghar

高通公司構建了“統一的技術路線圖”,基于此打造了一系列面向AI的IP和技術,助力終端側AI能力實現規模化擴展,覆蓋智能網聯邊緣。硬件方面,基于第七代高通AI引擎,高通公司為智能手機帶來了業界領先的終端側AI體驗,同時也構成了面向高通汽車、物聯網、XR等所有不同業務AI擴展能力的真正核心。

軟件方面,高通公司最新推出的高通AI軟件棧(Qualcomm AI Stack)已覆蓋其當前所有產品線,讓客戶一次開發,即可將解決方案跨高通所有產品線進行遷移,開發者和終端廠商可以根據實際需求進行模型開發和優化,Ziad提到這是一個對開發者和終端廠商都非常強大的優勢。

高通公司的研發團隊致力于推動終端側AI能力在性能和能效上不斷實現突破。展望未來的邊緣側AI前景,Ziad提出,未來我們希望下一步能夠實現完全分布式的AI,能夠在終端上進行推理和一定程度的學習工作,而高通所開發的眾多技術已經能助力實現這一目標。

Ziad Asghar還談及最近大火的元宇宙:“元宇宙是每個用戶獨一無二的數字孿生,元宇宙中所有的視覺和體驗都基于用戶的喜好,這意味著需要持續進行個性化,不斷適應用戶的特定需求,我認為這也是元宇宙的獨特優勢。”

結語:峰會首日圓滿舉行,明天精彩繼續!

峰會首日,來自產學研投界的17位重磅嘉賓,在AI芯片高峰論壇與云端AI芯片專題論壇上,圍繞技術創新、生態建設等AI芯片核心議題,輸出了豐富的產業干貨。

明日,GTIC 2022全球AI芯片峰會精彩繼續,邊緣端AI芯片專題論壇、存算一體芯片專題論壇、新型計算技術專題論壇將帶來更多攻克AI芯片技術壁壘和落地難關的思想碰撞,期間還將公布“2022中國AI芯片50強”榜單,敬請期待。