智東西(公眾號:zhidxcom)
文 | 心緣
導語:“AI芯片”這個新鮮的概念在過去一年間逐漸走過了普及的階段,越來越被大眾所熟知。在行業走過野蠻生長,開始加速落地、加速整合的過程中,也有更多的AI芯片公司也開始走出屬于自己的差異化路線。
智東西在此前AI芯片系列報道第一季之后,再次出發,進一步對AI芯片全產業鏈上下近百間核心企業進行差異化的深度追蹤報道。此為智東西AI芯片產業系列報道第二季之一。
說到通用AI芯片,沒有人會忽略英偉達。
憑借GPU的超強并行處理能力,英偉達搭上人工智能(AI)的高速列車,在近幾年瘋狂進擊,市值飆升十幾倍,在數據中心AI芯片領域所向披靡,成為難以撼動的云端AI霸主。
算力的爆發為AI技術提供加速發展和落地的基石,炙手可熱的AI市場催生出國內外一批新興的AI芯片創企。
前有英偉達、英特爾這些芯片巨頭雄霸云端AI市場,絕大多數AI芯片創企都選擇避其鋒芒,專攻終端AI專用芯片領域。
不過,有一家名為“登臨科技”的創企眼光相當獨到,瞄準的是如今正被英偉達控場的GPGPU。GPGPU全稱General Purpose Computing on Graphics Processing Unit ,即能夠進行通用計算的圖形處理器(GPU),它將GPU的應用范圍擴展到了圖形之外,在科研教育、財務計算、工業等各種領域的大規模并行計算中都得到了廣泛的使用。
目前在全球范圍內,實現GPGPU大規模落地商用的唯有英偉達,國內在這一領域的缺口還很明顯,但已有幾位玩家在往這方面努力研發。

▲登臨科技創始人兼CEO李建文
在一個溫暖的早晨,智東西和登臨科技創始人兼CEO李建文聊了聊,看這位在GPU領域深耕二三十年的行業老兵,如何帶領團隊研發兼顧通用性和高效率的創新GPGPU架構,朝著“成為中國的英偉達”的愿景進發。
一、GPU老兵創業一年半,十幾項專利已在手
作為AI發展的中流砥柱,AI底層硬件的機會無疑是極為廣闊的,但放眼望去,全世界云端AI訓練的絕大多數解決方案都由美國公司英偉達提供。
高性能處理器的設計面臨著復雜度高、技術難度大、技術壁壘深等諸多挑戰,是集成電路設計領域中的關鍵領域,相關人才儲備非常有限,即使在聚集眾多IC精英的美國硅谷也屬稀缺。
李建文本科就讀于清華大學微電子所,于1990年在清華無線電系無線電系線路教研組獲得碩士學位。
早在2017年,李建文就開始思考,我們為什么不造中國人自己的服務器AI芯片呢?
這一想法,成為李建文創辦登臨科技的萌芽。
在成立登臨科技之前,李建文在GPU領域已有二三十年的從業經歷。他曾在圖芯科技(2004年創立)擔任副總裁,由他負責的GPU/GPGPU IP產品,曾被賣給飛思卡爾、英特爾、美滿、谷歌、三星、諾基亞、大華等著名半導體和科技公司。
起初李建文也曾被谷歌TPU吸引,想要在專用AI芯片方面小試牛刀。但在北極光創投做顧問的期間,通過和多方業內人士交流,李建文發現面對快速演化的算法和不斷涌現的新的應用的出現,類似于谷歌TPU的專用AI芯片不具備市場需要的通用性,可能等投入大量資金和時間做出芯片后,市場已經不再需要這個東西了。
在看到了專用AI芯片的瓶頸后,基于自己長年積累的行業經驗,李建文決心在以GPGPU為核心的異構通用計算平臺構建上有所建樹,要做比英偉達性能表現更出色的GPGPU解決方案。
2017年11月,李建文在上海成立登臨科技,由知名的高科技風險投資機構“北極光”創投孵化,已經分別在2017年底和2018年上半年完成天使輪和Pre-A輪融資,融資金額共計約1.5億人民幣。
登臨科技的核心創始團隊共有8人,其中七個人都是長期深耕于GPU領域,還有一人在網絡處理器方面經驗豐富。
據李建文介紹,其他成員分別有在圖芯、英偉達、AMD、思科、Acacia等世界知名的半導體、系統和互聯網公司任職多年的經歷。每個成員不僅擁有20余年的高技術行業從業經驗,有在從28nm到7nm先進工藝上成功流片及批量生產的業績,而且全面覆蓋并行處理器系統架構、軟硬件、核心IP、處理器驗證平臺搭建,及整體SoC芯片的開發。
經過一年半的發展,如今登臨公司約有60人,其中絕大多數成員的學歷背景至少為碩士畢業,工作經驗不少于七八年、行業經驗非常豐富。目前,登臨科技已經獲得的十幾項專利,還有數十項核心專利正在國內外申請中。
二、軟硬件結合創新GPGPU,今年年底交付客戶使用
有英偉達GPGPU珠玉在前,一家新創公司如果想讓自己的產品得到市場的認可,通常會選擇降價,少掙點錢。
但李建文想做的不僅于此,他希望能做點不一樣的東西,既能繼承英偉達的優點,在通用性方面和英偉達GPU一樣好,同時在技術方面有所創新,使得計算密度更高,效率進一步提升,對外部帶寬的需求大幅度降低。
在人們的傳統認知中,英偉達的GPGPU核心主要是面向圖形加速和高性能計算,但為了兼顧所有這些應用的特征,他的硬件結構是固定的,執行的模式基于指令集,存儲是基于傳統馮·諾依曼架構的中心化數據存儲,這些在一定程度上都限制了硬件的效率,對AI應用而言并非最優解。
于是,李建文選擇在系統架構設計上,采用軟硬件協同設計的概念,來專門解決兼顧AI計算通用性和高效率的難題。
與其它廠商提供定制化專用AI處理芯片不同, 登臨科技自主創新的“登臨-Minsky”體系結構(軟件定義的異構AI計算平臺)在架構設計上具備更高的靈活性。
軟件能預測到客戶的最終應用,通過在較高的應用層次上做特征分析,讓包括流水線、控制模型、存儲模型在內的各種硬件設計,根據任務的特征做整體的優化。
通過這種架構創新,登臨科技可以將AI處理器硬件的計算密度和計算效率做到更高,將功耗和面積做到更低,同時對帶寬的要求也低很多。
“原來就好比左手做完事情后再把任務交給右手去做,而軟硬件協同的做法就是兩個手一起協作處理。”李建文生動地比喻道。
據他介紹,相比英偉達最新一代主流產品Tesla V100和Tesla T4,登臨科技的產品在更低成本的成熟工藝和縮小芯片50%以上面積的基礎上,將性能提高5-10倍。

與此同時,新創公司在還沒有成長起來之前,直接自己重新創造一套軟件生態是不現實的,因此李建文選擇繼承以英偉達為主體的生態,提供更優的解決方案。
李建文透露,目前登臨科技核心的GPGPU處理器已通過FPGA驗證,第一代產品Goldwasser的設計也已完成,正在進行流片前的全面驗證,該產品計劃在今年年底前可供客戶測試使用。
三、創業公司需看清三個方向
李建文認為,對于新創公司來說,弄清三個方面非常重要:一個是市場,二是技術和產品路線,三是市場和技術方向要與團隊能力相吻合。
首先,AI硬件市場正在飛速發展,這是大家都公認的事情。根據美國研究機構Tractica的報告,到2025年,云端AI芯片市場有望達到146億美元。
這個時候,技術和產品路線的選擇就顯得尤為重要。由于當前AI算法迭代速度還很快,李建文覺得還沒有到研發專用AI芯片冒的風險會比較大,相對而言,通用AI芯片的路線更為穩妥,可行性也更高。
而即便看到了市場的機會,又發現了有潛力的技術和產品方向,還需要具備擅長這一領域的能力。同樣以登臨為例,他們的絕大多數成員都在GPU領域擁有成熟的經驗,并且從軟硬件、IP到SoC均有專業技術能力過硬的從業者,因而具備快速解決問題和研發產品的能力。
此前隨著AI芯片日趨火熱,大批追風者涌入這一市場,然而隨著資本市場趨于冷靜,人們開始質疑這場狂歡的背后是否充斥著泡沫。
對于這一現象,李建文認為市場是有點過熱,有些跳進去的人和資本低估了云端AI處理器的難度,但靠PPT是做不成芯片的,最終的贏家一定是能夠對客戶的想法有較為深刻的理解、做出真正解決客戶核心問題的產品的人。
結語:大規模AI芯片落地潮還未到來
去年可以說國內外科技圈都卷入一場AI芯片的狂潮之中,既有傳統半導體公司和AI芯片創企堅守陣地,又有各路云計算公司、AI算法公司、傳統行業巨頭跨界涌入,爭相宣布自研AI芯片。
他們分別選擇了不同的技術和產品路徑,以滿足數據中心、安防、語音等不同細分應用場景的需求。
根據此前各公司宣布的AI芯片計劃來看,今明兩年國內外將有多家AI芯片公司的產品陸續落地,從底層硬件到適配的解決方案,AI芯片領域的競爭將更加激烈。任何泡沫的破碎都將伴隨著大批創企的消失,但大風吹過后,真正抓住市場剛需和解決客戶問題的創企將會脫穎而出。