芯東西(ID:aichip001)
編 | 韋世瑋

芯東西2月21日消息,據EE Times報道,EE Times正在對美國、歐洲和亞洲共約60家AI芯片創企進行研究,其中既包括重新設計可編程邏輯和多核設計的公司,也有自研全新體系架構的公司,以及使用神經擬態(類腦)和光學計算等未來技術的芯片公司等。

隨著神經網絡技術的不斷發展,業界對加速AI性能的需求越來越高,世界各地亦涌現出了大量的AI芯片創企,持續研發不同的芯片技術。與此同時,這一行業的爆發也吸引了大量的風險投資資金,從而使行業擁有了研發新型計算架構,以及開拓新技術方向的資本。

基于此,EE Times從這來自三大洲的60家AI芯片公司中,選出了最具代表性和發展潛力的十家。根據這些公司產品的定位和應用范圍,主要被用在數據中心、終端和AIoT設備這三大領域。以下內容基于EE Times對這十家芯片創企的介紹編譯:

一、數據中心:邊緣計算應用廣泛

若根據應用范圍劃分,數據中心也屬于邊緣計算技術的應用領域之一。

什么是邊緣計算?它主要在和生成或收集數據相同的位置(或附近)處理數據,涉及網關或集線器設備,以及可加速單個AI應用程序的本地服務器。

從應用上看,數據中心的服務器還能夠用來加速醫院或醫學研究機構中,X射線或CT掃描的圖像分類,或者是從工廠車間接收狀態數據并進行處理。

1、Graphcore

總部位于英國布里斯托爾的Graphcore一直受到行業關注。在早期一輪融資中,該公司的估值就已超過10億美元,成為西方首批AI芯片獨角獸之一。

性能方面,該公司的IPU(智能處理單元)芯片擁有大規模并行架構,具有1200多個專用內核,每個內核可運行6個程序線程。

與此同時,它還有大量的片上存儲器、數百兆的隨機存取存儲器(RAM),以及45 TB存儲器帶寬,能夠讓整個機器學習模型存儲在芯片上。

此外,Graphcore的IPU芯片還可用于戴爾服務器中的邊緣計算應用程序。

外媒眼中的10大AI芯片創企!寒武紀、地平線在列

▲Graphcore的IPU芯片

2、Groq

Groq由谷歌原TPU核心團隊的8名成員成立,目前該公司已擁有70名員工,并籌集了6700萬美元資金。

去年,Groq曾發布一款1000 TOPS的芯片架構,專門針對計算機視覺、機器學習和其他AI相關工作負載的性能需求而設計。同時,它的張量流處理器(TSP)主要面向數據中心應用和自動駕駛汽車領域。現階段,該器件已在PCIe板上采樣。

除此之外,該公司還堅持“以軟件為先”,其編譯器能處理硬件中的控制功能,例如執行計劃等。Groq的軟件還可精心編排所有數據流和所需時序,以確保計算不會出現停頓,并在編譯時完全可預測延遲、性能和功耗。

3、Cerebras

Cerebras以重振晶圓級芯片計劃而知名,該計劃曾在1980年代被半導體行業所放棄。

該公司研發了一塊面積約為46225平方毫米的巨大芯片,將40萬個內核與18 GB內存封裝在84個處理器塊上,能耗達到15 kW。

雖然這些參數看起來過于龐大,但實際上,Cerebras研發這一芯片的目的是用它來替代數千個GPU的工作。

該公司表示,他們已經解決了以往困擾晶圓級設計的問題,例如良率(繞缺陷走線),并研發了可以抵抗熱效應的封裝技術。

資金方面,目前Cerebras已經籌集超過2億美元的資金。與此同時,該公司還透露,他們的機架系統已在少數客戶的數據中心里開始運行。

外媒眼中的10大AI芯片創企!寒武紀、地平線在列

▲Cerebras的巨型芯片

4、寒武紀

寒武紀是中國最早的AI芯片創企之一,2016年脫胎于中國科學院,由同樣出身于中國科學院的兩兄弟創立。

寒武紀認為,CPU和通用GPU(GPGPU)指令集在加速神經網絡方面缺乏敏捷性,因此他們開發了自己的指令集架構(ISA)。這是一種集成了標量、矢量、矩陣、邏輯和數據的負載存儲架構,還擁有傳輸和控制指令。

寒武紀的第一個產品Cambricon-1A主要面向智能手機和其他終端設備,如無人機和可穿戴設備。此外,寒武紀還發布了邊緣計算芯片思元220,性能為8 TOPS、能耗為10 W,進一步填補該公司在邊緣計算產品中的空白。

目前,寒武紀是全球最有價值的AI芯片創企之一,至今已籌集2億美元資金,市場估值達到25億美元。

二、終端應用:計算機視覺與自動駕駛為主

“終端”是指網絡末端的設備,其收集和處理數據都在同一設備內部。終端的產品范圍包括安防攝像機、消費電子產品和家用電器等,以及自動駕駛汽車和智能手機等某些可用作網關或端點的設備。

1、Hailo

Hailo成立于2017年,由以色列國防軍精銳情報部門的前任成員在以色列特拉維夫成立。目前,該公司擁有約60名員工,已籌集了2100萬美元資金。

據悉,該公司的AI協處理器Hailo-8性能為26 TOPS,能效為2.8 TOPS/W,主要面向ADAS(高級駕駛員輔助系統)和自動駕駛應用而設計。

從結構上看,它混合了內存、控制和計算模塊,并通過軟件分配相鄰的模塊來計算神經網絡的每一層。同時,Hailo-8芯片將于2020年上半年開始實現量產。

外媒眼中的10大AI芯片創企!寒武紀、地平線在列

▲Hailo的AI協處理器Hailo-8

2、耐能(Kneron)

耐能成立于2015年,總部位于美國圣地亞哥。目前,該公司在圣地亞哥和臺灣地區共擁有員工150名,已獲資金7300萬美元。

據了解,耐能的第一代KL520芯片已被幾家公司宣布使用,其2019年也實現了數百萬美元的營收成績。

性能方面,KL520芯片還針對卷積神經網絡(CNN)進行了優化,在0.5W(相當于0.6 TOPS/W)下運行的性能為0.3 TOPS。同時,它還能應用于IP安防攝像機中的面部識別、智能門鎖和門鈴。

耐能表示,他們已開始研發用于人臉識別的神經網絡,并將它和IP一同用來開發神經處理單元(NPU)。與此同時,該公司的第二代芯片將于2020年夏天上市,能夠加速CNN和遞歸神經網絡(RNN)。

外媒眼中的10大AI芯片創企!寒武紀、地平線在列

▲耐能的KL720芯片

3、Mythic

Mythic在2012年密歇根大學成立,如今位于得克薩斯州奧斯汀市。現階段,Mythic已籌集了8600萬美元資金,將用于開發模擬計算芯片。

該芯片基本采用基于閃存晶體管的內存處理器技術,與CPU和GPU相比,Mythic的芯片在功耗、性能和成本方面均有優勢。

實際上,內存處理器并不是什么新鮮事物。但Mythic表示,他們已經研發出一種補償和校準技術,能夠消除噪聲并實現可靠的8位計算。

此外,Mythic計劃出售獨立芯片以及多芯片處理卡。由于該設備可以處理30 FPS的高清視頻圖像,因此Mythic的主要目標市場之一是安防攝像機,以及用于安防攝像機系統的本地聚合器。

值得一提的是,Mythic的CEO Mike Henry在今年的CES 2020上表示,其芯片將很快進入采樣階段。

4、地平線

地平線成立于2015年,目前已經擁有500多名員工,專利超600項。截止2019年底,該公司已籌集6億美元資金,市場估值高達30億美元。

地平線的大腦處理單元(BPU)最初是為計算機視覺應用而設計,其第二代BPU擁有64位多指令多數據(MIMD)內核,能處理所有類型的神經網絡,還可通過稀疏神經網絡來預測目標的運動和場景解析。

據了解,地平線的第三代BPU將為決策算法、深度學習之外的AI提升加速性能。

目前,地平線擁有兩條產品線,分別是面向自動駕駛領域的征程系列,以及面向AIoT領域的旭日系列。

第一代征程和旭日系列處理器于2017年12月推出,第二代基于BPU 2.0的芯片也在2019年發布。據稱,征程2.0芯片在2 W功率下能夠提供4 TOPS的L3/L4自動駕駛性能,并結合了地平線自身的感知算法,實現90%的核心利用率。

外媒眼中的10大AI芯片創企!寒武紀、地平線在列

▲地平線的征程處理器

三、物聯網:AI推理性能與低功耗需求高

這一類別的劃分包括具有微控制器計算級別的芯片,它們能夠在資源受限的環境中以超低功耗運行。

在這一情況下,終端設備上的AI推理性能就顯得十分重要,因為它不僅能降低延遲、節省帶寬、幫助保護隱私,同時還能節省數據到云射頻(RF)傳輸過程中的能耗。

1、GreenWaves

GreenWaves成立于2014年,總部位于法國格勒諾布爾,是RISC-V開源生態中最早的芯片供應商之一。

該公司在一個超低功耗機器學習應用處理器中,使用了多個RISC-V內核,用于電池供電的傳感設備。此外,GreenWaves還依賴其自定義指令集擴展,以方便DSP操作和實現AI加速的最低功耗。

GreenWaves的第二代產品GAP9使用了10個RISC-V內核。其中,一個內核用作結構控制器,剩余九個內核則組成了計算機群,控制器和集群位于單獨的電壓和頻域,因此它們僅在必要時才消耗功率。

同時,該芯片還采用了最先進的FD-SOI工藝技術,以進一步降低功耗。

據GreenWaves提供的數據,GAP9在160×160幅圖像上運行預訓練模型MobileNet V1時,通道縮放比例為0.25,僅需12ms。

2、Eta Compute

Eta Compute成立于2015年,在美國和印度共擁有35名員工。目前,該公司已籌集1900萬美元資金,產品已進入樣品階段。

Eta Compute為超低功耗物聯網設備中的AI處理設計了兩個核心,分別為Arm Cortex-M3微控制器內核和一個DSP微處理器。

據了解,這兩個核心均使用了Eta Compute的動態電壓和頻率縮放技術,以盡可能低的功率水平運行,而無需使用鎖相環(PLL)。

其AI工作負載在軟件的分配下,還可在一個或兩個核心上運行。同時,該技術能夠以100μW的功率預算,將圖像處理和傳感器融合。

此外,Eta Compute還針對在ECM3532器件上運行的超低功耗應用,對神經網絡進行了優化。

文章來源:EE Times