芯東西(公眾號:aichip001)
編譯 | ?
高歌
編輯 | ?
江心白

芯東西6月10日消息,今天,賽靈思推出了新的Versal AI Edge系列,這是一款自適應SoC,將主要在汽車、工業和醫療等領域中使用。

相較于其他的SoC,賽靈思Versal AI Edge主要具有三點優勢,分別體現在單位面積功耗性能、計算密度和靈活性上。賽靈思稱,Versal AI Edge的機器學習算力和單位功耗性能都是GPU的4倍,時延也更低。

當前,Versal Edge AI已經向客戶提供了資料,計劃在2021下半年為客戶提供工具,并在2022年上半年提供早期試樣和量產芯片。

賽靈思Versal AI Edge系列高級產品線經理Rehan Tahir分享了Versal AI Edge的具體技術細節,也與芯東西等媒體在會后進行了深度交流。

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge的三大優勢(來源:賽靈思)

一、AI引擎針對機器學習優化,單位功耗性能為GPU的4倍

Rehan Tahir提到,邊緣端設備具有低時延、低功耗、安全保密等特性,可以解決云端薄弱點。據英國市場公司Omdia統計,邊緣AI芯片市場正在迅速擴展,預計將于2025年達到650億美元。屆時,邊緣AI芯片市場將會是數據中心市場的3倍左右。

而賽靈思Versal ACAP產品組合此前主要針對云與網絡領域,并已完成了7nm節點的量產。本次,賽靈思則針對邊緣市場推出了Versal AI Edge,這將在智能視覺、無人機、協作機器人、ADAS與自動駕駛、內窺鏡、超聲等應用中使用。

Rehan Tahir稱,Versal AI Edge采用了AI引擎陣列,與英偉達的Jetson AGX Xavier GPU相比,具有4倍AI單位功耗性能的優勢。這主要是因為賽靈思采用了專為機器學習優化的AI引擎。

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge的AI引擎(來源:賽靈思)

在這款AIE-ML AI引擎中,其乘法器數量翻倍、INT8算力翻倍,原生支持INT4和BFLOAT16。與未經機器學習優化的AI引擎相比,AIE-ML的每顆核心可提供2倍INT8算力,4倍INT4算力和16倍的BFLOAT16算力,時延減半。

在內存方面,AIE-ML的數據內存從32KB提升到64KB,實現了存儲本地化。

此外,賽靈思還提出了新的加速器RAM,該器件可以實現35GB/s的存儲器帶寬,取代了DDR存儲AI計算數據或安全關鍵代碼。與DDR4相比,RAM還可以提升20%的機器學習算力。

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge的加速器RAM細節(來源:賽靈思)

Rehan Tahir提到,Versal AI Edge與英偉達Jetson AGX Xavier同為最優配置的情況下,Versal AI Edge的單位功耗性能是Jetson AGX Xavier的4.4倍。而在其他配置下,Versal AI Edge也占有功耗性能優勢。

談到數據如何得出時,Rehan Tahir補充說:“Jetson AGX Xavier的功率估算數據是由其總模塊功耗減去存儲器和I/O功耗得出的。”

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge與英偉達Jetson AGX Xavier的單位功耗性能對比(來源:賽靈思)

二、單個芯片完成L3級半自動駕駛控制,計算密度達10倍

在具體應用中,相比賽靈思此前的Zynq產品,Versal AI Edge在算力、面積和功耗上都有很大的提升。

相比Zynq,Versal AI Edge的算力從4TOPS提升到了17.4TOPS,也支持8MP(百萬像素)攝像頭。此前需要3個Zynq芯片才能控制的系統,Versal AI Edge只需要單個芯片就能控制,縮小了58%的面積,功耗也有所下降。

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge與上一代SoC的性能對比(來源:賽靈思)

據Rehan Tahir分享,Versal AI Edge可用于ADAS與自動駕駛的各個方面。Versal AI Edge系列能夠令引擎匹配于算法,以標量引擎進行嵌入式計算、人機交互等;自適應引擎則支持汽車的各類傳感器融合;智能AI、DSP引擎則可以進行AI推斷、處理雷達/激光雷達等高級信號等。

目前,Versal AI Edge已通過最高等級的ISO 26262安全認證,也支持Caffe、TensorFlow、PyTorch等多款軟件棧。

另外,在協作機器人和無人機場景中,Versal AI Edge也可以在有限的尺寸、功耗與熱量管理條件下提供所需的AI算例,并支持多種軟件棧。

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge支持汽車、機器人及無人機軟件棧(來源:賽靈思)

三、單架構支持全算力區間, 芯片硬件也可在線更新

在介紹了Versal AI Edge的性能優勢和應用案例后,Rehan Tahir強調,Versal AI Edge是全球最靈活且可擴展的邊緣平臺。他提到,Versal AI Edge采用了特定領域架構(DSA),能夠定制化AI、視覺、傳感器等。

而且Versal AI Edge也是唯一一個支持從0-100+TOPS算力區間的邊緣AI芯片。其他的平臺都在部分算力區間上存在空白,需要多個芯片聯動才能支持全算力區間。Versal AI Edge單一平臺就可以滿足客戶的各類需求,可以使部署更加靈活,并在功耗和成本上更具優勢。

賽靈思推出新邊緣SoC,每瓦特AI性能可達GPU的4倍▲Versal AI Edge可擴展至所有算力區間(來源:賽靈思)

由于當前AI芯片迭代迅速,賽靈思也為Versal AI Edge提供OAT軟硬件更新。Rehan Tahir稱,與一般的軟件、算法更新不同,Versal AI Edge可以對硬件進行在線升級,并重新配置,進一步提升了產品壽命。

Versal AI Edge也具備動態功能切換(DFx),可以在毫秒內切換功能,通過減少系統組件數量,降低功耗和成本。

最后,Rehan Tahir給出了Versal Edge AI的落地進展。因為Versal Edge AI是Versal系列的新產品,所以現在客戶可以使用Versal AI Core ACAP VCK190評估套件進行原型設計,并在之后遷移到Versal AI Edge上。

結語:賽靈思Versal Edge AI抓住邊緣市場關鍵

邊緣AI芯片依靠其安全保密、無需上傳數據等特性,在安防、自動駕駛和智能制造等領域快速發展。在逐漸成熟的邊緣AI市場中,AI算力往往不是設備性能發展的瓶頸。相反,功耗、散熱、成本成為了邊緣設備最核心的問題。

最近,賽靈思針對邊緣市場推出了多款產品。本次推出的Versal Edge AI則主打成本、功耗、可擴展等優勢,抓住了邊緣市場的關鍵。未來,該產品或許會在汽車、工業等領域發揮更大的作用。