智東西(公眾號:zhidxcom)
編輯 | 徐珊

智東西6月11日消息,近日GTIC 2021嵌入式AI創新峰會在北京圓滿收官!在這場全天座無虛席、全網直播觀看人數逾150萬次的產業峰會上,來自產業鏈上下游的16位大佬共聚一堂,圍繞嵌入式AI的軟硬件生態創新、家居AIoT、移動機器人和工業制造產業4大版塊地圖,帶來了深入淺出的分享。

成立于2015年的圖漾科技是我國3D機器視覺領域的新銳玩家。圖漾科技創始人&CEO費浙平以《3D機器視覺在工業制造領域的前景與實踐》為題,分享了圖漾科技在3D機器視覺發展的幾點思考。

圖漾科技費浙平:解讀3D機器視覺商用現狀,嵌入式AI成為破壁關鍵點

▲圖漾科技創始人&CEO費浙平

基于過去的技術積累和市場經驗,費浙平對行業進行了一些分析和展望。從實際落地來看,他認為3D機器視覺是2D機器視覺的補充和延伸,更多的價值在于完成2D機器視覺做不到或做不好的任務。

在他看來,3D機器視覺在消費、安防、工業和商業領域都有許多應用方向,尤其是商業領域的應用潛力巨大。與此同時,費浙平還分享了圖漾科技對當下3D機器視覺市場現狀的內部分析數據,涉及工業自動化、工業檢測、物流科技和商業應用四大垂直領域。

其中,工業檢測是現階段行業3D機器視覺滲透率最高的領域,但也意味著它的增長空間較少;3D機器視覺在物流科技領域還有很大發展潛力,至少有100倍以上的增長空間;而在商業應用場景,3D機器視覺甚至能達到1000倍的增長空間。

費浙平認為,現在3D機器視覺還處于創新產品的創新應用落地階段,擁有100倍的成長空間,但還面臨著傳感器、算法軟件、算力單元三大方向的發展挑戰,而算力單元的最大挑戰是成本。

以下是費浙平演講內容整理:

一、從消費、安防到工業領域,3D機器視覺的應用現狀

3D機器視覺是一個趨勢性的技術,是指在2D的信息之外再引入幾何信息,可以用一個簡單的表述RGB+XYZ。

費浙平認為,從真正實際的價值或者可以落地的地方來看,3D機器視覺一定只是2D機器視覺的延伸和補充。

相比2D機器視覺的便宜與穩定,3D機器視覺的價值在于完成2D機器視覺難以達到的地方,如更強大的識別分析能力。3D機器視覺在消費、智能安防、工業和商業里面都有大量應用方向,商業領域的3D機器視覺應用甚至能超過工業市場成為一個新的巨大藍海市場。

在消費領域里,3D機器視覺的應用的數量仍是少數,盡管有FaceID這樣單一容量比較大的應用,但是從應用場景的豐富程度來看并不普及,而FaceID也不屬于機器視覺的行業,在這里不做討論。

目前在安防領域里面,3D機器視覺更多停留在概念上,還沒有成為可以大規模普及化應用的場景。從技術的價值來看待,3D機器視覺對人做一些行為分析動作理解,將會是智能安防技術領域皇冠上的明珠,是最難且最具有價值的事情,但是從技術角度來看,目前的硬件與軟件技術都不夠成熟。

3D機器視覺在工業領域的應用,由于工業的場景非常多且分散,單一的工業場景體量無法像消費領域的單品有幾十萬、上百萬甚至上千萬的數量。但是,在工業領域里面,可以找到上萬甚至十萬數量級的場景,可應用的數量非常多,總量加起來很可能有上百萬、上千萬。如今,圖漾科技將工業領域作為重點探索的目標場景。

至于商業,很多工業領域的機器人技術和視覺技術可以走出工廠,商場,飯店,酒店甚至家庭應用,3D機器視覺在這個方向的應用具有非常大的想象空間,會逐漸出現很多新的機會與市場。

二、當前出貨量達萬級,物流應用增長空間超百倍

從圖漾的角度,費浙平分享了今天3D機器視覺市場應用的情況。

圖漾科技內部對3D機器視覺市場應用的分析,包含了工業自動化、工業檢測、物流科技和商業應用。

費浙平認為,盡管物流科技在功能上是屬于工業自動化,但由于物流科技本身的產品形態以及巨大的市場空間,它值得從工業自動化劃分出來進行特殊考察。

圖漾科技費浙平:解讀3D機器視覺商用現狀,嵌入式AI成為破壁關鍵點

▲圖漾科技的內部市場分析

如圖所示,在3D機器視覺已有規模化落地的工業自動化、工業檢測、物流科技、商業應用四大垂直系統市場,圖漾科技統計了2020年年度出貨量以及市場空間,說明一下,表格中的數據做了一定的模糊化取整處理。

圖中的價值統計是指核心零部件統計口徑,只計算了相機和核心配套軟件,不包括設備和系統集成的市場價值。這個可能跟市場上有些數據的統計口徑不太一致。

目前3D機器視覺仍是一個全新的技術以及產品在新的場景落地。圖漾科技取得的成果,像在海外市場有較大的出貨量,其價值并不在于進口替代,而是新產品和新技術在新場景里面的全新落地,是一個全新的增量市場。

3D機器視覺的市場空間目前看來是幾十K左右,與2D的工業相機大幾百K的出貨量相比,只有5%——10%。費浙平認為,從增長潛力和增長空間來,在五年左右,工業自動化會有不少于50倍的增長空間。工業檢測是目前在行業滲透率上來講相對比較高的一個機器視覺落地應用,但也意味著它的增長空間小。3D機器視覺在物流科技領域是非常創新的應用落地,物流具有相當大的市場,對3D機器視覺而言是一個巨大的金礦,至少有一百倍以上的增長空間。

在工業自動化領域,與想象中既好看又有用的應用場景不同,早期能夠落地的地方,基本是不太好看但具備真正的使用價值。如機器人配合3D機器視覺,對于重物和大件物體進行搬運、抓取、分撿這些動作。

面對物理世界里面的對象物體,可能有不同的形狀、不同的位置,甚至散亂的放置情況,對于這些物體的分割、定位以及測量需要用到3D機器視覺。在3D機器視覺的引導下,機器人完成看似簡單的分撿抓取動作,這其中的使用價值非常大,在食品飲料、汽車配件、工程機械行業里具有較多的場景應用。

事實上,看似高大上的智能機器人,以及有些AI技術加持的方案真正落地的地方,需要去面對和服務的客戶其使用場景有很多是較惡劣的環境,如煤礦、工程機械等。

圖漾科技費浙平:解讀3D機器視覺商用現狀,嵌入式AI成為破壁關鍵點

▲較惡劣的工況條件

如視頻里大家看到的是一個國內頂尖白色家電的生產線和物流行業的一個自動化叉車場景。大家可以看到里面的工況條件是比較惡劣的,對于機器人和視覺產品的魯棒性要求就特別高,而不是簡單的視覺和算法識別能力而已。

再說說物流行業,我國物流行業占GDP的比例占到16%、17%、18%左右,物流行業是占國家GDP產值最大的行業。費浙平認為,自動化技術、智能視覺技術、AI技術最大的價值就在于,能夠幫助行業降低營運成本,增加生產效率。

物流行業的客戶都有一個共同的目標——少人化。他們追求的目標并不是是無人化黑燈工廠,而是減少10%的勞動力甚至50%的勞動力。達到這樣的目標,就是一個典型的雙贏,客戶會愿意把節省下來的成本分享給提供相應技術升級產品的供應商。圖漾幫助行業客戶實現降本增效,一定能在其中實現圖漾應有的價值。少人化是圖漾在物流行業以及工業場景里面里最大的目標和機會所在。

機器人和智能視覺在商業里面的3D機器視覺應用,是把原來在工廠生產車間里面的設備或者技術經過跟應用場景結合移植包裝優化之后,成為適合商業化場景應用的設備,典型的例子比如包含像咖啡店、餐館甚至酒店的一些工作任務。

商業場景里面的3D機器視覺應用,與工業場景無論在視覺還是機器人形態上面可能會有所不同,比如機器人的形態可能不再是工業機器人或人形機器人。

協作機器人可能是早期落地機器人的一種形態,比如六軸機器人,雖然工作距離不遠,雖然力氣不大,但是它的動作非常靈活,可以替代人工在視覺識別和引導下面實現原來需要人來執行的一些動作。

協作機器人的配合需要與之相匹配的3D機器視覺技術,將來在商業化的場景里面應用空間會非常非常大,甚至不排除將來每個家庭里擁有能夠幫助完成一些特定家務動作的機器人。從餐飲、酒店、商場、一直到家庭都有商業化的智能視覺加上自動化機器人的應用需求。

基于這樣的場景假設,也許可以理解之前提到的商業3D機器視覺有一千倍的增長空間,這個基數將來可能會是每多少人擁有一套機器人系統。

費浙平認為,盡管3D機器視覺還只是一個小小的蛋糕,但會有一百倍以上的增長空間。他提到,今天成熟的技術和產品,有更多的場景可以復制,比如工業自動化領域落地最多的目前是食品飲料、工程機械、汽車配件市場,后續還有大量的白色家電、黑色家電、家具等各行各業應用。這類場景所需的技術相對成熟,但是場景需要擴展的。

另外一個緯度,以前面提到的商業場景和智能安防為例,它們在技術上還不夠成熟,但是通過技術持續不斷進步,就能夠解鎖更多的場景產生。

圖漾科技費浙平:解讀3D機器視覺商用現狀,嵌入式AI成為破壁關鍵點

▲一百倍成長空間

所以如圖中所示看著兩個維度,橫向有十倍以上的增長空間,縱向也有十倍以上的增長空間,所以,一百倍的成長空間并不夸張。

三、加速應用普及,需重點考察三大挑戰

3D機器視覺的挑戰重點考察的三個部分:第一,傳感器,就是圖漾做的3D工業相機;第二,軟件和算法,3D機器視覺結合深度學習是較為前沿的領域;第三,算力單元,算力單元要解決的最大問題在于成本,如今的算力單元如果不計成本地連接云、服務器、以及獨立顯卡,3D機器視覺需要的算力基本能運行,但基于現實出發,這顯然不能支撐3D機器視覺應用大規模普及化落地。

談及算力單元,費浙平首先分析了3D機器視覺的系統架構,最前端的傳感器就是2D的圖像傳感器,無論用紅外光作為輸入還是RGB輸入,2D數據進來結合一些特定的光學方法得到特殊的圖像,通過算法計算得出3D深度數據。

由3D相機完成的從多路2D數據算出3D距離和尺寸信息,這部分的計算和算法實現是比較標準化的算法套路,它的算力單元基本不會是GPU,也不會是CPU,圖漾更加偏向用FPGA。當應用算法特別前沿,只有少數特殊客戶愿意支付特別高的成本,不計成本實現最高精度的設備和產品,圖漾才會用到GPU,做普及化的標準產品的話,FPGA是非常舒服也是性價比非常高的算力承載單元。

當基于3D數據和2D數據做具體應用的時候,會涉及很多上層的應用算法,其中既有傳統算法,也有大量的機器人學習應用,目前很多場景采用機器學習的方法效果很好。這些上層應用軟件的算力承載單元一定是通用可編程的,如GPU、CPU,不太可能是FPGA。

圖漾科技費浙平:解讀3D機器視覺商用現狀,嵌入式AI成為破壁關鍵點

▲數據流動路徑

通過數據流動的路徑來看,不同的數據轉換過程需要不同的芯片。首先,從物理世界得到2D信息,一定是圖像傳感器(Image Sensor),這是2D點數據的獲取。

應用3D數據做應用場景一定是應用處理器(Application Processors)承擔的,計算之后,如果是工業檢測類的應用,任務就已完成,部分其他場景如AR/VR或是電視等應用,還需要將3D的模型和數據在2D顯示平面上輸出。這個3D轉2D的過程是由GPU完成的。

圖漾科技一直致力于實現從2D數據又快又好地算出3D數據的任務,也就是Depth Engine這個環節,從架構上來看,這正好是GPU的一種對稱。GPU實現的功能就是3D到2D,Depth Engine做的事情是從2D到3D。從2D到3D的過程,基本是由3D相機在本地完成,為了達到低延時、高幀率和速度的目標,3D工業相機應該使用專用硬件計算單元。

在承載應用層算法的應用處理器這個算力單元,3D機器視覺對嵌入式的AI有可預見的強烈需求。圖漾科技從某種程度上更像一個系統產品設計者,希望使用業界里面性能夠用、性價比最高的嵌入式芯片,來完成最有競爭力和性價比的3D相機產品。

目前AI的計算成本太高是一個痛點。由于如今的高階算法,尤其跟深度學習相關的算法,太多的軟件資源建立在英偉達的CUDA生態上。雖然目前的多數CPU都有浮點、DSP的向量擴展,但是對支持機器學習算力仍然不夠。

目前圖漾科技并不需要云計算之類的高要求算力,但很希望能在本地實現合理規模的主流NN網絡,這就需要嵌入式AI芯片,這類芯片中應該有合適規模的嵌入式CPU、GPU,有算力合適、價格合適的NN加速器,以集成的SoC形式呈現。

費浙平認為,嵌入式AI的出現,對于行業帶動,無論工業自動化、工業測量、物流科技、商業場景的3D機器視覺落地都會是極大的推動。

以上是費浙平演講內容的完整整理。