機器人前瞻(公眾號:robot_pro)
作者?|??許麗思
編輯?|??漠影
“在生物進化中,越晚出現的器官越容易模擬,越早出現的反而越難。”他山科技聯合創始人兼CEO馬揚在不久前接受機器(qi)人(ren)前瞻的采訪(fang)時提到。
觸覺(jue),正是(shi)這(zhe)一規(gui)律(lv)的(de)(de)典型例證(zheng) —— 作(zuo)為生物演(yan)化最早形成的(de)(de)感官能力之一,其復雜機制(zhi)至今仍是(shi)機器(qi)人領域的(de)(de) “卡脖子(zi)” 難題(ti)。
早在20億年(nian)前(qian),原始(shi)單細(xi)胞生物就(jiu)能夠通過(guo)細(xi)胞膜表面(mian)的受體感知周圍化學物質(zhi)濃度梯(ti)度,并做(zuo)出趨利避害(hai)的運動反應。
這(zhe)種原始的(de)觸(chu)覺機制經過(guo)漫長演化(hua),在人類指尖形成了包含(han)皮膚、肌肉、神經末梢的(de)精密系統,讓(rang)人類既能通過(guo)三維力的(de)變化(hua)感(gan)知到物體形狀(zhuang)、紋(wen)理(li),也(ye)可以完成一(yi)系列(lie)精細(xi)化(hua)操作。
當人工智能技術的飛速迭代推動著機器人的腦端等多方面能力快速提升,相比之下,觸覺感知能力卻依然面臨重重難關:要突破從底(di)層芯片到傳(chuan)感器結構等全鏈條技術瓶頸,解(jie)決多維度信號融(rong)合、抗干擾(rao)設(she)計與實時(shi)閉(bi)環控制(zhi)等復雜挑戰。
▲他山科技聯合創始人(ren)兼CEO馬揚
馬揚(yang)的(de)創業之旅(lv),正是始于對這一現狀的(de)洞見。
2004年,他從北京航空航天大學畢業后,曾進入了比亞迪工作。按部就班的職業軌跡,在馬揚接觸到一項名為ECT(電容層析成(cheng)像)的技術時悄然轉向。
當(dang)時(shi),他加入了他山(shan)科(ke)技(ji)董(dong)事長孫(sun)滕(teng)諶創辦的一(yi)家科(ke)技(ji)公司,這項(xiang)ECT技(ji)術是由曼徹(che)斯特(te)大學楊五強教(jiao)授(shou)研發的,可(ke)用于石油管(guan)道檢測(ce),展(zhan)現出通過電容信(xin)號解析(xi)材質的潛力,為后續觸(chu)覺研發埋下伏(fu)筆。
時間來到2017年,國內機器人產業風起云涌。馬揚認為,機器人若想真正走向工廠、商場、家庭等,成為人類的得力助手,指尖的觸覺閉環能力是不可或缺的一塊拼圖。而當時,市面上沒有一(yi)家企業能(neng)做出可以放進去指(zhi)尖的觸覺感知芯片。
于(yu)是(shi),馬揚與孫滕諶、楊五強一拍即合,共(gong)同創辦了北京他山科技有限公司,專注(zhu)于(yu)人工智能觸(chu)覺(jue)傳(chuan)感領域。
創業(ye)之(zhi)初,團隊(dui)不得不面(mian)對(dui)市場對(dui)觸(chu)覺感知的(de)認知有限(xian)、需求基本不多的(de)窘境(jing)。機器人(ren)產業(ye)的(de)產品(pin)落地至少需要(yao)3到(dao)5年,他們決(jue)定先將底層觸(chu)覺技術嫁接到(dao)家(jia)電、汽車等成(cheng)熟行業(ye),尋找生存與驗證(zheng)的(de)土壤。
轉機就在跨界合作(zuo)(zuo)中(zhong)出現:他山科技和奔馳、寶馬(ma)等全球知名車(che)企合作(zuo)(zuo),為(wei)其打造汽(qi)車(che)上的智能感知系統,業(ye)(ye)務在海外市(shi)場逐漸有了起色。直(zhi)到(dao)疫(yi)情突襲,海外B端業(ye)(ye)務遭重創,他山科技調頭在國內(nei)的汽(qi)車(che)智能交互、酒(jiu)店配送機器人等場景中(zhong)尋找突破口(kou)。
2019年(nian),他山(shan)科(ke)技的第(di)一款觸覺(jue)感(gan)知芯片作為北京市重點合(he)作項(xiang)(xiang)目立項(xiang)(xiang)研發(fa)。經過多(duo)年(nian)技術攻關,終于(yu)在2022年(nian)成功一次流片、一次點亮。
這是全球首款人工智能觸覺傳感芯片,搭載(zai)了團(tuan)隊基于R-SpiNNaker分布式類(lei)腦架構下(xia)的AI觸覺傳感技(ji)術,可(ke)同(tong)步處(chu)理指尖(jian)多(duo)維觸覺信號,其核心性(xing)能超(chao)越國(guo)外頭部(bu)廠商(shang)同(tong)類(lei)產品,能夠滿足機器人在精(jing)細操作過程中高精(jing)度、低延遲(chi)的觸覺需求。
他山科技提出了“感控一體”的(de)概念,將觸覺(jue)感知和執行控制進(jin)行了深度融合,用(yong)觸覺(jue)來(lai)牽(qian)引(yin)動作控制,這(zhe)是與傳統觸覺(jue)傳感器(qi)截然不同的(de)技術路(lu)徑。
不(bu)久前,他山(shan)科技還在 IEEE 國際機(ji)器人(ren)與自動化大(da)會(ICRA 2025)上展(zhan)示了自研的人(ren)工智能觸覺傳(chuan)感(gan)器,通(tong)過(guo)模擬(ni)人(ren)類指尖的觸覺功能,讓機(ji)器人(ren)精準完(wan)成“抓取-移動-遞交”任務。
▲ICRA展會現場,他山(shan)科技觸覺感知方案精準完成抓取-移送-遞交
隨著具身智能的爆發式發展,團隊多年以來對觸覺技術的探索終于等來了開花結果的時刻。目前,國內70%以上的(de)機器(qi)人整機及(ji)靈巧(qiao)手(shou)廠商、共超60余(yu)家機器(qi)人產業鏈公司都采用了(le)他山(shan)的(de)觸覺解決方案。
他山科技(ji)正逐漸從單(dan)一的觸覺硬件產品供應商(shang)轉向整(zheng)體觸覺解決方案提供商(shang)——不(bu)僅涵(han)蓋物理端的方案,還將在仿真端開發配套模型,幫助客戶完成線下與線上(shang)的訓練。
成立至(zhi)今(jin),他山科(ke)技已完(wan)成四輪(lun)融資(zi),投資(zi)方包括軟銀、國(guo)新(xin)、新(xin)鼎等。
一、從電容技術切入,造出全球首款AI觸覺感知芯片
機器人前瞻:他山科技成立之前就已經有十幾年的技術積累,具體在哪些方面?
馬揚:他山科技的傳感技術起源于曼徹斯特大學的楊五強教授,他在2000年左右研發了一項ECT 技(ji)術,就是用電(dian)(dian)容進行層析(xi)成像,簡單(dan)來(lai)說可以(yi)用電(dian)(dian)容技術(shu)來(lai)實(shi)現類似 CT 技術(shu)能做到的(de)效(xiao)果。這項技術(shu)最早應用于石油(you)行業(ye),在石油(you)管道(dao)外(wai)壁安裝電(dian)(dian)容傳(chuan)感器,可以(yi)實(shi)時探測(ce)石油(you)管道(dao)橫截面的(de)油(you)水氣分(fen)布。這在當時是非(fei)常劃時代的(de)技術(shu),在海(hai)內(nei)外(wai)都得到了廣泛應用。
2007-2008 年,我們(men)關注到有企業機構開始(shi)研(yan)究機器人抓取物體、識別材(cai)質,就(jiu)與楊五(wu)強(qiang)教授(shou)合(he)作開發相關項目。最初,我們(men)用電容傳感器來區分不同材(cai)質,比如塑料(liao)杯(bei)、玻璃杯(bei)、裝(zhuang)水(shui)的塑料(liao)杯(bei)等,這(zhe)些材(cai)質是視覺難(nan)以(yi)區分的,但觸覺可以(yi)。
2014-2015 年,隨著機器(qi)(qi)人任(ren)務執行(xing)需(xu)求提升,我(wo)(wo)們(men)開始將傳感器(qi)(qi)布(bu)置在(zai)夾爪上,進行(xing)大量(liang)抓握實踐。早(zao)期,夾爪在(zai)工(gong)業(ye)產線上的應用(yong)往(wang)往(wang)只能(neng)抓取(qu)剛性物體(ti),而(er)不具備柔性物體(ti)操作能(neng)力。因(yin)此我(wo)(wo)們(men)持(chi)續研(yan)究柔性抓取(qu),并(bing)開始構(gou)思硬件(jian)產品,最終在(zai) 2017 年成立(li)了他山科技。
機器人前瞻:從2017 年到現在,他山科技經歷了怎樣的不同發展階段?
馬揚:主要從研發端和商務端進行劃分。2022 年是研發端的分水嶺,我們完成了全球首款人工智能觸覺感知芯片。這個“全球首款”并非由(you)我們(men)自己(ji)定義,而是由(you)北京市科委進行(xing)充分調研、匯總材料比較后確認的成果。基于這款芯片,后續(xu)我們(men)將開發更多應用層技術,拓展不同場景的落地可能。
最(zui)近兩(liang)年(nian)(nian),研(yan)發(fa)與(yu)商業化(hua)的聯系(xi)越(yue)來(lai)越(yue)緊(jin)密了(le)(le)。2024 年(nian)(nian)初,機器人與(yu)具身(shen)智能的火爆,讓我們多年(nian)(nian)的研(yan)發(fa)積(ji)累迎(ying)來(lai)了(le)(le)開花結果的時刻(ke),也是技術(shu)逐(zhu)漸產業化(hua)落地的關(guan)鍵(jian)時期(qi)。
機器人前瞻:相較于市面上眾多從事觸覺傳感的企業,他山的技術路線主要是怎樣的?
馬揚:我(wo)們在(zai)觸覺領域已(yi)深(shen)耕 8 年,可以(yi)說是細(xi)分賽道(dao)上(shang)最資深(shen)的觸覺企(qi)業之一。我(wo)們的方向是從底層算法到硬件,再到模型,最后到傳感器(qi)結構,由下而上(shang)實現(xian)。
許多傳感器廠商是基于力傳感性能好的材料來開發產品,而我們的核心差異在于專(zhuan)注(zhu)芯片(pian)與底層,幫助不同材料廠商(shang)解決(jue)傳感端需(xu)求,也向行(xing)業內電子皮膚(fu)廠商(shang)提(ti)供底層(ceng)芯片和算法。
人(ren)(ren)形機器(qi)人(ren)(ren)發展剛起步,是(shi)(shi)未(wei)來(lai)5-10年最篤定(ding)的方向。我堅信,機器(qi)人(ren)(ren)尤其是(shi)(shi)服務型機器(qi)人(ren)(ren)將(jiang)走進家庭,如同車輛(liang)、手機般普及(ji)。
機器人前瞻:目前他山科技整體團隊規模如何?
馬揚:目前(qian)非(fei)產線的員工大約 130 人左右,其中70%以上是(shi)研(yan)發人員。
▲他山科(ke)技在(zai)ICRA展會展示TS-V視觸融合技術平(ping)臺
二、從汽車領域開始落地,客戶已覆蓋國內八成機器人廠商
機器人前瞻:觸覺傳感器之前已經被列入國內35項目“卡脖子”技術里,具體是難在哪些地方呢?
馬揚:不止國內,觸覺感知技術對整個機器人(ren)行(xing)業來(lai)說,都是比(bi)較“卡脖子”的技術,我們已突破多個技術瓶頸。
前兩天我在參會的時候,聽一位院士提到,研發機器人時發現:生物進化中越晚出現的器官越易模擬,越早進化的器官越難。
例如大腦(nao),我們通過腦(nao)端芯片已實(shi)現與(yu)人腦(nao)相似的計算(suan)能力,甚至在歸納能力上(shang)可能超越人類,并初步具備演繹(yi)能力。但相反,觸覺作為生物進化早期就形成(cheng)的感(gan)官能力,模擬難度極(ji)大。
觸(chu)(chu)覺是生物體在演化初期就具(ju)備(bei)的(de)基(ji)礎能(neng)力(li),人類觸(chu)(chu)覺系統的(de)復雜性(xing)遠超想象,觸(chu)(chu)覺前端具(ju)有精(jing)密(mi)的(de)神經元網絡和突觸(chu)(chu)自適應機制(zhi),全身皮(pi)膚的(de)結構(gou)與功能(neng)也都各不相同,比如指尖的(de)皮(pi)膚主要(yao)用于抓取,要(yao)實現三(san)維(wei)力(li)的(de)精(jing)準識別(bie)和精(jing)準控制(zhi)。
業內經常以 “電子皮膚” 來描述機器人的觸覺感知系統,這一概念適用于機器人軀體的觸覺覆蓋,但指尖的功能實現遠不止于皮膚層面。就像人類指尖因頻繁使用而產生的老繭,其實說明了抓握動作的核心并非依賴皮膚,而是指尖下方的肌肉結構,以及底層神經、神經元和突觸共同完成。
所以,我們提供的指(zhi)尖產(chan)(chan)品是(shi)一個(ge)(ge)完整的指(zhi)尖單(dan)元。它不僅需(xu)要完成(cheng)感知,而且是(shi)所有感知器官(guan)中唯一一個(ge)(ge)需(xu)要與客觀世(shi)界產(chan)(chan)生實質交互并控制物體的。大腦僅發(fa)送(song)指(zhi)令,實際控制更(geng)依賴整個(ge)(ge)指(zhi)尖前端的結構。
雖然我們的(de)產(chan)品距離人(ren)類指尖(jian)還有一定的(de)距離,但是(shi)已經(jing)突破了觸覺傳感器(qi)的(de)核心瓶頸(jing)。接下來,我們會建(jian)立更多泛化數(shu)據庫,逐步通過(guo)模型將產(chan)品及底層(ceng)算法進行迭代,最終希望它能具備媲美人(ren)類指尖(jian)的(de)能力。
機器人前瞻:他山科技花費4到5年才制作出全球首款人工智能觸覺感知芯片,在研發過程中最具挑戰性的是什么?
馬揚:我們(men)需(xu)要(yao)完成芯片(pian)從0到1的研發,這與常規國產替(ti)代路徑不同,沒有參(can)考范本。
我(wo)們(men)先打造了24位的高精度模數(shu)(shu)轉換模塊,在(zai)芯(xin)片上集成了32個通道,這在(zai)傳(chuan)統工業芯(xin)片中從未有過(guo)先例,芯(xin)片性能(neng)已經超越同類產(chan)品。其(qi)次,我(wo)們(men)需要將(jiang)模數(shu)(shu)轉換部(bu)分(fen)與底層的系統架構相結合(he),同時還設(she)計(ji)開發(fa)了類腦控制單(dan)元(yuan),模數(shu)(shu)的Dual Router,負責數(shu)(shu)據(ju)的自主分(fen)發(fa),從而支持神經網絡模型在(zai)多芯(xin)片上的分(fen)布式部(bu)署和協(xie)同計(ji)算。
視覺(jue)數據(ju)通過雙目(mu)采(cai)集后可直接傳輸至腦(nao)端(duan)(duan)芯(xin)片,而觸(chu)覺(jue)端(duan)(duan)有上百個(ge)傳感單元(yuan)(yuan),需(xu)要(yao)更多(duo)芯(xin)片支持,以及這些芯(xin)片作(zuo)(zuo)為一個(ge)系(xi)統的協同(tong)工作(zuo)(zuo)。如完成抓握動作(zuo)(zuo)時(shi),就需(xu)要(yao)協同(tong)整手觸(chu)覺(jue)單元(yuan)(yuan)。
芯片要在分布式模式下協(xie)同工(gong)作,誰來協(xie)調指揮?Router就像(xiang)是項(xiang)目中(zhong)的平行成員,這樣每個節點均可輸(shu)出指令,自主分發數(shu)據(ju)至其他芯片,實現網絡中(zhong)數(shu)據(ju)的有效(xiao)交互,組建(jian)整(zheng)體感知(zhi)和(he)計(ji)算網絡。
這幾(ji)大部分(fen)的(de)整合,都極具挑戰性。芯(xin)(xin)片項目(mu)作(zuo)為2019年北京市9個重(zhong)點(dian)合作(zuo)項目(mu)中唯(wei)一(yi)由民營企業承擔(dan)的(de)課題,我們在2022年實現了芯(xin)(xin)片一(yi)次(ci)流片、一(yi)次(ci)點(dian)亮(liang)。
機器人前瞻:公司產品最初落地在什么領域?
馬揚:他山(shan)科技的觸覺(jue)感知技術產品率先在汽(qi)車(che)領域落地,第一個項目是奔馳。當時(shi),我(wo)們在奔馳汽(qi)車(che)的儀表臺面上通(tong)過(guo)一顆(ke)芯片(pian)和一個傳感器,實現(xian)了人手識別(bie)(bie)功(gong)能(neng):從10厘米之(zhi)外的揮(hui)手交互,到(dao)2厘米距離的懸停識別(bie)(bie),再到(dao)接(jie)觸后(hou)的滑動(dong)和按(an)壓動(dong)作。
此外,系(xi)統(tong)還可(ke)以精準識(shi)別出(chu)人(ren)手(shou)(shou)和(he)手(shou)(shou)機(ji),比(bi)如把手(shou)(shou)放在儀表臺(tai)面上能識(shi)別出(chu)來是(shi)人(ren)手(shou)(shou),放上手(shou)(shou)機(ji)也能識(shi)別出(chu)這是(shi)手(shou)(shou)機(ji),進而將手(shou)(shou)機(ji)與車機(ji)打通(tong)實現互(hu)聯(lian)。
當時(shi)這個項目(mu)做得(de)很成(cheng)功,2018年我(wo)(wo)們(men)(men)還在德國(guo)獲獎了。2019年,我(wo)(wo)們(men)(men)接了寶(bao)馬(ma)一個項目(mu)。緊接著,我(wo)(wo)們(men)(men)的業務拓展到(dao)車(che)內車(che)外的傳感器領域,逐(zhu)漸從PVC項目(mu)邁向量產階(jie)段。
機器人前瞻:最開始像奔馳這樣的客戶是在怎樣的機緣下接洽上的?
馬(ma)揚(yang):2018 年,奔(ben)馳在(zai)國內(nei)(nei)啟動了一個面向創新型企(qi)業的新項目(mu),需要優化車(che)(che)內(nei)(nei)交(jiao)(jiao)互(hu)方案——原有的視(shi)(shi)覺(jue)解決方案雖(sui)能通過(guo)揮手動作識(shi)別(bie)實現交(jiao)(jiao)互(hu)操(cao)作,但存在(zai)兩大問(wen)題(ti):一是(shi)(shi)車(che)(che)輛行駛時的震(zhen)動環境(jing)易導致視(shi)(shi)覺(jue)動作識(shi)別(bie)誤操(cao)作;二是(shi)(shi)車(che)(che)內(nei)(nei)作為隱私(si)空間,用(yong)戶很可能并(bing)不希望部署高清視(shi)(shi)覺(jue)傳感器。
因此,奔馳尋求一種既(ji)能實現非接(jie)觸操(cao)作、又(you)能覆(fu)蓋接(jie)觸操(cao)作的觸覺交(jiao)互(hu)方案(an)。而我們團隊在2015-2016年已經將相關(guan)技術應(ying)用于一些在歐洲的項目,后來奔馳就找(zhao)到我們,希(xi)望(wang)能夠進行合作。
機器人前瞻:他山科技在人形機器人方面已經和國內哪些企業達成合作?
馬揚:我們服務的客戶,目前已經覆蓋國內70%以上的機(ji)器人(ren)廠(chang)商(shang)。而在國(guo)內70多(duo)家(jia)機(ji)器人(ren)產業鏈核心公司(si)中,已經(jing)有 60 多(duo)家(jia)客(ke)戶采用了(le)我(wo)們的產品(pin);國(guo)內最頭部的靈(ling)巧手(shou)廠(chang)商(shang),都已經(jing)和我(wo)們建立了(le)深度(du)合作關系。
三、人形機器人落地,現階段降本尚在探索中
機器人前瞻:人形機器人想要真正走入千家萬戶和場景,降本是非常關鍵的一環。您覺得人形機器人現在到了討論降本的時候嗎?
馬(ma)揚:從發展階段來看,全面降本(ben)的(de)時機尚未完全成熟,但(dan)從智能體(ti)技術(shu)迭代的(de)角(jiao)度,對(dui)降本(ben)的(de)探索其(qi)實一直(zhi)在(zai)進行(xing)。當我(wo)們在(zai)討論智能體(ti)或者機器人(ren)時,核心依舊是他們解(jie)決人(ren)在(zai)執行(xing)端的(de)一些痛點(dian)。去(qu)年,我(wo)們參與制定了上(shang)海(hai)的(de)人(ren)形機器人(ren)與具身(shen)智能分(fen)級指南,將具身(shen)智能與自(zi)動(dong)駕駛進行(xing)了類比分(fen)析(xi),劃(hua)分(fen)成L1到(dao)L5級。
如果要打造出具備充分泛化能力、能像人類一樣完成各類復雜任務的人形機器人,樂觀估計需要 3-5 年才能逐步落地。但聚焦在(zai)有限泛化任務(wu),現(xian)階段已可行。
以我(wo)們與酒店(dian)機(ji)器人廠(chang)商云(yun)跡的(de)合作為例(li):傳統酒店(dian)機(ji)器人僅(jin)能(neng)完成路徑規劃的(de)移動(dong)(dong)任務,而完整的(de)服務閉(bi)環(huan)需要“抓(zhua)取(qu) – 移動(dong)(dong) – 遞交”三(san)個環(huan)節,目前只(zhi)有我(wo)們的(de)觸覺解決方案能(neng)夠幫助機(ji)器人廠(chang)商完成這(zhe)一(yi)系(xi)列流程(cheng)。
我們的觸(chu)覺解決方案通過自適應力(li)(li)的抓(zhua)取和三維力(li)(li)識別(bie)技術,能確保機器人抓(zhua)取物體(ti)后平穩遞交(jiao),比如自主取走桌(zhuo)上(shang)的外賣,送至房間門口或(huo)直接遞交(jiao)給(gei)用戶,有(you)效(xiao)減少配送環節的人力(li)(li)消耗(hao)。
另一個場(chang)景是在(zai)酒店(dian)的(de)洗衣(yi)房里(li)。很多時候,洗衣(yi)設備(bei)空占率高,需人(ren)(ren)工全程介入衣(yi)物的(de)裝載、轉(zhuan)移(yi)和收取,任何環節(jie)遺漏都會導致設備(bei)閑置。在(zai)這(zhe)個過程中,如果機器人(ren)(ren)能夠(gou)完成衣(yi)物的(de)拿取然后送(song)到客人(ren)(ren)房間,就能夠(gou)非常高效地幫助酒店(dian)節(jie)省成本。
在這些場景里,機器人只需要實現有限泛化即可,需要抓取的物品無非就是酒店的香皂、牙刷、梳子之類的日用品,不同形態的外賣、衣物等。訓練過程無需充分泛化,可能在 3-6 個月之內完成 95% 的任務學習,剩余的 5% 通過有限的算法模型就足夠支持完成任務。
未來 1-3 年,許多場景將出現(xian)可商業(ye)化的(de)具(ju)身智能應用。如同自動駕駛(shi)從 L0 到 L3 逐步(bu)推(tui)進(jin),機器人也將進(jin)入漸進(jin)式(shi)商業(ye)化過(guo)程。
機器人本質是人工智能,核心目標是通過能力驗證替代人類工作。只要機器人能夠在某些方向超越人類的能力,即便初期成本高,也必然能在應用場景中占據一席之地。隨(sui)著(zhu)技術(shu)迭代(dai)實(shi)現規模化(hua)應(ying)用后,機器人(ren)就能憑借效率(lv)優勢顯(xian)著(zhu)降低綜合成本,展(zhan)現出相較于人(ren)力的(de)長期經濟性(xing)。
機器人前瞻:之前人形機器人馬拉松賽事,您對這件事情如何看待?馬拉松上機器人的表現如何?
馬揚:天工機(ji)(ji)器(qi)人、松延動力等參(can)賽(sai)機(ji)(ji)器(qi)人的(de)最終表現非常亮眼,賽(sai)事(shi)整體完賽(sai)率達 30% 左右(you),極具突破性(xing)。
機(ji)(ji)器(qi)人(ren)參(can)與馬拉松的意義(yi)類似(si)于汽車挑戰達喀爾拉力(li)賽 —— 這類設(she)備的初始設(she)計目標是(shi)(shi)滿(man)足室內或室外短距離作業需求。但是(shi)(shi)在(zai)賽事中(zhong),機(ji)(ji)器(qi)人(ren)展現(xian)出來的持(chi)續運行能(neng)力(li)讓人(ren)非常吃(chi)驚:例(li)如采用自主跟蹤模式的天(tian)工(gong)機(ji)(ji)器(qi)人(ren),長(chang)時間(jian)沒有出現(xian)機(ji)(ji)械故障,充分驗證了復(fu)雜場景下的穩定性。
一些國(guo)外同行(xing)反饋,中(zhong)國(guo)人形機器人在(zai)馬拉松上的表現非常讓人吃驚(jing),因為海(hai)外極少有機器人能夠在(zai)公開場合中(zhong)完(wan)成(cheng)這樣的長時(shi)間操作。
部分人(ren)形(xing)機(ji)器(qi)人(ren)在起點(dian)表(biao)現差異,可能與賽事(shi)開(kai)放(fang)度(du)高有(you)關(guan),有(you)很多學(xue)生團隊、普(pu)通(tong)開(kai)發者參與其中。如果給國內絕主流本體廠商1-2 個月的(de)(de)優(you)化周期,完(wan)賽率是(shi)可以顯著(zhu)提升的(de)(de)。這(zhe)次賽事(shi)是(shi)一個非常好的(de)(de)契機(ji),無論企業(ye)是(shi)否獲獎,這(zhe)樣的(de)(de)挑戰都(dou)會推(tui)動技術進步。
機器人前瞻:像馬拉松比賽非常考驗人形機器人的運動控制能力,那您認為在運動控制、智能和操作這三大方面中,哪個環節能夠率先推動整個行業實現質變?
馬揚(yang):目前,國內人(ren)形機(ji)器(qi)人(ren)的(de)(de)運動控制能(neng)力已經達到領先的(de)(de)水(shui)平(ping),甚至可(ke)以完成一(yi)些(xie)人(ren)類(lei)難以實現的(de)(de)復雜動作,并(bing)且具備一(yi)定的(de)(de)工業化應用基礎(chu)。但單純的(de)(de)運動控制能(neng)力不足以讓機(ji)器(qi)人(ren)替代(dai)人(ren)類(lei)—— 除了(le)跑(pao)馬拉松(song)之(zhi)外,人(ren)類(lei)日常對腿部運動的(de)(de)功(gong)能(neng)性(xing)需求相對有限。
相較之下(xia),操作(zuo)端(duan)以(yi)及(ji)腦端(duan)的(de)(de)發(fa)展水(shui)平和運動(dong)控制能力還存在一定差(cha)距。正如木桶效應(ying),只有各部分都達到一定水(shui)平,才能推動(dong)人形機器人在工業、商業、家(jia)庭(ting)場景中(zhong)的(de)(de)發(fa)展。
以自動駕駛分級為類(lei)比:當運動控制(zhi)達到 L2 水平,類(lei)似汽車具(ju)備(bei)基礎道路(lu)行駛能力,機器人腦端(duan)與操作端(duan)的精細執行仍需從有限泛(fan)化場景(jing)起步(bu)。
在(zai)靈巧(qiao)手(shou)方(fang)面,許多(duo)廠商(shang)傾(qing)向于研發(fa)五指高自由度(du)靈巧(qiao)手(shou),因(yin)其更貼近人(ren)(ren)類交互習慣,可模仿人(ren)(ren)類完成(cheng)復雜(za)任務(wu)。隨著人(ren)(ren)形機器人(ren)(ren)進入(ru)充分泛化(hua)階段,高自由度(du)手(shou)的成(cheng)本將(jiang)隨量產規模下降。
而面對一些可快速商業化場景,靈巧手無需追求過高自由度,滿足有限場景需求即可(如二指(zhi)夾爪(zhua))。畢竟(jing),自(zi)由(you)(you)度越(yue)高,模型計算的(de)算力(li)需求越(yue)大(da),因此三指(zhi)、二指(zhi)等低(di)自(zi)由(you)(you)度夾爪(zhua)在未來的(de)一些商(shang)業化應用場景中反而具(ju)備落地優勢。
機器人前瞻:如何看待目前整個人形機器人行業的泡沫?
馬(ma)揚:從以前的第一波人形機器(qi)(qi)人浪潮至今,經歷了極為關鍵(jian)的大模(mo)型迭代階段。當(dang)前,在通(tong)用模(mo)型的支撐下,人形機器(qi)(qi)、具(ju)身智(zhi)能領域的開發成本及時間(jian)迭代效(xiao)率已顯(xian)著提升。
以抓取物體的訓(xun)練工作為例,我(wo)們(men)在七八年(nian)前完(wan)成(cheng)同類(lei)任務(wu)可能(neng)需要 6 個月,而目前僅需一周左右,時間成(cheng)本大幅降低。當下的核心(xin)工作,是聚焦(jiao)于機器人專用端模型(xing)的優(you)化(hua)與完(wan)善。
其(qi)次,家(jia)庭的智(zhi)能(neng)(neng)終(zhong)端(duan)除了(le)手機、汽車外,機器人(ren)也是(shi)非常重(zhong)要的方向。換(huan)言之,機器人(ren)終(zhong)將成為(wei)家(jia)庭中(zhong)的核心(xin)智(zhi)能(neng)(neng)終(zhong)端(duan)?—— 具備通(tong)(tong)曉家(jia)居環境并(bing)提供優(you)質服(fu)務能(neng)(neng)力(li)的通(tong)(tong)用(yong)保姆型機器人(ren),將成為(wei)家(jia)庭場(chang)景的標(biao)配。
當前(qian),機器(qi)人或(huo)具身智(zhi)能是最穩定的未來(lai)導向(xiang)賽道,市(shi)(shi)場(chang)(chang)潛力堪稱(cheng)巨大。當行業發(fa)展至(zhi)成熟階(jie)段(duan),其市(shi)(shi)場(chang)(chang)體量(liang)將與汽(qi)車產業比肩,將會面臨每年萬億的市(shi)(shi)場(chang)(chang)。
如果我們對未來充(chong)滿信心,那么這只是時間長短(duan)的問(wen)題。
在(zai)這個過程中(zhong),行(xing)(xing)業(ye)可能出現(xian)階段(duan)性波動,外界對(dui) “泡沫” 的(de)認知或許存在(zai)差異,但(dan)核心在(zai)于(yu)技術(shu)根(gen)基(ji)是否扎(zha)實(shi),只要行(xing)(xing)業(ye)浪潮持續向前(qian),終將形(xing)成堅實(shi)的(de)發展態勢。如果(guo)大家對(dui)未(wei)來方(fang)向足夠堅定,那(nei)么(me)眼前(qian)的(de) “泡沫”,不過是發展進程中(zhong)的(de)細(xi)微波動而(er)已。
機器人前瞻:他山在技術產品或者商業化方面有什么規劃?
馬揚:我們最初推出自己的產品時,更多地將其定位為觸覺傳感器。今年,在與行業內的同行以及下游客戶討論時,我們希望能進一步升級為整體的解決方案 —— 不僅涵蓋物理端的方案,還將在仿真端制開發配套模型,以更(geng)好(hao)地(di)幫助客戶完成線下與線上的訓練。
未來幾年,主要分為(wei)兩個方向(xiang)(xiang):一(yi)個方向(xiang)(xiang)是面向(xiang)(xiang) L4/L5級(ji)充分泛化(hua)場景(jing)(jing),為(wei)客戶提供數據(ju)采(cai)集支持,不僅是在現實(shi)訓練(lian)場景(jing)(jing)中,還包括(kuo)仿真虛擬(ni)場景(jing)(jing)。另外(wai),觸覺(jue)數據(ju)區(qu)別于視(shi)覺(jue)數據(ju)的(de)核心特征在于其連續性,例如 “抓取 – 握持 – 放下” 的(de)動作必須是連續。所以(yi),他山科技會推(tui)動觸覺(jue)數據(ju)的(de)標準化(hua)與通(tong)用化(hua)進程,期望(wang)以(yi)行(xing)業共建的(de)模(mo)式實(shi)現資源共享。
第二(er),聚焦(jiao)未來三(san)年商業化落(luo)地場(chang)景(jing)(jing),我們(men)會與許多下游客戶合作,比(bi)如(ru)酒(jiu)店服務、物(wu)流分揀(jian)、養老護理(li)等場(chang)景(jing)(jing),提供在不同場(chang)景(jing)(jing)下的專用解決方案,并(bing)搭建(jian)開(kai)放(fang)平臺供客戶自主訓練與底層(ceng)模型迭代。
