機器人前瞻(公眾號:robot_pro)
作者 | 許麗思
編輯 |?漠影

在柏拉圖的洞穴(xue)隱(yin)喻里(li),一(yi)群一(yi)輩子沒(mei)出過山(shan)洞(dong)的(de)(de)人,對外界唯一(yi)的(de)(de)感知來源是投射在(zai)洞(dong)里(li)墻(qiang)壁上的(de)(de)影(ying)子。他們可(ke)以(yi)借助影(ying)子了解到外界的(de)(de)一(yi)些情況,但影(ying)子對真實世界的(de)(de)投射不一(yi)定是完全真實的(de)(de)。

現在的人工智能,也像處于“洞穴”之中,它對外界的理解來自于人為提供的二手(shou)信息,還沒辦法直接去感受真實世界、獲取一(yi)手(shou)信息

而對胡魯輝來說,他想做的就是讓人工智能可以直接感(gan)知(zhi)、理解物理世界,然后進行交互,從而逐步接近通(tong)用人工智能(neng)

在清華大學、美國留學深造后,進入微軟、亞馬遜、華為美國研究(jiu)院、Meta這樣的頂尖科技巨頭擔任高管,胡魯(lu)輝的履歷堪稱(cheng)優秀(xiu)。

前年年底,他萌發了“理(li)解物理(li)世(shi)界”的想法。今年,他下決心回國再創業,創辦了智澄AI,“澄”的意思就是逐步走向真正的智能。“目前,國內還沒有類似企業。我們對標的是美國李飛飛老師創辦的空間智能公(gong)司。”胡魯(lu)輝(hui)說。

AI 2.0時(shi)代(dai)的(de)(de)到(dao)來(lai)意味著什么?給機器人(ren)裝上(shang)模型就可(ke)以讓它實現具身智(zhi)能(neng)?通(tong)用(yong)人(ren)工智(zhi)能(neng)將會創造出機器人(ren)的(de)(de)“iPhone時(shi)刻(ke)”?最近,機器人(ren)前(qian)瞻和智(zhi)澄AI創始人(ren)胡魯(lu)輝(hui)進行了一場深入(ru)交談,從他毅然轉向的(de)(de)事業發展路(lu)徑背后,看到(dao)了從多模態大模型到(dao)物理智(zhi)能(neng),實現通(tong)用(yong)人(ren)工智(zhi)能(neng)的(de)(de)新(xin)答案。

對標李飛飛!前華為美研CTO創業,要讓機器人理解物理世界

▲前Meta首席工程師、智澄AI創始人 胡(hu)魯(lu)輝

一、擔任過多家科技巨頭高管,手握30+專利

早年在清華大學(xue)畢(bi)業后,胡魯輝就收(shou)到了(le)美國(guo)西(xi)北大學(xue)等多(duo)所高校(xiao)博士錄(lu)取通知,赴(fu)美深造(zao)。畢(bi)業后,他選擇留(liu)在西(xi)雅(ya)圖,在這(zhe)樣一座匯集了(le)一眾世界頂尖科(ke)技巨頭的城(cheng)市工(gong)作。

他先是在微軟亞馬遜總部工作了十來年,后面又加入華為(wei)美國研究院(yuan)擔任首席架構師兼首席技術官,最近的一段經歷是在Meta擔任首席工(gong)程負(fu)(fu)責(ze)人(ren),負(fu)(fu)責(ze)數據(ju)人(ren)工(gong)智能方面的工(gong)作。

除了各大科技巨頭(tou)的(de)高管頭(tou)銜(xian),他的(de)從(cong)業生涯中濃墨(mo)重彩的(de)一筆(bi),是(shi)在美國獲得的(de)三十多項發明專利及申請。在這些專利里,胡魯輝作(zuo)為主要負(fu)責人,基本都是(shi)第一作(zuo)者。

胡魯輝回憶起在2010年前后,負責了一個亞(ya)(ya)馬遜(xun)線(xian)下(xia)零售(shou)(shou)的項目。原本亞(ya)(ya)馬遜(xun)主攻線(xian)上業(ye)務(wu)(wu),后來想要(yao)拓(tuo)展以無人(ren)店(dian)為代表的線(xian)下(xia)業(ye)務(wu)(wu)。但管理線(xian)下(xia)的商(shang)品銷售(shou)(shou)就需(xu)要(yao)人(ren)工流程(cheng),這(zhe)可能會耗(hao)費時間和成本,并且可能難以準確(que)地做出(chu)商(shang)業(ye)決策。

最初,他選(xuan)擇用軟件處理這種問題。后來,他開始研(yan)發(fa)人工智能,還獲得(de)了一個“用于線(xian)下零售業(ye)務的數據驅動(dong)和自(zi)適應機器學習(xi)(ML)平臺(tai)和技術”的專利,可以讓多個機器學習(xi)算法為線(xian)下零售提供多樣化的支(zhi)持。

這是胡(hu)魯輝第一(yi)個(ge)與(yu)AI相(xiang)關(guan)的(de)專利發明,也(ye)是從這里(li)開始,他可以說(shuo)是真正(zheng)對AI領域(yu)產(chan)生了濃厚的(de)興趣(qu)。那(nei)個(ge)時(shi)候,AI尚(shang)未到火爆、備受關(guan)注的(de)程度。

對標李飛飛!前華為美研CTO創業,要讓機器人理解物理世界

▲胡魯輝第一個與AI相關的(de)專利

二、瞄準AI 2.0的機會,再次投身創業浪潮

2015年(nian),以CNN卷積神經網絡模型為核心的計算機視覺技術,正式拉開了AI 1.0感知智能時代的序幕。2016年,AlphaGo擊敗圍棋世(shi)界冠軍李世(shi)石,AI迎來了重要的高光時刻,受到廣泛關注。

在AI 1.0時代,胡魯輝看中了其中的機遇,選擇在2018年回(hui)國(guo),奔(ben)赴上海(hai)、北京兩地創業。

“那次創業,主要聚焦在智慧零(ling)售方面的人工智能技術的應用,”胡魯輝說,“當時AI技術的特點是垂直性(xing)特別強,需要在(zai)垂(chui)直領域進(jin)行應用(yong),也(ye)和永輝、京東、騰(teng)訊等平(ping)臺進(jin)行了(le)合作。”

而現在,當AI已經邁入2.0時代,帶來了平臺式的變(bian)革。

在胡魯(lu)輝看來,AI 2.0時代蘊藏(zang)著比(bi)上一個時代更多的(de)機會(hui),會(hui)對(dui)人類(lei)的(de)生活、工作(zuo)、產業等產生更大的(de)影響,并且還(huan)更容(rong)易落地。

所以,他的(de)(de)第二次創業(ye)開始了。他找到了之前在微軟、華為、Meta的(de)(de)一些同(tong)事,組成了公(gong)司的(de)(de)核心(xin)創始團(tuan)隊,公(gong)司的(de)(de)研發團(tuan)隊也基本(ben)都是畢業(ye)于國內外知名高校(xiao)的(de)(de)碩(shuo)士(shi)、博(bo)士(shi)、博(bo)士(shi)后。

面對深(shen)圳(zhen)、上海(hai)等地發出的(de)(de)落地邀約(yue),老家(jia)在(zai)浙(zhe)江寧波的(de)(de)胡魯(lu)輝(hui)最終決(jue)定將(jiang)公司設立在(zai)杭州的(de)(de)菜(cai)鳥智谷產(chan)業園。

智澄AI的成(cheng)立,還得到了投資界、政府部(bu)門(men)等(deng)多方(fang)面的支持。

胡魯輝表示,公司在成立(li)前(qian)就已成功融資,不(bu)久后投(tou)資人還繼(ji)續追加投(tou)資。同(tong)時當地政府(fu)部門(men)也(ye)很重視(shi),把智澄(cheng)評(ping)為AI杭州(zhou)市余杭區海外(wai)高層次領軍人才項(xiang)目,還在資金(jin)等多方(fang)面(mian)給予大力支持。

對標李飛飛!前華為美研CTO創業,要讓機器人理解物理世界

▲今年7月,智澄AI在杭州開業(ye)

三、低成本機械臂,也能實現具身智能

在AI 2.0時代,下一個爆發點及落地大方向將是AI for Robotics,而智(zhi)澄AI正是瞄準了這一點。

“我們是一家通用人工智能公司,核心技術是理解物理世界的模型,”胡魯輝解釋道,“但是我們的產品并非是模型,而是具身智能,也就是人工智能機器人。”

從前年年底,胡魯輝就誕生了讓人工智能理解物理世界的想法,并開始思考如何實施。這就要求模型不僅理解編程或語言處理,更要深入到(dao)物(wu)理世界的(de)具體應用中(zhong)去

今年5月開(kai)始(shi)(shi),智(zhi)澄(cheng)AI的(de)人(ren)工智(zhi)能機(ji)器人(ren)原型一(yi)(TR1)、原型二(TR2)基(ji)本完成,已經進入了(le)(le)(le)生產環節,并且(qie)和一(yi)些企(qi)業達成了(le)(le)(le)合作,開(kai)始(shi)(shi)了(le)(le)(le)商(shang)業化之路。胡魯輝將智(zhi)澄(cheng)AI的(de)人(ren)工智(zhi)能機(ji)器人(ren)命名為TR,即Transforming?Robot。

“雖然模型研發的時間比較長,但是集成智能本體的時間較短,迭代速度也很快,現在基本上兩個月就實現(xian)了一次迭代。”胡魯輝說。

對標李飛飛!前華為美研CTO創業,要讓機器人理解物理世界

對標李飛飛!前華為美研CTO創業,要讓機器人理解物理世界

▲智澄AI的TR2雙臂機器人

不久前,智澄AI聯合了來自哈佛大學、清華大學的人工智能專家,推出了一種低成本的通(tong)用(yong)人(ren)工智能機器(qi)人(ren)學習框架(GRLF)

把這(zhe)個框架(jia)裝在(zai)機械(xie)臂上,機械(xie)臂仿佛變成(cheng)了具(ju)有視覺能(neng)(neng)(neng)力(li)、感(gan)知能(neng)(neng)(neng)力(li)的個體,能(neng)(neng)(neng)夠像人一樣去執行精(jing)細的模仿學(xue)習(xi)任務。

它可以完全擺脫對仿(fang)真環境的(de)依賴(lai),實(shi)現從數據(ju)采(cai)集、模型訓練到(dao)模型部署(shu)的(de)端到(dao)端實(shi)景操(cao)作,還(huan)可以對多種物(wu)體進行放置、排序、操(cao)縱,具(ju)備(bei)了一定的(de)通用能力。

對標李飛飛!前華為美研CTO創業,要讓機器人理解物理世界

▲裝(zhuang)上了通用人工智(zhi)能機器人學習(xi)框架的機械臂正在(zai)執行不同的任(ren)務

縱觀目前的(de)機(ji)(ji)器(qi)人行業(ye),胡魯輝(hui)覺得,許(xu)多企業(ye)的(de)產品還處于演示、研(yan)究(jiu)和教(jiao)育的(de)階段,難(nan)以實現機(ji)(ji)器(qi)人真正的(de)應用。機(ji)(ji)器(qi)人行業(ye)不僅面臨(lin)著成本高(gao)、價格高(gao)的(de)挑戰,還存在泛化(hua)能力不足的(de)問題,機(ji)(ji)器(qi)人難(nan)以適應不同場景需(xu)求和環境。

所以,他希望智澄AI能夠將通用(yong)人工(gong)智能真(zhen)正應用(yong)到大(da)眾的工(gong)作和(he)生活(huo)中,讓機器(qi)人實現像人一樣的智能。

“很多公司都專注于制造機器人,讓機器人能夠完成某項工作。但我們想做的是能夠感(gan)知、理(li)解物(wu)理(li)世界的機器人,它(ta)具(ju)有(you)推理和思考能(neng)力(li),能(neng)夠與外界進行智能(neng)的交互,而目前國(guo)內還沒有(you)這類企業。”胡魯(lu)輝說。

在他的(de)計劃里,智澄(cheng)AI會繼續(xu)圍(wei)繞實(shi)際應(ying)用場景(jing)、通過技術創(chuang)新和突(tu)破(po)來加快產(chan)品的(de)迭代,并且繼續(xu)推進和不同企業的(de)合作(zuo),讓(rang)產(chan)品的(de)應(ying)用落到實(shi)地。

四、對標李飛飛,讓AI走出“洞穴”

要讓AI走出(chu)“洞(dong)穴(xue)”,就需要AI直(zhi)接接觸真實(shi)的物理世界。

今年4月,“AI教母”李飛飛創辦了一家“致力于構建能夠感知、生成并與 3D 世界互動的大型世界模型的空間智能公司”——World Labs

“我們現在看(kan)到的(de)大(da)型語(yu)言模型和(he)多模態語(yu)言模型,它(ta)們是(shi)(shi)(shi)底(di)層表達其實是(shi)(shi)(shi)一(yi)種(zhong)一(yi)維表示,”李飛飛在此(ci)前接受的(de)公開采訪中(zhong)曾(ceng)說道(dao),“而空間智能是(shi)(shi)(shi)對世界的(de)三(san)維表達,從(cong)算法(fa)的(de)角(jiao)度來看(kan),這是(shi)(shi)(shi)在用不(bu)同(tong)方式處理數據并從(cong)中(zhong)獲得不(bu)同(tong)類(lei)型的(de)輸出,最后解決不(bu)同(tong)的(de)問題(ti)。”

簡(jian)單來說,李(li)飛飛的空間智(zhi)能就是要讓人工智(zhi)能直(zhi)接繞過一切中間障礙,直(zhi)接地(di)感受(shou)、理(li)解所身(shen)處(chu)的三(san)維世界,然后(hou)采(cai)取一些行動。

而胡魯(lu)輝的想法,剛好和李(li)飛(fei)飛(fei)不謀而合。

前年年底,他萌生出了“理解物理世界”的想法。“最初,我們關于物理智能的想法其實沒有多(duo)少人(ren)接受,畢竟這是比較有挑戰性的,”胡魯輝說,“通用人工智能有不同的實現方式,很多人都在探索,但通常都會采用大(da)模型的方式。”

但是他認為,現有的多模態大模型只能局限于訓練的范圍中,對外界的理解還是有很大局限性。只(zhi)有讓人工智能(neng)做(zuo)真(zhen)正理解(jie)物理世界(jie),才(cai)能(neng)實現通用。

這也正是胡魯(lu)輝創辦(ban)智澄AI的愿景所在。

不(bu)過,在走向通用人工智(zhi)能的路上,還是面臨著不(bu)少的阻礙,不(bu)僅(jin)包括(kuo)(kuo)在算力(li)、數據、算法方面,也包括(kuo)(kuo)在真(zhen)正的實際應用落地上。胡魯輝(hui)歸納出了“兩個20”來概(gai)括(kuo)(kuo)當前(qian)人工智(zhi)能發展的差距:

第一個“20”是從算力的(de)(de)角度,他提到如果讓(rang)AI和人(ren)同(tong)時創(chuang)作一首詩或一幅畫,人(ren)可(ke)能只需(xu)(xu)要(yao)要(yao)20瓦的(de)(de)電量(liang),而AI需(xu)(xu)要(yao)耗費巨(ju)大的(de)(de)電量(liang),并且像(xiang)OpenAI大模型的(de)(de)訓練經常需(xu)(xu)要(yao)耗費數億美(mei)元。

第二個“20”是從數(shu)據量的(de)角度,人類可能(neng)花(hua)費(fei)20小時就(jiu)能(neng)掌(zhang)握(wo)很復雜的(de)事情,例(li)如學車,但是AI可能(neng)要花(hua)費(fei)數億個小時的(de)數據進(jin)行訓練。

要實現通用人(ren)工智能,還是道阻且長。

五、結語:AGI的到來,會是機器人的“iPhone”時刻”

通用人工智能,到(dao)底還需(xu)要多久才會到(dao)來呢?

沿著物理智能的路徑,胡魯輝覺得,可能還需要3到5年左右。而等到通用人工智能實(shi)現(xian)的那一刻的到來(lai),也將會給機器人領(ling)域帶來(lai)顛覆性的變(bian)革。

這是機器人“iPhone 時(shi)刻(ke)”。就(jiu)如同(tong)當年(nian)iPhone的(de)橫空出世(shi),它(ta)作為一個(ge)突破性的(de)硬件平臺(tai),帶動了整個(ge)軟件應用生態(tai)的(de)發展一樣,通用人工智能也(ye)會(hui)創造出一個(ge)蘊含(han)著巨大(da)價值(zhi)的(de)生態(tai)。

它(ta)作(zuo)為(wei)一個相對(dui)標準化(hua)的(de)模型(xing)、軟件,會(hui)走向平臺(tai)化(hua),可(ke)以廣泛地應用到(dao)不同的(de)機器(qi)人上,重新定義人們的(de)生活方式。

那個時候,機器人會成為一個更為廣泛的概念,不止是我們現在所熟悉的人形機器人,而是一切都(dou)會走向機器人化,重新定義每個人的生活方式(shi)。

這(zhe)個時(shi)刻的曙(shu)光,已(yi)經逐漸顯(xian)現了。