智東西(公眾號:zhidxcom)
作者?| 香草
編輯?| 心緣
智東西8月7日報道,昨晚,由微軟OpenAI英偉達英特爾聯手投資的明星機器人創企Figure,發布了新一代機器人Figure 02,再次顛覆我們對人形機器人的想象。
升級后的Figure 02不僅外形更像人,還在OpenAI多模態大模型的加持下,實現了與人類語音對話;擁有16個自由度的第四代手部靈活度大幅提升,可以實現更精細的操作,而特斯拉的擎天柱二代手部自由度為11個。
與第一代相比,Figure 02從外觀設計、軟硬件性能,到內置AI模型都進行了徹底的升級,主要體現在以下方面:6個板載相機、電池容量增加50%以上、3倍推理速度、第四代手部、語音到語音交互、內置VLM(視覺語言模型)。

▲Figure 02
Figure成立于2022年,截至目前共完成5輪融資,總額8.54億美元(約合人民幣61.08億元),估值達到26億美元(約合人民幣185.88億元)。其投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等,涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家,陣容十分亮眼。
今年2月,Figure宣布與OpenAI達成合作,將在OpenAI大模型的支持下開發下一代人形機器人模型,將其多模態模型擴展到機器人的感知、推理和交互中。Figure 02的語音到語音交互功能,便是其基于OpenAI為其定制大模型的最新嘗試。

▲Figure 02在工廠中行走
Figure創始人兼CEO Brett Adcock稱,Figure 02的續航可支持每天完成約20小時的有效工作,這有助于其進入勞動力市場和家庭。值得一提的是,Figure的初代機器人Figure 01已經在寶馬工廠落地,在汽車制造過程中“自動執行困難、不安全且乏味的任務”。
從概念設計到落地,Figure 02僅用時18個月。Adcock還提到,團隊將推動低成本、高效率地制造,預計明年開始批量生產。
一、推理能力提升3倍,每天可工作20小時
從外形上看,Figure 02比第一代酷炫了許多,布線不再裸露在外,看起來更加完整,外骨骼為其增添了現代感和科技感。不得不說,Figure 02現在看起來更像特斯拉的擎天柱了。

▲Figure 01(左)、Figure 02(中)和擎天柱二代(右)外形對比
在Figure 01的基礎上,Figure對機器人的軟硬件進行了徹底的重新設計,覆蓋AI、計算機視覺、電池、電子設備、傳感器和執行器等關鍵技術。

▲Figure 02
Figure 02在6個方面取得突破,包括語音交互、攝像頭、手部、VLM(視覺語言模型)、電池、CPU/GPU。
具體來看,Figure 02通過定制AI模型驅動的板載麥克風和揚聲器,以語音到語音的方式直接與人類對話。
它的頭部、前軀干和后軀干共有6個板載RGB攝像頭,通過AI驅動的視覺系統感知和理解物理世界,并在內置VLM的支持下進行快速常識性視覺推理。

▲Figure 02的6個攝像頭
Figure 02采用Figure自研的第四代手,其具備16個自由度,且力量與人類等同。

▲Figure 02手部
Figure 02內置的電池容量為2.25 KWh,相比上一代增加了50%以上,據稱每天能夠完成約20小時的有效工作,這為人形機器人進入勞動力市場和家庭鋪平了道路。

▲Figure 02在寶馬工廠
模型推理方面,Figure 02板載的CPU/GPU提供比上一代高3倍的計算和推理能力,具備自我修正的學習能力。

▲Figure 02在寶馬工廠
在外骨骼的加持下,Figure 02的重量相比上一代有所減輕,但由于增加了電池、攝像頭、CPU/GPU等,凈重量增加到約70kg。

▲Figure 02的外骨骼細節
二、歷時18個月落地,預計明年開始量產
Figure創始人兼CEO Brett Adcock稱,Figure 02在2023年2月完成概念設計,從概念到成品歷時18個月。
Adcock解讀了Figure 02在語音交互、布線等方面的技術原理。Figure 02的語音交互能力是基于OpenAI為其定制的大模型實現的。

▲語音到語音推理
在接收到語音后,模型首先將其轉換為文字,同時,板載的VLM(視覺語言模型)基于攝像頭捕捉到的圖像和語音理解進行常識推理,然后基于推理控制機器人的行為,同時將輸出文本轉換為語音輸出。
在布線方面,Figure 02采用集成電源和計算布線,并設計了定制的電線端子和連接器,從而隱藏電線,并實現更高的可靠性、更緊密的包裝。
基于板載CPU和GPU,Figure 02能夠運行最新的AI模型,其推理能力達到Figure 01的3倍,能夠完全自主執行現實世界中的任務。

▲Figure 02的CPU和GPU
對于Figure 02的進步,不少行業大佬和網友紛紛發來賀電。
英偉達高級研究經理兼具身智能實驗室負責人Jim Fan稱:“恭喜Brett!制作高自由度靈巧手的決定絕對是正確的。”

▲Jim Fan評論
有的網友已經迫不及待地想看Figure 02和馬斯克的擎天柱大戰2024了。

▲網友評論
有的網友則迫切地想購買一臺幫自己洗碗。

▲網友評論
同時,也不乏有一些質疑的聲音出現。有網友問道:“他是否具備超級工廠的制造能力?他真的能在垂直整合方面做到精細到原子成本的程度嗎?”
Adcock很堅定地回答:“是的。我將推動低成本、高效率制造,明年開始批量生產。”

▲Adcock回應成本問題
也有網友對Figure 02所謂的“世界上最先進的AI硬件”產生質疑,稱擎天柱在7個月以前就已經做到這些了。

▲網友評論
有網友認為Figure 02的營銷大于其真實進步:“這很酷,但靈活性顯然不足。你浪費了很多時間展示平移,而本可以給我展示更多手部操作——這才是真正的訣竅,不是嗎?它把零件沖壓到位了?這是進步,但不值得你所營造的那種大肆宣傳。”

▲網友評論
三、成立2年估值185億,初代機器人已進寶馬打工
Figure成立于2022年,其創始人Brett Adcock是一位連續創業者,其此前創立的兩家公司分別實現IPO和以1億美元被收購。
Figure致力于開發能夠在倉儲、零售、看護等不同環境中工作,并處理各種任務的通用人形機器人。
截至目前,Figure共完成5輪融資,融資總額達到8.54億美元(約合人民幣61.08億元),估值26億美元(約合人民幣185.88億元)。

▲Figure融資歷程
去年10月,Figure發布第一款通用人形機器人Figure 01行走的視頻,此時團隊剛剛成立一年多,擁有60名工程師。

▲Figure 01行走
今年1月7日,Figure發布了一則Figure 01煮咖啡的視頻,并強調其使用端到端的AI系統,僅通過觀察人類煮咖啡,即可在10小時內完成訓練。

▲Figure 01煮咖啡
1月18日,Figure宣布與寶馬簽署商業協議,機器人Figure 01將進入寶馬工廠,在汽車制造過程中“自動執行困難、不安全且乏味的任務”。
2月,Figure獲得6.75億美元高額融資,一舉躍升獨角獸,投資方包括微軟、OpenAI、英偉達、英特爾、貝索斯等,涵蓋了時下生成式AI熱潮中的大模型、算力、投資公司等明星玩家,陣容十分亮眼。

▲Figure官宣融資
同時,Figure宣布與OpenAI、微軟達成合作,將與OpenAI合作開發下一代人形機器人模型,將其多模態模型擴展到機器人的感知、推理和交互中,并利用微軟云進行AI基礎設施構建、訓練。
半個月后,Figure于3月13日發布了Figure 01在OpenAI大模型加持后的進展。
在2分半的視頻中,Figure 01展示了如何描述自己眼前看到了什么,判斷自己眼前看到的東西相互之間有什么關聯,給饑餓的測試員找到桌子上唯一能吃的蘋果并精準遞過去,進行“回憶”并對自己做過的事情給出評價,用簡單易懂的話語口頭解釋自己做事的緣由等高難度動作。
7月,Figure發布了一段視頻,展示其機器人在寶馬工廠訓練的最新成果,其已經可以在生產車間上從事簡單的抓取工作。
不得不說,僅看Figure 02此次發布的演示視頻,我們并不能十分明確地感知到它相對于上一代實現的突破,也難怪不少網友感到失望。
結語:人形機器人賽道再添一把火
今年年初,人形機器人一度迎來爆發式開局。從斯坦福機器人大秀廚藝做大餐,到特斯拉擎天柱化身保姆疊衣服,再到兩家創企的機器人比賽煮咖啡。除了Figure之外,另一家機器人企業1X也獲得OpenAI等知名投資者的巨額投資支持。
半年多過去,人形機器人的熱度有所退卻,不過Figure 02的發布又為這個賽道添了一把火。Figure 02在軟硬件諸多方面展現出了顯著的升級與突破,但由于演示視頻的局限性,也面臨著網友的質疑與期待。
科技的進步從來不是一蹴而就,每一次的創新都伴隨著挑戰與爭議。后續Figure能否不斷優化Figure 02,交出更亮眼的答卷,特斯拉擎天柱等同類產品又能否實現新的突破,我們將持續關注。