智東西(公眾號:zhidxcom)
作者 | 周炎
編輯 | 云鵬
近期,亞馬遜宣布,計劃將其智能語音助手Alexa接入其自研的大模型Alexa Teacher Model,這是繼小度和天貓精靈后又一個接入大模型的語音助手。9年前,以Alexa智能語音助手衍生出來的智能音箱Echo曾創造了傲人的成績,不僅被稱為“品類開創者”,還被視作“谷歌與蘋果的學習對象”。
而在今年2月,據美國科技媒體Business Insider報道,亞馬遜旗下的Alexa去年虧損100億美元(折合人民幣約693億元),Alexa硬件團隊在去年年底遭遇了大裁員。
在生成式AI火爆的當下,像亞馬遜一樣尋求新變量的智能硬件廠商不在少數,他們紛紛將生成式AI引入自家智能硬件中,以期提升原有智能硬件的交互體驗、使產品能夠在更廣泛的場景下服務用戶。
目前來看,調用ChatGPT服務到智能硬件產品上,可以通過REST API、SDK或者Webhooks等方式,繼而實現自然語言處理(NLP)、聊天機器人(Chatbot)等功能。接入ChatGPT的智能硬件可以用于自動客服、聊天機器人、自動文本生成、自動問答等應用場景。
當下,Humane等AI創企已先行一步推出AI可穿戴設備,百度、阿里、谷歌等巨頭憑借自身在大模型上的積累和技術優勢已將生成式AI融合進智能硬件中,創維數字、美的等智能家居品牌也宣布將推出搭載類ChatGPT的智能硬件產品。
智能硬件的“第二春”似乎到來了,然而生成式AI如何賦能智能硬件,搭載生成式AI技術的智能硬件產品在規模量產前還面臨著哪些問題,我們試圖通過目前各類智能硬件玩家的最近動作來找到答案。
一、ChatGPT前夜,智能硬件廠商陷入困局
像VR/AR設備、可穿戴設備、智能家居產品這樣的智能硬件在2022年似乎格外不好賣。
而在銷售的另一頭,生產智能硬件也絕非容易。2013年,作為一個即將興起的領域,智能硬件市場等待著產業鏈成熟,也等著一個真正的爆品出現。
2014年,亞馬遜推出基于Alexa的智能音箱Echo,智能硬件市場也經歷了一場創投熱潮。彼時,智能硬件產品開始在市場上涌現,但是多數智能硬件僅僅是實現App的控制,并沒有找到用戶的痛點,沒有辦法讓用戶能夠真正形成使用意愿,一些用戶出于新鮮感購買智能硬件產品,但是產品用戶粘性很弱。

▲亞馬遜Echo第一代智能音箱
據騰訊科技不完全統計顯示,截止2015年,完成A輪融資的智能硬件公司接近300家,而完成B輪僅有20家,90%的初創公司都在“戰場”上死去。而在2016年,更是有3000多家智能硬件企業注銷關停。2017年,堅果智能影院董事長胡震宇曾說:“98%做智能硬件的都死了,我是那2%的幸存者”。
慘淡的市場、失意離開的玩家、不夠智能的產品構成了“ChatGPT前夜”智能硬件領域的概貌。廠商們期盼著新技術的出現”拯救”陷入困局的智能硬件。
二、元宇宙沒能帶火VR/AR設備市場,生成式AI會是新風口嗎?
在ChatGPT之前,“元宇宙”曾帶給制造VR/AR設備的智能硬件廠商希望。Meta、微軟、索尼、字節跳動都曾下注號稱是“虛擬世界入口”的VR/AR設備。
但VR/AR設備的成績單并非“亮眼”,甚至可以說有些“慘淡。市場研究機構IDC發布的數據顯示,2022年全球VR/AR設備出貨量下降20.9%。與之前幾年相比,VR/AR設備市場的頹勢顯而易見,功能缺乏創新、性價比遭受質疑。
目前,使用生成式AI推動AR設備功能創新的是一家德國智能眼鏡開發商Innovation Eyewear,上月中旬它宣布推出首款支持ChatGPT的智能眼鏡,用戶可以使用眼鏡內置的麥克風向ChatGPT提問,ChatGPT生成的內容,會通過Siri或者谷歌語音來傳遞給用戶。Innovation Eyewear CEO哈里森·格羅斯稱,目前這款眼鏡不僅可以自動翻譯用戶所說的話,還能成為用戶的移動學習系統,當用戶有疑問的時候,只需連接到ChatGPT上,就能獲得相關主題研究資料庫。
雖然Snap也在財報中透露,公司計劃用生成式AI技術驅動智能眼鏡,但它一直沒有推出使用生成式AI驅動的AR眼鏡。反而不是智能硬件廠商的斯坦福大學最近有了智能硬件方面的新進展。他們的研究人員在上月下旬開發出“rizzGPT”,并打造了可與ChatGPT實時對話的AR單片眼鏡。簡單來說,該眼鏡利用OpenAI的自動語音識別工具Whisper來聆聽用戶的講話,當獲取到講話內容后,GPT-4就會自動生成響應,AR開源設備Brilliant Monocle還會將上述的響應內容疊加在用戶真實世界環境之中。當進行求職面試或者公開演講時,這款眼鏡還會指導用戶接下來說什么,幫助用戶更好地面對高壓場景。

▲可與ChatGPT實時對話的AR單片眼鏡
可以看到,無論是還是德國眼鏡商Innovation Eyewear推出的“行走的研究資料庫”,還是斯坦福大學針對當下用戶容易產生社交焦慮而設計的“語言指導”AR眼鏡都在解決真實場景下的用戶所關心的問題,AR眼鏡的實用性得到了加強。
雖然此前,元宇宙為VR/AR設備造起了極大的“聲勢”,但彼時智能硬件廠商們一直沒有給用戶一個“必須要買VR/AR設備”的理由。所謂的“未來虛擬世界入口”也離普通用戶太遠。而目前入局生成式AI賦能VR/AR設備的玩家,正在為VR/AR設備找到合適的應用場景,也努力在為用戶提供“必須要買VR/AR設備”的理由。
三、不做“智能手機附庸”,生成式AI或拓展可穿戴設備應用場景
與VR/AR設備相比,智能手表、智能手環等可穿戴設備在不斷迭代中以“運動”和“健康監測”可為用戶提供了購買理由。但這依舊沒有阻擋住可穿戴設備的市場頹勢。市場研究機構Canalys發布的報告顯示,2022年全球智能可穿戴設備出貨量下滑5%,只計算四季度的話,出貨量更是低至5000萬件,同比大跌18%。
其中很大一部分原因是,智能手表等并非想象之中如此“智能”,它必須通過連接智能手機才能夠實現功能的推展,處于“手表+手機”的尷尬處境,智能手表在很大程度上還是智能手機的附庸。
在逃離做“智能手機附庸”這件事情上,蘋果前高管伊姆蘭·喬杜里(Imran Chaudhri)為其他可穿戴設備制造商開了一個好頭。近期,他開辦的AI初創企業Humane推出了一款AI可穿戴設備,無需與智能手機相連,就可實現無屏幕接打電話、自動生成會議摘要,還能充當智能健康助手。
伊姆蘭·喬杜里曾任蘋果人機交互界面團隊的設計總監。他對生產一款面向消費者的智能可穿戴產品有著極高的熱情。

▲伊姆蘭·喬杜里和妻子合照
今年年初,這款AI可穿戴設備的背后的專利——“可穿戴設備和云計算平臺與激光投影系統”被媒體扒出。仔細分析專利圖紙,或許可以幫助我們想象未來智能硬件產品的形態與功能。
如此之長的專利名稱泄露出了這款設備的關鍵器件。除AI外,它還配備了3D深度傳感器、Goolge lens、激光投影系統等。從工作流程來看,首先,3D深度傳感器識別用戶手勢指令,接下來它會將捕捉的多媒體數據上傳至云端。這時AI便會分析上下文,并將多媒體數據轉化為圖像、視頻、音頻等格式,最后,激光投影系統會把圖像、視頻等投射在物體表面。
或許這么說來有些抽象,伊姆蘭·喬杜里的現場演示或許可以幫助我們更好地理解這一流程。現場中,由于該設備較小,他將設備夾在夾克口袋上,然后對設備發出了“翻譯”的手勢指令,接著他說了一段話,3D深度傳感器將捕捉的音頻數據傳到云端,AI通過分析然后生成了他所說的這段話的法語版。不僅如此,他還用這個3D深度傳感器掃描了巧克力棒的信息,AI隨后為伊姆蘭·喬杜里提出了健康建議。最讓人驚喜的操作是,伊姆蘭·喬杜里還將原本應該在屏幕上的內容投射到手里,然后在無屏幕的情況下,與妻子打了一通電話。

▲伊姆蘭·喬杜里和妻子在無屏幕的狀態下進行通話
Goolge lens的功能沒有在演示中呈現,但專利圖紙中卻為我們勾畫了一個場景:用戶在修理汽車引擎的時候,Goole lens會將汽車引擎轉化成一個虛擬模型,然后再對虛擬模型中的各元件進行識別,之后各元件功能信息以及修理步驟會通過過激光投影系統投射在汽車引擎表面,指導用戶如何修理。如此看來,這些功能如果可以落地,將會使可穿戴設備逃離“智能手機附庸”的命運,同時還將會極大地拓展可穿戴設備的應用場景。
四、生成式AI或成智能家居“產品經理”,5-10年AI大模型將用于通用機器人
比起VR/AR設備和智能可穿戴設備,大家可能容易忽視的是,智能家居才是AI最早應用的領域之一。億歐智庫發布的報告曾分析出AIoT發展的三個階段,也就是從“單機智能”到“互聯智能”再到未來的“主動智能”,那時,智能系統可以根據用戶行為偏好、用戶畫像、環境等各類信息,隨時待命,并具有自學習、自適應、自提高能力,可主動提供適用于用戶的服務。
這聽起來讓人興奮,但事實上,智能家居產品目前還很不“智能”。IDC發布的最新報告顯示,2022年全球智能家居產品出貨量下降2.6%,降至8.74億臺。

▲2022年全球智能家居設備出貨量情況,來源:IDC
造成這種情況非常關鍵的一點就是,智能家居產品目前交互體驗較差。ChatGPT的融入將會彌補這種情況,那時用戶下達多個指令,系統可以在分析理解后分步執行。Josh.ai家庭自動化系統的聯合創始人Alex Capecelatro曾指出:“如果我們不采用類ChatGPT技術,像我們這樣的企業將不復存在。”
目前,創維數字已經在智能機頂盒領域發力,它計劃將逐步融合AI、物聯網、云計算和大數據技術,并結合NLP和CV等AIGC等相關應用系統,最后使智能機頂盒不僅可以提供電視直播服務,還能成為智慧家居的智能控制中心。創維數字目前計劃接入百度文心一言大模型,推出創維小度盒子。國光電器在互動平臺回答投資者提問時也指出,計劃于今年推出搭載類ChatGPT的智能硬件產品。
雖然現在還沒有使用生成式AI技術的智能家居“爆品”出現,但可以預見的是,未來,生成式AI模型可以通過反饋式學習、聯想和記憶能力,充當智能家電的”產品經理“,從而使智能家居產品不再拘泥于固定程序交互的情況,進一步提升產品的智能化程度。
與其他智能硬件市場當下慘淡現狀有所不同,中國機器人產業聯盟發布的最新數據顯示,2022年,中國工業機器人整體銷量預計超30萬臺,全球銷量占比超過50%,雖然增速較2021年放緩,但是全球市場中占比依舊增長。
今年2月,美的集團宣布將接入百度文心一言大模型,美的家庭服務機器人也將優先內測和試用文心一言的諸多能力。就在3月,谷歌發布了一個基于名為PaLM-E的大模型的機器人樣機,目前該機器人可以按照人類指令拿零食和可樂。
將大模型接入智能機器人計劃說得比較詳細的是阿里巴巴。在今年第六屆數字中國建設峰會上,阿里巴巴CEO張勇稱,阿里云工程師正在將千問大模型接入工業機器人。按工程師的話來講,千問大模型將會為機器人執行任務提供了推理決策的能力,也就是說,當一線工人真正操作這個機器人時,他只需發送文字,千問大模型就可以在理解意圖的基礎上進行任務推理,并自動翻譯成機器可以理解的代碼,指揮機器執行任務。但比較遺憾的是,目前阿里仍沒有發布樣機。
近期,國盛證券對大模型接入智能機器人具體時間作出研判,它研報中指出,大模型在1-5年內,能夠應用于行業化機器人等領域。展望5-10年后的發展,隨著復雜多模態方案的成熟,AI大模型或將能夠應用于通用機器人。
五.生成式AI賦能智能硬件,落地背后的四重挑戰
梳理來看,目前基于大模型的AI硬件大多還都處于概念階段,真正的產品并不多。Humane推出的AI可穿戴設備只向公眾做了功能演示,谷歌基于PaLM-E大模型的機器人也只是發了樣機,而且從視頻來看,這個機器人樣機執行指令十分遲緩。

▲谷歌發布基于PaLM-E大模型的機器人樣機
那為什么會造成這種情況呢?這就不得不從智能硬件本身討論起來。比起軟件開發,智能硬件的制造更加復雜,這其中需要經歷工業設計、軟件開發、云服務搭建、開膜、銷售等一系列的過程。對于廠商來說,制造智能硬件不僅成本高、時間長,而且盈利還難以預估。更重要的是,硬件的生產還涉及到供應鏈渠道體系,如果不能形成規模化的生產,供應鏈可能就會不支持,這就造成產品成本的居高不下。
而就生成式AI賦能智能硬件落地而言,首先要面臨的問題就是大模型訓練的成本極高。創維數字、美的等計劃接入大模型的公司無疑要支付一大筆費用。
其次,在接入智能云大模型平臺后,由于平臺有大量的API接口訪問,這就可能會帶來較長的時延,進而影響硬件產品的交互體驗。再次,硬件廠商還要遵守國家相關政策,保護好用戶數據安全。
最后,對于智能機器人這個品類來說,還面臨著平衡商業機密與編程效率間關系兩難問題。簡單來說,大語言模型的動作指令代碼生成依賴于動作環節的可拆解、可輸入、可訓練,編程效率提高就需要數據要盡可能開源、生產工藝要盡可能標準化,但一旦動作過程涉及商業機密,將存在訓練數據泄漏的風險。
結語:生成式AI或為智能硬件市場帶來新轉機
從市場研究機構發布的關于VR/AR設備、可穿戴設備、智能家居的報告來看,智能硬件市場呈現頹勢,這種情況不單單是受宏觀經濟的影響,還在于這些智能硬件本身功能缺乏創新、缺乏殺手級應用等等。
在生成式AI的浪潮下,智能硬件廠商開始布局將生成式AI融進產品功能或產品生產中去,這將還有助于一部分的智能硬件“重獲生機”。
但是目前僅有極少數玩家推出了基于生成式AI的硬件產品,大多數企業還都停留在概念階段,同時這些硬件廠商也面臨著一些問題,需要不斷進行解決。