智東西(公眾號:zhidxcom)
文 | 寓揚

在剛剛過去的百度世界大會,一款智能音箱raven H經過立項、ID設計、原材料選擇、工廠制造約8個月的時間最終出世,百度創始人兼CEO李彥宏、COO陸奇親自為它站臺,它的發布在萬千矚目下占據大會近一半時間,以至于不少媒體調侃到百度世界大會變身智能音箱大會!

這款由渡鴉科技打造的raven H智能音箱憑借個性化的外觀設計、多元的色彩以及具有想象力的頂部Touch模塊受到業內關注。

獨家:87天,百度渡鴉智能音箱誕生記

根據智東西從產業鏈參與各方的初略估計,百度這款智能音箱打造的近8個月過程中,至少有數千人參與其中。無論是渡鴉、度秘、材料商還是工廠,無論是前方一線還是后方,所有人加班加點追趕時間;無論是長達45天攻克材料難題,還是87天將設計圖紙快速落地產品;無論是“備戰會議室”,還是凌晨3點半隨打隨通的電話,都呈現了百度這款智能音箱誕生背后的故事。

獨家:87天,百度渡鴉智能音箱誕生記

(百度硬件事業部總經理、渡鴉創始人呂騁)

智東西訪遍百度硬件事業部總經理、渡鴉創始人CEO呂騁、渡鴉首席體驗官阿不都力木·阿不都熱依木(以下簡稱阿不)、Tymphany中國事業部總經理劉曉彤一干人等,并深度體驗raven H智能音箱,為你復盤百度智能音箱誕生全過程,以及這款音箱究竟有何特殊之處。

一、數千人組團參戰

首先,我們不妨沿著時間軸回到原點,看看這款智能音箱何時立項、如何誕生,從ID設計到工廠生產又經歷了怎樣的故事,百度內部以及產業鏈到底有多大投入。

這還要回到今年2月份,百度宣布全資收購主打家居場景智能設備的創業公司渡鴉科技,渡鴉創業早期,智東西就曾對創始人呂騁和該項目進行過深度報道。呂騁攜團隊正式加盟百度,并擔任百度智能家居硬件總經理,向COO陸奇匯報。據智東西產業鏈人士消息,百度為渡鴉投資幾億元來打造一款智能硬件,渡鴉也不負使命,在11月16日百度世界大會前完工了raven H智能音箱。

獨家:87天,百度渡鴉智能音箱誕生記

同渡鴉團隊成員溝通中得知,智能音箱這個項目3月份開始立項,5月底第一個設計方案出來,然后在工廠實驗材料、落地產品,10月初第一批樣機出來,11月生產線上的樣機完成。Tymphany中國事業部總經理劉曉彤與呂騁團隊一起見證了渡鴉raven H從想法到誕生整個過程后,也感嘆不已,據其估算,從拿到敲定的設計圖紙,到產品最終落地并在11月16日公之于眾,前后只用了87天,這個速度在智能音箱打造過程中是很了不起的效率,和渡鴉團隊交流中,每次提到這個點,團隊成員都表現出自豪和激動。

為了這款raven H,渡鴉近百名員工全部All in 智能音箱,百度內部也有DuerOS語音團隊和AI團隊等進行內部配合,而外部還有龐大的供應鏈體系,包括材料商、工廠的聲學、結構、制造團隊等,據渡鴉團隊透露,加起來至少幾千人組成的大團隊參與到了這個硬件的開發生產中。

渡鴉團隊2月份加入百度,為了這個項目團隊不斷擴充,目前已到近百人。據產業鏈人士透露,渡鴉做硬件的團隊之前曾參與過旗艦手機的生產,在硬件領域呆了很多年,圈內都很知名,很專業也很拼!

立項并擴充團隊后的第一件事就是ID設計,渡鴉找到了北歐的著名設計公司Teenage Engineering共同設計出了今天我們看到的ID。渡鴉首席體驗官阿不談了色彩的來源,現在年輕的潮流人群,在購買家居時以宜家為首選,而宜家的家居除了暖色系外,就是按照橙、紅、藍、綠四個色系搭配的,這給了渡鴉很多參考。

渡鴉方面還談到,raven H的目標用戶就是那些年輕的潮流人群,追求的就是特立獨行,因此采用了獨特的外觀和豐富的色彩,很容易辨別也很時尚。渡鴉被百度收購前上一代智能家居控制設備Raven H-1的模塊化設計也被用到了raven H的設計理念中。

此外,在raven H類似“積木”的模塊化分體設計,尤其是頂部的Touch模塊可以在功能上疊加更多設想,渡鴉團隊為人們保留了更多想象空間。

二、87天:從圖紙到產品

當ID構想好之后形成方案,便開始跟工廠開始溝通,并進行產品落地。苦不堪言的材料試驗、沒日沒夜的趕工、87天從圖紙落地產品成了這一階段故事的核心。

關于raven H智能音箱由圖紙落地到產品背后的過程,我們從渡鴉團隊、Tymphany中國事業部團隊等那里獲取了更多的信息。

獨家:87天,百度渡鴉智能音箱誕生記

(百度世界大會現場)

Tymphany中國事業部總經理劉曉彤對智東西講到,這款智能音箱正式動工是在8月份,之前的接觸則是談好產品的設計,并由百度提供方案。為了這個項目,Tymphany前前后后投入約50人的團隊進行配合,包括聲學、結構、電子以及模具組等,最終87天完工,產品落地。

87天究竟是一個什么樣的速度呢?出口國外的藍牙音箱從設計交付到產品落地的時間周期大概是6~9個月,包括國外的驗證期、時間差、假日等。智能音箱按道理說應該更加復雜,按國外的做法基本上生產要1年,如Echo研發了2年,后來生產基本也需要1年1款。盡管國內團隊都很拼,正常情況下產品的落地仍需半年左右的時間,而渡鴉以及Tymphany團隊在87天將產品落地,可以說效率很高。

“他們的團隊(渡鴉)很專業,執行能力很強,大家都很拼”,這是劉曉彤對整個產品生產過程的感嘆。

然而首先面對他們的就是痛苦不堪的材料打磨。可以說這份痛苦要來自Teenage Engineering這家設計公司提出的高溫尼龍玻璃纖維復合材料 Kalix,它非常適合用于智能硬件,一方面摸上去它的質感要比普通的PC材料好很多,另一方面這種材料也可以減少震感,有利于提供更好的音質。

獨家:87天,百度渡鴉智能音箱誕生記

(高溫尼龍玻璃纖維復合材料 Kalix)

但問題是這款材料很貴而且最初很難落地到產品,蘋果也只是在iPhone的邊框部分使用了這個材料,來使手感更順滑。渡鴉曾身處一線的工作人員談到,這個材料成本很高,坑很多,當時從臺灣、歐洲、美國調來了幾十個博士到工廠就為攻克這個材料。

“這完全是化學實驗,同樣的配方同樣的模具,1號機出來OK,2號機出來不OK,控制變量都不行,我們都快崩潰了”,當談到材料時,渡鴉工作人員明顯情緒有些波動,“當時我們在生產線搭了帳篷,用了45天就為調試這個材料!”

Tymphany一位技術負責人也談到,這也是他們遇到最大的坑,做到幾近要放棄。一般產品加玻纖10%~15%的時候,表面就很難做漂亮,容易坑坑洼洼,為了它模具、設備都要從新改造。

“最難的在于外面的玻璃纖維材料與音箱中間的黑色材料是兩種不同的材料,但需要同時進模具,兩種材料的熔點什么都不一樣,沒有人做過實驗,為了這個工藝我們做了45天的實驗”,呂騁感嘆到。

而且我們看到raven H豐富的色彩并非噴漆后的顏色,而是玻璃纖維材料直接調出的原色。可見,為了讓外觀更好看,材料質感更舒服,渡鴉以及各方團隊費了一番功夫。

獨家:87天,百度渡鴉智能音箱誕生記

材料問題解決了,接下來依舊是艱辛的產品生產環節。劉曉彤談到,為了這款音箱,各方還在工廠設了一個“備戰”會議室,能夠坐20多人,就從來沒空過。無論是渡鴉、百度、材料還是工廠人員都很拼,為了這個產品,基本上只要有一個人在現場沒有下班,合作方的幾個核心負責人都會陪著,“前線待到幾點,后方老大就坐鎮到幾點”,這位Tymphany技術負責人表示。

而這其中還有一個小插曲,渡鴉的一個結構負責人從北京奔赴工廠,一呆就是兩個月,全身心參與到硬件打磨生產的全過程,由于長期熬夜以及工廠生活直接工作到心律不齊,為的是能夠盡快趕出產品。

“這些互聯網公司的人大多是大公司出來的,對產品流程的嚴謹性、驗證的科學性要求很高,但遇到更注重速度的互聯網企業,他們又放不下職業里的嚴謹性,就只能把時間投入進去”,劉曉彤總結到。

同時拼搏在一線的不止渡鴉團隊,還有Tymphany團隊以及百度等團隊。Tymphany這位技術負責人感嘆到,最長的一次是4天3夜都待在廠房里,當趕一個東西時需要一個持續的過程,機器一旦開就不能停,同事累的不行了就直接睡在機器旁邊,為了產品體驗、細節打磨,大家投入很多。

百度內部也是如此,“我們經常半夜隨時電話渡鴉和度秘,凌晨3點半以前都可以打通,隨時保持溝通”,劉曉彤這句話恰好反映出為這款產品,各方付出的心血。

實驗室的樣機第一次出來大約是在9月底10月初,為了隔天就能讓渡鴉拿到機器,劉曉彤又講述了一個有趣的故事。為了讓渡鴉、度秘等團隊來驗證技術,保證隔天早上可以送到,他們想盡了郵遞、托運的辦法。盡管是靠飛機托運也不能完全保證第二天早上可以送到渡鴉團隊,為此,劉曉彤最終選擇派人連夜“人肉”把樣機送到北京,后來都是如此。可見為了產品準時交付,Tymphany也在近可能避免一切風險。

獨家:87天,百度渡鴉智能音箱誕生記

(百度世界大會現場)

就這樣多方團隊奮戰到11月初,產品線上的樣機出來了,趕在了11月16日百度世界大會之前完工。87天,渡鴉智能音箱從圖紙到產品落地,從硬件層面來說,他們值得自豪。

三、北京三里屯洲際酒店智能客房體驗

再回到2017年11月21日,智東西作為少數特邀媒體,來到了渡鴉與戰略合作伙伴洲際酒店共同打造的位于三里屯通盈中心洲際酒店首個AI智能客房(樣板間),參與了渡鴉raven H的深度體驗。

這款智能音箱給人的第一印象是外觀的新穎時尚。不同于市面上的“桶型”智能音箱與黑白灰的配色,raven H采用積木式的8層級結構,并配以橙、紅、藍、綠四種顏色,給人以層次感和鮮活感。

整體來看,raven H方方正正,邊長8厘米,高為11.3厘米,可“安穩”立于手掌之上,可見小巧。raven H采用分體設計,整體可分為兩部分,頂部的Touch模塊相當于音箱的“主機”,而下面7層則是“機身”。

獨家:87天,百度渡鴉智能音箱誕生記

頂部的Touch模塊由一個19×19的LED點陣屏構成來呈現基本的視覺信息,同時可以進行長按、雙擊、滑動觸控操作。它通過一個磁性接口和音箱本體連接,可進行上下滑動以及“拆卸”。在家庭中,你可以隨意攜帶Touch模塊,并像使用微信APP一樣,進行長按模塊中部發出語音指令,Touch模塊背部也有一個小的揚聲器,但主要作為提示音存在,具體的播放任務以及遠場交互則由音箱本體來承擔。

獨家:87天,百度渡鴉智能音箱誕生記

(頂部Touch模塊)

原來raven H的Touch模塊和音箱本體各自帶有一個4麥克風陣列,兩部分都可以拾音并進行獨立使用,不同的是Touch模塊滿足觸摸近場語音交互,音箱本體負責遠場語音交互,等于說這就是“兩套”智能音箱,而這無疑增加了成本。而在具體工作中,渡鴉團隊談到,音箱會通過傳感器感知Touch模塊傾斜的角度,通過算法進行動態工作,判斷使用麥克風的數目。

智能音箱小巧容易,但難的是如何在小體積下保證音質以及實現有效喚醒。在這方面,raven H使用了國際音響知名品牌Tymphany定制的Peerless 2寸全頻喇叭來保證音質,并在7.2厘米的間距中做到麥克風陣列與揚聲器共存,實現遠場5米喚醒。

獨家:87天,百度渡鴉智能音箱誕生記

通過raven H智能音箱的現場體驗以及渡鴉工作人員的講解,我們對這款產品有以下了解:

1、拿到產品激活的第一步就是配網,目前國內新一代的產品中都開始使用更簡便與快捷的藍牙配網。而raven H則采用了WiFi配網,不超過45秒。不過,有趣的是,渡鴉并沒有給自己的智能音箱做APP,而是直接通過微信公眾號的形式聯網、管理使用,減少了用戶下載應用的成本。

2、raven H在約3米和5米的距離內均可保持較高的喚醒率。喚醒是我們進行人機交互的第一步,只有良好的喚醒才能實現后面的交互。我們現場進行了3組測試,第一組是在據智能音箱3米處,通過正常人聲3次均可喚醒;第二組智東西為了進行5米測量,特意站到了由一面玻璃墻格擋的洗漱間,并在約5米處以近似相同的聲音呼喊“小度小度”,3次也都實現喚醒。

獨家:87天,百度渡鴉智能音箱誕生記

(約5米環境實測raven H喚醒率)

第三組測試中,raven H還可以在高分貝音量下實現喚醒。該組測試可分為兩種情況,一種是當raven H自身播放音樂時,在接近100分貝的音量下(回想一下裝修中電鉆機的聲音吧),可實現在1米內無障礙喚醒,可見raven H在回聲消除等方面下了一番功夫;另一種情況是用另一臺音箱就近提供一個約70分貝的噪聲(鬧市街道聲),raven H同樣可以實現喚醒。

3、機器對指令的響應時間也是影響用戶體驗的一個重要因素,raven H可以做到平均1.4秒的響應時間。目前1~1.5秒的響應時間較為理想,1.5~2秒有燈光顯示聲音反饋,效果也不錯。渡鴉工作人員指出,在考慮網絡環境以及用戶體驗,做到較為均衡的1.4秒響應。

4、做為一款音箱,好的音質同樣十分重要。raven H盡管體型“嬌小”,但在音質上同樣有不俗的表現。它采用音響界知名品牌Tymphany定制的Peerless 2寸全頻喇叭,通過現場分貝儀的測試,可以達到120分貝的高音,相當于你趴在汽車頭部鳴笛的聲音。通過《加州旅館》這首專用于低音測試的歌曲,我們還能感受到raven H聲音的飽滿、低沉、自然。

5、與其他家智能音箱通過APP來實現管理不同,raven H通過微信公眾號實現技能商店等服務。為了降低用戶的使用成本,渡鴉直接跳過APP,將應用做在微信公眾號中。微信公眾號內置技能商店,渡鴉預裝技能大約五六十個,其他技能(DuerOS目前已有200多項技能)用戶可以自行添加使用。

獨家:87天,百度渡鴉智能音箱誕生記

6、海量數據有了,智能化仍需發力。在內容方面,渡鴉主要展示了體育、音樂、視頻三方面的語音交互,可以發現在限定邊界的場景內,以任務為導向的指令可以做到不錯的理解和交互,體育領域可以做到盡管問,顯示了渡鴉在這方面的深耕。但在音樂方面,raven H接入了百度音樂、太合音樂,還可支持喜歡/收藏功能,但考慮當下音樂版權的現狀(大部分在騰訊),流媒體音樂仍是渡鴉下一階段要重點攻克的一關。而在智能音箱早期,渡鴉給出的解決辦法是通過藍牙與手機相連播放,作為音頻資源的補充。

此外,盡管百度有著海量的數據以及強大的搜索能力,但raven H在問答領域的多輪對話仍需改善,DuerOS的潛力還沒有完全釋放出來。可見落地到智能音箱時,在NLP(自然語言處理)方面仍需進一步打磨。渡鴉團隊也談到,百度有海量的數據,但主要是應用在網頁搜索中的, 針對語音搜索還需要對數據進行清洗,更深層的交互還在進一步打磨,后續會有更多進展。

7、有趣的“如意說”功能。所謂的如意說是指,raven H可以根據語音語義給出不同的回答。在語義上,當你給出一個完整的提問“今天天氣怎么樣?”,它會給你完整的答復,包含氣溫、空氣質量、生活提示等。但是當你只拋出2個字“天氣”,它也會很簡短的回復你氣溫狀況。在語音上,raven H可以根據用戶的語速來選擇合適的語速進行應答。此外,小孩和成人講出的“講個笑話”,raven H也會給出不同的回復。

獨家:87天,百度渡鴉智能音箱誕生記

8、在方言方面,raven H已支持部分大眾方言(與普通話接近的)。現場我們用重慶話和河南話對raven H進行“調教”,它都準確給出了回答以及實現了家居控制。

9、家居控制也是智能音箱應用的一個核心點。目前raven H已支持34個品類共120款設備的家居控制,包括愛奇藝電視果、飛利浦、SONOS、蘇寧等。目前百度已經和洲際酒店集團達成了戰略合作,渡鴉首階段已在三里屯通盈中心洲際酒店行政樓層推出AI智能客房(樣板間),之后將推廣到全國40多家洲際酒店及度假村共計100間套房。

10、最后還有一個小細節,數據線本是一個很普通的東西,但為了差異化,渡鴉做成了復古式“電話線”版的數據線。

可以看出,渡鴉團隊在產品設計、用料、產品結構、硬件打磨上的用心,包括頂部Touch模塊和音箱本體兩套麥克風陣列系統,昂貴的高溫尼龍玻璃纖維復合材料Kalix(iPhone邊框使用的材料),Tymphany打造了全頻喇叭等這些都大大提升了這款智能音箱的成本。難怪渡鴉方面會說盡管我們定價很高(1699元),但也并不賺錢。

盡管DuerOS 2.0 被首發用到raven H上,讓渡鴉的產品有了一個堅實的技術基礎平臺,但在音樂內容、語音交互尤其是多輪對話方面如何在落地時帶來最佳體驗,還需要不斷打磨。

四、Touch模塊上的“野心”

在體驗現場,渡鴉團隊和創始人呂騁還與智東西談及了raven H的分體設計以及智能音箱產品定位上的一些看法。

所謂的分體設計,就是在頂部的Touch模塊和音箱本體上同時使用相同的兩套麥克風陣列、內存、主板等,這就相當于2套完整的方案,為什么渡鴉要采用這種較貴的方案呢?

獨家:87天,百度渡鴉智能音箱誕生記

渡鴉方面稱,在內部他們更傾向于把Touch模塊稱為智能音箱的“主機”,而把音箱本體稱為“機身”。除了外觀外,音箱本體和其他市面上的智能音箱并無本質不同,都用于遠場語音交互上。

而與其他智能音箱不同之處正在于Touch模塊,“Touch模塊才是主角,單獨拿在手中按住說話,不用喚醒詞,就像微信語音一樣”,呂騁演示到。單獨的Touch模塊則又在純語音交互外,給了用戶觸摸交互的選擇。

而渡鴉的“野心”顯然不止如此,通過渡鴉團隊的溝通以及渡鴉的兩款產品raven R 和raven Q,可以看出渡鴉想要賦予Touch模塊更多的想象力,通過磁性結構連接更多的設備,從而以模塊化的方式兼容更多的設備,比如Touch模塊+HiFi音箱、Touch模塊+機械手臂等等。

但如果渡鴉想要實現這種“野心”,首先要做的就是鋪開銷量,只有獲得更多的用戶,才有可能發展成連接器,連接更多的設備。而1699元的價格則可能會成為它首先遇到的障礙。

獨家:87天,百度渡鴉智能音箱誕生記

在既有的智能音箱中,無論是國外亞馬遜的Echo、還是國內阿里的天貓精靈等都采取的是音箱這個形態,其中一點就是找到用戶的一個既有品類認知,以此打開市場。可是渡鴉又為何將產品設計成一個非音箱的樣貌,進而稱自己為智能音箱呢,用戶又能否接受這種認知?

渡鴉團隊談到,這款智能音箱定位的就是潮流的年輕人,他們追求的就是特立獨行,無論是外觀還是配色,raven H都是時尚的。

未來智能硬件的形態,音箱是一個很好的起點,但不是終點。呂騁判斷音箱這個形態不會停留太久,因為音箱不會是一個定義性產品(相比iPhone)。對于未來的定義性產品,渡鴉也在探索,而此次他們給出的答案就是Touch,以Touch為載體,將更多的功能和應用接入Touch,比如六軸機器人。

結語:百度智能音箱誕生記

歷時近8個月,百度這款智能音箱由團隊組建到ID設計再到工廠落地生產,尤其是工廠環節,我們看到了這款高顏值智能音箱背后的故事,看到了百度為打造其首款智能音箱的付出。

李彥宏、陸奇親自為其站臺,百度世界大會近一半時間拱手相讓,可見百度對這款智能硬件的重視。對于百度而言,它為百度將技術與生態落地到產品提供了一次機會,通過打造這樣一個標桿產品來快速迭代技術,構建自身生態。

但百度能否像微軟一樣,成功打造一款引領潮流的Surface,仍是一個未知數,而產品的出現則至少讓一個新的故事開始展開。


每日一頭條

趨勢·深度·犀利·干貨,最專業的行業解讀

深喉爆料、投稿:guoren@jmfly.net

獨家:87天,百度渡鴉智能音箱誕生記