車東西(公眾號:chedongxi)

文 | Origin

4月16日,第十八屆上海車展正式開幕。當數以萬計的觀眾涌入會館,一睹千余輛展車的風采之時,一家AI公司,也加快了“上車”的步伐。

4月17日,語音交互AI公司思必馳,與國內大型第三方車聯網公司博泰簽署戰略合作協議,建立語音AI私有云平臺,為更多車企賦能。

從后裝走向前裝 思必馳的語音AI上車之路

▲思必馳與博泰簽署戰略合作協議

這次合作的背景,是此次上海車展上,超過8成的新車型,都搭載了智能語音交互技術。車載語音交互技術的市場潛力顯露無疑。

這家在人工智能創業領域頗有名氣,要如何在愈發興盛的車載智能語音交互市場開拓更大的發展前景,思必馳能為這個領域帶來什么差異化的價值?

車東西與思必馳副總裁雷雄國進行了一番深度交流,他向車東西繪出了思必馳智能語音交互技術的上車路線。

從后裝走向前裝 思必馳的語音AI上車之路

▲思必馳副總裁雷雄國

一、從后裝到前裝 思必馳語音交互上車的技術底氣

提及思必馳,對智能家居或AI有興趣的人應該不會陌生,這家以AI語音交互技術為出發點的公司,在語音交互技術席卷各類消費電子產品的浪潮中貢獻了重要力量。智能音箱、智能電視、對話機器人····它們背后都有思必馳的身影。為人熟知的小愛同學、天貓精靈、華為音箱,關鍵的語音交互技術提供者,正是思必馳。

想象力更大的車載語音市場,其實思必馳也早已開始布局。思必馳語音交互上車之路,是從后裝渠道開始的。在早兩年的后裝智能車機、智能后視鏡熱中,思必馳向大量的硬件設備商輸出了語音交互的技術方案,合作伙伴包括車蘿卜、360、飛歌、小米70邁、盯盯拍、兜風出行、易圖等等。其中,思必馳投資的車蘿卜,目前在國內HUD領域排名第一,2019年主推AR-HUD。

在大量硬件設備合作伙伴的產品輸出下,雷雄國告訴車東西,思必馳在后裝車載語音交互市場的占有率達到70%。

而近兩年,智能語音交互技術的進一步成熟,突破了以往車載語音技術命令式交互的局限。語音交互的體驗得以大大改善,它成為新車型產品力的重要組成部分。這使得車載語音交互技術從后裝走向前裝,成為不可阻擋的大趨勢。

車企有需求,思必馳有技術,從后裝走向前裝理所應當。但趨勢歸趨勢,這條路并沒有那么容易走。雷雄國向車東西表示,后裝市場主要是思必馳向合作伙伴輸出技術方案,而在前裝市場,車廠會提出更多的技術指標,就車載的場景來說,有三大關鍵問題必須解決:

1、車內聲場環境復雜,包括風噪、胎噪、背景回聲在內的各種噪聲加大語音的采集識別難度。

2、車內網絡環境復雜,汽車高速行駛過程中網絡連接質量通常較差,語音交互技術過多依賴云端的話體驗會很差。

3、車內人車交互的主體從駕駛員拓展到了前排乃至后排乘客,傳統只針對駕駛員的語音交互方案無法滿足車內其他人的需求,或者會在駕駛員語音交互過程中受到其他乘客干擾。

針對這三個問題,思必馳提出了自己的解決方案。

對車內聲場環境復雜的問題,雷雄國告訴車東西,思必馳通過后裝設備采集到的數據發揮了很大作用。思必馳在后端建立了一套大型的自動化數據處理模型,以及訓練、測試的流程,讓思必馳的語音交互算法在各種實際的噪聲環境中不斷訓練、強化,保證語音識別的準確性。

對車內網絡經常處于弱網狀態的問題,思必馳則有意識地降低了對云端設施的依賴。具體包括:通訊錄、控制系統操作、導航、音樂等常用功能的語音控制,思必馳將其做在了本地(車輛端),不必依賴網絡;本地的數據,與云端數據更新保持快速同步,并且會根據用戶的畫像做個性化的數據更新;此外在語音指令的置信度和網絡延時的判定方面,思必馳也進行了大量優化工作。這些工作的結果是,在沒有網絡的情況下,思必馳提供的技術方案也能支持關鍵任務的操作。

對于車內多主體的交互難題,思必馳則推出多音區方案,進行聲源定位,在不同音區內精準識別不同對象的語音。目前,思必馳能夠提供雙音區、四音區、六音區的交互方案,其中既包括更多靠軟件算法實現的單麥克風方案,也有使用多麥克風搭配軟件的軟硬一體化解決方案。

從后裝走向前裝 思必馳的語音AI上車之路

▲思必馳多音區方案樣例

在這些解決方案之外,思必馳還做了大量的工作,比如對語音進行“清洗”的信號處理算法優化、語義理解算法的優化、喚醒+識別同步技術的開發、大型知識庫的建設等等。

這些全面優化語音交互體驗的技術工作到位,才有車企選擇買單。雷雄國稱,雖然前裝的技術標準指標更高,開發周期更長,但好在確定性更高——換句話說,收入更有保障。

車東西了解到,思必馳目前已經與20余家車企建立了合作,客戶包括吉利、長城、一汽大眾、北汽、小鵬汽車等等。

車東西還了解到,思必馳能夠拿到眾多車企的訂單,除了技術作保障,思必馳的態度也很重要。

二、“讓車企有選擇” 開放模式打動車企

車企在與供應商合作的過程中,往往會考慮“選擇權”,供應商過于強勢是主機廠的大忌。而作為智能語音技術供應商,思必馳的開放態度,則讓合作伙伴們很放心。

思必馳的開放首先體現在內容生態上。

思必馳引入了來自廣泛互聯網、移動互聯網的第三方內容服務,包括BATJM等。雷雄國稱,目前思必馳已經接入200余家企業的內容與服務。

在廣泛對接全網資源的情況下,思必馳基于其DUI開放平臺,開發了100余個高可用的車載語音交互技能,讓車內的語音交互有了更高的便利性與可玩性。

而在與車企的合作過程中,思必馳也秉持著這種開放性。

雷雄國向車東西表示,思必馳將自身的車載語音交互技術方案打包成了“天琴語音助手”,這是一個全鏈路的語音交互產品,集成思必馳150余項高可用的車載語音技能,支持聲紋識別、多音區、離線交互、方言識別、車載客服、快捷命令、OTA升級等能力,為車企提供智能語音交互的全套支持。

從后裝走向前裝 思必馳的語音AI上車之路

▲思必馳全新車載語音交互系統:天琴助手

不過,如果車企不想全要也沒關系,思必馳也能通過SDK的形式,為車企以及Tier-1提供單點語音技術支持。

思必馳這種讓車企“有得選”的開放性,甚至滲透到了非常細節的技術中。上文提到的思必馳多音區解決方案,雷雄國告訴車東西,就近場而言,一枚麥克風+軟件算法的“純軟方案”,和多枚麥克風+軟件算法的“軟+硬方案”,在單純的識別效果上差距并不是十分顯著。純軟的方案可能成本更低,但是無法滿足車廠的高級需求,例如說話人的位置確認、身份識別、更針對性的車內消噪處理等。同時還要考慮和設備的主控芯片的配合,以追求最高的性價比、達到最好的效果。

思必馳提供兩種不同方案,主要目的在于滿足車企不同的開發需求。

當思必馳對車企的需求已經考慮到如此細致的程度的時候,車企當然會歡迎這樣用心的語音交互供應商。

三、與博泰合作加速“上車” 車規級AI芯片正研發

理解了思必馳的開放性,對思必馳與博泰的合作也就不難理解了。

博泰作為國內最大的車聯網公司之一,其態度也是高度開放,并且在BAT強勢入局車聯網之時緊緊站在了車廠一邊。這使得博泰對車廠的需求、車聯網的產品理解很深,也積累了眾多車企合作伙伴

在思必馳與博泰的戰略合作發布會上,博泰CEO應宜倫透露,為了搭建這一語音AI私有云平臺,去年下半年雙方開始接觸,組建了百人團隊。

雷雄國告訴車東西,思必馳與博泰的合作根據各自所長進行了分工,思必馳更多提供核心的語音AI技術,博泰則圍繞車聯網產品進行打磨,調用第三方服務。雙方共同搭建一個平臺,去為車企服務。

而思必馳與博泰共同搭建的語音AI私有云平臺,對思必馳語音技術上車有著新的意義——以往車企在車聯網的合作中總是顧慮數據與差異化的功能點被第三方的公司取得。這一語音AI私有云平臺建立后,車企既可以通過它調用各種語音交互能力,又能通過數據的隔離保證數據的安全與功能的差異化。

可以說,思必馳的開放態度給了車企更多選擇,與博泰合作建立這一私有云平臺,則解決了車企接入車聯網生態的一大痛點。可以預見的是,思必馳在前裝領域的上車步伐,將在這一私有云平臺的幫助下進一步加速。

當然,思必馳對車載語音交互前裝市場的思考,也不止于此。

雷雄國還向車東西透露,思必馳已經在今年年初發布的AI語音芯片“TH1520”基礎上,規劃了車規級AI芯片。這款芯片,車載語音交互體驗尤其是本地化功能的體驗將會得到提升。

此外,在車內語音、視覺、手勢等多模態交互越來越主流的形勢下,思必馳也將其目光從語音識別、自然語言理解等領域向多模態交互方向拓展。

思必馳方面告訴車東西,他們依托于上海交通大學-蘇州人工智能研究院,正在開展多模態的人工智能交互研究。

結語:不斷進化的語音AI公司

在人工智能技術被廣泛認知的今天,其不斷學習、快速進化的特點成為它被廣泛應用的關鍵優點。

而從事語音人工智能技術開發的思必馳,也擁有這樣的特點,這家公司在短短數年內,將其智能語音交互技術從智能終端走向多維企業服務,汽車領域又成功地從后裝走向前裝。

思必馳不僅在單點技術積累上不斷進步,對市場的理解也在迅速加深,如今其技術維度或即將迎來拓展。

就像AI在不斷進化的過程中應用的場景不斷拓展,思必馳在不斷進化的過程中,也贏得了越來越多的機會。