智東西(公眾號:zhidxcom)
作者 | 韋世瑋
編輯 | 漠影
思必馳在AI智慧辦公賽道上正不斷玩出新花樣!
兩個月前的上海AWE(中國家電及消費電子博覽會)上,思必馳首次亮相了面向智慧辦公場景的新產品——會議魔方M1,具有藍牙和USB兩種連接方式、360°全向麥克風拾音、智能降噪和錄音轉文字等功能,大大滿足了各類辦公場景的會議需求。
作為我國人工智能語音行業的獨角獸,思必馳在這條賽道上已布局多年,構建了語音識別、聲紋識別、口語對話系統等一系列核心技術,其自然語言交互解決方案已落地車聯網、IoT及政務、金融等行業場景。
與此同時,思必馳長期以來也為許多合作伙伴提供了會議場景下,聲音采集和處理的軟硬件解決方案。而會議魔方M1推出,也是思必馳將這部分智能語音技術向更加專業的方向集成拓展。

作為思必馳智能語音技術的集大成產品之一,會議魔方M1背后的技術城池是如何構建的?能解決哪些行業及用戶的痛點需求?未來產品迭代路徑是如何規劃的?
為此,智東西與思必馳智慧辦公業務負責人進行了深入交流,在嘗試尋找上述答案的同時,也看到了不少思必馳打磨會議魔方系列背后的思路和閃光點。
一、三大核心技術加持,會議魔方的技術護城河
在深入交流之前,我們也親自體驗了一下會議魔方M1,看看使用它來進行遠程會議是不是真的那么方便。
剛拿到會議魔方M1,我們感覺它比一臺iPhone 12要重一些,形狀是一個塔尖被“削平”的倒金字塔形立方體,重量只有260g,方便攜帶。
在一次業務周會中,我們體驗了一下它在多人遠程會議場景下的使用效果,并和手機進行了對比。參加遠程會議的異地同事反饋,會議魔方的拾音效果明顯優于手機,對環境噪音的抑制能力很強,以往在遠程會議中不可避免的鍵盤敲擊聲、開關門聲、以及空調運轉聲等,在使用會議魔方時,都沒有聽見。與會發言者們的聲音也始終非常清晰,無論遠近,聽到的音量都幾乎一致,沒有忽高忽低現象出現。

如果要使用會議魔方的錄音以及“語音轉寫”功能,在初次使用時,首先要下一個名為“曉語聽聽”的APP,打開后根據軟件提示進行綁定。綁定成功后,直接點擊軟件下方的“藍色加號–開啟錄音”,會議魔方M1就會同步開啟錄音,記錄會議內容。
開始錄音一秒后,手機端的錄音工作界面就會開始出現實時轉文字的內容。遇到想要重點記住的內容時,我們只需要點擊APP錄音界面的“M一下”,轉寫界面就會出現高亮部分,能更好地一眼區分哪里是用戶關注的會議重點。會議結束后,我們只需點擊會議魔方M1上方的結束錄音,手機端的轉寫工作也能很快結束。

從結果上來看,在我們長達3個小時的會議中,會議魔方M1除了口語交流中的少數同音詞、多意詞沒有識別準確外,其他大部分的對話內容都能準確且流暢地轉寫完成。還可以快速生成會議記錄,一鍵分享給參會的同事。
之后,智東西在和思必馳智慧辦公業務負責人的溝通中了解到,會議魔方M1流暢的遠程會議體驗背后有三大核心算法技術,一是拾音,包括遠距離拾音;二是智能降噪;三是對語音進行識別和轉寫,整個過程也是溝通信息被數字化和智能化處理的過程。
1、拾音:5米內全方位清晰拾音
用戶所處的空間環境不同,給會議魔方M1帶來的拾音挑戰也不同。目前,會議魔方能夠做到在75分貝條件下,清晰拾取5米內的任何語音。

2、降噪:3項智能降噪核心
拾音后的降噪工作是一個大工程,涉及到噪聲抑制、回聲消除、增益放大等技術。
一方面,通常會議場景中也會存在許多噪音,包括會議室外有人說話、走動、敲鍵盤,或是室內空調、風扇的聲音,會議魔方M1則需要對這部分噪音進行噪聲抑制,把會議中的人聲清晰地呈現出來。
另一方面,由于設備的揚聲器和麥克風連接得很近,當人們在講話過程中很容易出現回音,這也會影響到用戶的通話效果,這時就需要對拾音內容進行回聲消除。
同時在遠距離拾音過程中,有些說話人離麥克風較遠,會議魔方M1也需要對這部分聲音進行增益放大處理。

3、轉寫:實際會議場景中準確率達95%
正如前面的體驗,目前會議魔方M1在轉寫方面有兩項核心功能,一是區分說話人,根據聲紋和音色的不同,讓轉寫文字能按不同說話人段落顯示;二是文本智能校正,識別口語中常出現的反復、停頓等表達,讓轉寫文本更加流暢。
此外,會議魔方M1通用的轉寫準確率約95%,還支持中英文混合識別、離線轉寫分析等功能。

二、遠程會議需求爆發背后,溝通的數字化與智能化
實際上,會議魔方M1的誕生,離不開思必馳對智慧辦公場景深刻觀察。
思必馳發現,現在的企業會議場景中經常會遇到一個尷尬情況,那就是常常聽不清會議內容或是需要喊話交流,一定程度上影響了會議的質量和效率。
另一方面,企業日常中有許多會議或面對面的溝通,都沒有被進一步的數字化或智能化處理,難以對會議中的一些價值內容進行深入挖掘。

“那思必馳作為專業語音和語義技術的企業,能夠解決其中的一些關鍵點。”負責人解釋,這也是思必馳做會議魔方M1的優勢所在。
首先是思必馳的拾音和智能降噪技術,能夠幫助企業解決聲音的質量問題,讓用戶不管是在小型還是大型會議場景下都能清晰交流。其次是思必馳的語音識別和轉寫技術,能夠實現溝通的數字化。
同時,將一場會議面對面溝通的所有語音轉成文字,能讓用戶快速去獲得整個會議的信息,再通過機器學習技術對信息進行結構化處理,從而實現會議效率和內容價值的進一步提升。
“我們外部環境的變化,疫情的變化也導致越來越多人需要遠程或在家辦公。”負責人補充,在這個環境下還有另一個細分場景,那就是家里或咖啡廳場景下的個人設備需求,能夠讓用戶的遠程溝通更加清晰,并且還能實時記錄交流內容。
而這些都是思必馳決定研發會議魔方M1的重要出發點。
三、千億規模藍海市場下,智能會議業務的創新邏輯
目前思必馳面對整個會議場景的思路是構建一個終端設備+云服務的生態模式,這也是發展的核心,具體到產品業務的拓展大致有三類方向。
一是思必馳在錄音采集方面已經做了單款采集設備,但適合小型、中型和大型等各類會議場景的采集設備也存在不同區別,而這個方面思必馳會繼續做縱深拓展,做得更專業。
二是從橫向來看,為了給用戶帶來更豐富便捷的智能會議體驗,思必馳也將選擇通過深度合作的方式,補全多模態交互的產品組合。
三是所有傳統的會議設備都能和思必馳的語音轉寫終端做配合,將傳統設備變成一個也能智能語音轉寫的會議設備。

除此之外,未來會議魔方M1還需繼續打磨和優化,這主要體現在算法和軟件兩個層面。
算法方面,會議魔方的智能降噪算法技術將實現更大突破和提升。軟件的安全性、易用性和可擴展性也是思必馳接下來重點優化的方向。尤其是會議魔方主要面向企業用戶,對產品的安全性要求更為嚴格。
在可拓展性方面,思必馳在未來也將推出針對大型會議的產品,實現多個設備的互聯互通,從而拓展產品的使用空間。而在信息化上,思必馳表示也將面向多人協作場景提供更多軟件服務,特別是利用到語義識別或關鍵信息提取等技術,與企業化流程相結合,目標是降低企業的運營成本。
結語:遠程辦公浪潮爆發,AI語音賽道的機遇和挑戰
過去一年的疫情影響下,云辦公、語音視頻會議等辦公方式逐漸成為大多數人的常態,徹底點燃了智能辦公行業的發展浪潮。
盡管在后疫情時代下,人們的辦公方式也有所轉變,但企業對辦公效率智能化、數字化的需求已成行業的一大趨勢,越來越多的玩家也抓住機會入局,想著要分一杯羹。在這一市場浪潮下,思必馳也為行業的創新發展提供了一個重要思路。
歸根結底,這也是一場技術與企業實現更深入結合的關鍵階段。相信在未來,隨著人們利用語音技術提取和挖掘信息價值形成一個成熟方法論,也將能廣泛地拓展到政務、醫療等更多細分場景,讓各行各業都能更好地實現降本增效。