智東西(公眾號:zhidxcom)
作者 | 韋世瑋
編輯 | 漠影

經歷過一年的新冠疫情影響,線上辦公和在線學習成為不少人的生活新常態,這大大刺激了K12在線教培行業,線上教育火了,不少科技公司則瞄準兒童及學生的學習剛需,推出各式各樣的軟硬件學習工具。

擁有17年AI教育布局經驗的科大訊飛,就是這股浪潮中的重要參與者之一。

目前,訊飛已推出了訊飛智能學習機、訊飛口袋打印機等人工智能學習輔助產品,因材施教地幫助孩子高效掌握知識,節省家長和老師大量輔導時間。

基于系統化的AI教育布局,在2020年財年中,訊飛的教育教學業務實現1.67億人民幣營收,同比增長16.77%。但學無止境,訊飛在AI教育中的布局也不止于此。

去年10月,訊飛針對學生在英語生詞學習中的聽、說、讀、記全學習場景,推出了訊飛掃描詞典筆,只需筆頭在紙面上輕輕一掃,0.5秒就能查閱英文生詞,掃描識別準確率達99%,還能進行模擬真人對話練習。

據悉,這款訊飛掃描詞典筆一經首銷就售罄,足以見消費者對它的喜愛,而這個成績的背后與訊飛在AI語音及圖像技術領域的長期積累息息相關。

為此,智東西與科大訊飛消費者AI學習業務部總經理翟吉博進行了深入交流,在更好地了解訊飛掃描詞典筆背后的核心技術亮點的同時,也進一步揭開訊飛在AI教育賽道布局的思考與邏輯。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

▲科大訊飛消費者AI學習業務部總經理翟吉博

一、AI語音技術城池的構建,中英文識別正確率達99%

訊飛掃描詞典筆的背后,涵蓋了訊飛從語音到視覺,從NLP(自然語言處理)到醫學影像、手勢識別等領域的豐富AI技術。

“從用戶使用過程到后臺處理的邏輯來看,訊飛掃描詞典筆的工作本質上是一個信息輸入輸出處理的過程。”翟吉博談到,詞典掃描筆的技術鏈條是呈衰減關系,需要一個端到端的完整良好體驗,每一步環節都處理好才能達到符合用戶預期的效果。

我們也親自體驗了一下訊飛掃描詞典筆,看看它的英文識別翻譯是不是真的那么牛。一上手,訊飛詞典筆的體積雖然比一般手寫筆大了些,但握起來手感也不錯。

當我握住筆頭輕輕在紙面上一摁,筆頭的識別燈就會亮起,接著我就像平常做高亮記號一樣勻速滑過想要識別的英文段落,在我持續滑過文字的同時,掃描筆屏幕上也會陸續跳躍出我識別的英文內容。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

接著在我掃描結束1秒不到,屏幕就已經完整顯示我掃描的英文段落及中文翻譯,同時還會有機器語音朗讀一遍,可自由選擇英美發音,從掃描到翻譯完畢的整個過程僅需短短幾秒。

之后我在和翟吉博溝通過程中才發現,這短短幾秒的識別過程背后,其實是許多AI技術環環相扣,才將紙面上的文字呈現在小小的掃描筆屏幕上。通俗來講,這一過程大致要經歷4個步驟:

1、當我掃描英文時,訊飛掃描詞典筆會利用圖像高速掃描技術,將紙面上的打印或手寫文字快速拍成圖片。但這和手機的一次性成像不同,前者是基于用戶“掃描”的動作過程,通過前端的圖像拼接算法將一幀幀的圖片拼接起來。

2、圖像拼接完畢后,就進入轉文字識別過程,需利用到OCR(Optical Character Recognition,光學字符識別)技術,將圖像中的信息全部識別轉換成文字。

翟吉博稱,在這個過程中,訊飛OCR技術的中英文識別率準確率均能達到99%以上,對中文生僻字或形近字的識別準確率約95%以上。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

3、轉換成文本后,設備就通過機器翻譯技術將英文單詞或句子翻譯為中文,其中對整個文本的翻譯也涉及到了機器閱讀理解技術,中英翻譯效果能堪比專業八級水平。

4、完成文本翻譯并不意味著結束,訊飛掃描詞典筆還需進行一些拓展功能。例如,它需要進一步學習單詞,除了中文意思外還需掌握單詞的發音,并基于這個單詞拓展更多的相關知識點推薦給用戶,或者幫助用戶糾正單詞讀音。

這個過程既應用到了常識推理和知識發現技術,也運用到了機器口語評測、聲音定位與檢測等技術。而一個單詞從掃描到結果的呈現,整個響應過程只需0.5秒,速度是翻閱紙質詞典的20倍以上。如果像我一樣掃描英文段落,完成掃描后的響應過程則穩定在1秒之內。

與此同時,訊飛掃描詞典筆還能實現離線查詞翻譯,用戶無需聯網也能使用掃描查詞、語音翻譯、跟讀評測、例句朗讀等功能。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

實際上,訊飛掃描詞典筆與訊飛其他硬件產品的底層技術是具有通用性的,不少核心技術的研發都復用了訊飛的核心研發平臺,即便如此,訊飛僅專注于訊飛掃描詞典筆軟硬件研發的團隊,也已達百人規模。

但由于訊飛掃描詞典筆交互形態的不同,訊飛研發團隊也還需根據設備及使用場景的特點進行技術定制,包括前端圖片處理的掃描和拼接、拼接圖片的OCR識別技術。

其中,用戶在不同的光照環境、掃描握持姿勢、掃描速度/軌跡等條件下,掃描出來的圖片也容易產生畸變,這些都會給OCR技術帶來新的挑戰。

另一方面,訊飛掃描詞典筆的純離線處理功能也對設備芯片提出更高要求,需要在性能不及手機芯片的條件下,在本地進行快速識別翻譯并保證良好效果。因此,研發團隊也對芯片的部分算子層面和指令層面做了深度優化。

不難看出,從底層硬件到算法各個環節,訊飛掃描詞典筆已逐步構建起了一座屬于自己的AI技術城池。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

二、17年AI教育市場積累,詞典筆的誕生和軟硬件生態

“其實在教育方向,訊飛有著原來B端市場十余年的積累。”翟吉博談到,從最初開發訊飛輸入法等互聯網產品,到2017年起瞄準智能硬件方向并推出翻譯機、錄音筆等C端產品,訊飛已積累了不少從硬件研發到供應鏈布局的經驗,以及在B端教育積累的營銷和渠道資源。

在翟吉博看來,如果說翻譯機、錄音筆這些垂直類產品是藍海市場,那么當下訊飛正在往競爭更激烈的黃海市場遷移,爭取更大的市場空間,而遷移的路徑訊飛選擇了AI技術與教育的結合。

之前訊飛在做主打跨語言溝通的翻譯機產品時發現,翻譯機的應用還存在一定的場景限制,例如在個人語言學習的場景中,不少用戶仍依賴傳統紙質詞典或手機端翻譯APP來進行單詞學習和查詢翻譯,而這個過程需要進行跨設備解決,在一定程度上也影響了自身的學習效率。

尤其在K12行業,大多數孩子還無法隨時使用手機APP來查詞翻譯,更需要一個專用的智能硬件來解決。

因此在2020年疫情影響下,隨著在線學習導致電子設備在家庭自主學習場景中的普及,以及家長對電子設備接受度提高,消費觀念和使用觀念得到轉變,訊飛抓住機會推出了訊飛掃描詞典筆,為孩子提供更高效、更低成本的查詞翻譯工具,從而大大提升學習效率。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

與此同時,針對孩子學習的復習鞏固和課外拓展等需求,訊飛掃描詞典筆在硬件連接和內容生態方面也下了不少功夫。

目前,訊飛掃描詞典筆支持生詞本云端同步,并已和訊飛旗下的學習機、打印機等設備打通,方便孩子將積累的生詞本同步到手機端,或與便攜打印機等設備連接,隨時隨地復習和打印。

內容方面,訊飛掃描詞典筆覆蓋了朗文詞典等權威漢英/英漢詞典,還加入了不少課外拓展的聽力內容,即便是K12課程也能同步跟上學習進度。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

三、積極開拓藍海市場,訊飛掃描詞典筆的創新邏輯

在翟吉博看來,目前掃描詞典筆市場本質上是對原來電子詞典品類的一次升級和替換。

“我們小時候使用文曲星、快易典等電子詞典上的基礎功能,現在的詞典筆都能實現。原來電子詞典在便攜性、AI能力、課本輸入效率和成本等方面的不足,在詞典筆上也得到了很好的解決和升級。”翟吉博談到。

從數據層面上看,原來電子詞典市場能實現千萬級的年出貨量,但隨著智能手機的普及,電子詞典的市場規模逐年衰減,如今年出貨量估計為百萬級。

但翟吉博認為,詞典筆的誕生一方面能將如今電子詞典的小幾百萬級市場進行替換,另一方面也將吸引更多新用戶接受智能詞典筆這一新品類。“現在市場還處于初期階段,但如果再發展兩、三年,估計也能達到大幾百萬、千萬的級別。”他說。

盡管詞典筆市場比翻譯機、錄音筆等市場空間更大,但布局的玩家也相對更多。“這個市場的特點是消費者還處在接受、認知和教育的過程,市場也還未出現明顯巨頭,各個玩家也在并跑階段。”翟吉博認為,如何快速普及更多用戶并形成口碑,這一循環也是掃描詞典筆早期開拓市場的一個路徑。

那么,相比文曲星、漢王、有道等也在積極布局詞典筆市場的公司,訊飛的差異化優勢在哪?

翟吉博談到,從公司層面看,訊飛多年積累的軟硬一體核心技術,能對智能錄音筆、翻譯機等效率工具的體驗帶來很大提升,有能力在市場中打造標桿性產品。

從產品層面看,訊飛已擁有了自己的一套學習產品矩陣,能夠圍繞不同學習屬性進行產品組合,同時產品營銷上也有不少渠道與合作資源,相比文曲星、漢王更有優勢,與有道也能形成相互啟發的競爭關系。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

除此之外,翟吉博認為詞典筆的識別準確率和響應速度是當下市場競爭的兩大技術焦點。

“這兩個技術就像蹺蹺板,想要效率又高又快是比較難的。”他談到,識別準確率高需要更大的存儲和處理器,但成本就上去了,甚至響應速度也會下降。

因此,如何平衡詞典筆的識別準確率和響應速度,實現降本增效的同時達到最佳綜合體驗,也是包括訊飛在內的每一個玩家都在思考的問題。

在翟吉博看來,未來訊飛掃描詞典筆的技術也會沿著這個思路迭代,一是單點技術的針對性優化,包括語音識別、OCR識別、語音合成、機器翻譯等技術;二是各環節技術之間的聯動優化,形成端到端的體驗提升。

“從核心能力上看,未來我們也會重點精進知識推薦功能,探索知識圖譜技術能否連接詞典筆輸入輸出的交互,以及后續深度有價值的內容信息推薦。”翟吉博說。同時,面向國際市場的多語言識別功能和特定行業人群的專業領域查詢需求,也將是訊飛持續探索的方向。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

作為一家在AI語音領域深耕20多年的科技公司,訊飛已構建了覆蓋教、學、考、評、管五大主場景的智慧教育全棧產品體系,智慧教育產品也已廣泛落地國內31個省級行政區,與全國超3.8萬所學校達成深度合作,幫助學生更好地提升學習效率,實現因材施教。

“教育本身是挺復雜的,盡管以學生為主體,但教育的完整體系包含了多種環境和角色,如何打通不同環境之間的學習場景,為孩子提供智能個性化的學習方式和建議,形成完整的學習閉環,也是我們一直以來的暢想。”翟吉博說。

他認為,AI教育的核心涉及了大量的教育資源和內容,行業必須形成一個完整的產業鏈,在B端市場中才能更好地針對不同學校教學特點、管理模式做適配,C端市場中也才能根據不同家長訴求和孩子體驗特點做提升。

一支詞典筆撬起的AI教育革命!0.5秒實現99%識別率,訊飛到底牛在哪?

結語:K12浪潮爆發下,AI+教育融合打開創新思路

誰能想到一支小小的詞典筆背后,也蘊含了大量的AI技術,從AI語音到AI圖像,從識別、翻譯再到機器閱讀理解和知識推薦,每一個技術細節都能看到訊飛對科技賦能教育的專注和用心。

但也正是這支詞典筆,引得大量玩家積極涌入,在讓傳統電子詞典市場以新品類、新形態煥發生機的同時,也給AI教育市場的每一位玩家帶來更多挑戰。尤其是隨著產品功能的同質化發展,如何讓用戶更低成本地獲得更高效、更完整的產品體驗,也是每個企業不斷提升的方向。

未來,在這場越來越激烈的AI教育競賽中,AI賦能的下一個傳統品類市場會是什么?誰最終能成功脫穎而出,成為真正引領行業的風向標?我們拭目以待。