4月8日至11日,全國乃至全球媒體的注意力都集中在博鰲亞洲論壇,這里匯集了多國首腦政要與高層人士,他們進行的討論與決策,不僅會影響亞洲經濟發展,更會影響全球經濟走向,其規格之高、意義之重無需多言。
今年博鰲論壇的一個變化就是引入了人工智能進行AI同聲傳譯,其實AI同傳不是新鮮事物,早在2016年的烏鎮大會上,搜狗就率先推出搜狗同傳,為大會提供機器同傳服務。但因為博鰲論壇的影響力且是舉辦17年以來的首次嘗試,從而引起廣泛關注。但擔負此項重任的騰訊AI同傳現場卻表現不佳, AI同傳也一時成了大家的吐槽對象。
拋開騰訊AI同傳在博鰲論壇的表現,機器翻譯的難點在哪里,國內機器翻譯研究水平到底如何,值得行業關注與思考。
騰訊AI同傳現場“翻車”
在一場主題為“全球化下半場:風險和不確定性”的分論壇中,騰訊AI同傳產生了許多錯誤,下圖是公眾號“遇見人工智能”截取的直播小程序頁面,和會議現場的顯示是一模一樣的,可以看到,翻譯出來的內容支離破碎,已經無法正常理解和閱讀。
此外,騰訊AI同傳還出現了類似下圖這樣,不斷重復無意義單詞和字符混亂的情況。
博鰲亞洲論壇作為亞洲乃至全球的一場有影響力的峰會,本是機器同傳一展身手,捕獲各方政要“芳心”的絕佳時刻。而此次論壇中的AI同傳卻錯誤頻頻,在吐槽騰訊AI同傳的同時,一個更加值得關注的問題是國內機器同傳發展水平到底如何?機器同傳的難點到底在哪里,我們又該如何去進一步突破。
AI同傳的挑戰
從行業整體發展來看,認知智能相較于感知智能來說,在引入深度學習方面慢了一拍,整體發展還不成熟,其核心自然語言理解更是業界公認的難點。作為認知智能的落地應用之一,AI同傳也會受制于認知智能的整體發展。
比如在博鰲論壇上,騰訊AI同傳將“一帶一路”翻譯成了“一條公路和一條腰帶”,這背后的故事是,演講嘉賓將“一帶一路”的固定說法“the belt and road”說成了“the road and belt”,這種需要“反應一下”的工作,人類可以輕松完成,但對于缺乏上下文背景、沒有背景知識的機器來說,則是非常艱巨的任務。
此外,在翻譯領域,即使是兩位專業翻譯人員對于完全相同的句子也會有略微不同的理解,而機器翻譯面臨的挑戰就更大,比純粹的模式識別要復雜的多。
騰訊機器翻譯應用AI同傳選擇在博鰲亮相,又同時面臨復雜的應用場景:
第一,各國語言與口音混雜。博鰲論壇嘉賓來自世界各地,即便都使用英語,也存在不易識別的口音問題。英語就分美式發音、英式發音、中式發音等。通常的英文識別引擎側重的更多是美式發音和中式發音,但是如果遇到其它發音方式,識別的效果也會大大折扣。因此,多樣化的發音方式、口音都給AI同傳的第一步語音識別帶來巨大的挑戰。
第二,是會議內容專業性強。無論是騰訊的AI同傳還是其他企業的機器同傳,所做研究的主要應用方向都是通用領域的,對于極其專業和嚴肅的博鰲論壇來說,如何對專業詞匯、術語、關鍵的觀點進行精準的翻譯也是一個難題。即使是人工同傳,也需要花費大量的時間來學習和掌握經濟、政治等這里領域的概念術語的翻譯。
針對騰訊AI同傳在博鰲論壇中的表現,搜狗同傳負責人表示,博鰲論壇中出現的問題,其實是目前行業內都在面臨的幾個挑戰,總體來講就是不同口音的語音識別難、會議內容的領域性強、語音識別錯誤對機器翻譯的干擾、口語化文本翻譯難等難題。
中國機器翻譯,水平到底如何?
從2014年開始,機器翻譯技術上開始從統計機器翻譯(SMT)向神經機器翻譯(NMT)的遷移。深度學習技術的應用和底層框架的突破,使目前國內機器翻譯取得階段性進展。
拿搜狗來說,作為國內較早從事機器同傳的團隊,搜狗早在2016年就在烏鎮互聯網大會上推出了機器同傳產品。這也是全球首個基于深度神經機器翻譯技術的商用翻譯產品。目前搜狗的同傳翻譯已經基于業界領先的Transformer框架。搜狗同傳目前已經在國內很多頂級大會上得到了應用,已經成功為數百場頂尖行業盛會提供過機器同傳服務。
除此之外,搜狗手機輸入法上線了文本翻譯和語音翻譯的能力,日均請求達800萬次。搜狗還推出了搜狗翻譯APP、搜狗旅行翻譯寶、搜狗翻譯筆等各個形式的AI翻譯產品。在國際翻譯比賽方面,搜狗榮獲了國際頂級機器翻譯比賽WMT 2017中英和英中賽道的冠軍,再一次在頂尖的國際舞臺證明了搜狗的翻譯技術實力。
搜狗同傳負責人表示,搜狗同傳取得的這些技術進步,主要得益于搜狗同傳的技術團隊在自然語言處理和深度學習方面有深厚的積累,同時也是搜狗同傳走在行業前沿的關鍵原因。
與此同時,我們也應該看到機器翻譯作為AI研究的前沿方向之一,仍處行業于最早期,比如業界機器翻譯的準確率普遍略低,機器翻譯最難的部分在于盲傳,它沒有背景知識,而翻譯本身又嚴重依賴上下文。這有賴于自然語言技術的突破。
所以騰訊AI同傳面臨的挑戰和問題,是行業內共有的。人工智能的發展仍然處在初級階段,機器同傳應該給予更多的包容和時間,讓這些產品在博鰲論壇這樣規模的會議進行檢驗。