智東西(公眾號:zhidxcom)
文 | 韋世瑋

智東西8月25日消息,今天,百度在百度大腦語言與知識技術峰會上發布語義理解技術與平臺文心(ERNIE)、智能文檔分析平臺TextMind、AI同傳會議解決方案3項新產品,以及智能創作平臺和智能對話定制與服務平臺UNIT的多項升級。

其中,文心基于深度學習平臺飛槳打造,能夠為用戶提供一站式能力,將為開發者減少90%數據標注量、90%算力投入、85%模型開發時長,進一步降低NLP定制開發的成本。

據了解,這些新產品發布與升級覆蓋語言理語言生成、對話、機器翻譯4大NLP(自然語言理解)領域重點研究方向。

除此之外,百度CTO王海峰也來到現場,為大家分享百度大腦發展歷程的同時,也從知識圖譜、語言理解與生成技術等方面介紹了百度完整的語言與知識技術布局。

值得一提的是,百度還聯合中國計算機學會、中國中文信息學會,共同發起中文自然語言處理數據共建計劃——千言,同時百度技術委員會主席吳華還發布了百度語言與知識技術算力共享計劃。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

一、三大新品發布與兩大產品升級,豐富落地應用

峰會上,百度集團副總裁吳甜以理解、生成、對話、翻譯四大方向,分別介紹了三款百度語言與知識技術的新產品,以及兩項新升級。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

1、文心(ERNIE):語義理解技術與平臺

2019年,百度發布了具備持續學習和知識增強的語義理解框架ERNIE,語言理解能力得到了大幅提升。而今年,百度在ERNIE核心技術基礎上延展開發了語義理解技術與平臺,并取名為“文心”,意義取自《文心雕龍》。

據介紹,文心基于深度學習平臺飛槳打造,集成了預訓練模型、全面的NLP算法集、端到端開發套件和平臺。文心將減少開發者90%數據標注量、90%算力投入、85%模型開發時長,為開發者提供一站式NLP開發與服務,從而降低NLP定制開發的成本。

目前,文心已經廣泛用于百度產品中,包括搜索引擎、推薦系統、智能音箱、智能客服等。同時,文心已累計支持超過20000名開發者,應用場景覆蓋金融、通信、教育、電商等各行各業,顯著提升企業應用效果和效率。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

2、TextMind:智能文檔分析平臺

TextMind是百度面向企業文本智能化需求,推出的智能文檔分析平臺,主要面向文檔解析、文書審核等場景。

TextMind的底層基于OCR和NLP技術,以文檔解析為核心能力,支持文檔對比、文檔審核等功能。同時,TextMind還結合了知識圖譜的能力,能幫助企業在合同審核時能發現更多的隱含法律風險。

吳甜介紹,TextMind核心優勢為“多、快、好、省”。

其中,“多”指支持多種格式,TextMind目前可解析6種格式、20類文檔;“快”指顯著提高企業文檔處理效率,比如,可將企業報銷時間從3-5個工作日縮短至1分鐘;“好”指效果好,基于TextMind預置的文檔解析能力,企業開箱即用,實現零門檻定制;“省”指文檔規范化解析可幫助企業降低人力成本80%以上。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

3、AI同傳會議解決方案

百度自2017年推出同傳系統以來,其AI同傳已逐步構建起較為豐富的產品形態,包括桌面助手、翻譯、同傳功能等。這次百度則面向會議場景,發布AI同傳會議解決方案,覆蓋會議全場景、全流程。

現場,吳甜還為大家展示了如何只用一臺電腦和一部手機,就能快速搭建一套同傳服務,只需點點鼠標、打幾個字,就能快速獲得專業的同傳服務。

值得一提的是,用戶在會議前可以根據會議設計的特定領域進行屬于定制,來應對各類專業議題中獨有的詞義,讓翻譯更準確。同時,用戶在會議中也可以隨時進行術語干預,并實時生效,會議結束后還能自動生成會議記錄并保存到網盤中。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

4、百度大腦智能創作平臺

2019年初,百度上線了智能創作平臺,尤其在媒體行業進行了重點深入,通過輔助創作和自動創作等多項能力,輔助用戶進行內容創作、圖文轉換視頻等工作。

此次,百度大腦智能創作平臺針對媒體的應用場景,更新了智能策劃、智能采編、智能審校3大媒體場景方案,幫助媒體人更快、更好地進行創作。

例如,在智能策劃方面,百度大腦創作平臺上匯聚了全網數據資源,利用知識圖譜與自然語言處理的技術對數據深度的理解和分析,圍繞媒體行業推出系列智能策劃場景方案,高時效性的匯聚全網主流媒體線索,關聯分析得到行業地域的熱點信息。

自平臺推出以來,它已自動創作文章超過200萬篇,圖文轉視頻能力已有7000多用戶,已生產短視頻15萬個,相當于一個人至少100年的工作量,并已落地人民日報、央視網等20多家媒體機構。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

5、UNIT:智能對話定制與服務平臺

為了讓開發者更加高效的獲得高質量的對話理解能力,此次百度升級了UNIT的3大特性,包括任務式對話理解、表格問答和新對話引擎,將數據標注成本進一步降低到30%以上,并融合通用對話能力提升交互體驗。

一是小樣本意圖理解能力升級。每個意圖將提供大約10個標注樣本就能達到高準確率的意圖識別,顯著降低數據標注的成本。

同時,UNIT基于最新升級的依存句法分析技術和通用關鍵詞識別技術,為開發者帶來了詞槽修飾關系的識別能力。

二是表格問答能力升級。百度通過對表格的分析和自動化構建,基于表格內在知識能力,能夠自動理解用戶提出的問題,并分析出相應答案。此外表格問答還具備較好的口語化交互效果,支持在對話場景中使用。

例如,開發者只需上傳業務數據表格,經過UNIT一分鐘自動分析后,產出的問答機器人就可以準確回答大部分基于這些表格的事實性問題;加之1小時左右的人工輔助調優,問答機器人達到的水平相當于以往通過至少2周的人工整理FAQ建設的問答系統的水平。

三是新一代融合任務式對話和通用對話引擎。該引擎通過通用對話的主動式人性化交互,進一步提升用戶體驗,同時動態分析當前對話進程,以適當推薦引導的方式嘗試觸發任務,滿足用戶的具體需求。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

二、百度語言與知識技術的十年布局發展

在王海峰看來,要讓自然語言表達靈活,其普遍語言結構分析和語義理解難度很大。因此,以語言和知識為研究對象,研究如何讓機器像人一樣掌握知識,理解語言的NLP技術對AI技術的發展至關重要。

在現場,王海峰向大家分享了百度的語言和知識技術在過去十年是如何布局發展的。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

▲百度CTO王海峰

“我們始終把握技術發展和產業發展兩個趨勢。”王海峰談到,從研究方法上看,百度初期以規則和統計機器學習技術為主,探索深度學習、神經網絡語義匹配框架、多語言神經網絡及翻譯等技術,近兩年還擴展到知識增強的深度學習。

從研究對象上看,詞、短語、句子以及篇章都是百度的研究對象。

隨著AI技術的發展,應用場景變的愈發復雜,百度的研究對象也從語言擴展到語音、視覺等多模態信息,探索跨模態語義理解技術,例如語音一體化、圖像語言一體化等。

從研究方向上看,從語言分析、語言生成、知識圖譜及翻譯拓展到深度與理解,完整的技術體系也促進了各項技術的融合發展。

在百度語言和知識技術發展的過程中,其技術已應用到搜索、翻譯、地圖、信息流和智能硬件等產品,并廣泛應用于金融、醫療、教育和能源等各行各業,在為社會提供全方位智能服務的同時,加速產業智能化升級。

歷經11年的發展,如今百度已形成了完整的NLP技術布局,包括知識圖譜、語言理解與生成技術,以及應用系統等。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

王海峰對百度NLP技術布局的部分關鍵技術進行了解讀,并分享了部分最新進展。

1、知識圖譜技術

作為機器認知世界的重要基礎,知識圖譜主要以結構化的形式描述真實世界中的實體屬性、關系等。

基于搜索引擎,從多元異構的大規模數據中能構建非常龐大的知識圖譜。基于此,百度提出了一整套構建方案,包括無標簽大數據、開放知識挖掘技術知識體系、自學習技術,以及融合多源異構數據的知識補全和整合技術等。

據王海峰介紹,如今百度打造了一個多元異構知識圖譜,擁有超過50億實體和5500億事實,并在不斷演進和更新,已應用于各行各業,每日調用次數超過400億次。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

2、語言理解技術

在知識的加持下,百度的語言理解相關技術也不斷增強。

百度提出知識增強的語義理解框架文心(ERNIE),即在深度學習的基礎上融入知識,具備人類一樣的學習能力,曾一舉登頂全球權威數據集GLUE榜單,首次突破90分大關,刷新榜單歷史,并且超越人類得分。

同時,百度還研制了知識增強的跨模態深度語義理解方法,通過知識關聯跨模態信息,運用語言描述不同模態信息的語義,進而讓機器實現從“看清”到“看懂”、從“聽清”到“聽懂”,即圖像和語言、語音和語言的一體化理解。

在NLP技術領域,還有一個重要的任務是語言生成,主要研究如何讓機器使用自然語言進行表達和寫作。

百度提出了基于多流機制的語言生成預訓練技術,在語言生成過程中兼顧詞、短語等不同粒度的語義信息,顯著提升生成和應用效果。

基于語言生成技術,百度還結合了其他語言和知識技術,并應用到百度智能創作平臺,在各個環節全方位幫助用戶進行智能創作。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

隨著百度大腦語言與知識技術的廣泛落地應用,百度已經收獲了許多行業成果。據王海峰介紹,百度大腦語言與知識技術已獲得包括國家科技進步獎在內的20多個獎項,30多項國際競賽冠軍,發表學術論文超過300篇,申請專利2000多項。

未來,隨著NLP技術的不斷突破創新,百度也將在產品上繼續保持探索,進一步賦能智能搜索、智能推薦、智慧城市、智慧醫療等各行各業。

三、發布兩大計劃,助力語言與知識技術發展

為了突破語言與知識技術在研發過程中面臨的數據匱乏、算力不足的瓶頸,百度聯合中國計算機學會、中國中文信息學會共同發布全球最大中文自然語言處理“千言”數據共建計劃。

百度發布五大硬核NLP技術新品及更新!CTO王海峰談語言與知識技術十年布局

百度千言目標覆蓋更豐富的任務類型,從語義理解、知識融合、跨模態融合等角度推動技術進步,同時提供能進行多維度綜合評價的數據集。

據百度技術委員會主席吳華介紹,千言一期項目由來自國內11家高校和企業的數據資源研發者共同建設,已涵蓋開放域對話、閱讀理解等7大任務,20余個中文開源數據集。

未來三年,百度計劃面向超20個任務,收集和建設不少于100個中文自然語言處理數據集,覆蓋知識圖譜、語言理解、語言生成、跨模態融合、NLP 應用系統等多個領域。

吳華談到,算力是語言與知識技術發展中面臨的另一大挑戰,超大規模深度學習模型帶來顯著效果提升的同時,算力的需求也呈現出指數級的增長。

因此,吳華正式發布了語言與知識算力共享計劃,通過百度AI STUDIO平臺,百度將提供價值一億元的免費算力支持,幫助廣大開發者更好地專注技術創新。

結語:百度NLP技術版圖的十年布局

如王海峰所說,語言與知識技術是人工智能認知能力的核心。回顧這場峰會,我們也能看到過去十年百度在語言與知識領域的技術發展和產業布局,如今已逐步構建起一套成熟和豐富的NLP技術版圖。

下一個十年,百度的NLP技術布局還會給我們帶來哪些驚喜?它能否推動行業離通用人工智能(AGI)的目標更近一步?我們拭目以待。