智東西(公眾號:zhidxcom)
作者 | 三北
編輯 | 漠影

隨著AIGC(生成式AI)引爆新一輪全球科技競賽,百度對話機器人“文心一言”上線也進入倒計時,3月“交卷”籌備如何備受各界關注。

適逢百度財報今日發布,百度2022年營收約1237億元,凈利潤約207億元,研發投入達214億元,約等于把一年賺的錢全用來做研發了;同時,AI產業化成果初顯,百度智能云已連續四年居AI公有云市場第一,關于百度文心一言的多個動向也隨之曝出:

已有超400家企業宣布加入文心一言生態圈,同時百度多項主流業務將接入文心一言,包括百度搜索,以及基于百度智能云的智能語音助手小度、智能駕駛阿波羅(Apollo)等。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜

▲百度2022年的研發投入及AI新進展

作為中國AI市場長期增長的代表,百度正站在浪潮之巔。

百度創始人兼董事長李彥宏在財報發布后的內部信中說:“AI技術已經發展到一個臨界點,各行各業都不可避免地被改變,中國AI市場即將迎來爆發性的需求增長。”實際上,這一新機會引起了全球產業的沸騰,基于大模型的AIGC成為一片掘金熱土。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜

▲百度創始人兼董事長李彥宏

美國硅谷的微軟、谷歌等科技巨頭為此打得不可開交;國內,百度、科大訊飛、復旦大學等大廠和知名學府紛紛出手,原美團“二號人物”王慧文、出門問問創始人李志飛等科技大佬也一頭扎入AIGC創業大潮……

而作為國內在“AI+搜索”首屈一指的互聯網大廠,百度十年AI理想和窮盡實驗,或許正進入爆發前夜。

一、每月投18億做研發,迎戰全球AIGC競賽

AI研發向來是一項費錢的事業。盡管2022年業務深受疫情影響,百度依然保持了“月投18億做研發”的記錄。

從經營基本面來看,根據財報,百度本季度營收約331億元,高于市場預期的320億元;歸屬百度的凈利潤約54億元,同比增長32%。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜
▲百度近年營收及增長情況

在研發投入方面,百度保持了多年以來的高研發投入,2022年約達到214億元,相當于每月投18億做研發,占百度核心收入22.4%,在全國科技公司里位于前列。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜

▲百度近年研發投入情況

持續的研發投入,正在轉化為產業化成果。比如承載AI產業化的百度智能云部門,2022年強化了“云智一體”戰略,已連續四年居于中國AI公有云市場第一。

而在前沿技術研發方面,百度TPG部門最新的文心(ERNIE)大模型成果,正成為百度應對全球AIGC產業化浪潮的錨點支撐。

在剛剛過去的2022年Q4,百度在11月的深度學習開發者峰會上全新發布11個大模型,包括5個基礎大模型、1個任務大模型、5個行業大模型。同時,百度新發布和升級基于文心大模型的兩大產品——AI 作畫產品“文心一格”和產業級搜索系統“文心百中”。

文心是百度自主研發的產業級知識增強大模型,與當下流行的大模型GPT-3.5相似。截至目前,文心已累計發布11個行業大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領域。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜

▲百度文心產業級知識增強大模型框架圖

隨著2023年新季度的開啟,百度將于3月推出又一個生成式AI產品“文心一言”,以此續寫迎戰全球AIGC競賽的篇章。

二、十年AI理想與研發長跑,在中文搜索土壤上開花

要問當下什么是AIGC的最佳商業化應用?

搜索引擎一定榜上有名。

接入了ChatGPT的微軟新版Bing秒變私人智能助理,谷歌對標產品Bard也進入了全公司萬人內測階段……憑借“百度一下”被全國人認識的百度也出手了——在今年1月Create AI開發者大會前夕,百度宣布將搜索升級為“生成式搜索”,這意味著百度搜索將提供更好的答案、交互聊天和生成內容。

躋身全球AIGC產業化競賽舞臺,百度正試圖引領中文搜索體驗的代際變革。

根據財報可知,作為基本盤,搜索業務為百度文心一言的誕生提供了厚實土壤。2022年Q4,百度搜索規模同比增長17%,領跑優勢持續擴大。12月,百度App月活躍用戶達到6.48億,同比增長4%。此外,隨著國內市場消費需求釋放,百度在線廣告營銷業務預計將迎來復蘇。這些增長都與百度基本盤搜索業務緊密相關,從而為文心一言的落地提供了底盤基座。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜
▲百度移動生態流量池保持增長

知名分析機構麥格理預計,百度2023年廣告及云服務收入增長將會有所回升,受惠于有效的成本控制措施,整體利潤率提高,而可見的上行驚喜將會是公司有機會在中國推出類似ChatGPT的人工智能(AI)聊天機器人。

可以預測,隨著接入文心一言,百度搜索將擴大服務場景和市場規模。AIGC有望助百度搶占內容生態高地,比如增加百度平臺上的高質量短視頻供應,助百家號發布者提高轉換效率等。

實際上,除了搜索,百度文心一言將通過智能云提供服務,應用于智能駕駛阿波羅(Apollo)、智能語音助手小度等多塊業務,使得用戶體驗實現跨代進化。

當然,AIGC相關技術研發難度大,即便是微軟新版Bing在近期的測試中也是“翻車”不斷,百度文心一言做的怎么樣依然是一個未知答案。攻克技術缺陷需要時間,這對百度來說挑戰和壓力不小。

不過,百度文心一言的誕生并非一日之功,超10年在NLP(自然語言處理)領域的積累或許能為其提供堅實支持。

早在2010年,百度就創立了自然語言處理部,在語音、圖片等技術上布局;2019年3月,百度提出知識增強的語義理解框架文心(ERNIE),在深度學習的基礎上融入知識和持續學習,當時一舉登頂全球權威數據集GLUE榜單。

2021年9月,百度發布了全球首個百億參數的對話大模型PLATO-XL,再次刷新了開放域對話效果;2022年12月,文心大模型迭代出ERNIE 1.0、ERNIE 2.0、ERNIE-Tiny多個版本,開始加速落地到各個行業。

十年AI理想與研發長跑,在百度中文搜索土壤上開花,并開始走向千行百業實體經濟的結出果實。

三、熱戰微軟、谷歌,百度文心一言打造四大護城河

熱戰微軟、谷歌,國產大模型將與硅谷科技巨頭進行在不同的舞臺隔空PK。

百度創始人兼董事長李彥宏在近期公開發言中說:“怎么把這么酷的技術,變成人人需要的好產品,賦能千行百業,讓他們的生產效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠產生影響力的。”

根據官方數據可知,目前已有包括互聯網、媒體、金融、保險、汽車、企業軟件等行業的超400家頭部企業宣布加入百度文心一言生態。而文心一言能否為這些行業伙伴帶來驚艷的效果?成為當下階段百度團隊的主要攻堅戰。

面向這一攻堅戰,百度從至少算法、算力、數據、應用四大方面建立了技術護城河。

1、四年大模型飛速迭代,飛槳底座匯聚535萬開發者

無論是大模型算法還是AI開發框架,百度都走在國內科技大廠的前列。

文心一言背后,文心大模型迭代四年至今,已從單一的自然語言理解延伸至多模態,實現視覺、文檔、文圖、語音“全能”,具備較強泛化能力和性能。以最新發布的ERNIE 3.0 Zeus為例,已擁有千億級參數,據稱公開數據集上小樣本學習、理解和生成任務效果皆好于業界其他模型。

支撐文心模型訓練的框架是百度飛槳(PaddlePaddle),中國首個自主研發的產業級深度學習開源開放平臺。一方面飛槳技術不斷迭代,2022年11月剛在MLPerf Training v2.1測試中奪魁;另一方面生態不斷壯大,截至2022年11月底,飛槳平臺上已凝聚535萬開發者、創建67萬個AI模型,服務20萬家企事業單位,位列中國深度學習平臺市場綜合份額第一。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜

▲飛槳平臺全景圖

2、三大云中心穩定供算力,幾萬片自研芯澎湃加速

大模型戰場正變得越來越熱鬧,算力成本隨著飆升。比如GPT-3大模型的單次訓練成本上百萬美元、總訓練成本上千萬美元。

在算力方面,百度在陽泉、徐水、定興三地建立了自用云計算中心,龐大的超算集群為文心大模型的訓練奠定了基礎設施。百度智能云在成為百度第二增長曲線的同時,也能為文心大模型應用提供高并發、高彈性、高精度等不同計算需求。

同時,百度自研AI芯片“昆侖”已在多場景實際部署幾萬片,在公司搜索業務中也已形成較強工程化實踐,為文心大模型底層算力鋪上了加速路。

文心一言上線倒計時:百度十年AI理想和研發長跑,進入爆發前夜

▲百度“芯片-框架-大模型-行業應用”的智能化閉環路徑

3、自有業務海量真實文本,具備先天數據優勢

眾所周知,擁有千億參數的大模型是用海量數據“喂出來的”。

在數據層面,百度以移動APP、搜索等業務為依托,積累了海量真實文本和用戶需求數據。這些大規模結構化、非結構化數據有望支撐文心一言充分預訓練,形成自身優勢。此外,在安全領域多年的深耕也將為文心一言保駕護航。

4、多款應用提供創新土壤,用戶開放帶起迭代飛輪

正如前文提到的,文心一言能夠落地到百度搜索、小度、阿波羅等多塊自有業務,這些產品不少已在市場占據領導地位。隨著文心一言的嵌入,這些產品有望實現代際變革;產品的迭代也將反推文心一言繼續進化。

另外,隨著文心一言的公眾開放,真實的用戶調用和模型迭代之間的良性循環建立起來,文心一言大模型的智力有望不斷升級。

此外值得一提的是,文心一言在迎戰國外AIGC產品的同時,更需要適應中國市場的實體經濟數字化轉型需求。根據百度方發言,文心大模型是本土化的AI模型,具備對中文、中國文化的更深理解,這意味著文心一言可能會更適合中文和中國市場。

結語:巨頭AIGC競賽號角拉響,中國AI產業迎來“小陽春”

全球AIGC的巨頭戰已經打響,在AI和搜索領域深耕多年的百度站在了新的歷史舞臺上。2019年推出文心大模型,其將于3月推出的文心一言可以說是中國科技力量參戰全球AIGC競賽的一大代表。

適逢文心一言上線進入倒計時,百度發布了2022年的財報及Q4的業務進展情況,成為提前了解其“答卷”的參考。百度搜索、智能云、阿波羅、小度等業務快速發展,成為文心一言大模型在實際落地中不斷迭代的試驗田。

不久之前,人們似乎還在AI產業的低谷仰望光明,不知道通用人工智能的曙光何時出現。現在,隨著全球AIGC巨頭戰號角吹響,AI市場又熱了起來,中國方興未艾的AI產業有望迎來一個“小陽春”。