在過去一年中,人工智能的新算法不斷涌現,深度學習仍是這一時期發展主線,嘗試解決更為復雜的應用任務。 人工智能的產業格局與生態體系更為明晰,開源開發框架格局逐步確立,以科技巨頭引領的生態系統垂直整合速度不斷加快;同時,產業發展重心開始轉變,企業比拼重點從單項技術的理論準確率轉向應用場景白熱化的“跑馬圈地”。

人工智能的技術應用開始全面覆蓋日常生活、 科學研究、社會治理、商業創新和國家安全等經濟社會的關鍵領域, 以空前的廣度和深度推動社會發展。然而,由于人工智能技術成熟周期相對較長,產業發展速度不及資本市場預期, 資本熱度開始減退。 人工智能產業似乎顯現出“陷入困境”與“高速發展”的矛盾現象。

本期的智能內參,我們推薦中國信通院的報告《人工智能核心技術產業白皮書》, 探討以深度學習技術為主要驅動力的人工智能發展狀況、 技術創新重點與產業發展趨勢,總結十三五期間我國發展情況, 提出十四五期間的發展方向與機遇

本期內參來源:中國信通院

原標題:

《人工智能核心技術產業白皮書》

作者:李論 lilun@caict.ac.cn

一、 人工智能核心技術產業發展總體態勢

1、 深度學習技術進入升級優化階段

人工智能技術體系與產業體系錯位發展,深度學習理論突破速度逐步放緩,產業開始步入高速發展階段。 目前,本輪深度學習理論突破速度開始放緩,技術紅利的持續釋放驅動圖像分類、機器翻譯等多類感知任務準確率大幅增長,步入升級優化期。 人工智能本輪爆發初期主要在探討算法理論的可能性,聚焦探索強化學習、遷移學習等新的學習方式以及 AlexNetVGGGoogLeNet 等結構多樣的算法模型;算法理論的不確定性和技術的不成熟耗費產業界大量精力和時間,阻礙人工智能大規模應用進程。

目前, 產業開始步入高速發展時期, 2020年技術標志性生產工具 TensorFlow 框架下載量爆發式增長, 僅一個月11000 萬次,占發布四年半下載總量( 1 個億+) 的十分之一;同時,技術成本快速下降,同等算法水平所需計算量每八個月降低一倍,成本降低百倍, 業內涌現出研發平臺、技術服務平臺等多樣化的平臺形態, 工程技術正在引領產業快速發展

2、 寒冬并非低谷,產業生態已現加速構建態勢

資本寒冬已經出現。 其中,預期過高是主要原因。 人工智能企業增速明顯放緩, 20192020 年全球每年新增人工智能企業數量已不足 100 且投融資的輪次后移趨勢不斷擴大。 2020 B 輪及以上融資筆數占總筆數的 62.3%,較上一年增長 40%以上。同時,曾獲大筆融資的知名創新企業由于預期過高、虛假宣傳等原因退出產業舞臺。曾對標英特爾的芯片企業 Wave Computing,是人工智能計算領域最受關注的獨角獸之一, 2020 4 月由于數據流處理器性能不達預期而宣告破產;智能會計工具 ScaleFactor 宣稱利用人工智能技術自動化生成財務報表, 但實際卻部分采用人工外包方式處理, 在融資1 億美元后于 2020 3 月宣告倒閉。

此外, 資本早期對人工智能產業回報周期過于樂觀是資本寒冬的另一原因。 移動互聯網在偏向工程屬性的前提下,資本預期取得成效的時間為二到四年;與之相較,人工智能與傳統行業核心業務深度融合,需更高的技術準確率和更深刻的行業理解力。因此,人工智能產業孕育時間更長,資本市場的期望和現實出現較大偏差。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

全球融資輪次數量分布

從技術基礎理論突破到工程化落地應用,既有技術紅利已為產業發展奠定堅實基礎。 當前,雖然資本市場的泡沫逐步破裂,但優質企業的估值仍在持續增長,獨角獸企業不斷出現, 產業呈現良性發展態勢。深度學習技術局限性似乎導致人工智能產業發展將遇天花板,然而事實并非如此。雖然,可解釋性、理解推理等局限性確已顯現,但這是下一時期理論技術突破重點, 不能因此否定圖像識別、語音合成、機器翻譯等感知類任務上的應用技術成就和產業應用前景。 目前,基 于深度學習理論的優化技術層出不窮, RegNetGPT-3 等模型不斷提升視覺處理、閱讀理解等基礎智能任務水平,虛擬助手、多語種翻譯等智能應用已開始進入規模化應用階段,大量的行業應用場景加速深度融合,技術能力和優化速度可見 5 8 年的紅利。

業各環節逐步明晰,規模化應用突破已現曙光。 人工智能技術在消費互聯網領域發展速度較快,智能推薦、視覺識別、語音助手等智能技術能力已深度應用至電商、社交、資訊等消費互聯網平臺以及手機、無人機等消費終端中,并加速與核心業務進行整合。當前,智能技術正在向更多的行業領域滲透,融合滲透仍需時日孕育。 相較于消費互聯網領域,傳統行業的知識獲取和積累需要較長時間,應用場景碎片化的特點導致低成本、易用、泛化能力較強的能力平臺構建需較長周期。

總體來看,人工智能產業正處于 S 曲線中快速發展的臨界位置(如下圖),現階段智能技術落地成本較為昂貴,導致智能產品絕對量增加時,其單位成本并未明顯下降。目前,人工智能頭部企業加速布局, 不斷完善技術生產工具(開源開發框架、數據處理、驗證分析、部署監測等完備研發工具鏈), 加速建立全棧智能計算技術體系(形成基礎計算理論、 芯片、 軟硬協同、 系統協同全棧技術支撐能力), 探索孕育基礎和垂直行業技術平臺; 產業規模化發展的進程正在不斷加速,規模經濟有望形成。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

人工智能規模經濟 S 曲線

3、 人工智能以空前廣度與深度推動社會發展,加速產業結構升級進程

工智能已全面覆蓋社會運行的基本要素,內生化提升全局運轉效率。從社會運行角度,人工智能加速影響日常生活、科學研究、商業創新和國家安全等社會運行的基本要素。一是人工智能與科學研究的結合已開始改變基于傳統學術經驗的科學研究方式,實現從大量已知論文、實驗數據中挖掘未知理論,加速提升化學、材料、物理、藥物研發等領域文獻獲取速度與實驗發現效率, 成為下一時期科技競爭的重要動力。

二是人工智能成為商業創新與競爭的下一個主戰場, 傳統行業巨頭加速布局智能供應鏈、質量檢測、商業決策等細分應用,有望顯著提升生產流程、質量控制、商業營運等環節效率,改善工作條件;

三是娛樂、消費電子、醫療等生活領域的智能應用不斷貼近、細化場景需求, 室內安防無人機、人性化虛擬助手等智能消費產品不斷涌現,問診機器人及智能影像逐步推廣使用,醫療資源緊缺、分布不均等一些行業痛點開始緩解; 四是疫情加速教育培訓向在線智能化發展,試題 OCR 識別、輔助批改等應用已從試點向規模化發展,推動教學管理向精準管理轉變,助力個性化學習體系的建立; 五是全球領先國家已充分意識到人工智能技術與國防安全融合的重要程度, 投入針對性資金推動預測維護、自動駕駛、情報分析、智能飛控等國防智
能應用的發展。

人工智能滲透率的提升有望顯著加快全產業鏈結構的優化速度,牽引產業向高附加值的產品與服務轉變。一方面, 人工智能作為眾多技術產品創新核心,是下一時期最為關鍵的高附加值產業。據預測,到 2030 年約 70%的行業企業將使用人工智能技術,預計為全球增加13 萬億美元的附加值另一方面, 人工智能加速提升傳統行業高附加值產品的比重, 進一步優化產業結構。人工智能技術與核心業務、專家經驗深度融合,行業主營產品和運行方式的智能化程度正在不斷提升,衍生新產品與新服務。《麻省理工科技評論》全球 50 家聰明企業( TR50)榜單中已顯現傳統行業企業的身影,如布局醫藥研發賦能平臺的傳統藥物研發廠商藥明康德,利用智能技術提升物流收派效率的順豐科技等。

二、 人工智能技術創新重點

1、 深度學習試圖從多角度融合創新,開啟認知時代仍在探索

深度學習仍然是人工智能技術發展的主導路線。 當前,基于大量標注數據進行訓練是深度學習技術實際應用的主要路線,從 1400 余萬幅圖片的ImageNet數據集至2020年臉書和卡內基梅隆大學構建的超過 130 萬種化合物分子間作用數據集 Open Catalyst,模型訓練所需標注數據普遍達十萬以上。然而,這種路線在取得良好成效的同時,面臨著嚴重依賴標注數據的問題,帶來在更多細分場景中應用落地的局限性。

業內不斷拓展深度學習解決問題的邊界, 推動人工智能進入感知增強時代。 人工智能純粹使用有監督學習方式訓練深度學習模型的時代基本結束,受限于對大量標注數據依賴與理解能力缺乏,這種路徑難以解決更多應用問題。當前, 感知增強時代拉開序幕,這一時期的新算法聚焦提升數據的質量和規模, 通過遷移其他領域訓練成果、自主生成或增強數據、依托知識圖譜常識關系、利用多源數據等方式側面彌補深度學習的局限性。 深度強化學習、多模態學習等多元化的學習方式受到產業熱捧,深度學習技術與知識工程、傳統機器學習等分支的結合成為學界探索的熱點新方向。

深度學習加速探索與多元學習方式、多種技術分支的結合, 少量數據訓練、弱化人為干預以及多模態學習成為下一時期的發展關鍵。

一是減少數據量依賴的少樣本學習。 少樣本學習通過復用其他領域知識結構,使用少量數據對新領域進行訓練, 已進入初步應用階段,如英偉達提出基于少樣本學習的視頻轉化( Few-shot vid2vid)框架,僅借助少量目標示例圖像即可合成未出現過的目標或場景視頻。

二是弱化人為干預的自監督學習、強化學習。 業內主流的有監督學習方式數據標注成本高昂,以機器翻譯任務為例,市場人工翻譯每單詞平均價格約 7.5 美分, 假設單個句子平均長度為 30 個單詞, 1000 萬個句子人工翻譯標注的成本約為 2200 萬美元;若需支持上百種語言的互譯,人工標注訓練集的成本將達上千億美元。這種高昂的數據成本促使學產兩界加速對深度強化學習、自監督學習等范式的探索。 圖靈獎獲得者楊立昆( Yann LeCun)加速自監督學習的研究進程,通過從未標記的數據集中學習監督信息, 提升數據無標注下的學習能力;DeepMindOpenAI 等機構不斷演進深度強化學習算法,試圖顯著提升智能體的自主決策和多智協同能力。

三是提高應用場景復雜度的多模態學習。 應用場景正從單一視覺、語音的感知向多模態理解側重,復雜度不斷提升, 從多模態信息源中學習模態間關系成為焦點,如菜肴制作視頻與菜譜文本步驟對齊、唇動視覺描述與語音信號融合預測單詞等。深度學習技術正在不斷挑戰更為復雜的任務,擴展能夠解決問題的邊界。

直面推理理解問題的算法路徑尚無定論,距離認知時代到來仍需數年。從理論體系角度來看,深度學習的領軍專家開始探索深度學習理論體系的新形態,反向傳播、經典神經網絡模型等已有基礎理論受到質疑。目前,杰弗里·辛頓( Geoffrey Hinton)提出替代深度神經網絡( DNN)架構的膠囊網絡,試圖解決小樣本問題。 然而,膠囊網絡雖連續三年推陳出新,但研究進程并非疊加式的演進,而是完全不同路徑的替代。

從學習方式角度來看, 近一年來,強化學習實現通用智能的技術路徑不再是業內共識,不依賴大量人工標注數據的自監督學習成為學習方式的新焦點,并在 2020 ICMLICLR 等全球人工智能學術會議上高頻出現,已成為眾多專家所關注的關鍵路徑。然而,無論是深度學習體系的顛覆式創新,還是多種學習方式的不斷嘗試,具備理解能力的算法模型目前未有顯現跡象, 真正的認知時代到來仍未可知。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

人工智能技術發展階段

2、 任務場景愈加復雜,倒逼學習方式多元化發展

有監督學習建立在嚴苛條件之上,已不能完全滿足模型學習需求,面對更為復雜的任務場景,業內加速探索強化學習、自監督學習等多元學習方式,試圖縮小與通用智能的距離。

深度強化學習不斷演進,加速提升自主決策能力。 深度強化學習加速拓展任務邊界, 突破性解決多人棋牌、即時戰略游戲等多智能體非完全信息博弈任務。目前, OpenAI、谷歌、微軟等企業相繼攻克即時戰略、 德州撲克、麻將等復雜游戲, 并加速向無人機群體飛行等更為實際的應用場景拓展。另一方面, 深度強化學習不斷提升處理復雜任務的能力, 逐步拓展芯片設計、音樂編曲等對知識技能要求更高的專業領域,如 2020 年谷歌研究人員利用深度強化學習優化設計芯片布局,達到 PPA(功率、性能、面積)的最佳平衡,顯著縮短設計時間;清華大學提出用于在線伴奏生成的深度強化學習算法,能夠根據輸入音樂實時生成伴奏。

自監督學習成為最為活躍的學習方式。 谷歌、臉書等多家企業先后發布使用自監督學習的算法模型,通過挖掘無標注數據的監督信息,顯著減少人為干預,在自然語言理解( NLP)領域取得顯著成效,如谷歌 BERT、 臉書 RoBERTaOpenAI GPT-3 等。目前,學產兩界正在加速自監督學習在計算機視覺( CV)領域的突破創新,已在精細圖像處理方面初步取得進展,如華盛頓大學利用自監督學習方式實現圖像背景的前后景分離,精度達像素級別,可實現頭發絲的精確分離。然而,盡管在自然語言理解、視覺處理等方面取得初步進展,現階段自監督學習本質上仍依賴規范化、標簽化的數據,主要借助預訓練模型構造并學習數據特征,而非基于對數據內容和任務對象的深層次認知;真正理解數據內容的自監督學習尚未出現。

3、 深度神經網絡理論體系嘗試顛覆性創新,多分支融合趨勢漸顯

深度學習局限性日益凸顯,理論體系探索革新。 當前,以杰弗里·辛頓( Geoffrey Hinton)為代表的業內巨頭持續推動理論體系的創新,其中,膠囊網絡作為革新熱點,試圖解決數據依賴與不可解釋問題;然而,歷史上膠囊網絡的三個版本更新大相徑庭, 尚未形成穩定的新形態架構, 仍處于探索階段。 此外,以膠囊網絡為核心的應用也在不斷探索, 2020 Hinton 團隊提出一種用于機器學習安全領域的網絡檢測機制,顯著提升攻擊檢出率;中佛羅里達大學學者提出膠囊路由方法,可通過輸入句子查詢視頻中符合條件的人物及特定動作,但上述成果仍停留在研究階段。

深度神經網絡與其他技術分支加速融合發展。 人工智能頭部企業、高校等開始摸索深度神經網絡與知識圖譜、傳統機器學習等分支的融合創新。

一方面, 知識圖譜試圖在不顛覆深度學習理論的基礎之下,彌補小樣本訓練與理解推理能力不足的技術天花板。目前,面向垂直領域的專業知識圖譜加速發展,已在金融、醫療、司法多個行業初步應用, 顯著提升垂直行業應用中知識自動關聯、 自動獲取的智能化水平。如金融消費領域,螞蟻金融知識圖譜平臺已經廣泛應用在螞蟻內部以及合作伙伴的微貸、保險智能理賠和智能理財等業務領域中;藥物研發領域,亞馬遜開發藥物重定位知識圖譜( DRKG)預測藥物與疾病靶點結合的可能性,縮短藥物研發周期并降低成本,已用于新冠病毒藥物研發。

另一方面, 深度學習與傳統機器學習融合已顯現新的算法形態; 貝葉斯深度學習成為熱點方向之一,有效利用先驗知識解決過擬合、小樣本數據等問題,模型性能超越傳統深度學習方法,如 DeepMind 提出貝葉斯 RNN 模型,圖注釋生成任務表現顯著優于傳統 RNN 模型;紐約大學和三星研究人員提出基于貝葉斯思想的深度學習不確定性表示方法 SWAG, 大幅提高模型泛化能力, 在異常點檢測、校準等計算機視覺任務上表現良好。

4、 預訓練模型加速演進,試圖實現語言處理領域的通用智能

預訓練模型參數已至萬億級,訓練成本之高幾乎成為業內頭部玩家的專屬技術路徑。 2020 年, OpenAI 發布 GPT-3 模型,模型參數多達 1750 億個,高達 1200 萬美元的訓練費用為預訓練模型的構建構筑壁壘,中小型人工智能企業難以望其項背。 2021 年,谷歌發布 SwitchTransformer 模型,再次將模型參數推至 1.6 萬億新高。此外,微軟宣布與 OpenAI 達成合作協議,獲得 GPT-3 語言模型源碼的獨家授權,升級巨型模型的寡頭格局形勢,預示著未來超大規模預訓練模型或將掌握在少數頭部企業手中。

預訓練模型已進入可直接用于多種自然語言處理任務的“通用”智能階段。 預訓練模型再次升級,頭部人工智能企業先后發布通用預訓練模型,可直接面向多種自然語言處理任務使用,不再需要針對不同任務進行微調。目前,谷歌 T5OpenAI GPT-3 等通用預訓練模型進一步提升文本理解能力,在包含閱讀理解、問答等任務的基準測試中接近人類水平。另一方面,通用預訓練模型加速步入產業應用階段,OpenAI 公司發布 GPT-3 商用應用程序接口( API,提供問答、翻譯、文本生成等服務, 搜索服務提供商 Algolia、社交媒體平臺 Reddit等多家企業已開始使用。

5、 模型小型化成為提升模型運行效率的關鍵

深度學習模型效率提升成為應用落地的關鍵突破點。 目前,深度學習模型的復雜度會隨著模型精度的提升而提升,步入通過大幅增加計算量而獲取高精度的時期。計算量的增長雖帶來性能的提升,但高度復雜模型在硬件能力受限的設備上部署運行難度越來越大,以AlphaGo 為例, 每場比賽僅電費耗費就高達 3000 美元, 模型運行性能與硬件能力的矛盾成為模型效率的關注重點。

模型小型化成為提升模型運行效率的主要方向。 目前,知識蒸餾、剪枝、量化模型小型化的技術手段逐步成熟,主流模型可達幾十倍壓縮率。如亞馬遜利用知識蒸餾進行預訓練,從 BERT 模型中提取壓縮模型 Bort,壓縮后模型大小僅為 BERT-large 6%,推理速度提升七倍 ; 麻省理工學院與上海交大的研究人員提出LiteTransformer,結合量化和剪枝技術將 Transformer 模型壓縮 95%,加速在邊緣設備上部署自然語言處理模型的應用進程。 與此同時, 開發框架中的模型壓縮功能創新活躍, 模型壓縮已成為開發框架必不可少的關鍵能力,臉書、騰訊、谷歌等頭部人工智能企業以及英偉達、英特爾等芯片大廠加速構建完善模型壓縮能力,依托自身算法技術與硬件芯片優勢,在其主導的 TensorFlowPyTorchTensorRT 等開發框架中提供剪枝、量化等算法壓縮工具, 并針對 GPUCPU 等硬件芯片進行特定壓縮優化。

6、 深度學習應用加速推動智能計算革命

深度學習應用加速推動云端計算范式進入高性能計算時代。 深度學習訓練效果高度依賴計算資源和數據質量,追求大規模高速處理能力。當前, 全球最大規模的訓練模型所需算力每年增長幅度高達 10倍。谷歌曾預測,如所有用戶每天使用 3 分鐘語音搜索功能,基于傳統 CPU 的數據中心算力就必須提升一倍,對算力需求快速增長的預期也促使谷歌加速研發針對人工智能應用更有優勢的張量處理器。 隨著深度學習模型結構日益復雜以及訓練樣本規模持續擴大,算力需求與日俱增,對云側計算性能提出更高要求。

計算模式走向云邊協同,端側場景化算力成爆發新方向。 在去中心化的計算形態下,自動駕駛、工業智能、智慧城市等邊緣場景產生出大量的算力需求,邊緣智能設備需要通過芯片架構、編程模型、專用加速庫以及軟件框架等多個環節與特定應用深度融合,實現邊緣計算平臺全棧能力升級,以滿足低功耗、 實時性、可靠性和安全性等復雜邊緣場景需求。 預計未來三年, 面向工業電子、汽車電子和傳統消費電子應用等場景化智能計算芯片增長迅速,市場容量年復增長率高達 100%以上,成為推動智能芯片產業主要驅動力量。

三、 人工智能產業發展趨勢

1、 從謀求單點技術的“極致”,向場景化綜合生態發展

單項技術的“理論”準確率不再是智能企業的比拼重點,產業進入應用場景”跑馬圈地”新階段。 人工智能企業單點技術標簽化的特點逐步弱化,企業加速進入實質應用轉化階段,人工智能技術服務企業的變化尤為凸顯。如曠視、商湯、科大訊飛等企業已將重心從視覺、語音等技術轉移至社會治理、供應鏈物流、生活消費等領域的軟硬件解決方案,從而催生出曠視天元、商湯 SenseParrots 等開發框架和基礎技術服務平臺。

目前,以物流、零售、公共安全等為代表的先導應用領域“跑馬圈地”持續白熱化。曠視升級發布機器人倉儲物流軟件平臺“河圖 2.0”,并計劃投入 20 億元與合作伙伴搭建完整的機器人行業解決方案;商湯持續推進城市級開放平臺方舟( SenseFoundry)在城市域落地,已覆蓋全國 31 個省市、近 100 座城市,總計接入攝像頭十萬路;云從推出云從起云智慧 Mall運營平臺,聚焦新零售領域幫助商業地產擁有者進行決策,實現精細化運營。

場景化綜合生態模式開始清晰,與“類”安卓開發者生態共同驅動產業發展。

一方面, “類”安卓開發者生態模式逐步成熟,頭部智能企業延續移動互聯網典型發展模式,以微服務形式提供視覺、語音等技術服務,憑借第三方開發者來構建多樣化的智能應用, 大幅提升開發的易用性

另一方面, 純粹基礎技術輸出難以完全滿足智能技術與各行業深度融合和應用落地,主要有三方面挑戰:一是需要與行業專有知識深度結合;二是場景碎片化特征突出;三是使用標準數據集訓練的圖像識別、對話系統在實際行業場景中泛化能力不足,需基于實際場景數據進行二次訓練和優化處理,這些均導致開發周期較長和開發成本居高不下。

因此, 頭部智能企業認識到智能技術與傳統行業的深度融合應用需要構建新的發展模式。 一是加速打造提供模型選擇、訓練、部署監測等一體化的研發平臺, 奠定智能技術滲透至各行業規模化應用的基礎;二是面向工業、農業、金融、公共安全等行業領域構建多樣化行業技術服務及解決方案平臺, 將行業特有數據、專業知識、業務流程與智能技術進行深度融合;發展速度較快的公共安全、醫療、智能駕駛等領域已初步形成垂直行業平臺,提供相對通用的行業應用服務。在此基礎之上,智能音箱、智能錄音筆、安防無人機等垂直行業智能產品不斷涌現, 場景化綜合生態正在形成。

2、 以科技巨頭引領的產業垂直整合速度不斷加快

在過去的一年中, 由于人工智能發展所需算力、算法、數據等要素的高位起點以及硬件、軟件框架、平臺等核心環節間的緊耦合銜接特點,使得谷歌、微軟等科技巨頭生態系統的垂直整合引領產業整體發展;產業垂直一體化的趨勢不斷加強,計算支撐、軟件框架、研發平臺等核心環節基本被老牌科技巨頭所把持。

算力、軟件框架、研發平臺、技術服務的縱向一體化幾乎成為全球頭部科技企業的共識。 人工智能硬件、算法、 軟件平臺與行業應用場景的結合緊密度空前,驅使不同環節具備點狀競爭力的科技巨頭爭相探索行業實際應用需求。目前,產業仍為早期發展階段,任何一個環節的水平化都尚未完全確立,過去以通用基礎能力自居的芯片企業、云計算企業,抑或是具有技術獨到優勢的互聯網企業都難以將自身的優勢能力直接滲透至復雜多變的行業應用場景中來。

因此,科技巨頭加速從自身優勢能力出發,延伸至行業應用的多個中間環節,試圖以這種方式準確把握智能時代的需求方向;在持續保持自身已有優勢的同時,布局支撐行業應用的多個核心環節,鞏固其生態系統在人工智能時期的領導地位。

亞馬遜、微軟等云服務企業不斷強化其智能服務能力, 緊抓面向基礎技術服務、研發訓練與推理等智能計算需求,通過布局研發平臺、開源開發框架等技術生產工具,以及更為底層的專用硬件及芯片,提升其智能計算服務的競爭力;谷歌、百度等 AI技術優勢顯著的互聯網頭部企業基于先進算法和技術優勢布局開源框架,并以此為核心上下延伸,構建智能服務生態體系。以英偉達為代表的 AI 芯片巨頭加速提升面向智能任務的芯片性能,積極豐富性能庫、編譯器、編程框架等軟件配套,通過多樣化方式壯大開發者社區及產業合作伙伴規模,力圖構建軟硬協同的產業生態體系。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

垂直一體化布局

3、 開發框架格局逐步清晰,已從百花齊放向幾家分爭轉變

以谷歌 TensorFlow、臉書 PyTorch 等為代表的開源框架格局初顯清晰,框架格局已從百花齊放轉向幾家分爭。 目前,業界開源開發框架主導權基本被 TensorFlow(谷歌)PyTorch(臉書)等掌握;微軟CNTK、日本初創企業首選網絡( preferred networksChainer、 加拿大蒙特利爾大學主導的 Theano 等早期熱點框架已通過與主流框架合并或直接停止更新的方式退出歷史舞臺。

TensorFlow 依托工業界的部署優勢持續位于第一,市場關注度達 15 超過第二名3 倍以上,臉書的 PyTorch(合并 Caffe2)憑借其易用性迅速突起,在各大頂級學術會議論文中占比超過 50%,有趕超勢頭。 同時,我國正在快速進行開源開發框架的系統化布局,百度飛槳、曠視 MegEngine、華為MindSpore、清華大學 Jittor 等國產框架加速升級,其中,百度飛槳作為最早推出的開放框架之一,已初步應用于工業、農業、服務業等業務場景,服務 230 余萬開發者,整體應用廣度和深度正在不斷成熟和完善。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

開源框架發展歷程

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

主要開源框架活躍情況

端側推理框架遇碎片化挑戰。 隨著各行業終端智能化需求加速增加,算法模型的終端推理性能引起業內重視。目前,推理框架面臨碎片化挑戰,一方面,計算終端所使用的芯片類型多樣, CPUGPU 雖為主流架構,但 NPUDSPFPGA 等多樣的人工智能芯片也在不斷涌現,終端推理框架對底層硬件的適配難以統一;另一方面, 算法架構尚不穩定, 算子(卷積、激活函數-ReLU 等) 及組合方式的多樣化和持續演化使得單一的推理框架短時間內難以覆蓋所有的可能性, 推理框架顯現出各為其主的發展格局。

端側推理框架處于多元化發展階段。 谷歌、臉書主導的頭部開源開發框架加大訓練、推理一體化的布局力度,但推理部分在終端側市場占比不高。目前,業內涌現了一批各具特色的終端推理框架,如阿里提出 MNN 框架,集成在手淘、優酷、飛豬等 20 余終端應用中,實現互動營銷、實人認證、試妝等功能;小米構建 Mace 框架,在小米手機中的相機場景識別、人像模式、人臉解鎖等諸多場景中進行應用。但由于硬件芯片、軟件算法仍在快速發展, 推理框架預計將在很長一段時間難以統一,或始終處于多元發展的格局。

開源開發框架競爭焦點從模型庫轉移至易用性和硬件適配優化。高級語言接口與硬件適配優化成為開源框架構筑壁壘的關鍵, 一方面,高級語言接口封裝后端框架中關鍵的模型構建、訓練等功能,降低研發門檻。 目前, 三大主流框架加速綁定或構建高級語言接口,已出現合作圈地現象。TensorFlow keras 形成排他性合作,提升框架易用競爭力,與近期以易用性為優勢快速提升地位的 PyTorch 抗衡; MXNet Gluon 聯合,由亞馬遜與微軟共同維護; PyTorch(臉書)Torch Caffe2 作為后端框架, 內部先天構筑高級語言接口。

另一方面, 硬件適配優化試圖解決多樣硬件編譯工具導致的適配復雜和性能參差不齊問題,統一編譯工具與編譯語言成為主流開源開發框架的布局重點。目前, 谷歌、臉書加速構建統一的編譯語言( IR), 試圖引導硬件廠商主動適配,獲取框架適配的話語權。

4、 以研發和技術服務為核心,產業開始打造平臺化發展模式

平臺化發展速度不斷加快。 當前,人工智能平臺發展步伐加快,2020 年上半年我國人工智能研發平臺市場規模達 1.4 億美元,復合增長率超 30%12; 頭部智能技術服務平臺的單日調用次數已過萬億次,如阿里云 AI 服務的日調用規模超 1 萬億次,日處理圖像 10 億張,百度大腦已對外開放了 270 多項 AI 能力,日調用量突破 1 萬億次。與此同時,人工智能的平臺生態規模不斷擴大,如訊飛開放平臺聚集超過175.6 萬開發者團隊,累計支持超過 28.9 億終端;騰訊 AI 開放平臺已服務全球用戶數超 12 億,客戶數超 200 萬。

云服務廠商積極主導人工智能研發平臺發展。 云服務廠商主導人工智能研發平臺的發展,亞馬遜、微軟、谷歌等擁有云計算業務的企業加速布局人工智能研發平臺,其中,亞馬遜 SageMaker 平臺最為成熟,份額高于后兩者近兩倍,占據全球 TensorFlow 負載八成以上;H2O.aiDataRobot 等研發平臺創新企業不斷出現,成為資本市場的追捧對象,人工智能研發平臺的發展空前繁榮。

技術工具鏈成為研發平臺的競爭核心。 目前,研發平臺整體呈現三類發展特點: 一是工具體系化, 打造全面的技術工具鏈成為了這一時期研發平臺的競爭核心,技術工具鏈提供數據處理、模型構建、部署、監測分析等全生命周期的工具服務,如 SageMaker Autopilot、谷歌 AutoML、微軟 MLOps 等; 二是開放框架開放化, 研發平臺基本均同時支持TensorFlowPyTorchMXNet 等多個主流框架; 三是分布式計算不斷優化, 研發平臺圍繞人工智能技術的特點和開發框架對自身的云計算架構進行深度優化,如 SageMaker 256 GPU 下的TensorFlow 擴展效率可達 90%,并同時支持多種類型人工智能芯片。

基礎技術服務平臺走向成熟,已形成涵蓋多種基礎技術的綜合性平臺。 包含視覺、語音、自然語言處理等智能技術服務能力的基礎技術平臺是人工智能產業形成最早的平臺形態,產業主體主要包括谷歌、微軟、亞馬遜等擁有云計算業務的廠商和科大訊飛、曠視科技等人工智能技術服務廠商,前者構建的基礎技術服務平臺在布局初期即向涵蓋多種技術能力的綜合性平臺發展,后者早期主要依托自身某一類技術優勢開展平臺建設,如科大訊飛側重語音文本,曠視則側重視覺處理。

目前,業內的基礎技術服務平臺形態基本成熟,領先平臺基本同時包含多類技術能力。究其原因,一方面是由于基礎技術能力的構建不再神秘,一家技術廠商同時擁有視覺、文本等能力的難度大幅降低;另一方面則是行業應用場景常常需視覺、語音等多種技術共同支撐,單一類型的技術服務平臺不再適合目前的應用需求。

垂直行業技術服務平臺發展處于早期階段, 尚未形成規模發展。除研發平臺顯著降低技術與垂直行業融合成本外,垂直行業技術服務平臺成為另一種重要平臺形態;平臺把垂直行業中的關鍵場景、相對通用的應用技術總結提煉,進而復制推廣。 目前,業內主流的垂直行業技術平臺存在技術服務直接輸出和提供關鍵應用場景解決方案兩種服務形態,但均未形成規模。

一方面, 技術服務直接輸出的形態(應用程序接口)一般面向具有成熟應用軟件環節的垂直行業,由平臺技術服務直接支撐下游軟件集成商;此類垂直行業的應用軟件環節通常進入門檻較高,或者市場空間有限,因此,人工智能技術企業缺乏與原有產業鏈軟件集成商搶奪市場的動力。

另一方面, 人工智能技術與垂直行業應用的融合對軟件、智能技術、底層硬件等多個環節均提出差異化需求,驅使面向關鍵行業的多樣化全棧解決方案不斷涌現。垂直行業技術服務平臺通過提供整體方案的選型和設計,同時直接提供智能技術、軟件等方案中的某幾種能力,推動智能技術與垂直行業場景的快速融合,如自動駕駛領域的 Apollo 平臺提供雷達、攝像頭等硬件選型,高精度地圖、路線規劃等智能軟件為一體的解決方案。

5、 智能計算產業形態初顯,呈現蓬勃發展態勢

智能計算已初步形成智能芯片、軟硬協同、多樣化算力供給模式的產業形態。 目前,人工智能芯片架構百花齊放,云側雖仍以 GPU 為主,但端側涌現出面向不同場景的芯片架構,英偉達、英特爾等芯片廠商面向人工智能應用的軟硬件工具生態日益完善,面向深度學習的大規模分布式計算平臺不斷成熟,云智能服務、公共智能超算中心、自建數據中心等多種計算供給模式逐步形成。

云側智能芯片市場仍以英偉達為主導,云服務提供商及初創企業正在持續加大布局力度。 傳統芯片廠商英偉達加速提升其并行計算能力的優勢和多線程并行軟件開發生態的壁壘,2020 年推出 A100 芯片,晶體管數量達540億, 自然語言處理模型BERT訓練性能較上一代V100提升 6 倍。谷歌、百度等云服務提供商加速升級基于各自工作負載需求的智能芯片,2020 年,谷歌發布第四代 TPU,平均性能是上一代的2.7 倍;百度昆侖 1 量產,百度搜索引擎及云計算方面部署 2 萬片。

另外, CerebrasGraphcore 等初創公司布局新架構智能芯片,部分應用的運行性能優于英偉達 GPU,但這類芯片僅能提供有限的軟件堆棧,面臨一定的市場推廣阻礙。

端側多元化應用催生大量創新探索,傳統芯片企業和終端企業相對領先。 汽車電子和嵌入式消費電子是這一時期端側智能芯片創新熱點。 其中, 2020 年英偉達和英特爾在汽車智能芯片方面持續位于領先位置,英偉達圍繞自動駕駛 SoC Orin 芯片,與理想汽車、奔馳等多家車廠展開合作;吉利概念車則將搭載英特爾 EyeQ5 芯片;恩智浦、瑞薩和東芝等成熟汽車電子供應商,黑芝麻、地平線機器人等初創企業,以及特斯拉等汽車制造商積極研發自動駕駛汽車芯片,試圖與英偉達和英特爾雙巨頭爭奪市場份額。相比之下,端側嵌入式消費電子類市場軟硬件成本以及供應鏈準入門檻較低,大量初創企業以不同的細分賽道加入市場競爭,其中智能手機神經網絡加速芯片市場仍以高通等傳統移動芯片企業和終端品牌企業為主,眾多初創企業主要集中在視覺和語音處理領域,包括 NovuMindSyntiant 等。

圍繞智能計算芯片的軟件工具開始從基礎計算向場景計算轉變。早期, 以英偉達為代表的芯片企業不斷構建以 CUDA 編程模型為核心的高性能算子庫、通信算法、推理加速引擎等多層次基礎軟件工具生態。 當前,隨著智能技術在傳統行業中滲透的不斷深入, 頭部智能芯片企業開始構建面向差異化場景的軟硬一體平臺, 實現底層芯片、編程框架、行業算法庫、細分場景研發平臺等全棧高效整合,試圖培育多樣化行業場景的計算生態、搶占細分市場。例如, 2020 年,英偉達圍繞機器人和自動駕駛場景,打造 Jarvis 對話系統、 ISAAC 機器人等軟硬一體計算平臺,寶馬公司使用英偉達 ISSAC 機器人平臺、Jetson AGX Xavier 芯片平臺以及 EGX 邊緣計算機,開發包括導航、 操控等五款機器人,依托深度神經網絡實現感知環境、檢測物體、自動導航等功能以改進物流工作流程。

多樣化算力供給模式開始顯現。 目前,云、邊、端成為算力供給的主要形態。其中,云側算力主要以云智能服務、公共智能超算中心和自建數據中心三類供給模式為主,亞馬遜、阿里云等云計算企業以云智能服務模式向中小型企業及個人售賣 AI 算力資源和技術服務,是目前最為主流的供給模式;公共智能超算中心逐步興起,上海、深圳、重慶等多地開始投建公共智能超算中心,這類中心目前主要以政府主導建設為主,支撐本地企業、科研機構和高校的人工智能技術與應用創新,緩解地方企業及機構算力資源不足、成本較高等問題,推動區域人工智能產業的發展;此外,谷歌、臉書等頭部企業通過自建專有智能計算集群的形式提升自身業務運行性能,部分企業根據業務特點研發人工智能專用芯片,試圖大幅度降低算力成本。與此同時,邊緣與端側計算模式成為熱點,英特爾、英偉達等硬件芯片企業加大邊緣智能專用加速產品的布局力度,面向工業、交通等云邊協同場景提供解決方案;寒武紀、地平線、云知聲等企業聚焦面向視覺、語音等智能任務的端側芯片研發,在無人機、可穿戴設備、智能攝像頭等智能終端中已顯現規模化應用態勢。

6、 全球數據鴻溝仍在加大,開放共享機制與數據服務能力加速構建

數據鴻溝問題愈加凸顯,開放共享仍在探索階段。 全球數字化加速數據生成和積累, 數據資產對全球經濟利益的分配已開始產生影響。“大規模數據→更準確模型→更好產品→更多用戶→更多數據”的循環邏輯將導致數據定向收攏聚集,人工智能數據資產已開始出現寡頭壟斷的態勢;互聯網產生的數據資產半數集中在僅 100 家左右的少數頭部企業中,影響全球人工智能經濟利益的分配。據統計,人工智能產生的經濟價值中約有 70%會累積到中美兩個國家, 而若推動數據資產的全球化,大多數國家有望將 GDP 提升 1%至 2.5%。

當前,各國政府、頭部企業持續推動數據的開放共享,數據原則、數據合作、數據規范與數據共享平臺成為重點。 政府積極推動數據開放共享原則, 注重在保護隱私和公開透明原則下進行數據開放歐盟率先出臺《通用數據保護條例》對涉及隱私的敏感數據做出嚴格要求;英國、法國、瑞典等國紛紛跟進修訂或新增;美國以原則倡議為主,政府先行數據開放,通用數據法案仍在制定中。頭部科技企業出于商業利益考量,對數據開放持謹慎態度;目前,微軟試圖打破這一局面,發起開放數據運動( Open Data Campaign),提出開放、可用、授權、安全、隱私五大原則,鼓勵數據互聯互通,承諾圍繞健康、環境和各種社會公益項目等問題共享數據,但尚未開放其產生利潤專有數據集。

跨領域數據合作也成為這一時期的熱點其中垂直行業企業最為積極,數據合作已從點狀互惠向有組織的開放共享方向發展。 微軟、Adobe 和 SAP 聯手構建數據共享聯盟,通過通用數據模型將數據存儲在統一的數據湖中實現共享,吸引安永、 飛思創( Finastra)等多行業企業共同加入。同時, 數據規范與開放協議尤為重要國家標準化組織密切關注數據隱私問題,企業也在自發建立數據開放協議或規范,如 IEEE P7002 數據隱私處理標準、 ISO 27701 隱私信息管理體系、微軟 AI 模型數據使用協議( DUA-OAI) 等。此外,谷歌、微軟等科技頭部企業推出 Dataset search、 Research Open Data 等自動化數據搜索平臺,進一步降低數據獲取難度,打造更加開發便捷的數據生態。

數據集建設需求更為專業。 監督學習仍是產業界人工智能算法訓練的主要方式,因此大規模、高質量的人工標注數據集是產業發展剛需。目前,數據標注從簡單、重復的拉框標注向精細化方向發展,呈現三類發展特點: 一是數據標注流程趨于智能化, 通過預標注技術和半自動化校驗的方式輔助人工標注已成為當前發展重點,業內涌現出一批標注工具,可對未標記圖像直接生成分割輪廓,并借助人工進行微調; 二是標注數據質量要求不斷提升, 自動駕駛、工業制造等智能任務場景愈之復雜,高質量、精細化的標注數據直接影響算法魯棒性和準確性,標注準確率需求從 90%提升至 99%; 三是醫療、工業等差異化垂直應用驅動數據標注服務進一步貼合個性化、多元化的場景需求, 如數據服務企業 Scale AI 為自動駕駛場景提供標注服務,對車道、煙塵、尾氣、雨水等更為個性化的目標物體進行標注。

具有智能標注能力的數據服務企業受到資本熱捧。 以數據標注為代表的基礎數據服務市場規模快速增長,資本市場進一步推高專業數據標注企業的估值。 2020 年,專業數據標注企業 Labelbox 完成 2500萬美元 B 輪融資;龍貓數據獲得 3300 萬元 Pre-B 輪融資。目前, 數據的智能化標注能力成為這一時期數據服務企業的發展重點; 一方面,傳統數據眾包平臺企業向專業數據標注企業發展,快速布局智能標注工具,數據服務企業澳鵬( APPEN) 花費 3 億美元收購數據標注公司 Figure Eight, 大幅提升企業數據服務競爭力;另一方面,智能標注工具企業不斷涌現,如 Scale AI、 Supervisely、馬達智數等。

7、 以開源開發框架為核心的生態體系雛形漸顯, 多種小生態同步形成

當前,全球人工智能產業生態雛形漸顯。 從產業鏈全局角度看,開源開發框架既是最具技術含金量的環節,同時也是芯片、應用開發等多個主體集聚的環節,伴隨時間積累,將具有很強的不可替代性和制約性。目前,谷歌、臉書等人工智能頭部企業圍繞開源開發框架構建的核心生態已初步形成。從產業主體角度看, 人工智能產業既對信息產業自身的產品形態、運行模式產生很大變革,同時影響傳統行業生產運營方式和運行效率。因此,產業的參與主體幾乎涵蓋全信息產業以及傳統行業企業,云計算、芯片、 ICT 設備、互聯網、智能技術服務、垂直行業 AI 企業和傳統行業企業等多主體正在圍繞自身優勢不斷摸索產業生態模式

人工智能頭部企業構建開源開發框架生態, 試圖形成應用接口和硬件適配的雙向主導權。

一方面, TensorFlowPyTorch 等開發框架不斷完善其高級語言接口,推動業內大量的算法模型和智能應用基于其高級語言接口進行研發,形成深度的綁定。由于轉換至其他框架會一定程度上影響模型性能、增加二次研發成本,長此以往,大量應用將深度依賴原有開發框架進行訓練和推理,形成產業默認的事實接口標準。

另一方面, 框架市場份額領先的人工智能頭部企業正在依托框架與智能芯片適配構建標準化硬件接口, 有望進一步增強其對智能芯片的話語權。如, 谷歌通過構建統一編譯中間表示語言( IR,驅動硬件廠商主動適配其 TensorFlow 框架,從智能芯片主導適配向統一中間表示語言( IR) 主導適配轉變。目前,由于智能芯片的技術路線百花齊放,仍在摸索階段,因此框架適配生態仍在構建初期,尚未形成。

產業主體以自身優勢切入,初步形成四種小生態模式。

一是人工智能全面融入云服務體系,云服務廠商積極構建 AI 基礎設施生態。亞馬遜、微軟、谷歌為代表的廠商布局人工智能專用硬件、開源開發工具、研發平臺、技術服務、 行業使能方案等全棧 AI 技術支撐體系,如, 2020 年微軟在研發平臺、技術服務等方面持續深耕基礎上,向下在硬件基礎設施方面聯合 Open AI 建立智能超算中心, 向上在垂直行業布局方面推出行業云解決方案 Microsoft Cloud for Healthcare,與智慧醫療、醫療機構合作,幫助醫生和醫療機構使用AI 技術實現精準醫療服務。

二是人工智能技術服務企業、互聯網企業以視覺、語音等技術優勢切入,加速打造垂直行業技術服務平臺和解決方案生態。

當前,該類主體正在加速推動智能技術在各行業中的應用落地,在不斷完善開發框架、基礎技術服務平臺的同時,聚焦構建面向行業場景的平臺生態,涌現出一批如依圖 care.ai(醫療)、百度 Apollo 開放平臺( 自動駕駛)等行業平臺。

三是傳統企業以行業經驗切入,強調解決問題的實際應用能力,積極構建圍繞基礎科研、成果轉化、 產業培育多維度的創新生態。 傳統行業頭部企業針對顛覆性、前沿性技術展開系統布局,鞏固行業領先地位和優勢;如大眾奧迪聚焦自動駕駛場景,建立奧迪 JKU 深度學習中心,成立硅谷研發辦公室,加大力度研發先進駕駛員輔助系統,同時發布自動駕駛數據集推動商用和學術研究, 打造多維度產業生態。

四是硬件廠商以芯片設計、整機集成為切入點,加速構建軟硬協同產業生態。 英偉達、英特爾、華為、浪潮等芯片、設備廠商圍繞其芯片和計算設備積極豐富性能庫、編譯器、編程框架、編程工具等配套軟件,通過多樣化方式壯大開發者社區及產業合作伙伴規模,力圖構建軟硬協同的產業生態體系。

四、 我國人工智能發展重點與機遇

1、 十三五期間我國總體發展情況

發展人工智能是黨中央、國務院準確把握新一輪科技革命和產業變革發展大勢,是為搶抓人工智能發展的重大戰略機遇,構筑我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國,所做出的重大戰略決策部署。十三五以來,我國人工智能產業發展迅猛,政策環境持續優化,創新能力不斷提升,產業規模進一步壯大,融合應用逐步深入,特別是新冠疫情防控期間, 人工智能技術產品形成“智能抗疫軍團”,有力支撐了我國疫情防控和復工復產。

1)、人工智能政策環境持續優化。 我國人工智能發展進入快車道,自 2015 7 月國務院出臺的《關于積極推進“互聯網+”行動的指導意見》首次將人工智能納入重點任務之一,至 2017 7 月國務院印發《新一代人工智能發展規劃》將其上升至國家戰略,人工智能發展政策環境不斷完善。截至 2020年,黨中央、國務院及各部門出臺人工智能相關政策 10 余項,連續4 年將人工智能寫入政府工作報告,如工信部、教育部相繼出臺《促進新一代人工智能產業發展三年行動計劃( 2018-2020 年)》、《高等學校人工智能創新行動計劃》等多項政策文件,為我國人工智能發展營造了良好的發展環境,各地方超過 20 個省市自治區相繼出臺人工智能專項規劃 60 余項。

2)、 人工智能技術創新能力持續提升。 我國企業在應用算法、專用芯片、開源開放平臺、智能傳感等核心關鍵技術上已取得局部突破,其中寒武紀、地平線、思必馳等神經網絡芯片實現量產并在安防、汽車、語音領域實現規模化應用;百度、阿里、華為、騰訊、曠視、科大訊飛、第四范式、京東等一批AI 開放平臺初步具備支撐產業快速發展的能力,其中百度 AI 開放平臺已超 260 萬開發者。部分關鍵應用技術居世界先進水平,特別是視頻圖像識別、語音識別等技術全球相對領先。人工智能論文總量、高倍引用的論文數量和發明專利授權量,處在第一梯隊。

3)、 人工智能產業規模不斷發展壯大。 產業生態基本形成,產業整體實力顯著增強。截至 2020 年,我國人工智能產業規模、核心企業數量,包括獨角獸企業數量均僅次于美國,位居全球第二位,覆蓋技術平臺、產品應用等多環節,基本建立了比較完備的產業鏈。人工智能芯片、智能語音、計算機視覺等創新產品不斷涌現,醫療影像、智能語音、智能翻譯、自動駕駛等產品已達國際先進水平,智能安防、 消費無人機等領域具備全球競爭優勢。人工智能產業初步形成京津冀、長三角、粵港澳、成渝等地區集聚發展、協同推進格局。

4)、 人工智能行業融合應用不斷深入。 我國人工智能產業發展不斷深入,與一、二、三產業融合成效初顯,正在從部分先導領域如醫療、交通、教育等服務領域向制造業、農業等產業領域拓展;智能金融、智能醫療、智能安防、智能交通等領域已經成為企業加速人工智能技術產業化落地的熱點應用場景,智能化新產品、新業態、新模式不斷涌現。新冠疫情防控期間,人工智能技術加速在醫療、應急、教育、制造等領域普及應用,一批人工智能 CT 影像輔助診斷設備、智能測溫+識別系統、智能機器人等抗疫產品,形成“智能抗疫軍團”,支撐疫情防控和復工復產成效顯著。

5)、 積極探索人工智能倫理和治理實踐。 我國政府高度重視人工智能倫理道德問題,積極構建有利于人工智能健康有序發展的體制機制。為進一步加強人工智能相關法律、倫理、標準和社會問題研究,新一代人工智能發展規劃推進辦公室成立新一代人工智能治理專業委員會, 2019 6 月發布《新一代人工智能治理原則——發展負責任的人工智能》,提出人工智能治理框架和行動指南,強調和諧友好、公平公正、包容共享等八條原則。

與此同時, 2019 年全國人大常委會已將一些與人工智能密切相關的立法項目列入立法規劃, 例如數字安全法、個人信息保護法和修改科學技術進步法等。在工業和信息化部等相關部委指導下,中國人工智能產業發展聯盟(簡稱: AIIA)發布了《人工智能行業自律公約》,引導企業加強人工智能倫理自律探索。 各地地方積極探索人工智能治理實踐,在制定人工智能相關政策中,支持人工智能倫理治理、法律法規等相關研究探索,《人工智能北京共識》、 《人工智能創新治理上海宣言》、《世界人工智能法治藍皮書》等成果相繼發布。當前,產業界和學術界協同推進,騰訊、百度、曠視等企業紛紛踐行人工智能倫理原則,設立管理機構;全國多個高校、研究機構等開展人工智能倫理治理、法律法規等方面的研究,如 2020 6 月,清華大學成立了人工智能國際治理研究院。

2、 十四五期間我國發展方向與機遇

1)、 加快 AI 基礎原創技術的創新突破,打造融合創新生態系統。 我國人工智能技術創新處于前所未有的活躍期。 當前,我國專利申請的活躍度與論文產出規模已位于全球前列,專利申請總量達 30.1萬件,占全球總量的 39%,是美國的兩倍以上; 近 10 年論文產出總量超過 18 萬篇, 2019 年論文規模是美國的近 1.5 倍。同時,我國視覺、語音等智能任務全球比賽的參與度和入榜率極高,多次在對話式問答、閱讀理解、 人臉識別等全球比賽中刷新智能任務的 SOTA13模型準確率。 我國發起的全球性比賽規模不斷擴大, iFLYTEK A.I.開發者大賽 2020 年參與團隊達 9000 余支,騰訊廣告算法大賽參與人次達萬余名。

2)、 將人工智能技術體系中的基礎理論、 原創及優化技術和共性應用技術, 依據創新程度和突破難度從高至低劃分為顛覆、階躍、創新優化和工程實現等四個發展層級。目前, 我國在創新優化和工程實現技術方面有一定優勢,但顛覆型、階躍型技術仍非常缺乏引領作用。

人工智能核心技術產業白皮書!資本降溫,白熱化競爭來臨 | 智東西內參

技術體系按創新程度和突破難度分級

我國基礎理論、原創模型等顛覆型、階躍型技術仍缺乏引領能力。反向傳播、人工神經網絡等深度學習基礎理論,以及知識工程、計算神經科學等其他分支的基礎理論基本由他國引領,相關的統計學、認知科學等底層近現代學科早期創始人、重大貢獻者鮮有我國學者身影。在本次浪潮之中,我國雖已涌現一批具有全球影響力的學者,在圖像識別、機器翻譯等領域不斷發聲;但深度學習理論體系、新型學習方式等顛覆技術主導權幾乎被全球幾位巨頭掌握; 卷積神經網絡、循環神經網絡、生成對抗網絡等階躍型算法技術多數在原始創造團隊
各分支中產生
,延續性較強; 人工智能顛覆、階躍技術的發展幾乎是寡頭壟斷的格局。

仔細分析全球人工智能前沿技術的發展, Yoshua BengioGeoffrey Hinton 等巨頭在 AAAIICLR 等全球人工智能會議上的觀點常引起全球學者追隨,引領新熱點方向發展。如, 2020Yann LeCunGeoffrey Hinton 等學者提出自監督學習是走向通用智能的路徑之一,引發自監督學習熱潮, CPVR 2020ICLR 2020 會議收錄的自監督學習論文數量較去年增長近一倍,計算機專業權威論文檢索平臺 dblp 2020 年收錄的相關論文數量接近歷年總和。

目前,我國已開始加強對人工智能基礎理論,甚至更底層基礎學科的建設發展,且取得一定成果,如,北京大學在隨機梯度下降法中的噪聲作用研究中取得進展,從理論上解釋了噪聲的正則化原理;南京大學提出不依賴反向傳播的深度學習模型深度森林( Deep Forest),探索神經網絡之外的深度學習發展路徑; 但總體來看,我國距離引領顛覆型、階躍型技術仍差距較大。

我國視覺、語音等基礎智能任務的工程實現水平全球領先,算法模型的二次創新優化能力也非常突出。 我國人工智能算法技術的發展著重于對業內主流算法模型的吸收改造與產業化應用,一方面, 我國擁有一批追求算法技術極致優化的人工智能企業,如曠視研發的ShuffleNet 模型具有輕量級 CNN 模型結構, 在計算復雜度相同情況下,相比其他模型可編碼更多信息, 人臉解鎖時間小于 0.1 秒。 百度推出的 ERNIE 模型是基于 Bert 的預訓練思想,支持詞匯、語法、語義三個層次的預訓練任務,可獲得更多的潛在語義信息,在中文任務上已超越原 Bert 模型水平。

另一方面, 我國在視覺、語音、自然語言處理等多類基礎任務的全球比賽中位列前位已成常態。 人工智能領域的比賽加速升級,從粗粒度圖像識別、目標檢測、段落語義理解等較為簡單的任務向人體關鍵點識別、推理理解等復雜任務轉變。

目前,我國企業在多個全球權威比賽中成績顯著,不斷挑戰更為復雜的任務。商湯、曠視、依圖、騰訊等企業在細粒度圖像識別、自動駕駛場景定位及追蹤、行人重識別( ReID)、 人體視頻解析等復雜任務上位列各類比賽榜單首位,哈工大訊飛聯合實驗室在推理閱讀理解評測任務( HotpotQA)全維基賽道中獲得第一,百度提出面向端到端問答的檢索模型 RocketQA 刷新微軟 MS MARCO( 微軟機器閱讀理解) 段落排序任務的榜單。

在上述背景下,我國人工智能技術的發展亟需圍繞三個方向進行布局:

一是進一步構建人工智能基礎理論與應用技術相結合的學科體系。 當前我國多個高校已著手布局人工智能學科建設,多以“人工智能+”為主線,著重應用學科的發展。然而,相較于應用技術,人工智能的基礎理論是我國下一時期提升人工智能顛覆性創新話語權的關鍵,但其學術周期更長,取得成效更緩,難以一蹴而就,需要完備的綜合型學科體系作為支撐。因此,基礎理論與應用并重的學科體系建設成為“顛覆型技術”取得突破的關鍵。

二是重點布局一批企業級人工智能研究院。 全球人工智能技術研究在產、 學兩界的分界線愈加模糊,由高校和企業合作完成的創新優化型和階躍型技術突破不斷增多,企業級人工智能研究院的重要性正在逐步顯現。從全球來看, 高校教授成為企業和高校間的特殊紐帶如, “深度學習之父”Hinton 在多倫多大學擔任教授,同時受聘為谷歌大腦人工智能團隊首席科學家;紐約大學終身教授 Yann LeCun,同時擔任臉書人工智能研究室(FAIR)主任。

縱觀我國人工智能人才培育的歷史, 企業級研究院對于我國早期人工智能人才的培育貢獻顯著, 微軟等頭部科技企業的企業級研究院培養一批諸如孫劍、楊帆、曹旭東等領軍人才, 在離開研究院后分別創立或加入我國曠視、商湯、Momenta 等人工智能創新企業,帶動我國早期人工智能技術產業的發展。 這種具有前瞻性的企業級研究院對中短期能夠應用落地的創新優化型、階躍型技術具有重要引領作用

三是打造區域人工智能技術融合創新生態系統。 建立以政府主導區域技術融合創新系統, 將鏈狀創新鏈基礎研究-應用研究-試驗開發升級為連通企業、高校、研究院所、政府等創新主體的共同體生態;圍繞區域特色優勢,在生態之上建立針對不同細分領域的技術專攻實驗室,有機整合各類要素、多元主體、異質產業群等,形成區域技術創新生態系統。

當前,全球已有部分國家率先開展該類載體建設, 荷蘭人工智能創新機構( ICAI), 已聯合 43 家合作伙伴建立16 家基礎研究、行業應用等類型的高校企業實驗室,聯合多方進行技術成果的轉化落地;美國計劃在未來五年內投資 7.65 億美元,用于數十個由聯邦政府、 工業界和學術界聯合建立的人工智能( AI)和量子信息科學( QIS)科學中心發展,進一步完善其人工智能技術創新生態系統。

2)、 協同發展 AI 基礎核心生態,加快構建一批行業智能軟件平臺。 我國已基本形成智能計算、數據服務、開源開發框架、核心平臺和關鍵應用的全產業鏈布局。目前,我國已形成以少數領軍企業為中心,一批科技企業加速跟進,大批創業型企業不斷涌現的產業發展格局,人工智能企業數量占全球比接近 25%,初步形成國內大循環的發展基礎。

一方面,我國在數據和關鍵應用環節具備一定國際競爭力,已形成數據采集、清洗、標注、交易等較為完整的數據支撐體系, 計算機視覺、自然語言處理等智能應用技術水平位居全球前列,并在公共安全、零售、交通、醫療等多個行業進行規模或試點應用;另一方面,在硬件芯片、開源開發框架等基礎核心環節,我國已涌現出寒武紀、地平線等新興智能芯片企業,并擁有百度飛槳( PaddlePaddle)、華為 Mindspore、曠視天元等開源開發框架,持續完善硬件芯片與軟件框架的基礎生態體系。

充分利用我國大市場與產業鏈完備的發展優勢,補強智能計算、 開發框架的基礎生態。

從全球來看,開源開發框架的第一次洗牌已到尾聲,谷歌、臉書等頭部企業的開發框架體系基本確立,市場份額和社區生態已遠超其他框架,我國框架以一己之身突圍難度很大。同時,受制于我國集成電路較全球起步晚的歷史背景,英偉達、英特爾等芯片大廠已在工藝制程、芯片架構、軟件生態等方面有數十年積累;智能計算時期,芯片頭部企業針對人工智能任務需求加速優化芯片架構、完善軟件工具、適配多樣的開發框架,構筑龐大的生態體系不斷提高行業壁壘,導致其他初創智能芯片企業一時間難以切入市場進行規模應用。

目前,我國雖涌現出一批智能芯片企業,同時也在研發框架方面有所布局,但兩類基礎生態構建所面對的形勢仍然非常嚴峻。因此, 深度聚焦本土市場的需求持續、 快速創新,驅動我國智能芯片生態和開發框架生態的協同、融合發展,形成合力占領國內市場份額,成為補強兩類基礎生態的關鍵方向。

憑借國內智能應用先行落地的時間優勢,沉淀一批行業智能核心軟件平臺,同時提升我國在傳統行業產業鏈中的地位。 應用創新活躍是我國自互聯網時代至今的長期發展優勢,目前我國已在多個領域形成全球智能應用的引領作用,并持續推進人工智能應用先導區的建設,不斷挖掘新的應用場景,沉淀行業數據和算法模型;如,百度自動駕駛開放平臺 Apollo 與包括寶馬、戴姆勒、一汽等在內的全球上百家車企達成合作;依圖科技 care.ai 智能醫療解決方案已在全國200 余家機構落地,并在歐洲、南美、中東、東南亞等海外區域推廣應用。

在先行試點、應用創新、行業數據、行業算法模型均有一定優勢的背景下,我國的發展方向應是深度滲透到關鍵行業的產業鏈中,沉淀一批面向行業的基礎核心智能軟件平臺,以行業軟件平臺為核心構筑應用生態,替代或增強原有產業鏈條中的軟件環節,甚至提升在傳統產業鏈中的影響作用,轉變過去僅在應用模式上創新的痛點,驅動我國關鍵行業產業結構向高附加值方向轉變。

3)、 產業軸心從前沿技術向行業應用轉變帶來區域化發展機遇。 當前,人工智能已從聚焦智能技術發展向各行業應用落地的階段轉變,這將代表著人工智能產業不再僅是北京、上海、深圳等頂尖人才集聚區域的聚焦重點,也為具有特色傳統產業優勢的區域帶來發展機會,我國人工智能產業有望形成各具產業應用特色的區域化發展格局。究其原因, 一是產業發展階段所驅使的, 人工智能產業雖是技術密集型產業,但由于其強賦能特點,與行業場景的深度結合是產業發展非常關鍵的一步。

當前,人工智能產業重心已從智能技術向行業融合應用轉變,使得具有傳統行業應用場景、行業知識的更多區域具備發展人工智能的條件和機會。這些區域擁有人工智能技術落地的試驗田,從而吸引智能應用企業集聚發展二是企業發展周期所驅使, 本輪人工智能產業的泡沫逐步破裂,企業面臨從早期靠愿景融資到靠應用變現融資的發展階段,應用落地成為人工智能企業這一時期的聚焦重點,因此也驅使企業尋找更合適的區域進行落地發展。 可以預計,未來我國更多的區域將會迎來人工智能產業發展的窗口期, 逐步形成各具產業特色的區域化發展格局。

打造分領域分區域的人工智能產業創新中心。 當前,科技部和工信部均部署了產業創新的試點,截止至 2021 3 月底,科技部頒布15 個新一代人工智能創新發展試驗區,工信部設立 8 個人工智能應用先導示范區,推動人工智能產業區域化、特色化發展步伐不斷加快。在此背景下,我國應打造一批分領域、分區域的人工智能產業創新中心,構建縱向垂直一體化的、產業鏈與創新鏈合一的產業發展平臺, 助力我國人工智能關鍵核心產業從技術路線、適配標準、生態構建、應用推廣等方面的協同創新發展,加速形成金融、制造、能源、醫療、災害應急、農業、生態環保等領域的應用創新體系,助力區域人工智能產業特色化、深入化、規模化發展。

4)、 加快人工智能和各產業深度融合,打造人工智能產業集群。結合各地區產業基礎和資源稟賦,引導各地先行先試,不斷匯聚力量、理念、方向,抓住幾個亮點,在全國范圍內形成標桿和規模效應。培育更多人工智能領軍企業,引導相關行業的龍頭企業加速智能化改造步伐。推動開展一批重點領域融合創新工程,培育一批標志性人工智能技術產品,提升重點領域人工智能產品智能化水平。 加快推動人工智能與工業、交通、醫療、農業、能源、應急安全等領域深度融合,推動人工智能在智能制造、智能醫療、智慧城市、智能農業等領域得到廣泛應用。 發展一批人工智能產業園,按應用領域分門別類進行相關產業布局,培育建設人工智能產業創新集群。

5)、 深化國際合作,主動融入全球人工智能治理框架。 加強人工智能倫理治理研究力量, 促進形成更多更加開放、有國內外影響力的交流合作平臺組織,推動國內倫理治理規則共識、中國方案的形成,把引導和規范人工智能發展不斷推向深入。 強化人工智能標準體系建設, 推動形成“國家標準頂層架構引導,行業和團體標準指導,國際標準協同推進”的良好局面。 堅持全球化道路,堅持國際視野和全球思維, 以開放心態應對全球競爭,搭建全球化服務平臺,促進國際交流,吸引全球創新要素資源參與我國人工智能技術及產業發展,同時鼓勵中國人工智能企業加大“走出去”力度;充分利用“一帶一路”倡議、 G20 等雙/多邊合作機制,主動融入全球人工智能治理體系,積極推動企業、聯盟、行業組織等機構的更多專家參與全球人工智能規則制定,強化在國際標準組織中的協作,為全球人工智能發展貢獻中國智慧。

智東西認為,近兩年,人工智能的技術應用開始全面覆蓋日常生活、 科學研究、社會治理、商業創新和國家安全等經濟社會的關鍵領域, 以空前的廣度和深度推動社會發展。但同時,相關資本的減速也是最近的一個很明顯的現象。但是,這種降速不一定是一件壞事,這是一個擠掉泡沫,讓行業回歸理性的過程,在十四五期間,經歷篩選后生存下來的企業必將是有自己的核心競爭力,能夠走出國門的優秀AI玩家。