智東西(公眾號:zhidxcom)
編輯 | GTIC
智東西4月18日報道,在剛剛落幕的GTIC 2023中國AIGC創新峰會上,云知聲聯合創始人兼副總裁李霄寒帶來了名為《從理解到生成,云知聲的AGI之路》的主題演講。
李霄寒通過回顧過去近30年AI的發展歷程,總結出了AI演進3點規律。首先,AI的演進從以算法為中心逐步變為以模型為中心,這將影響科技企業未來在相關資源上的投入比例;其次,AI項目逐漸從小而美的工程變為一項大工程,如果一家科技企業過去沒有AI相關的積累,而未來又沒有大規模的投入的話,那么發展起來是非常困難的;最后,AI在解決復雜任務時,將通過端到端的方式,中間任務將面臨凋零。
李霄寒認為,ChatGPT的推出,對當下AI技術路線、社會分工以及AI企業發展產生深遠影響。在技術路線層面上,此前,雖然國內外的許多家科技企業認為實現通用人工智能(AGI)需要一個“線性輸入——線性輸出”的過程,但是這家企業對這條路徑信心不足。ChatGPT驗證了這條路徑的可行性,即只要持續地線性投入,那么當模型參數達到一定規模時,就可能出現涌現效應。
在社會分工層面,李霄寒指出,未來從事文稿撰寫、客服、兒童成長陪伴師這樣的崗位將會被淘汰,因為這些崗位實際上只是在做一些簡單的輸入輸出工作。在AI企業發展上,李霄寒展望了未來兩種不同模式下的AI企業生態。其中一種是基于通用大模型的公司,它們通過通用大模型底座對外提供服務,從而獲取規模性的用戶,另一種是基于垂直場景大模型提供精細化服務的公司,這種公司的大模型可能達到幾百億參數的規模。
最后,李霄寒分析了ChatGPT的進步性以及局限性所在。他認為,ChatGPT的出現,讓AI真正進入了CGG時代。這不僅體現在人類有機會告別人工智障,還體現在AGI有望成為現實。但ChatGPT目前生成的信息并不完全準確,同時知識更新和自動化的程度不夠。
以下為李霄寒的演講實錄:
非常榮幸有機會來跟大家做一下分享,云知聲是一家AI公司,也是這波ChatGPT的浪潮下最受關注的公司類型之一。大家紛紛關心我們這種AI公司在想什么、做什么。同時,也有人在問,這波浪潮會對AI公司有什么影響?AI公司將如何破局?
簡單來講,云知聲是一家垂直類的AI公司,它有兩方面業務,分別是智慧物聯和智慧醫療。近期我們會推出醫療版的預訓練大模型,因為這件事情還正在進行中,所以我今天沒有太多關于這件事情的分享。我還是更多講一下關于AI從業者、AI公司如何看待最近這波ChatGPT浪潮。我們可以從中總結一些規律、展望一下未來,同時看一下這波浪潮將會帶來哪些機會,以及存在哪些風險。
一、AI歷史回顧與3大規律總結
首先,我們來回顧一下,AI在過去近三十年間的重大事件。自我從業以來,云知聲整個創始團隊碰到的第一個、也是最重大的事件就是,1997年,IBM開發的象棋電腦,也就是我們熟知的深藍計算機擊敗了世界圍棋冠軍卡斯帕羅(Гарри Кимович Каспаров)。
2012年,AlexNet橫掃ImageNet的榜單,讓人認識到深度神經網絡的力量,那一年,云知聲把深度神經網絡應用在語音方面,并且達到了當時普通話的最佳水平。
2016年,AlphaGo打破人類圍棋不可戰勝的神話,在那一年,云知聲完成了過去幾年比較基礎的技術積累,并且在那個時間點形成了一直延續至今并且還在不斷發展壯大的兩大業務——智慧物聯和智慧醫療。
最近OpenAI推出了ChatGPT,一方面,我們感受到了巨大的壓力,另一方面,我們也感到非常欣喜——從業這么多年,終于有機會真正看到AGI在未來幾年成為現實。所以云知聲也積極地融入到整個大模型浪潮之中。
回顧歷史,我總結了AI演進的3點規律。首先,AI的演進將從以算法為中心逐步變到以模型為中心。早些年的專家系統基本上都是規則。上世紀90年代,統計學習模型興盛以后,模型逐步開始占比較大的比重,拿典型的語言識別關鍵詞檢測任務來講,原代碼的大小和模型大小基本在同一個量級,現在看來像一個玩具。而隨著深度學習模型的引入以及到最近預訓練模型引入,整個模型占的比重越來越大,這就導致我們的投入——資源、人力、硬件以及比例跟過去相比完全不一樣。

第二個規律,AI項目逐漸從小而美的工程變成大工程。在過去的5年或者10年前,一家企業找幾個人搭一個班子,買一些服務器數據就可以做出一個AI產品,這個AI產品可以面向某個特定場景解決一些特定問題。


在未來,這件事情將會變得不可行。AI真正變成一個大工程。雖然還會有人想找一個非常小的領域去做AI,但是問題是,當這個大模型解決完所有通用的問題之后,只需要在上面延伸出一個垂直就可以把原來辛辛苦苦做的東西顛覆掉。現在,一家企業如果在AI領域沒有一定的積累,未來又沒有大規模投入的話,那么發展AI還是比較困難的。
第三個規律,就是中間任務的凋零。過去AI解決一個復雜問題的時候,會把這個任務劃分成一系列子任務,然后再把它們串起來。這樣一來,前一個子任務的輸出可能只是為了下一個子任務的輸入,這是所謂的中間任務。

2000年前后,手寫識別功能特別流行。當用戶在手機上用手寫輸入,AI就可以從一張原始圖片里面提取出相應的特征,然后再將這個特征輸入到后面的分類器中從而實現手寫輸入的功能。但現在,大家都是通過端到端的方式來實現,未來人們將用大模型來實現。這種中間任務慢慢就沒有人做了,或者說,這種中間任務沒有存在的意義了。類似的中間任務里面還有NLP里面的分詞、指代識別等等,這些都將被弱化或者消失。
這里面也延伸出一個有趣的問題。ChatGPT輸入、輸出都是文字,其實文字本身是人類對整個物理世界翻譯以后形成的符號系統。這種符號系統仍然被看作是一項中間任務,那么ChatGPT這種文字類的輸入輸出是不是也只是一種中間任務呢?這是一個開放性話題,還有待大家的討論。
二、ChatGPT對當下技術路線、社會分工、AI企業之影響
事實上,ChatGPT還對當下AI的技術路線、社會分工以及AI企業發展產生重要影響。首先,從對技術路線的影響上來看,2022年及以前,國內的AI公司或者大廠都在做大模型,但是可能各家公司可能沒有那么強的信心。ChatGPT對國內的最大影響,就是驗證了這條路的可行性,告訴各家公司:只要你線性持續投入,模型參數達到一定規模就會獲得涌現效應,實現非線性的、爆炸式的輸出。它讓所有人相信大模型是AGI的必經之路。

在社會分工層面,我們將項目經理提交的有關項目進度的一封郵件交給ChatGPT重新組織一下,我發現:組織以后的文本文筆特別流暢、精簡、結構鮮明,而且重點突出、沒有廢話。對比來看,項目經理提交的項目進度書中廢話還是蠻多的。這就讓我自然而然地產生一個問題:項目經理這樣的角色未來在我們的公司是不是還會存在?
我的思路是,要看他為什么負責。我認為,項目經理應該為項目的進度負責,并不是為周報負責,周報只是一個中間任務,被替代掉沒有關系。大模型的輸出這種功能可能最終會去服務于項目經理,而不是替代項目經理。
當下,“程序員被替代”的消息頻頻引爆互聯網。我對程序員的看法與對項目經理的看法相同。程序員并不是為輸出代碼負責,他負責的是功能的正常集成,以及集成后的正常運行,他為debug(計算機排除故障)負責,而所謂代碼只是一種中間任務。
未來,云知聲的開發體系里,產品經理、項目經理、架構師、編碼、集成、運維等等,每個人都將獲得大模型的輔助。同時,我認為,未來從事文稿撰寫、客服、兒童成長陪伴師這樣的崗位將會被淘汰,因為這些崗位實際上只是在做一些簡單的輸入輸出工作。

在AI企業發展上,我認為,未來將會有兩種不同模式下的AI企業生態。其中一種是基于通用大模型的公司,它們通過通用大模型底座對外提供服務,從而獲取規模性的用戶。除此之外,由于這種服務的成本會較低,最后它的售價也會非常低。
另一種是基于垂直場景大模型提供精細化服務的公司,我堅信,通用的大模型并不能解決垂直領域的所有問題,哪怕它在技術上解決掉,在真正的應用過程中,還會有很多行業壁壘。所以云知聲希望成為這種基于垂直場景大模型提供精細化服務的公司。但目前,云知聲還沒有那么大參數規模的模型,一開始的時候,云知聲的大模型可能不會到千億參數級別,但一定會在百億參數級別,那樣也將會有涌現效應存在。
三、理性分析:ChatGPT的進步與局限
下面,我將簡單談一下ChatGPT的進步性與局限性所在。ChatGPT的出現,讓AI真正進入了CGG時代。所謂CGG,第一個指的是會話式AI,ChatGPT讓我們有機會告別人工智障,這給我們帶來了非常大的興奮點。

第二個是生成式AI,語音、文字、圖像,視頻皆可生成;第三個就是AGI,我們將有幸看到,AGI在未來幾年真正成為現實,然后從這個時間點往后,巨量的投資也好,或者AI企業的人員投入也好,都會集中在AGI層面。
ChatGPT當然也存在一些局限,我們關注這些局限不是為了挑毛病,而是去反思在我們所從事的領域如何解決這些問題,避免這些問題。
第一是“幻覺”,就是所謂的一本正經地胡說八道;第二是知識更新的速度和自動化的程度,當我們去做垂直場景的時候,存在大量的行業知識,這些行業知識在不斷地產出,我們也需要迅速地吸收,讓它被搜索到,另外在To B場景中,我們需要賦予客戶本身一定的能力,讓其能夠自己“灌知識”,而不是所有事情都依賴服務公司;第三是推理資源的微型化,也就是私有化;第四是倫理和價值觀的問題,這個問題通過前置或者后置審查,相對可控。
最后是ChatGPT學習及處理的僅僅是人類世界從現實世界翻譯來的符號化知識,缺乏與物理世界的互動。這個問題是相對比較長遠的一個方向,但它也是我們解決上述問題之后,必須面臨的下一個問題。
四、云知聲的AGI路徑展望
云知聲于2012年成立,公司擁有自研的技術架構,包括自建的超算中心、全棧式算法,以及這么多年積累的海量數據。云知聲一開始是用AI 1.0的方式在做云知大模型,現在正將其進化到預訓練大模型的方式。
云知聲下游覆蓋智慧物聯與智慧醫療兩大場景,未來會從智慧醫療入手,應用我們的大模型,面向醫院、醫生及醫管部門,提供AI醫學大腦。那么,ChatGPT在醫療場景有哪些用途呢?ChatGPT的回答是:醫療問答、聊天機器人、疾病診斷、醫學文獻檢索、患者跟蹤等,歸根結底,它也是在做虛擬醫生。
云知聲對ChatGPT做了比較長時間的分析,并根據我們積累的行業知識做了一些推導,發現除了上述一些通用的局限之外,ChatGPT在垂直領域還有進一步的應用局限:
1.在某些問題上可以給出一個很好的答案,但它沒法對自己作出的回答援引資料進行背書,沒法對自己可能出現的錯誤負責,醫生較難為模型的錯誤買單;
2.在醫療領域的生成文本,難以保證可控,可信和可靠——場景更關注短板而不是長板;
3.尚不能整合電子病歷、影像、基因組等多模態醫學數據;
4.難以導入醫院內部數據和知識;
5.難以及時更新最新文獻結果;
6.使用成本尤其是監管成本的問題。
云知聲的主要工作重心就是解決大模型在垂直場景落地的這些具體的局限。例如,我們會做行業知識的增強以解決“幻覺”的問題,會做企業檢索的增強、API的增強、微型化以及IO審查,所有這些問題都是可解的,都會在有限的時間內解決。

在這個基礎上,云知聲會推出面向醫療行業的行業版大模型,并在行業之上,面向客戶提供企業定制版大模型。從2016年進入醫療行業以來,云知聲經過多年積累,在數據層面、在大模型以及知識圖譜方面都取得了一定的進展和成效,有一個非常好的起點。
云知聲的愿景,就是從醫療版著手,逐步覆蓋到其他專業版,最后把各個專業版聯合起來,基于MoE(Mixture of Experts)技術做模型集成,訓練得到通用增強版。
從業那么多年,這是第一次感覺AGI距離我們那么近,以前用AI技術去解決某個場景的某些問題,一旦涉及到業務本身如何真正賦能行業時,就會遇到各種各樣的應用層面問題。今天這個時間點給了云知聲一個新的機會,我們可以真正通過AI的方式把我們原來的愿景和夢想真正落地。謝謝!
以上是李云霄演講內容的完整整理。