智東西(公眾號:zhidxcom)
編輯?| ?GTIC

智東西4月18日報道,在剛剛落幕的GTIC 2023中國AIGC創新峰會上,竹間智能創始人兼CEO簡仁賢進行了主題為《如何加速AGI通用人工智能在企業落地的到來?》的演講。簡仁賢從技術創造實際價值的角度解讀了企業在落地AGI的過程中所面臨的挑戰,以及可行的落地路徑和策略。

簡仁賢說道,基于大型語言模型的產品將成為通用人工智能的操作系統,并且將分裂為“兩個世界”,一個是由OpenAI和微軟主導的閉源世界,另一個是由Deepmind和谷歌主導的開源世界。他指出,中國的創業公司將成為開源模型的最大受益者,因為小型創業公司具備更強的創新能力,而大公司擁有更充足的資源和資本,所以創業公司和大公司之間的結合將使得創新更加規模化,并呈現“百花齊放”的局面。

未來的軟件范式將是由自然語言技術驅動應用,形成“大語言模型+知識+應用”的新模式。他認為,模型與用戶之間存在著鴻溝,需要產品來做橋梁,沒有產品的模型無法體現實際價值,因此他主導更具可商用性的“模型即應用”(MaaA)模式。

大語言模型的出現將催生全新的軟件產業,數以千計基于大模型和生成式AI的應用的公司將涌現出來。未來將是“應用為王”的時代,模型將成為應用的基本組成部分。基于大模型的應用能夠提高白領工作者的生產力與創造力,減少每日工作時間,從而提高幸福感。客戶服務自動化、虛擬助手、知識管理和員工培訓這四個應用場景將首先被顛覆,大模型應用能夠從這四個方面來提高企業的運營效率,迅速創造價值。

簡仁賢提出了一種方法來平衡大型語言模型和小型語言模型的優缺點,他稱之為“自然語言雙引擎”,由小型自然語言處理模型、知識模型和大型模型構成。小型模型可以加強大型模型的可控性、可追溯性和可解釋性,目前,竹間智能主力產品——四大平臺全面以大語言模型和生成生成式AI為核心技術,加上可商用化的模型工廠平臺,為企業提供較低成本的大模型產品和解決方案。

以下為簡仁賢的演講實錄:???

大家下午好!前面聽了非常多的專家們在大模型、ChatGPT、機器學習、深度學習等技術方面進行分享,下面我不講技術,而是探討一些更實際的問題。

一、研究如何復制OpenAI不重要,讓技術產生價值更重要

ChatGPT已經成為新一代AI代名詞,也是未來AGI的代名詞。以十年的跨度來看,我們聊ChatGPT就等于是聊AI的未來。那么,類似ChatGPT的大模型技術如何能夠落地?大家聽了很多ChatGPT的故事,有許多人一直在做反向工程研究,想知道如何復制OpenAI和ChatGPT,想了解背后的原理,可當大家都還在鉆研這些問題的時候,GPT-4出現了,斯坦福大學的Alpaca模型出現了,幾乎每過兩三天就會有AI科技和產品的爆炸性新聞傳來,因此我們已經沒有時間去回溯,更重要的是思考未來的技術,如何克服大模型的缺點,把精力和資源放在商用化和模型工程上。怎么利用這個技術,讓它為我們產生價值?不要再去想復制一個OpenAI,應該去考慮怎么樣順應趨勢、如何運用技術去為未來創造更多的價值。

ChatGPT的用戶數增長創造了記錄,上線兩個月活躍用戶就突破了1億,現在每天都有上億的用戶在使用,而相關的使用數據從去年12月份到現在,不斷反饋給OpenAI,讓它一直打磨模型,于是模型能力和Prompt(提示)性能越來越強。

大家知道GPT-4是2022年8月完成訓練的,它所用的數據集截止到2021年9月,整體花費了很多精力才推出來,是一項非常大的工程。那我們看一下它到底能夠做什么。在此之前,先給大家介紹一款竹間打造的、使用起來很方便的AIGC產品“靈感閃寫”,我用“閃寫”為今天的演講生成了一篇演講稿,而且前幾天在中東做演講,我也用它生成了英文演講稿。

給大家看一下我是怎么生成的——“閃寫”里面有非常多的模板,我們的目標是打造上千個模板,給不同人群使用。全中國大概有2.5億白領,都需要這些模板。我把今天演講的題目和三個大綱輸入進去,當然它也可以生成大綱,最后這個產品輸出的演講稿和我今天要講的內容其實差不多,包括ChatGPT將帶來的紅利、ChatGPT能給企業帶來的好處、ChatGPT在企業落地的挑戰、它在企業落地的實用場景等。

竹間智能簡仁賢:“大語言模型+知識+應用”,自然語言技術推動軟件范式變革丨GTIC 2023

二、ChatGPT聰明,創新源自創業公司

那么,我們是不是都認同大模型?AGI的起點是不是已經到來了?通用人工智能到底是不是我們期望的未來?

我們先來了解一個事實:ChatGPT比人類更聰明。當然,把所有的人類加起來,它比不過,可是如果拿地球上的每一個個體來比較,它就是最聰明的。美國高中生要考AP,而ChatGPT考多科AP的成績可以得滿分5分,AP得滿分相當于大一學生的水平了,另外ChatGPT考LSAT法學院入學測試得分在90%以上,還可以通過美國律師資格考試Bar Exam。如果用高考來測試它,我估計它可以考550分左右。人類里面,沒有哪一個人可以單獨同時應對這些考試并取得高分。

美國超過80%的學生已經在用ChatGPT了,我有一個朋友的孩子想到我們公司來實習。他是一名攻讀機器學習方向的名校的研究生,會寫Prompt(提示),會用ChatGPT。并且他們整個機器學習小組都在用ChatGPT,他表示現在已經回不到沒有ChatGPT的日子了。可見,對于機器學習研究來說,ChatGPT的幫助有多大。

很多美國的老師被迫用ChatGPT,因為學生也在用。但是ChatGPT對老師有什么好處?在座的可能有老師,教授,應該知道ChatGPT可以做什么——它可以幫你出題、改作業、寫評論,增加與學生溝通的效率。美國有老師用ChatGPT來分析自己所在區域的學生對哪些題目最不熟悉,然后就用這些題目來考他們。一周前有一篇報道,講的是香港科技大學的黃教授宣布用ChatGPT寫作業可以加分。它在教育界的影響已經非常大了。

因此,我認為,ChatGPT這樣的產品會是未來AGI的操作系統。ChatGPT由兩部分組成,它不是一個模型,而是一個產品,它把對話跟大模型結合,使得人類和模型可以交流,讓模型為人所用。

語言模型的技術其實已經存在了二三十年了,很多人都可以做模型,為什么達不到ChatGPT這種火爆程度?OpenAI和ChatGPT這樣的組合未來會發展成什么樣?美國不開放給我們用怎么辦?這個世界會產生多大的變化?我的猜測是,這對全中國的創業公司會是一大福音。

模型軟件的生態會有兩個世界,一個是OpenAI+微軟的閉源世界,另一個是DeepMind+谷歌和Meta的開源世界。未來,微軟和OpenAI會像現在一樣繼續閉源,就像iOS模式。DeepMind和谷歌加上Meta則會繼續開源。谷歌和Meta都已經開源了很強的大模型,這就類似于安卓的模式。

竹間智能簡仁賢:“大語言模型+知識+應用”,自然語言技術推動軟件范式變革丨GTIC 2023

創新是從創業公司開始的,這句話是真理。OpenAI做出了GPT系列,它本身也是一家創業公司,一百多人做出來GPT,有了成效之后,微軟投入大量的資源和巨額的資金,才有今天的GPT-4。大公司有錢有資源,但是沒有OpenAI這樣的創新能力。OpenAI的GPT當時也是由他們團隊里的成員研發出來的,等到需要算力和資金的時候,大公司再進場,這就是典型的創業公司引領創新的意義。

未來每周、每個月可能都有更多的開源模型問世,也會有更優化的訓練技術,讓大模型的訓練成本大大降低,通用數據會更方便取得,這樣一來,創業公司的模型技術能力將得以跟大公司拉平,甚至超越大公司。

在模型領域,國內會呈現百花齊放的局面,創業公司不斷用大模型來打造一些創新的產品,滿足大家的期待。未來的軟件范式是自然語言技術驅動應用,大模型的通用能力很強,但是也有局限,這些需要持續去優化和克服。

三、大模型+知識+應用才能體現價值

ChatGPT將給企業帶來巨大的紅利,這些紅利在哪里?怎么產生?先來了解一個事實:用戶和模型之間存在巨大的鴻溝。谷歌與DeepMind在 2017年就發布了《Attention?is?All?You?Need》,推出了Transformer,但沒有多少人真正用到Transformer,也沒有多少人用到GPT-3,因為沒有產品。而ChatGPT最偉大之處是在模型和用戶之間架設了橋梁,這個橋梁就是產品,讓大多數的普通人都能夠用得到,這個模型才有價值。

無法產品化和商用化的大模型毫無價值。例如,有人說自己做了一個萬億參數的模型,并且可以把模型尺寸壓縮到很小,這些毫無價值,有價值的是這個模型能夠變成產品。所以我們倡導的不是MaaS(模型即服務)——你只給出一個API,并沒有價值,能夠開創軟件的新范式才有價值,就像ChatGPT可以通過與人溝通完成任務。

LLM(大語言模型)、Knowledge(知識)、Application(應用)三者加起來才能構建軟件的全新定義。對于新的軟件范式來說,只有模型是不夠的。我預測一年之后模型不那么值錢了,所有大公司、小公司都會先基于開源模型來開發。未來,應用為王,會出現成千上萬基于大模型的應用,這些狀況現在已經露出苗頭了,等到今年年底回頭來看,可能誕生了500個應用,每個應用都在解決一個細分問題。

竹間智能簡仁賢:“大語言模型+知識+應用”,自然語言技術推動軟件范式變革丨GTIC 2023

那么,這對企業有什么好處?我這邊列出幾個好處,包括減輕行政負擔、提高運營效率、提升客戶體驗、在內部優化數字員工、減少溝通障礙、提高溝通效率、提高咨詢和查詢的效率、人機協同等等。

具體說幾個場景,比如我們寫郵件,有時會讓人誤解部分文字。經過AI修改后,就可以讓文章變得更清晰、更通暢,讓大家都明白字里行間的意思,這是生成式AI的最大特點。高質量的訓練數據投入模型之后,再加上一些知識,能更好地輔助你寫東西。我剛才講的用“閃寫”生成的演講稿,里面融入的知識都是正確的。

再來看提高咨詢和查詢的效率——你必須花費一些時間來詢問及查找答案,但通過ChatGPT馬上就可以得到答案,搜索引擎不再是人們所依賴的獲得知識的方式。搜索引擎從今天開始就要被顛覆掉了,如果大家有機會用到New Bing的Chat功能就明白我的意思,它可以直接給你所需要的答案,而不是一推垃圾廣告或藍色鏈接。當你使用傳統搜索引擎檢索,然后閱讀每個網頁,最后找出來的內容可能比ChatGPT給你的內容還差,而且你看到的前幾個,甚至第一頁搜索結果都是廣告。

人機協同則意味著,人能夠跟模型對話,讓它產出你想要的東西,一起完成一個任務,或者一起完成一項工作,這些是透過自然語言來達成的。

在提高企業運營效率方面,首先,客戶服務自動化會出現替代的現象,換上更強大的智能客服。假如還在靠語料、規則或人為修改關鍵詞,那肯定全都要被換掉。

其次,虛擬助手可以集成到企業系統當中,ChatGPT可以擔當HR助理、產品助理、物流助理、班車助理等,這些全部都可以集成進去。竹間的KKbot就是一款基于大語言通用模型的對話系統,你用自己的數據就可以做出一個ChatGPT的對話機器人。別人向它提問,它會用你給的內容來回答。

第三,知識管理可以將企業的知識釋放出來,竹間的Knowledge Factory通過大模型解析所有的文檔,來構建龐大的知識圖譜。整個過程比以前更快,以前需要六個月的時間,現在可能六小時就可以做到了。企業用自己的知識圖譜賦能業務系統,就可以形成完整的知識管理體系,這樣企業的知識就留在自己的大模型中,然后重復訓練,重復應用,企業的Know-How(技術訣竅)就會越來越強。

第四,員工培訓。ChatGPT是很好的學習工具和訓練工具,那么竹間有一個Emoti Coach智能培訓系統,由大語言模型和生成式AI驅動,AI教練憑借實戰演練來訓練學員,效果比被動式的e-learning強10倍。因此,有了大模型的助力,未來所有的e-learning培訓軟件都將被顛覆掉。

四、ChatGPT落地面臨五大挑戰,大小模型混合匹配賦能垂直行業

ChatGPT落地的挑戰有哪些?

第一,訓練和部署的成本很高,企業自己搭建并訓練一個大模型不切實際。

第二,需要大量的數據進行訓練。參數量越多,需要的數據越多,這才能夠達到高參數量應有的大模型效果,這個原理大家都知道。當你有一千多億的參數,但數據只有一點點,是達不到理想效果的。

第三,需要大量的GPU做訓練,訓練完還要做推理,推理需要的GPU比較少一點,但是這樣龐大的計算量,怎樣才能實現規模化?很少公司買得起大量的GPU,并且買了GPU后還需要維護。另外,數據中心存放在哪里?這些都是問題。

第四,企業的私有數據不能傳到云端。所有的互聯網公司做出來的大模型都說可以賦能企業,但企業很多私密數據是不能上傳云端的。我們服務的200多家金融業客戶中,包括銀行、保險、證券、基金,沒有一家允許上傳私有數據,法規不允許。安全、保密性和個人隱私是企業采用大模型和生成式AI必須要重視的。

第五,企業很難找到厲害的算法科學家和工程師,人才太稀缺了。

對于竹間智能而言,由于ChatGPT的火爆,整個市場突然擴大了起來,因為廣大群眾都已經被ChatGPT掀起的浪潮教育了,大家已經能體驗到語言模型的超強能力,我們就不需要再去教育用戶了。

同樣,很多企業的高管和項目組都被ChatGPT、OpenAI教育過,他們知道原來大模型可以做到這樣的程度,以前我們要花很長時間去教育客戶,現在也不用了。自然語言理解的市場需求從現在開始巨量爆發,全球范圍內的市場都被激活了。

竹間智能是做自然語言處理起家的,從十幾億參數的模型到一兩千億參數的模型都有涉獵。企業需要的并不是ChatGPT,也不可能在企業內部部署一個ChatGPT,企業需要合適的大模型,而合適的大模型可能一兩百億參數就足夠了。

斯坦福大學最新發布的Alpaca模型,用一張GPU就能完成訓練。我們預測六個月之后,算力需求會越來越小,訓練模型的技術會更創新,壓縮模型的技術會升級,平行計算性能會提高,未來模型訓練的成本會壓縮到現在的1/10,模型會更容易取得,更重要的是如何去應用。

竹間為各行業提供預訓練模型,其中包含垂直行業的知識,它們可以派上大用場,而結合大模型之后就更厲害了。行業領域的大模型,或者說垂直大模型就是將來ChatGPT能提供的巨大紅利。

大模型有個缺點,就是不可追溯,一個大模型有非常多層神經網絡。GPT系列是根據給定文本來預測下一個詞出現的幾率,一個詞一個詞地生成,因此很不可控。如果聊天機器人不可控,對于企業來說是不可能被接受的,因為萬一這個工具對客戶、對員工胡說八道,企業要負法律責任。

但我們用小模型來做,上千個小模型就可以管控大模型,讓大模型變得可控、可追溯、可解釋,再加上知識,便形成一個自然語言雙引擎,讓企業享受大模型生成的優點,同時彌補大模型的缺點,還可以用大模型來協助訓練小模型。這樣交叉匹配做出的產品會更符合企業的應用需求。

五、五大決策實踐助力AGI落地企業

AGI在企業如何落地?是不是要買很多GPU?不一定。

首先,要選能夠最快上線部署的場景,能夠馬上體驗到大模型帶來的好處,不要選比較難的場景。

第二,選不需要跟復雜系統對接的場景,否則企業感受不到大模型帶來的好處,感受不到NLP帶來的好處。

第三,大模型落地立刻能夠提高員工個人的生產力,減少工作時長,然而通用人工智能未來給人類帶來的最高價值是什么?是降低成本嗎?不對。是提高效率嗎?不對。是提高產能嗎?不對。我常常說,通用人工智能給人類帶來的最大好處是提高人類的幸福感。比如,每個人每天要花兩個小時的時間寫周報、寫學習報告、寫各式各樣的報告,如果每一天可以幫你省下這兩個小時,你是不是多了兩個小時的幸福感?員工有了幸福感,就能積極幫助企業、個人和家庭創造更高的價值。從這個角度來說,ChatGPT可以提高員工的幸福感,提高老板的幸福感,那么企業的整體生產力和競爭力自然都會提高。

第四,找現有的業務場景,避免找新的業務場景。很多企業采取新技術都找錯了方向——找創新部門,找創新業務,再將創新技術放到創新業務上,這樣做創新做不起來。企業要在現有的業務上運用新的技術,才可以快速感知到用了和沒有用之間的差別,才有辦法衡量新技術的價值。

第五,控制場景范圍,由小范圍開始。企業不應該把一個大項目當做切入點,這是做不起來的,百分之百會失敗。從小范圍,從一個部門或者一個業務場景開始做,把大模型揉進去,你的業務比較簡單,需要的模型就沒有那么大,慢慢可以看到效果。

這五點是企業在接受與應用ChatGPT這類大模型產品時可以去借鑒的。采納這五點,企業一定可以有所收獲。

我今天的分享就到這里,希望對大家有用。如果各位對于AGI落地企業有一些意見和想法,或者需要幫助的,歡迎跟我聯系,我們可以好好探討。未來,無論通用人工智能、ChatGPT這樣的技術如何改變企業,如何改變個人,其最終目的都是提高每一個人的幸福感。

謝謝各位,謝謝大家!

以上是簡仁賢演講內容的完整整理。