智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣
智東西4月26日報道,今天下午,AI獨角獸第四范式首次公開了其面向企業的大模型產品SageGPT(式說大模型),并且首次提出AIGS(AI-Generated Software)戰略,也就是以生成式AI重構企業軟件。
第四范式創始人、首席執行官戴文淵現場拔網線測試了式說大模型在圖片理解、多輪對話、圖片代碼、生成代碼、邏輯推理上的能力。
除了這些通用大模型外,戴文淵認為,在C端,用戶對于軟件的使用體驗已經優化的十分到位,但對于B端軟件來說,很多企業在報銷、申請辦公室等方面的軟件體驗很差,因此B端軟件的體驗有巨大的提升空間。
第四范式提出了AIGS戰略,并將式說定位為基于多模態大模型的新型開發平臺。他補充道,要做到AIGS,大模型需要具備Copilot(副駕艙)和思維鏈CoT(chain of thoughts,多步推理)的能力。
第四范式今天公開的已經是式說的第三個版本,從今年2月開始,該公司就發布了具備生成語言能力的式說1.0,后續又推出加入文本、語音、圖像、表格、視頻等多模態輸入及輸出能力以及企業級Copilot能力的式說2.0。
一、寫代碼、文圖互生、“裝箱”難題均不在話下
首先是圖片理解能力,測試人員上傳了一張電視劇《狂飆》的劇照,式說不僅可以描述這張圖片的大致情況,還可以回答圖片中有幾個人、他們在做什么。

其次是圖片生成能力,測試人員讓式說“畫一張配色鮮艷的籃球鞋”,它還可以通過背景來突出“籃球”這一元素:

在代碼生成能力上,測試人員讓式說“請用VBA編寫一個求兩個數乘積的代碼”:

在CoT思維鏈能力中,測試人員告訴式說“我想研發一個萬億參數的生成式大語言模型,請告訴我解決這個問題的每一步”,它會將涉及到的基本步驟都羅列出來:

更為基本的聊天能力方面,測試人員讓它做個自我介紹,不過在第一句話上其生成的內容出現了重復性詞語:

測試人員讓式說做一個旅游規劃,如“五一假期去硅谷旅游,有什么推薦的地方?”,式說羅列了幾大值得逛的景點:

寫作能力方面,式說可以“根據電影《流浪地球2》的情節,寫一個《流浪地球3》的劇本”,它還將前兩部的劇情梗概展現了出來:

在推理更為復雜的“裝箱”操作上,式說也快速、準確的完成了任務,并且測試人員還能查看它的思考過程:

二、三個階段,要用生成式AI重構企業軟件
除了具備這些通用能力外,第四范式還提出了AIGC時代的AIGS(AI-Generated Software)戰略,也就是以生成式AI重構企業軟件。
戴文淵認為,生成式AI可能先改造B端的軟件。他舉了一個關于二維碼的例子,二維碼支付在國內已經無處不在,但海外的二維碼支付并不普及,原因在于美國信用卡非常成熟,二維碼相較于信用卡的提升并不大,因此其替代性并不強。但國內,二維碼支付帶來的體驗升級是從現金支付開始的,因此更為直觀。
同樣,生成式AI改造C端的軟件體驗不見得非常明顯,但對于B端菜單式的軟件,生成式AI可以將其轉化成更自然的交互方式。
例如,當前的員工想要通過企業軟件預定會議室,他們需要找到這個時間段內想用的辦公室,然后再去挑選沒有被占用的會議室。而經過生成式AI改造后的范式AI助手,員工只需要和它說“查詢會議室:下午14點7樓空閑的會議室”,就能清晰看到當前可用的會議室。
因此,AIGS還可以讓復雜的工作變得更加簡單,第四范式將AIGS的路徑總結為三個階段:
第一個是Copilot階段,用戶使用自然語言就可以讓Copilot調動不同的信息、數據、應用,來完成指令。例如用戶想要把照片的亮度提升20%,不需要用戶拖到修圖軟件中,只需要通過自然語言來輸入進去。

第二個階段是Copilot+基于企業規則的“知識庫”。絕大多數用戶使用軟件都并不是使用單一功能,而是多個功能的集合,而AI可以參照這一相應的規則來執行指令。例如任務是“把這張照片p的好看一點”,式說就可以查詢“人像美化”知識庫后,依次調節圖片的亮度、對比度等。
第三個階段是Copilot+思維鏈,軟件系統的使用行為不斷被大模型學習,最終形成AI針對這個領域的思維鏈,AI就可以自動按照步驟完成“把照片處理得更好看”等任務。

除此以外,生成式AI對軟件的改造,不僅僅體現在體驗上,還體現在開發效率上。戴文淵說道,當前的軟件開發,絕大多數都是以月計算時間,更復雜的軟件開發可能要以年計算。但生成式AI改造后的軟件開發,可以將這一時間維度縮短到以天計算。
他補充道,AIGC最重要的是將它的能力變成生產力工具,提升企業的生產效率。因此,第四范式將式說定義為一個軟件開發平臺,是基于大模型的新型開發平臺。
式說大模型的優勢包括數據安全、成本可控的多模態大模型能力,內容可信的知識庫能力,執行可控、知錯能改的Copilot能力,以及能夠實現多步推理、復雜任務拆分、形成數據飛輪的思維鏈能力。
第四范式正在快速迭代產品,基于AIGC的能力,幫助企業內部軟件實現效果提升。據了解,目前,其產品已經落地數十家頭部行業公司,覆蓋金融、醫療、能源、航空行業等。
三、四大能力積累,未來讓機器自己實驗找答案
第四范式在AIGC領域的布局分為四層,分別是底層的式說大模型,能力層的Copilot、知識庫、思維鏈CoT,平臺層的開發平臺,以及最后在金融、零售、醫療、制造行業的應用。
第四范式主任科學家涂威威談道,他們想讓語言模型不只擁有能聊天、會畫畫的能力,而是要成為一個生產力工具。
在1.0階段,大規模預訓練模型存在知識過時、上下文長度受限的缺陷,第四范式基于Memory Augmentation的核心技術,能輔助大模型進行相應推理,解決用戶的實際問題。
此外,這一技術不僅是將數據接進來,還能構建一整套的反饋機制,來讓用戶越用越好。

2.0階段大模型的核心能力是知識庫結合Copilot,也就是讓機器具有一定的視覺、聽覺和執行能力。
通過Plugin模式,大模型可以做一些科學計算, 讓其應用到實際領域中去的時候,能針對每個領域具有專業的能力。
并且,2.0階段大模型主要是企業已有的操作規范,來讓機器模仿人并代替人執行相關流程。
3.0階段就要機器做更多的事情,大模型擁有學習更多思維鏈的能力,可以復制、模仿、學習人的行為,甚至于模仿人的一系列動作來執行更加復雜的任務。
涂威威談道,他們下一個階段的目標就是讓機器對著任務的最終目標去學習,而不是簡單復制人的步驟,而這往往需要機器去做實驗。
因此,為了降低機器的實驗成本,第四范式未來的方向就是利用大型語言模型,讓機器在虛擬環境中進行迭代,再應用到實際環境中去,擁有可以解決更高層目標的能力。
結語:B端企業軟件或成大模型應用爆發點
OpenAI造就的ChatGPT的爆火,驗證了生成式AI產品的可行性,也提升了市場對于大模型的信心,但對于其商業化路徑的探索,更多還要依靠企業選擇的方向。
生成式AI的爆火很大程度來源于它對于人們生產效率的顛覆性提升,但對于企業來說,私域數據的安全性與如何快速應用前沿技術同樣重要,就需要更專業的技術公司來為提供支持,找到前沿技術與數據安全保護的平衡點。