智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 漠影
AI應用(yong)卷出新高度!
智東西4月22日報道(dao),上周(zhou),浪潮信息宣布“元(yuan)腦”品牌重磅升級,在(zai)算力(li)、算法、數據、互聯方面(mian)全面(mian)布局,一舉(ju)亮相多個面(mian)向大模型落地應(ying)用的工具套件(jian)。
浪潮信息專門面向大模型應用分別打造了企業大模型開發平臺“元腦企智”EPAI、可單機運行千億參數大模型的AI通用服務器、大模型應用(yong)專用(yong)存儲AS13000G7-N系(xi)列以及超級(ji)AI以太(tai)網交換機“X400”。

其中,EPAI作為企業AI大模型落地應用的高效、易用、安全的端到端開發平臺,提供了數據準備、模型訓練、知識檢索、應用框架等系列工具,支持企業調度多元算力和多模算法,大幅(fu)加速其(qi)高效開發部(bu)署(shu)生成式AI應(ying)用、打(da)造智能生產力。
浪潮信息董事長彭震談道,應用已成為中國AI產業的核心優勢之一。應用創新源自需求驅動,需要算(suan)法(fa)、算(suan)力和(he)數據協同發展(zhan)(zhan),以系統為核心的全局創新已成為推(tui)動人工(gong)智能高(gao)速(su)發展(zhan)(zhan)的產業新范(fan)式(shi)。
這(zhe)也對大模(mo)型落地應用與千行(xing)百業(ye)深度融(rong)合發揮價值提出了更為嚴苛的要求。
在(zai)這(zhe)一背景下,多元(yuan)多模的生(sheng)態格局顯現,浪潮信息以(yi)自身(shen)技(ji)術積累為底座,正(zheng)加速與更多元(yuan)腦(nao)品牌的合作伙伴構建(jian)協(xie)同(tong)共生(sheng)、開(kai)放共贏的生(sheng)態體(ti)系(xi)。
智東西(xi)等媒體(ti)與(yu)浪潮信息(xi)高級副總裁(cai)劉軍(jun)、浪潮信息(xi)服務器產品線總經理趙帥、浪潮信息(xi)AI軟件研發(fa)總監吳韶華進行了深(shen)入交流,在AI算力(li)范式不(bu)斷革新的(de)背景(jing)下,深(shen)入剖析浪潮信息(xi)升(sheng)級“元腦”品牌的(de)原因(yin)以及一系列工具發(fa)布對AI產業的(de)深(shen)遠(yuan)影響。
一、企業大模型開發平臺EPAI,提供全鏈路開發工具
從手機、PC到服務(wu)器(qi),越(yue)來越(yue)多元化的端側設(she)備被大(da)模型顛覆(fu),并在AI+時代釋放(fang)出更(geng)多潛力。
浪潮信息總經理胡雷鈞認為,AI算力正滲透進每一個計算設備中。面對AI產業的這一變革趨勢,浪潮信息在IPF上宣布將計算品牌全面升級為元腦,“元腦既是智算品牌,也是生態品牌”,以應用為(wei)導(dao)向、以系統為(wei)核心(xin)搭建起大模型在千行百(bai)業落地的基礎。

面向大模(mo)型(xing)正在(zai)顛覆千行(xing)百業的行(xing)業共(gong)識。浪潮(chao)信(xin)息發現,場景+大模(mo)型(xing)衍(yan)生出的創新應(ying)用對企業提出了(le)更為(wei)嚴苛的要求。
吳韶華稱,大(da)(da)模型(xing)預訓練階段學習的是(shi)通用(yong)(yong)知(zhi)識(shi),導致其在具體行(xing)(xing)業(ye)應(ying)用(yong)(yong)時(shi)缺乏專業(ye)知(zhi)識(shi),容易(yi)產生(sheng)幻覺(jue),企業(ye)內(nei)部數據分(fen)散、多元的特性也使得數據被(bei)快(kuai)速高效處理利(li)用(yong)(yong)有一定難度(du);其次(ci)大(da)(da)模型(xing)在行(xing)(xing)業(ye)應(ying)用(yong)(yong)時(shi)需引入知(zhi)識(shi)檢索(suo)手段,進(jin)行(xing)(xing)持(chi)續內(nei)部運維等;此(ci)外大(da)(da)模型(xing)仍處于技術(shu)發展早期,模型(xing)、芯片等快(kuai)速演進(jin),大(da)(da)模型(xing)與芯片的適配(pei)與部署難度(du)、成(cheng)本對于一般企業(ye)而言都很高。
因此,面向企業用戶大模型開發的軟件平臺正是應對上述難題的最優解法之一,也就是浪潮(chao)信息發布的(de)(de)企業(ye)大模型開(kai)發平臺“元腦企智”EPAI,面向企業(ye)開(kai)發部署生(sheng)成式AI應用的(de)(de)端到端開(kai)發平臺。
一定程度上,高質量數據決定了大模型的應用效果。EPAI的數據來源分為(wei)基(ji)礎知識(shi)、行業(ye)知識(shi)和企業(ye)知識(shi),其中上億(yi)條基礎知識數(shu)(shu)據(ju)來源于浪潮信息研發“源”大模型(xing)的(de)數(shu)(shu)據(ju)積累。對于私(si)密性較高的(de)企業數(shu)(shu)據(ju),浪潮信息提供了自動化數(shu)(shu)處理工具(ju),企業可以將數(shu)(shu)據(ju)保(bao)留(liu)在本(ben)地,并通過權限控制、加解密等工具(ju)套件(jian)幫助(zhu)數(shu)(shu)據(ju)安(an)全(quan)。

有了數據后,為了讓大模型對于行業的理解更加深入,需要進行模型微調,讓大模型變得更加通用且專業。EPAI提供的微調工具可支(zhi)持(chi)千億(yi)參數模型(xing)面向(xiang)產業(ye)知識快速再學習,并擁有百萬(wan)token的長文檔處理能力,以(yi)適應具體行業場景下的任務需求。
與此同時,EPAI實現了知識庫檢索與微調模型的相輔相成,其檢索增強生成(RAG)技術,通(tong)過本地化檢索(suo)基礎(chu)知(zhi)(zhi)識(shi)+行業知(zhi)(zhi)識(shi)+企業知(zhi)(zhi)識(shi),能彌(mi)補微調大(da)模型知(zhi)(zhi)識(shi)更(geng)新(xin)不及時的問題。

這樣一(yi)來,基于浪潮信(xin)息(xi)的(de)(de)大(da)(da)模型應(ying)用(yong)開發平臺,大(da)(da)模型的(de)(de)強(qiang)大(da)(da)能(neng)力(li)與企(qi)業(ye)的(de)(de)個性(xing)化(hua)需求、場景(jing)更加匹配。此外,對于應(ying)用(yong)大(da)(da)模型的(de)(de)玩家而言,其關(guan)注(zhu)性(xing)能(neng)的(de)(de)同時還(huan)會(hui)關(guan)注(zhu)平臺是否易(yi)用(yong)、好用(yong)且對成本(ben)更為敏(min)感。
因此,EPAI提供了將(jiang)大(da)模(mo)型快速接入現有系統的API、開箱即(ji)用的對話UI交互、為企業復雜任務流提供基礎(chu)模(mo)塊(kuai)支撐的智能體三種使用方法。

再(zai)加上(shang)諸多(duo)開源(yuan)(yuan)、閉源(yuan)(yuan)大(da)模型支持(chi)、面向多(duo)模和多(duo)元算(suan)力(li)的(de)計算(suan)框架等優勢,企業可以實現大(da)模型應用在跨算(suan)力(li)平臺上(shang)的(de)無感遷移。
可以看出,EPAI為企業提供了幾乎全鏈(lian)路(lu)的開發、部署(shu)、運維工(gong)具,讓企業在大(da)模(mo)型浪潮下“再無后顧之憂”。
事實(shi)上,伴隨著(zhu)大模(mo)型(xing)從底層(ceng)技(ji)術的(de)(de)突破到應用(yong)落(luo)(luo)地(di)的(de)(de)焦點(dian)轉(zhuan)移(yi),很(hen)多企(qi)業(ye)的(de)(de)核心需求(qiu)在(zai)(zai)落(luo)(luo)地(di)階段才逐漸顯現出來。吳韶華舉了一個(ge)例子,與(yu)開源代碼(ma)不同,企(qi)業(ye)內部(bu)的(de)(de)私有代碼(ma)有寶貴知識產(chan)權,使得基礎(chu)大模(mo)型(xing)的(de)(de)代碼(ma)能力很(hen)難直(zhi)接(jie)在(zai)(zai)企(qi)業(ye)內部(bu)的(de)(de)場景(jing)中釋放價值(zhi),這(zhe)與(yu)企(qi)業(ye)實(shi)際項目(mu)中,新的(de)(de)函數需基于(yu)現有的(de)(de)項目(mu)接(jie)口構建有關。這(zhe)也是浪(lang)潮信息(xi)正在(zai)(zai)重點(dian)突破的(de)(de)方向。
不論從大模(mo)型加速落(luo)(luo)地(di)的演進趨勢,還是(shi)EPAI的幾大核(he)心特征來看,企(qi)業在大模(mo)型開(kai)發(fa)、部(bu)署(shu)、落(luo)(luo)地(di)此前(qian)都面臨(lin)著諸多門檻(jian)。浪潮信息此次(ci)發(fa)布(bu)的端到(dao)端開(kai)發(fa)平臺以及一(yi)系列(lie)的工具(ju),或(huo)許會成為大大縮短企(qi)業開(kai)發(fa)、部(bu)署(shu)大模(mo)型的周期的關鍵變量(liang)。
或許在(zai)不(bu)久的將來(lai),在(zai)大模型落(luo)地這(zhe)一不(bu)可逆轉的趨勢下,EPAI進一步加快(kuai)大模型無限(xian)潛力釋(shi)放的顯(xian)著成果(guo)將充分(fen)體現出(chu)來(lai)。
二、算力、數據、互聯并駕齊驅,釋放AI應用萬億市場空間
在元(yuan)腦(nao)品牌新升級的“以(yi)系統為核(he)心(xin)”之中,算法、數據、算力、互聯(lian)缺一不可。劉(liu)軍談道,這四者(zhe)的關(guan)系為以(yi)算法為負載,以(yi)數據為輸入,以(yi)算力為承載,以(yi)互聯(lian)為連接。
這也是浪潮信(xin)(xin)息提(ti)供全棧智算產品和方案(an)的基礎(chu)。除了EPAI,浪潮信(xin)(xin)息面向大模(mo)型(xing)應(ying)用(yong)專門(men)打造了智能(neng)算力(li)底(di)座、專用(yong)存儲(chu)、超級AI以太網交換機(ji)。
得算(suan)力者得天(tian)下,算(suan)力需(xu)求與大(da)模型產(chan)業發展息息相關。隨(sui)著行業落(luo)地加(jia)速,千億(yi)甚至萬億(yi)參數大(da)模型層(ceng)出不窮,使(shi)得企業對智(zhi)能算(suan)力的需(xu)求急速攀(pan)升。
因此,浪潮信息聯合英特爾發布了AI通(tong)用服務器,可實(shi)現(xian)(xian)浪潮信息千億大模型(xing)源2.0部署、優化、測試,這(zhe)也(ye)是業(ye)界首次(ci)實(shi)現(xian)(xian)基于CPU處理器的(de)千億參數模型(xing)推理。
AI通用服(fu)務器在2U空(kong)間支(zhi)持(chi)4顆英(ying)特爾處理器,支(zhi)持(chi)AMX等AI加速功能,同時能滿足千億大模(mo)型的低延時要求。

高質量數據數據方面,浪潮信息打造了大模型應用的專用存儲AS13000G7-N系列,充分滿足大(da)模型(xing)的多(duo)協議(yi)、高(gao)帶寬、低延遲、數據高(gao)效流(liu)轉等需求。
基于DataTurbo新一(yi)代數據加速引擎(qing),從(cong)全局(ju)一(yi)致性緩存、空間(jian)均衡、GPU直通存儲(chu)等方(fang)面進行端到端性能優化,TB級訓(xun)(xun)練數據Checkpoint讀取耗時(shi)(shi)從(cong)小時(shi)(shi)級降為(wei)秒級,同時(shi)(shi)模型訓(xun)(xun)練的(de)空間(jian)損(sun)耗率僅為(wei)業界主(zhu)流的(de)1/6,顯著縮短(duan)模型訓(xun)(xun)練時(shi)(shi)間(jian)近50%。

此外,浪潮信息專為大模型打造了超級(ji)AI以太網交換機“X400”,這是國內率先支持Spectrum-X平臺的網(wang)絡(luo)產(chan)品。相比傳統RoCE網(wang)絡(luo)性(xing)能提升至1.6倍,AI網(wang)絡(luo)的帶寬利用率超過95%,通信時延(yan)降(jiang)低30%,NVIDIA Megatron-LM大模型(xing)訓(xun)練速(su)度(du)最高可以提升70%,大幅(fu)縮(suo)短訓(xun)練時長并降(jiang)低訓(xun)練成(cheng)本。

從多元算力(li)可調(diao)度、滿足大模型(xing)存儲需求到滿足AI集群需求,浪潮信息此次推出的(de)系列工具,已經成(cheng)為企業(ye)(ye)進(jin)行大模型(xing)開發的(de)重(zhong)要支撐,同時為大模型(xing)釋放(fang)技(ji)術潛力(li)以及幫助企業(ye)(ye)抓住市場機遇提供了更多可能性。
三、元腦品牌全面升級:一切計算皆AI
從元腦生態的蓬勃發(fa)展,以及(ji)浪潮信息在算力(li)、算法、數據(ju)、互聯方面的技術創新與(yu)突(tu)破(po),都離不開其此前的布局。
面(mian)向(xiang)大模型應(ying)用落地(di)的(de)狂飆突(tu)進,浪潮信(xin)息率先在算(suan)力、算(suan)法、數據、互(hu)聯方面(mian)實現了(le)技(ji)(ji)術創新與突(tu)破(po),并(bing)且能(neng)切(qie)中企業用戶(hu)的(de)真實痛點發(fa)布系列工(gong)具,都(dou)離不開(kai)其此(ci)前的(de)技(ji)(ji)術研發(fa)與生(sheng)態建設布局。
浪潮(chao)(chao)信息在大模(mo)型算法方面(mian)(mian)的研發布(bu)局(ju)由來已久。早在2021年,浪潮(chao)(chao)信息就發布(bu)2457億參(can)數規模(mo)的“源(yuan)1.0”中文語(yu)言大模(mo)型,并(bing)全面(mian)(mian)開(kai)源(yuan),2023年又成功研發并(bing)開(kai)源(yuan)千億參(can)數“源(yuan)2.0”基(ji)礎(chu)大模(mo)型,包含1026億、518億、21億三種參(can)數規模(mo),這也(ye)是(shi)國(guo)內首個千億參(can)數、全面(mian)(mian)開(kai)源(yuan)的大模(mo)型。
彼時,為(wei)了提升(sheng)基礎大(da)模型(xing)的(de)(de)智力(li)水(shui)(shui)平,源(yuan)2.0采用了新型(xing)的(de)(de)注意力(li)算法結構局部注意力(li)過濾增強機制(LFA,Localized Filtering-based Attention)等措施,實現(xian)源(yuan)2.0大(da)模型(xing)在精度上接近GPT-4的(de)(de)水(shui)(shui)平。
同(tong)時(shi),浪潮信息通過大模型生成高質(zhi)量數據以及非均勻流(liu)水并行、優(you)化器參數并行、數據并行、Loss計(ji)算分(fen)塊的分(fen)布式訓練方法等,不斷突破提(ti)升大模型智力水平的邊界(jie),找到技(ji)術發展的可行路徑(jing)。
伴隨著大模型產業發展在應用端呈現出的發展趨勢,智算的重要性顯而易見,而“一切計(ji)算皆AI”的產業發(fa)展趨勢已(yi)經融入浪潮信(xin)息發(fa)展的每一根(gen)毛細血管中。
除了技術創新(xin),誕生(sheng)于2019年的(de)元腦品牌的(de)全(quan)面升(sheng)級,也成為浪潮信(xin)息(xi)迎(ying)接AI產業革命(ming)新(xin)機遇的(de)最新(xin)答案。
浪潮信息渠道推進部總經理毛柏林透露,2023年浪潮信息生態伙伴數量已經達到3萬(wan)家,同比增長33%,元腦認證伙伴首次突破1萬家。
邁入智(zhi)能(neng)時代,擁有不(bu)同(tong)底(di)層技術、在(zai)不(bu)同(tong)行業(ye)深耕的各(ge)路企業(ye)之間的連(lian)接日漸緊密(mi),因此,元腦既(ji)是智(zhi)算品牌,也(ye)是生(sheng)態品牌。浪(lang)潮信息將聯合(he)左右手的伙(huo)伴,面向不(bu)同(tong)場景,實現大模型的加速落(luo)地,激發AI產業(ye)創新(xin)發展(zhan)的新(xin)動(dong)力(li)。

浪潮信息同期還發布了EPAI種子計劃,預計在3年內將伙伴數量擴充至1000家。
大模型(xing)產業發展的趨(qu)勢已經逐漸明晰(xi),多元(yuan)多模、落地(di)部署進(jin)(jin)程加快等趨(qu)勢演進(jin)(jin)加速,在這一背景下(xia),浪(lang)潮信息(xi)以開放共贏(ying)的“元(yuan)腦生態(tai)”為依托,正從(cong)AI創(chuang)新(xin)落地(di)的探索(suo)者向引領者沖(chong)鋒。
結語:“AI+”成新時代熱詞,掀起新質生產力革命
AI+成為(wei)今年大(da)模型產(chan)業發展當(dang)之無愧的(de)熱詞,新質生產(chan)力變革步伐(fa)加快。伴(ban)隨著AI部署(shu)落地(di)的(de)創新成果不斷涌(yong)現,多元(yuan)的(de)模型、算力、數據需求對其大(da)規模應用提出(chu)挑(tiao)戰。
浪潮(chao)信息依(yi)托(tuo)于(yu)此前(qian)的技術積累與布局,再(zai)加(jia)上對產業前(qian)沿趨勢的深入(ru)洞(dong)察(cha),率先(xian)向這一變革(ge)趨勢發起沖鋒,在算法、算力(li)、數據、互聯領域的工具體系助力(li)下,AI應用將會為(wei)千行百(bai)業帶來無盡的想象(xiang)力(li)。