智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣
盡管近期大模型產業打得不可開交,但華為的AI野心,與瘋狂的價格戰和刷榜競賽無關!
智東西6月21日東莞報道,今日,中國南方的陽光明媚熱烈,在下午開幕的華為開發者大會2024上,華為常務董事、華為云CEO張平安重磅發布盤古大模型5.0。
華為AI核彈“Harmony Intelligence(鴻蒙原生智能)”滾燙發布,呈現出華為AI“云+端”的行業獨一家打法,同時盤古5.0大模型的鼎力支持更顯耀眼。

盤古大模型5.0實現從十億級到萬億級參數版本全覆蓋,小到十億級參數的Pangu E系列,可支撐手機、PC等端側應用;大到萬億級參數的Pangu S系列,能夠幫助企業處理更為復雜的跨領域多任務。
在技術能力方面,盤古大模型5.0在全系列、多模態、強思維三大方面帶來全新升級,同時在現場具身智能機器人與真人交互、視頻生成及AI語音合成、模型物理世界3D生成等應用展示一輪接著一輪。

▲現場演示基于盤古大模型5.0的具身智能機器人
但更加引起關注的是,華為云一口氣發布了盤古鋼鐵大模型、盤古高鐵大模型、盤古具身智能大模型、盤古工業設計大模型、盤古安全大模型及盤古媒體大模型六大模型,通過其特有的“行業難題死磕者”氣質,引得觀眾陣陣“遙遙領先,一直領先”呼聲。
但華為云的“殺招”遠不止如此。
在盤古5.0背后,華為云昇騰AI云服務已快速迭代一年,服務超100個業內主流大模型。同時,華為云ModelArts studio、CodeArts、DataArts、MetaStudio等多條生產線也基于盤古大模型實現升級,下一代云基礎設施CloudMatrix助力模型訓練效率提升68%,業界首創EMS彈性內存存儲正式發布,都在重塑華為云服務。
此外,華為云還首次揭秘了盤古5.0誕生的背后技術,包括公布了昇騰親和的新模型架構π、MindStar技術等十幾項核心技術點,講解了其如何實現數據高效、效率高效、參數高效。

一、從10億到萬億參數全覆蓋,多模態強思維,打造“世界模型”?
張平安宣布,盤古5.0在全系列、多模態、強思維三個方面實現全新升級。而在他近40分鐘的演講中,透露華為云不僅將熱門的視覺理解與生成、復雜任務推理等高階能力升級,還多次提及模型“遵循物理規律”,隱隱透露出華為云打造“世界模型”的野心。
1、全系列:從十億級到萬億級參數,從手機到云全覆蓋
盤古大模型5.0包含不同參數規格的模型,以適配不同的業務場景。
十億級參數的Pangu E系列可支撐手機、PC等端側的智能應用;百億級參數的Pangu P系列,適用于低時延、高效率的推理場景。
千億級參數的Pangu U系列適用于處理復雜任務;萬億級參數的Pangu S系列超級大模型能夠幫助企業處理更為復雜的跨領域多任務。
2、多模態:支持10K超圖像識別,生成內容模擬物理世界
本次鴻蒙原生智能更新的小藝智能體,很多能力用到了盤古5.0多模態理解和生成能力。
盤古大模型5.0能夠更好更精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等更多模態。
在圖片和視頻識別方面,盤古大模型5.0可支持10K超高分辨率。比如當被問到《清明上河圖》中趙太丞家有多少人,盤古5.0可以在占全圖1/200的畫面中,識別出細小畫面和漢字,并得出“4個人”這一正確答案。

在內容生成方面,盤古大模型5.0采用業界首創的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術,聚焦自動駕駛、工業制造、建筑等多個行業場景,可生成更加符合物理規律的多模態內容。
3、強思維:思維鏈結合策略搜索,支持復雜推理
復雜邏輯推理是大模型成為行業助手的關鍵。盤古大模型5.0將思維鏈技術與策略搜索深度結合,極大地提升了數學能力、復雜任務規劃能力以及工具調用能力。但華為云今日并未公布其在各大榜單中的得分情況。
二、具身智能機器人現場“活了”,推出六大行業模型
基于盤古具身智能大模型的人形機器人首次登場,現場演示了復雜任務執行。
名為“夸父”的人形機器人能夠在要求下與張平安擊掌,分辨位于它面前的與華為有關的物品,并在得知主持人口渴時,將面前桌上的水遞給了口渴的主持人。

去年,張平安在發布盤古3.0時稱,華為云盤古大模型“不作詩,只做事”。今年,盤古5.0已經進入各行各業做事,解決行業難題。
在工業設計領域,盤古大模型可以讓汽車的造型設計時間大幅縮短,助設計師直接輸出成3D文件;可以支持建筑師在輸入設計草圖的情況下,生成彩色并帶有紋理的建筑群360°實景視頻。

在媒體產業,華為云推出盤古媒體大模型,通過在語音生成、視頻生成和AI翻譯三方面的技術創新,重塑內容生產和應用的新模式。
盤古媒體大模型在視頻生成方面取得了顯著成果,支持將實拍視頻轉換為不同風格的高清動漫,現場演示視頻中演員的舞蹈、武打等大運動軌跡能保持一致視覺效果,角色的面貌特征也保持前后一致。

在語音生成方面,盤古大模型通過AI原聲譯制與視頻生成能力,實現了將原片譯制成不同語言的視頻,還能同步生成新的口型。
在AI翻譯方面,華為云會議基于盤古大模型實現了升級,支持同聲傳譯,翻譯準確性高于93%,時延小于5秒,解決跨語言溝通難題。參會者還基于數字人分身功能,在自己不出面的情況下,讓實時合成的數字人分身來替自己發言,講述起來流暢自然。

但真正更令現場沸騰的,是華為云盤古大模型還進入了更多專業化更強、與生產息息相關的行業。
在高鐵行業,基于盤古高鐵大模型,華為云為高鐵檢測裝上了“盤古眼”,幫巡檢工人減少了巨大的工作量。一列動車的3.2萬個故障檢測項點,本來需要4人花費2小時進行反復、細致地檢查,用盤古大模型可以自動識別準確率可達99%。

再拿鋼鐵大模型來說,寶武集團是中國最大的鋼鐵集團,年鋼產量超1億噸。據稱盤古鋼鐵大模型已經幫他們把大模型與高爐煉鐵和熱軋鋼帶環節結合了起來,通過現場學習實現實時預測最優參數,最終效率提升了數十倍。

除此之外,在氣象、醫藥等其他行業,盤古大模型也已經在助力解決行業難題。死磕行業的打法,體現了華為云有別于很多其他大模型廠商的獨特氣質。
三、昇騰AI云已服務100+大模型,免費為開發者提供一臺云主機
華為云的“殺招”不止于此,盤古5.0升級背后,是華為云昇騰AI云服務的一年迭代優化。
目前,華為云已經在貴安、烏蘭察布和蕪湖,構建了三大AI算力中心,支持大模型產業發展。

根據華為云官方數據:業界萬億參數模型訓練的平均無中斷時長約2.8天,昇騰AI云服務可實現40天無中斷;業界平均集群故障恢復時間約60分鐘,昇騰AI云服務可以縮短到10分鐘。同時,昇騰AI云服務能將大模型的資源開通時間從月級縮短到天級,加速大模型的開發。
目前昇騰AI云服務已全面適配行業主流的100多個大模型,以云服務的方式協助客戶開發、訓練、托管和應用模型,打造百模千態的“黑土地”。

張平安宣布,華為發布華為開發者布道師計劃,未來3年計劃發展超過3000名華為開發者布道師。
了讓開發者更好地學習和使用這些技術,華為云為每個新生態的開發者免費提供一臺云主機、一套開發工具和5GB的云存儲空間。
華為云通過全棧系統性創新結合AI重塑云服務,打造AI Native的云。

通過下一代云基礎設施CloudMatrix,華為云推動單體算力向矩陣算力發展。盤古5.0在同等NPU算力基礎上,CloudMatrix對比傳統服務器集群實現模型訓練效率提升68%。

華為云還宣布業界首創EMS彈性內存存儲正式發布。通過業界首創EMS-彈性內存存儲,華為云助企業打破AI內存墻,釋放極致算力。

四、盤古5.0技術首揭秘:三大類技術優化,推出新模型架構π
華為云首次公布揭秘盤古5.0誕生的背后技術,涉及數據高效、效率高效、參數高效三大方面。
在數據高效方面,基于兩大關鍵技術——數據合成和數據課程學習,華為云提升數據利用率,試用優質的數據激活盤古5.0模型更多的能力。

同時,華為云推出了昇騰親和的新模型架構——π。一方面團隊基于增廣殘差連接的模型增強,緩解特征坍塌;另一方面,基于級數激活函數的非線性增強,使得模型與昇騰架構更友好。

面對大集群訓練千億稠密大模型,技術挑戰在于大集群訓練如何提升算力利用率,華為云通過多副本并行+計算通信流水,以及大集群調度與通信優化,使得隱藏通信降低70%,通信和等待時間從30%降至10%。
在多模態上,團隊主要做了兩大關鍵技術,一是統一視覺編碼器,二是采用動態分辨率,從而克服當下編碼器無法兼顧自然圖像和文檔圖表的問題。

在強思維,也就是復雜推理方面,華為云通過MindStar技術,圍繞多步生成+策略搜索兩大關鍵方法,從而將模型的推理能力提高30分,使得百億模型達到千億模型的能力。

五、生產線大升級,用大模型重塑華為云服務
工欲善其事,必先利其器,華為云還用大模型重塑了其多條生產線。
在模型開發方面,華為云ModelArts studio大模型即服務平臺支持便捷大模型開發與應用,通過0代碼、免配置完成模型開發與微調,通過多模型智能路由降低模型調用成本超25%,沉淀50+智能代理,賦能RPA、政務、會議等多個方面的企業內部助手。

繼去年接入大模型后,今年華為云通過結合AI Agent能力,將CodeArts軟件開發生產線從單點智能升級到項目級智能。相比業界主流方案,CodeArts在問題定位率上提升了73%,項目級問題修復成功率提升了57%,讓開發者能輕松實現項目級智能。

在數據治理方面,華為云DataArts數據治理生產線也實現升級,將盤古大模型和華為18年的數據治理經驗相結合,一是將沉淀在企業海量數據中的業務規則、決策流程、行業經驗發掘出來,形成企業知識湖;二是基于大模型,實現數據集成、開發、治理、分析等生命周期的自動化、智能化,從而降低智能化管數、用數的門檻。

在MetaStudio數字內容生產線方面,華為云將多模態大模型和生成式AI技術相結合,基于800多萬小時的音視頻數據和3000多萬的3D資產,打造了盤古媒體大模型;將盤古媒體大模型和華為有深厚積累的音視頻編解碼、3D模型物理仿真等結合用于AI內容生成,突破了當前大模型不懂物理世界的局限。

在數據庫方面,華為云將產品文檔、專家知識、運維經驗等數據庫專業數據和大模型相結合,構建盤古數據庫大模型,實現了GaussDB數據庫的開發、測試、遷移、運維的全生命周期智能化,提升開發人員和DBA的使用效率。
在安全方面,華為云用盤古大模型升級華為云安全服務,打造了面向安全領域的盤古安全大模型,學習了華為云每年4500億次攻擊對抗的攻防經驗,600多次的護網演練流程腳本,和400多個行業的攻擊場景等數據,讓華為云能夠快速、精準的給出安全治理咨詢的專業意見。

結語:華為云AI原生布局初現,盤古5.0將大模型深扎行業
今日,中國人迎來了自己的操作系統,純血鴻蒙正式發布,與此同時華為鴻蒙原生智能的大招炸場,背后則是華為云盤古5.0大模型的硬核支持。
去年,華為云在盤古3.0發布時提出“不作詩,只做事”,今年隨著盤古5.0的發布,華為云提出“不僅要做事,還要做最難的事”,從三大技術更新到行業大模型,從車間到工地,盤古大模型正在融入更多行業解決實際難題。
當下,如火如荼的“百模大戰”拼價格、比參數、刷榜單,競賽到了白熱化階段。但與此同時,大模型是不是同質化了、停留在GPT-3.5水平了?引起產業人思考。華為云為大模型的中國方案給出了新思路,通過與千行百業的實際問題結合,大模型有望在實踐中迸發新的生命力。