智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 漠影
智東西(xi)9月30日報(bao)道(dao),國慶前夕,全球AI競(jing)賽迎來一波小(xiao)高潮(chao),國產(chan)大模型紛(fen)紛(fen)放大招。
今天下午,智譜AI正式發布新一代大模型GLM-4.6,就在昨晚,DeepSeek也宣布推出DeepSeek-V3.2-Exp實驗版模型。兩家國產大模型領軍企業在國慶假期毫不放松,加班加點推進技術迭代。而在大洋彼岸,Claude Sonnet 4.5同期(qi)發布,谷歌Gemini 3.0也(ye)預計(ji)將在10月(yue)迎(ying)戰,全球大模(mo)型競爭進入白熱化(hua)階(jie)段。
作為智譜GLM系列的最新版本,GLM-4.6在真實編程、長上下文處理、推理能力、信息搜索、寫作能力與智能體應用等多個方面實現全面提升,整體性能超越DeepSeek-V3.2-Exp。這也是新晉“國內最強Coding模型”,據稱能使用戶僅用1/7的價格即享(xiang)受(shou)到接近Claude Sonnet 4的代碼能力。
智東西第一時間對GLM-4.6進行了實測體驗,發現其編程能力表現驚艷,在代碼質量和實現效果上相比GLM-4.5大幅提升,并可與Claude Sonnet 4.5、GPT-5媲美;同時在文本理解、邏輯、記憶、檢索、智能體調用等方面都(dou)有明顯體(ti)驗提升。
目前,GLM-4.6已上線智譜MaaS平臺bigmodel.cn,即將在Hugging Face、ModelScope同步開源。寒武紀、摩爾線程等國(guo)(guo)產AI芯(xin)片廠商在第(di)一時間完成適配,標(biao)志著國(guo)(guo)產大模型與國(guo)(guo)產芯(xin)片的協(xie)同發展正(zheng)在加(jia)速(su)推進。
體驗地址:
//chat.z.ai
技術報告地址:
//z.ai/blog/glm-4.6
一、GLM-4.6橫掃八大權威測評,編程能力創新高,token消耗節省三成
按照(zhao)慣(guan)例,我們先來看(kan)看(kan)GLM-4.6的測評成績。
在AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified等8大權威基準測試中,GLM-4.6在大部分權威榜單表現趕超了DeepSeek-V3.2-Exp、Claude Sonnet 4等頂尖模型,穩居國產模型首位。

這(zhe)些成績來之(zhi)不易。GLM-4.6的(de)上(shang)(shang)一代模型GLM-4.5最初發布(bu)于7月28日,首次在單個模型中實現將(jiang)推(tui)理、編碼和(he)智能(neng)體(ti)能(neng)力原(yuan)生融合。GLM-4.5在代碼能(neng)力上(shang)(shang)的(de)突出表(biao)現,讓智譜MaaS平臺(tai)的(de)API商業化實現了10倍(bei)以(yi)上(shang)(shang)增長。
GLM-4.6在這一基礎上實現全面躍升,不僅在代碼能力上創新高,在長上下文處理、推理能力、信息檢索、文本生成及智能體應用等方面均實現顯著升級,整體性能已超越DeepSeek昨日發布的DeepSeek-V3.2-Exp。
這些提升也體現在真實編程評測中,GLM-4.6同(tong)樣實現(xian)了(le)全面超越。
為了測試模型在實際編程任務中的能力,智譜在Claude Code環境下進行了74個真實場景編程任(ren)務測試。結果(guo)顯示,GLM-4.6實測超(chao)過Claude Sonnet 4,也(ye)優于(yu)其他國產模型。

在平均token消耗上,GLM-4.6比GLM-4.5節省30%以上,為同類模型最低。

為確(que)保透明性與可信(xin)度,智譜(pu)已(yi)公開全部測試題目與Agent軌跡,供業界驗證與復(fu)現。
鏈接:
//huggingface.co/datasets/zai-org/CC-Bench-trajectories
二、實測編程驚艷,勝任復雜交互任務,媲美Claude、GPT-5
智東西著重對GLM-4.6的編程能力進行了體驗,發現其不僅相比GLM-4.5大幅提升,能夠實現更加復雜的編程任務,完成度更高,且在多個任務中的代碼生成質量及預覽效果達(da)到(dao)與Claude Sonnet 4.5、GPT-5媲美(mei)的(de)水(shui)準(zhun)。
首先我們還是嘗試了“旋轉六邊形彈跳球模擬”。體驗發現,GLM-4.6能夠較準確模擬旋轉容器的作用、質量對碰撞的影響、能量守恒現象及動量傳遞效果,并且提供了調整旋轉速度、控制重力和摩擦力等控制選項。
輸入:模擬一個旋轉六(liu)邊(bian)形內彈跳球(qiu)(qiu),有(you)兩個球(qiu)(qiu)體積相同(tong),球(qiu)(qiu)a的質量是球(qiu)(qiu)b的2倍。
GLM-4.6輸出:

當我(wo)們將同一(yi)提示詞發送給GLM-4.5,輸出效(xiao)果(guo)如下,彈球彈出了六邊形邊界,模擬效(xiao)果(guo)不如GLM-4.6,且沒有更多的控制選項。從這一(yi)例子我(wo)們可(ke)以直觀看到GLM-4.6相比于GLM-4.5的代際提升。

GLM-4.6與今日最新發布Claude Sonnet 4.5相比如何呢?如下圖所示,這是(shi)X平臺用戶(hu)“提示詞(ci)”展示的(de)一個讓他“驚(jing)嘆(tan)”的(de)例子——一次性創建交(jiao)互(hu)式太陽系(xi)。這位用戶(hu)稱,在GPT-5嘗試相同的(de)提示沒(mei)有得(de)到有效代碼,GLM-4.6是(shi)否能勝(sheng)任?

如下圖所示,即便輸入非常簡單的提示詞,GLM-4.6也能理解抽象詞“交互式”和天文概念“太陽系”的含義,并進行比較準確的模擬。該控(kong)制臺(tai)模(mo)擬了太陽系(xi)行星的位(wei)置和運轉,支(zhi)持(chi)拖動查看(kan)3D模(mo)型,并(bing)且支(zhi)持(chi)調整(zheng)運行速度和行星大(da)小(xiao)等變量,看(kan)起來(lai)絲毫不遜色于Claude Sonnet 4.5。
輸入:創(chuang)建一個交互式(shi)太陽(yang)系的模(mo)擬。
GLM-4.6輸出:

GLM-4.6在SVG動畫生成的例題中,也實現了超過GPT-5的理解和編程能力。如下圖所示,一位X平臺用戶用GPT-5去生成“水豚騎自行車”的SVG動畫,然而動畫中卻沒有準確生成出水豚,令這位(wei)用戶懷疑:GPT-5好像只會(hui)生成(cheng)訓練(lian)數據中出現(xian)過的(de)內(nei)容,或許因為(wei)水(shui)豚沒(mei)出現(xian)過所以不能(neng)生成(cheng)。
我們讓GLM-4.6嘗(chang)試做了(le)同(tong)一道(dao)題(ti),發現其快速生成(cheng)了(le)一個準(zhun)(zhun)確逼真的動(dong)畫(hua)——動(dong)畫(hua)版水(shui)(shui)豚的形(xing)態接近真實世界的水(shui)(shui)豚,且(qie)水(shui)(shui)豚是坐在自行車座位上手扶著車把騎行的,生成(cheng)較準(zhun)(zhun)確。
輸入:SVG,水豚騎自行(xing)車(che)的動畫(hua)。
GLM-4.6輸(shu)出:

交互式游戲更加考驗大模型的編程能力。當我們讓GLM-4.6生成一個簡單的3D射擊游戲,GLM-4.6快(kuai)速生(sheng)成了一(yi)個(ge)736行代碼的程序,預(yu)覽就是一(yi)個(ge)具(ju)備三維(wei)立體(ti)感(gan)的空間,點擊鼠標就可以射(she)擊移動物體(ti),并且具(ju)有擊中(zhong)獎勵效果和計分機制。
輸入:用Three.JS做(zuo)一個簡單的(de)3D射擊游(you)戲。
GLM-4.6輸出:

GLM-4.6在全棧開發方面實現了增強的前端設計、GitHub集成、更長的上下文等升級,我們也嘗試了一下。我們要求GLM-4.6生成“速度型集群和力量型相互作用演化”的模擬,這將考察GLM-4.6在前端開發、物理模擬、狀態管理、系統架構、抽象建模、簡化復雜度、工具鏈使用等多重能力。
如下圖所示,GLM-4.6完成了一步實現,不僅模擬出速度型種群快速被力量型種群消滅的物理規律,還通過模塊化的控制板,給出了模擬控制、參數設置、種群A和B的動態指標等發展情況,前端視覺效果已經非常美觀,可以說“內外兼修”。
輸入:有兩個種(zhong)群(qun),種(zhong)群(qun)a注(zhu)重力(li)量的(de)發展,種(zhong)群(qun)b注(zhu)重速(su)度的(de)發展,請模擬一下兩個種(zhong)群(qun)之間的(de)相(xiang)互作用并給(gei)出說明(ming)。需要以“小(xiao)球(qiu)”的(de)形態模擬出可視化的(de)狀(zhuang)態。
輸出:

除了(le)體驗GLM-4.6的代碼(ma)能(neng)(neng)(neng)力,我們還通過(guo)AI PPT制作這一(yi)功能(neng)(neng)(neng),驗證了(le)GLM-4.6在文(wen)本理解、智能(neng)(neng)(neng)體調用、檢索(suo)及多(duo)模(mo)態方面的能(neng)(neng)(neng)力。
通過多輪(lun)對話,我們直觀感受(shou)到(dao)GLM-4.6的(de)“手眼并用”能力(li)更靈了(le)。其(qi)不僅準確(que)(que)理解了(le)生成需求(qiu),并圍繞主題進行了(le)準確(que)(que)的(de)檢索(suo)和信(xin)息(xi)提煉,文(wen)本和圖片內(nei)容都緊扣主題,同時(shi)多輪(lun)對話指(zhi)令遵循(xun)準確(que)(que)。
輸入:
第一輪:制作一份關于 “當(dang)代年(nian)輕人新型社(she)交方式” 的(de)PPT。請生(sheng)成一個4頁的(de)PPT大(da)綱,涵(han)蓋(gai)“搭(da)子社(she)交”、“MBTI社(she)交”、“全職兒女”和“追星(xing)社(she)交”四個話題。
第二輪:全職兒女更偏(pian)向(xiang)家庭關系,請將這一頁替換(huan)為關于“City Walk中的社交屬性”的內容,并保持與其他頁面相同的格式(shi)和深度。
第三輪:畫面有點單調,增加(jia)一些時尚視覺元素。在(zai)4張PPT中分(fen)別添加(jia)一些相(xiang)關的配圖。
輸出:




總的來說,我們發現GLM-4.6相比于GLM-4.5雖然在名稱上僅僅迭代了0.1代,但實測效果卻有非常直觀的提升,并且在一些案例中比GPT-5、Claude Sonnet 4.5效果更好。國產大模型的迭代速度十分驚人,這與我們昨日實測DeepSeek新模型時的感受是一致的。
三、國產芯片立刻適配,國產之光降價提質,AI惠及更多人
GLM-4.6發布的同時(shi),國產AI芯片(pian)廠商迅(xun)速響應。寒武紀(ji)與(yu)摩爾線程幾(ji)乎(hu)在第一(yi)時(shi)間(jian)完成對GLM-4.6的適配,國產大模型與(yu)國產芯片(pian)協同效率正超(chao)出我們的想象。
GLM-4.6已在寒武紀領先的國產芯片上實現FP8+Int4混合量化部署,這是首次在國產芯片投產的FP8+Int4模型芯片一體解決方案,在保持(chi)精(jing)度(du)不變的(de)前提下,大幅(fu)降(jiang)低(di)推理成本,為國產芯片(pian)在大模型(xing)本地(di)化運行(xing)上開創(chuang)了可行(xing)路徑。
與此同時,摩爾線程基于vLLM推理框架完成了對GLM-4.6的適配,新一代GPU可在原生FP8精度下穩定運行模型,充分(fen)驗證了MUSA架構(gou)及(ji)全(quan)功(gong)能(neng)GPU在生態兼容性(xing)和快速適配能(neng)力方面的優勢。
GLM-4.6和寒武紀、摩爾線程國產芯片的組合,即將通過智譜MaaS平臺正式面向大眾和企業提(ti)供服務。未(wei)來(lai),國(guo)產原創(chuang)GLM大模型與國(guo)產芯片將聯合推動在模型訓練和推理環節的性能與效率(lv)優化。
這一協同效應不僅體現在技術層面,更直接惠及終端用戶。
隨著GLM-4.6發布,智譜同步升級GLM Coding Plan,推出最低20元包月暢玩套餐,讓用戶以1/7價格享受到Claude的9/10智商。同時其推出GLM Coding Plan企業版套餐,為企業級用戶提(ti)供兼具安全、成本效益與國際頂尖性能(neng)的編碼(ma)解決(jue)方案(an)。
此前訂閱GLM Coding Plan包月套餐的用戶自動升級至GLM-4.6,新增圖像識別與(yu)搜索能力,支持(chi)Claude Code、Roo Code、Kilo Code、Cline等(deng)10+主(zhu)流編程工(gong)具。智譜(pu)還面向高頻重度(du)開發者(zhe)提供GLM Coding Max,是Claude Max (20x) plan三倍用量。
可以看到,國產大模型“提質降價”趨(qu)勢更加明顯,有望(wang)推動大模型(xing)技(ji)術更快普及,讓更多(duo)開發者和企業(ye)能夠以更低成本(ben)享受到頂尖(jian)的AI能力。
結語:模型提質降價背后,架構升級與國產芯協同加速
從GLM-4.5到GLM-4.6,智譜AI在短(duan)短(duan)兩個月內實現(xian)顯著(zhu)躍(yue)進,展(zhan)現(xian)出(chu)強勁的技(ji)術迭代能力(li)。在模型(xing)提(ti)質的同時(shi),價格持續下探,讓大(da)模型(xing)成為廣(guang)大(da)開發者和(he)企業觸手可及(ji)的工具。這不僅是(shi)單純的性能提(ti)升(sheng)(sheng),更(geng)是(shi)國產(chan)大(da)模型(xing)整體技(ji)術架構加速升(sheng)(sheng)級的縮影。
國(guo)產大模(mo)型與國(guo)產芯(xin)片(pian)(pian)的(de)深度協同(tong)正在構建(jian)更加自主(zhu)(zhu)可(ke)控的(de)AI技術生態(tai)。寒武紀與摩爾線(xian)程完成對(dui)GLM-4.6的(de)適配,以及DeepSeek與華(hua)為、寒武紀等AI芯(xin)片(pian)(pian)的(de)適配,標(biao)志著國(guo)產AI芯(xin)片(pian)(pian)與前沿大模(mo)型已具備協同(tong)迭代的(de)能(neng)力,為構建(jian)自主(zhu)(zhu)AI基礎設(she)施奠定堅(jian)實基礎。