智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣
智東西10月27日報道,剛剛,MiniMax發布并開源MiniMax-M2,一(yi)款為Max可視化編程和智能體工作流構建的(de)輕量(liang)級模(mo)型。

▲MiniMax-M2在Hugging Face的開源(yuan)界面截圖
MiniMax-M2聚焦智能體的效率提升,是一款總參數達2300億個的MoE(混合專家)模型,其中活躍參數達100億個,兼(jian)顧(gu)編程和智能體(ti)任(ren)務以及(ji)通(tong)用智能。
在權威基準測評中,MiniMax-M2的測試成績趕超Gemini 2.5 Pro、DeepSeek-V3.2等領先模型,接近GPT-5(thinking)模型性能,據稱可提供匹敵這些模型的端到端工具使用性能,同時部署和擴展更便捷。

▲MiniMax-M2的基(ji)準測試概(gai)況
具體(ti)來看,MiniMax-M2有(you)以下(xia)幾大亮點:
1、智能提升。根據知名分析機構Artificial Analysis的基準測試,MiniMax-M2在數學、科學、指令遵循、編程和智能體工具使用方面展現出具競爭力的通用智能。其綜合得分在全球開源模型中排名第一。
2、高級編程。MiniMax-M2專為端到端開發人員工作流程而設計,擅長(chang)多文件編輯、編碼(ma)-運行-修(xiu)(xiu)復循環以及測試驗證修(xiu)(xiu)復。在(zai)Terminal-Bench和(he)(Multi-)SWE-Bench風格的任務中展(zhan)現了(le)其在(zai)跨語言終端(duan)、IDE和(he)CI中的實用有效性。
3、智能體性能。MiniMax-M2能夠規劃并執行跨Shell、瀏覽器、檢索和代碼運行器的復雜、長周期工具鏈。在(zai)類似BrowseComp的評(ping)估中,它能夠持續定(ding)位(wei)難(nan)以發現的漏洞來源,保持證據的可追溯性,并(bing)優雅地從(cong)不穩定(ding)的步驟中恢復(fu)。
4、高效設計。MiniMax-M2擁有100億個激活參數,可為交互式智能體和批量采樣提供更低的延遲、更低的成本和更高的吞吐量,這(zhe)與(yu)向高度可部署的模型(xing)轉變(bian)契合(he),這(zhe)些模型(xing)在編程和智能體任務中仍然(ran)表(biao)現出色。
以下更全面的評估測試了端到端編程和智能體工具的使用情況,涉及編輯真實的代碼庫、執行命令、瀏覽網頁以及交付實用的解決方案等方面。MiniMax-M2在Multi-SWE-Bench、Terminal-Bench、ArtifactsBench、BrowseComp等多項測試中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等頂尖模型。

▲MiniMax-M2的基準測試具體情(qing)況
Artificial Analysis統計的(de)基(ji)準測(ce)試如下,MiniMax-M2在LiveCodeBench(LCB)、IFBench、AA Intelligence等(deng)多(duo)項(xiang)測(ce)試中(zhong)超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等(deng)頂尖(jian)模型。

▲Artificial Analysis基準測試(shi)具體情況(kuang)
目前,用戶可以在MiniMax Agent上體驗MiniMax-M2,在限定時間內免費用。

▲MiniMax Agent限免(mian)使用
體驗地址:
//agent.minimax.io/
智東西第一時間對MiniMax-M2進行了體驗,當輸入提示詞:“模擬一個旋轉六邊形內彈跳球。”MiniMax-M2能夠成功實現這一物理模擬,且提供了比較直觀的小球軌跡效果及參數控制面板設計。這期間等(deng)待數分鐘,主(zhu)要是其調用智能(neng)體對基本控(kong)制功能(neng)、面板參數調試、高級功能(neng)、網(wang)站顯示等(deng)進行了數次的測試調試。

▲MiniMax Agent生成的小(xiao)球實(shi)驗(yan)模(mo)擬
體驗鏈接:
//en6x2um63xa4.space.minimaxi.com/
當我把題目難度提高,輸入提示詞:“模擬一個旋轉六邊形內彈跳球,有兩個球體積相同,球a的質量是球b的2倍。”只見MiniMax-M2模擬的小球沖出了六邊形,與預(yu)期(qi)有一些(xie)出入,不(bu)過整個網站可調參(can)數和呈現內(nei)容變(bian)得更(geng)加(jia)豐富。或許(xu)這一題目對一個輕量級(ji)模型來說還(huan)是有難度。

▲MiniMax Agent生(sheng)成的小球實驗模(mo)擬
體驗鏈接:
//bwr3exu4k4ph.space.minimaxi.com/
另外,MiniMax-M2 API已在MiniMax開放平臺上線,同樣限時免費。MiniMax-M2模型權(quan)重(zhong)現已開源(yuan),允許本地部署(shu)和使用。
API地址:
//platform.minimax.io/docs/guides/text-generation
模型權重開源地址:
//huggingface.co/MiniMaxAI/MiniMax-M2