性能超DeepSeek-V3.2！国产大模型又开源了，限时免费用

智東西（公眾號：zhidxcom）
作者 | 李水青
編輯 | 心緣

智東西10月27日報道，剛剛，MiniMax發布并開源MiniMax-M2，一(yi)款為Max可視化編程和智能體工作流構建的(de)輕量(liang)級模(mo)型。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲MiniMax-M2在Hugging Face的開源(yuan)界面截圖

MiniMax-M2聚焦智能體的效率提升，是一款總參數達2300億個的MoE（混合專家）模型，其中活躍參數達100億個，兼(jian)顧(gu)編程和智能體(ti)任(ren)務以及(ji)通(tong)用智能。

在權威基準測評中，MiniMax-M2的測試成績趕超Gemini 2.5 Pro、DeepSeek-V3.2等領先模型，接近GPT-5（thinking）模型性能，據稱可提供匹敵這些模型的端到端工具使用性能，同時部署和擴展更便捷。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲MiniMax-M2的基(ji)準測試概(gai)況

具體(ti)來看，MiniMax-M2有(you)以下(xia)幾大亮點：

1、智能提升。根據知名分析機構Artificial Analysis的基準測試，MiniMax-M2在數學、科學、指令遵循、編程和智能體工具使用方面展現出具競爭力的通用智能。其綜合得分在全球開源模型中排名第一。

2、高級編程。MiniMax-M2專為端到端開發人員工作流程而設計，擅長(chang)多文件編輯、編碼(ma)-運行-修(xiu)(xiu)復循環以及測試驗證修(xiu)(xiu)復。在(zai)Terminal-Bench和(he)（Multi-）SWE-Bench風格的任務中展(zhan)現了(le)其在(zai)跨語言終端(duan)、IDE和(he)CI中的實用有效性。

3、智能體性能。MiniMax-M2能夠規劃并執行跨Shell、瀏覽器、檢索和代碼運行器的復雜、長周期工具鏈。在(zai)類似BrowseComp的評(ping)估中，它能夠持續定(ding)位(wei)難(nan)以發現的漏洞來源，保持證據的可追溯性，并(bing)優雅地從(cong)不穩定(ding)的步驟中恢復(fu)。

4、高效設計。MiniMax-M2擁有100億個激活參數，可為交互式智能體和批量采樣提供更低的延遲、更低的成本和更高的吞吐量，這(zhe)與(yu)向高度可部署的模型(xing)轉變(bian)契合(he)，這(zhe)些模型(xing)在編程和智能體任務中仍然(ran)表(biao)現出色。

以下更全面的評估測試了端到端編程和智能體工具的使用情況，涉及編輯真實的代碼庫、執行命令、瀏覽網頁以及交付實用的解決方案等方面。MiniMax-M2在Multi-SWE-Bench、Terminal-Bench、ArtifactsBench、BrowseComp等多項測試中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等頂尖模型。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲MiniMax-M2的基準測試具體情(qing)況

Artificial Analysis統計的(de)基(ji)準測(ce)試如下，MiniMax-M2在LiveCodeBench（LCB）、IFBench、AA Intelligence等(deng)多(duo)項(xiang)測(ce)試中(zhong)超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等(deng)頂尖(jian)模型。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲Artificial Analysis基準測試(shi)具體情況(kuang)

目前，用戶可以在MiniMax Agent上體驗MiniMax-M2，在限定時間內免費用。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲MiniMax Agent限免(mian)使用

體驗地址：
//agent.minimax.io/

智東西第一時間對MiniMax-M2進行了體驗，當輸入提示詞：“模擬一個旋轉六邊形內彈跳球。”MiniMax-M2能夠成功實現這一物理模擬，且提供了比較直觀的小球軌跡效果及參數控制面板設計。這期間等(deng)待數分鐘，主(zhu)要是其調用智能(neng)體對基本控(kong)制功能(neng)、面板參數調試、高級功能(neng)、網(wang)站顯示等(deng)進行了數次的測試調試。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲MiniMax Agent生成的小(xiao)球實(shi)驗(yan)模(mo)擬

體驗鏈接：
//en6x2um63xa4.space.minimaxi.com/

當我把題目難度提高，輸入提示詞：“模擬一個旋轉六邊形內彈跳球，有兩個球體積相同，球a的質量是球b的2倍。”只見MiniMax-M2模擬的小球沖出了六邊形，與預(yu)期(qi)有一些(xie)出入，不(bu)過整個網站可調參(can)數和呈現內(nei)容變(bian)得更(geng)加(jia)豐富。或許(xu)這一題目對一個輕量級(ji)模型來說還(huan)是有難度。

性能超DeepSeek-V3.2！國產大模型又開源了，限時免費用

▲MiniMax Agent生(sheng)成的小球實驗模(mo)擬

體驗鏈接：

//bwr3exu4k4ph.space.minimaxi.com/

另外，MiniMax-M2 API已在MiniMax開放平臺上線，同樣限時免費。MiniMax-M2模型權(quan)重(zhong)現已開源(yuan)，允許本地部署(shu)和使用。

API地址：
//platform.minimax.io/docs/guides/text-generation
模型權重開源地址：
//huggingface.co/MiniMaxAI/MiniMax-M2

国产又黄又猛又粗又爽的A片,小祖宗┅┅快┅┅用力啊视频,国产精品麻豆欧美日韩ww,少妇精品无码一区二区免费视频,波多野结衣在线播放

相關推薦