智東西(公眾號:zhidxcom)
編譯 | 王涵
編輯 | 漠影
智東西10月14日消息,今日凌晨,微軟AI推出其首款完全自研的文生圖模型MAI-Image-1。該模型首次亮相即以1096分排在權威評測平臺LMArena文生圖榜單第9名。

▲LMArena文生圖榜單(來源:LMArena)
在實際性能方面,MAI-Image-1在光影效果、自然景觀等超寫實圖像生成上表現突出。相比規模更大、響應更慢的模型,該模型在保證生成質量的同時顯著提升了處理速度,讓創作者能夠快速實現創意可視化并進行迭代優化。

▲MAI-Image-1生成圖像實例(來源:微軟AI)
微軟透露,研究團隊在模型訓練階段特別注重避免輸出內容的重復與同質化問題,通過嚴格篩選訓練數據并引入創意行業專業建議,讓模型在真實創作場景中展現出更好的實用性。MAI-Image-1后續也將集成至Copilot和Bing Image Creator等微軟核心產品中。
微軟AI(Mircosoft AI,簡稱MAI)創立于2024年3月,是微軟為推進Copilot及其他消費者AI產品研發而設立的專門機構。
該機構首席執行官Mustafa Suleyman曾作為聯合創始人創立DeepMind并領導其應用AI部門,隨DeepMind被谷歌收購后加入谷歌,后于2022年離開谷歌創辦大模型初創企業Inflection AI。
2024年初,微軟以6.5億美元(約合人民幣46.3億元)完成對Inflection AI的“人才收購”,Suleyman隨即帶領團隊核心成員加入MAI,14個月后,他們交付了首批全自研AI模型,分別為基礎模型MAI-1-preview和語音生成模型MAI-Voice-1。(參見智東西此前報道:)
結語:微軟多模態場景產品藍圖逐漸清晰
微軟AI全自研文生圖模型雖然闖進LMArena文生圖榜單前十,但與谷歌等公司的自研模型仍有差距,如此看來微軟收購Inflection AI的效果還沒有完全顯現出來。
在文生圖模型領域,MAI-Image-1需要來自面對Midjourney、Stable Diffusion等海外成熟模型以及hunyuan-image、seedream等中國文生圖模型的激烈競爭,壓力不算小。
不過,從其發布的三款模型的類型來看,從語音、對話到圖像生成,微軟正試圖打造覆蓋多模態場景的自主產品矩陣,其似乎是想要通過自研模型逐步構建獨立技術體系。