網易首頁 > 網易號 > 正文申請入駐

微軟MAI-Image-2模型躋身前三正面挑戰Google與OpenAI

2026-04-03 01:04:43　來源: cnBeta.COM

浙江舉報

分享至

微軟近日正式發布第二代自研圖像生成模型 MAI-Image-2，在第三方評測平臺 Arena 的圖像生成模型排行榜中已升至第 3 名，僅落后于Google gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity，這也標志著微軟在生成式 AI 領域從“追趕者”轉型為一線強者。

目前，MAI-Image-2 已面向 Copilot 和必應圖像創作者用戶逐步開放，用戶也可通過 MAI Playground 率先體驗，開發者則可以借助 Microsoft Foundry 提供的 API，將該模型集成到自有應用與服務中。

回顧 2025 年 10 月，微軟首次公布其自研圖像生成模型 MAI-Image-1，希望在該領域與 OpenAI 的 gpt-image-1 以及Google的 Gemini/Imagen 等產品展開競爭。隨后，微軟將 MAI-Image-1 擴展至 Bing.com/create 以及必應移動應用，讓更多終端用戶能夠通過圖像生成工具進行創作。不過，在第三方平臺 Arena 的 Image Arena 排行中，MAI-Image-1 初登場僅位列第 9，與其他領先實驗室的模型相比差距明顯。當時微軟強調，其訓練策略著重減少重復和過度風格化輸出，并突出生成速度優勢，聲稱在同類大規模圖像生成模型中擁有更快的響應表現。

此次發布的 MAI-Image-2 則是微軟 AI 團隊在上述基礎上的一次大幅升級。官方介紹稱，新一代模型在自然光效果、膚色還原以及環境細節方面均有顯著提升，有助于創意工作者減少后期修圖時間，更高效地完成商業與創意項目。同時，MAI-Image-2 針對文本渲染能力進行了重點優化，使其在制作信息圖表、演示文稿、流程圖和技術示意圖等場景中更加適用，提升了圖文一體內容創作的可用性。微軟還表示，該模型在生成電影感、超細節風格圖像方面有明顯進步，尤其擅長處理超現實概念、復雜華麗構圖以及宏大場景等高難度創意需求。

微軟管理層也在社交媒體上為 MAI-Image-2 造勢。微軟消費者 AI 業務負責人 Mustafa Suleyman 在平臺上表示，新圖像生成器 MAI-Image-2 已經上線 MAI Playground，可用于從逼真寫實到復雜信息圖等多種用途，并強調微軟團隊為這一版本付出了巨大努力，如今該模型家族已躋身 Arena 排行的前三。他鼓勵用戶前往體驗，并展示了由該模型生成的圖像示例。

就整體戰略而言，MAI-Image-2 的推出與微軟近年來在 AI 領域“自給自足”的方向相呼應。在繼續深度合作 OpenAI 的同時，微軟正加速打造自有模型矩陣，從圖像生成到語音轉寫等多個細分方向發力，以減少對單一外部合作伙伴的依賴。伴隨 MAI-Image-2 在排行榜上的快速攀升，微軟在高端圖像生成賽道上對Google與 OpenAI 的直接競爭態勢已愈發明顯。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.