微軟近日正式發布第二代自研圖像生成模型 MAI-Image-2,在第三方評測平臺 Arena 的圖像生成模型排行榜中已升至第 3 名,僅落后于Google gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity,這也標志著微軟在生成式 AI 領域從“追趕者”轉型為一線強者。
目前,MAI-Image-2 已面向 Copilot 和必應圖像創作者用戶逐步開放,用戶也可通過 MAI Playground 率先體驗,開發者則可以借助 Microsoft Foundry 提供的 API,將該模型集成到自有應用與服務中。
![]()
回顧 2025 年 10 月,微軟首次公布其自研圖像生成模型 MAI-Image-1,希望在該領域與 OpenAI 的 gpt-image-1 以及Google的 Gemini/Imagen 等產品展開競爭。 隨后,微軟將 MAI-Image-1 擴展至 Bing.com/create 以及必應移動應用,讓更多終端用戶能夠通過圖像生成工具進行創作。 不過,在第三方平臺 Arena 的 Image Arena 排行中,MAI-Image-1 初登場僅位列第 9,與其他領先實驗室的模型相比差距明顯。 當時微軟強調,其訓練策略著重減少重復和過度風格化輸出,并突出生成速度優勢,聲稱在同類大規模圖像生成模型中擁有更快的響應表現。
此次發布的 MAI-Image-2 則是微軟 AI 團隊在上述基礎上的一次大幅升級。 官方介紹稱,新一代模型在自然光效果、膚色還原以及環境細節方面均有顯著提升,有助于創意工作者減少后期修圖時間,更高效地完成商業與創意項目。 同時,MAI-Image-2 針對文本渲染能力進行了重點優化,使其在制作信息圖表、演示文稿、流程圖和技術示意圖等場景中更加適用,提升了圖文一體內容創作的可用性。 微軟還表示,該模型在生成電影感、超細節風格圖像方面有明顯進步,尤其擅長處理超現實概念、復雜華麗構圖以及宏大場景等高難度創意需求。
微軟管理層也在社交媒體上為 MAI-Image-2 造勢。 微軟消費者 AI 業務負責人 Mustafa Suleyman 在平臺上表示,新圖像生成器 MAI-Image-2 已經上線 MAI Playground,可用于從逼真寫實到復雜信息圖等多種用途,并強調微軟團隊為這一版本付出了巨大努力,如今該模型家族已躋身 Arena 排行的前三。 他鼓勵用戶前往體驗,并展示了由該模型生成的圖像示例。
就整體戰略而言,MAI-Image-2 的推出與微軟近年來在 AI 領域“自給自足”的方向相呼應。 在繼續深度合作 OpenAI 的同時,微軟正加速打造自有模型矩陣,從圖像生成到語音轉寫等多個細分方向發力,以減少對單一外部合作伙伴的依賴。 伴隨 MAI-Image-2 在排行榜上的快速攀升,微軟在高端圖像生成賽道上對Google與 OpenAI 的直接競爭態勢已愈發明顯。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.