網易首頁 > 網易號 > 正文申請入駐

2025新發布LLM盤點

2025-11-29 08:14:36　來源: Ai時代前沿

北京舉報

分享至

現在你每次上網都可能看到新的大型語言模型（LLM）更新的頭條新聞，過去幾周是LLM們發布和升級的繁忙時期。

現在似乎是盤點前沿模型開發人員最近推出的更新的好時機。對于一些最大的版本，匯集了新的和不同的內容，以及這些模型的最佳用例和受眾。

讓我們來看看五個熱點LLM最新發布

ChatGPT 5.1

OpenAI為GPT-5.1系列中的兩個模型推出了更新，日常任務模型Instant和高級推理模型Thinking。

當GPT-5首次發布時，那些熟悉之前gpt-4o友好、非正式語氣的人立即注意到這款流行聊天機器人的語氣有所不同。GPT-5可以被描述為一個簡短的機器人：沒有廢話，有時甚至有點粗魯。OpenAI表示，GPT-5.1 Instant“更溫暖，更具對話性……并且經常以其游戲性給人們帶來驚喜，同時保持清晰和有用。”

GPT-5.1Thinking更精確地調整其“思考時間”。該公司表示，它在簡單任務上更快，在復雜任務上花費更多時間，并產生更清晰、更少術語的答案。OpenAI還聲稱，這種模型更善于遵循指令。此外，還有更多定制功能，改進了聊天語氣和風格的控制。

適用場景：創意寫作、頭腦風暴和技術解釋。OpenAI表示，它也吸引了那些想要一個可以處理嚴肅任務但以更自然的方式進行溝通的模型的企業用戶。

可用性：11月12日開始向Pro、Plus、Go和Business用戶推出，現在可用于所有級別。在過渡期間，傳統GPT-5將保留約三個月。

Gemini 3

谷歌正在將其新的Gemini 3定位為迄今為止“最智能”的模型，結合了高級推理、多模態理解和智能體功能。改進的多模態性能可以在單個工作流中跨文本、圖像、視頻和代碼工作。Gemini 3還具有新的“深度思考”模式：這是一種增強模式，在推理、智能化工作流程和具有挑戰性的基準測試方面具有更高的性能。

谷歌生態系統中的可用性比以往任何時候都更廣泛。在Gemini應用程序、搜索中的AI模式、AI Studio、Vertex AI和新的智能體平臺“反重力（Antigravity）”中。谷歌還聲稱已經進行了嚴格的安全和可靠性升級，并指出Gemini 3比其之前的任何型號都進行了更全面的安全評估。

適用場景：構建復雜應用程序或代理工作流的開發人員，以及想要“多模式、推理繁重”工具而不僅僅是聊天助手的企業/高級用戶。

可用性：Gemini 3于11月18日推出，可在Gemini應用程序和Google AI Pro/Ultra層中使用。該模型還包含在搜索選定訂閱者的AI模式中。對于使用API的開發人員，它可以通過Google AI Studio、Vertex AI和新的Google Antigravity代理平臺獲得。

Claude Opus 4.5

與谷歌一樣，Anthropic也將其最新旗艦模型描述為迄今為止最智能的模型，聲稱在編碼和生產力任務方面有重大性能改進。例如，該公司表示，Opus 4.5“比我們測試過的任何模型都更有效地處理長期編碼任務……在延遲測試中實現了更高的通過率，同時使用的令牌減少了65%。”Anthropic表示，該模型的專用工具使用和內存/上下文管理架構使其能夠處理更長的序列、多個文件和多個代理，同時保持一致性。

對于生產力任務，Opus 4.5擴展了辦公工作流的功能，如電子表格和幻燈片、大上下文故事講述和智能體工具使用。Anthropic表示，Opus 4.5推動了“模型作為合作者”的前沿，而不僅僅是“模型作為助手”，特別是在長期和工具繁重的任務中。Anthropic聲稱它也更具成本效益，將在多個云上運行，成本是其前身的三分之一。該公司提到，它也節省了時間，稱以前需要兩個小時的任務現在可以在大約30分鐘內完成。

適用場景：Opus 4.5針對進行復雜、多步驟工作的企業和工程團隊。Anthropic表示，它非常適合在許多任務或代理上展開的大型軟件項目，以及構建依賴于工具集成的代理工作流的開發人員，從代碼庫到數據管道。對于業務用戶，該模型還可以處理日常生產力任務，包括電子表格、幻燈片、長格式文檔和其他“計算機使用”工作流。

可用性：Claude Opus 4.5于11月24日發布，可在AWS Bedrock、Google Cloud的Vertex AI和Microsoft的Foundry等主要云上使用。

Claude Sonnet 4.5

Anthropic表示Claude Sonnet 4.5是“世界上最好的編碼模型”。該公司將其定位為廣泛采用的Sonnet 3.5代的有意義的一步，稱新版本在推理、編碼和STEM重點任務方面提供了更強的性能，同時保持了使Sonnet系列受到日常用戶歡迎的速度和成本。在內部基準測試中，Anthropic報告了長篇寫作、結構化分析和逐步推理的改進，特別強調技術領域的準確性。

Sonnet 4.5還繼承了Opus 4.5中引入的許多工具使用和生產力升級，包括更好地處理電子表格、幻燈片、數據量大的文檔和更長的上下文窗口。Anthropic指出，該模型在多步驟指令下更可靠，在需要特定格式或約束的提示下更一致。總體而言，該公司將Sonnet 4.5視為能力和效率的平衡。

適用場景：Sonnet 4.5專為需要強大推理和編碼支持的開發人員和業務用戶而設計，而無需一直升級到旗艦級模型。它非常適合起草和編輯長篇內容、分析數據、生成結構化輸出以及處理電子表格或演示大綱等生產力任務。Anthropic表示，它也非常適合構建輕量級智能體工作流的團隊，這些工作流需要以較低的成本實現可靠性和速度。

可用性：Claude Sonnet 4.5于9月29日發布，可通過Anthropic的平臺、其API和主要云合作伙伴（包括AWS Bedrock、Google cloud的Vertex AI和Microsoft Foundry）提供。

Olmo 3

艾倫人工智能研究所（Allen Institute for AI，Ai2）將Olmo 3系列模型引入了完全開放的模式，不僅發布了模型權重，還發布了檢查點、訓練數據、代碼和依賴關系，因此研究人員和開發人員可以完全適應并使用它進行構建。與這里介紹的其他模型不同，Olmo 3是完全開源的，為研究人員提供了一個更透明的封閉邊界系統的替代方案，以實現整個模型流的開放性和可重復性。

Olmo 3系列包括基礎模型（7B和32B參數）和針對高級推理進行優化的“Think”變體。根據Ai2的說法，這些模型在完全開放的基礎模型中表現最佳，擅長編程、閱讀理解、數學問題解決和高達65KToken的長上下文任務。

此外，Olmo 3引入了多種訓練后路徑，包括用于聊天和工具使用的Instruct、用于強化學習實驗的RL Zero和用于推理工作流程的Think，所有這些都是在許可的開源許可證下記錄和發布的。

適用場景：Olmo 3非常適合優先考慮開放性、可審計性和靈活性的開發人員、研究人員和組織。這些模型可用于構建需要檢查模型行為、從中間檢查點進行微調或集成工具使用和長上下文推理的自定義工作流。它也適用于希望在編碼、分析和長篇內容方面表現出色的團隊，特別是當他們希望完全透明地了解模型的訓練方式時。

可用性：Olmo 3于11月20日發布，整個模型流程可通過Ai2 Playground、OpenRouter和Hugging Face下載和實驗。

隨著時間的推移，模型更新速度很快。無論您是在嘗試開源工具還是將前沿模型投入生產，最新一輪的發布都在編碼、推理和多模態工作方面提供了新的優勢。這是一個擁擠的領域，但在能力和選擇方面不斷擴大。隨著整個行業的發展，2026年將成為LLM構建的又一個繁忙的一年。

與 Ai 時代前沿合作，將大門向更多普通用戶敞開！無論你是對新技術充滿好奇心的愛好者，還是希望提升自己技能的職場人士，這里都有適合你的課程和資源。歡迎掃碼加入我們！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.