IT之家 4 月 24 日消息,OpenAI 公司今天(4 月 24 日)宣布推出 GPT-5.5 模型,是其迄今最智能、最直觀的 AI 模型,在 Agentic Coding、計(jì)算機(jī)使用及科研領(lǐng)域表現(xiàn)卓越,相比較 GPT-5.4,在完成相同任務(wù)的情況下減少詞元(Token)消耗。
![]()
OpenAI 總裁格雷格 · 布羅克曼(Greg Brockman)強(qiáng)調(diào),GPT-5.5 的核心突破,在于能夠以更少的指導(dǎo)完成更多任務(wù),最大的亮點(diǎn)在于在處理模糊問題時(shí),展現(xiàn)出更強(qiáng)的自主性,能快速理解用戶意圖,自主規(guī)劃并執(zhí)行多步驟復(fù)雜任務(wù),在代碼編寫調(diào)試、在線研究、數(shù)據(jù)分析及跨工具操作等場(chǎng)景表現(xiàn)出色。
![]()
GPT-5.5 的核心優(yōu)勢(shì)在于 Agent(智能體)能力,用戶無需精細(xì)管理每一步,只需下達(dá)模糊的多部分任務(wù),模型即可自主規(guī)劃、調(diào)用工具、檢查結(jié)果并持續(xù)推進(jìn)直至完成。
性能方面,GPT-5.5 進(jìn)一步平衡智能與速度。盡管模型更大、能力更強(qiáng),但在實(shí)際服務(wù)中,其每個(gè) Token 的延遲與 GPT-5.4 持平,且完成相同任務(wù)所需的 Token 顯著減少:
- 在 Artificial Analysis 的 Coding Index 中,它以競(jìng)爭(zhēng)模型一半的成本提供了 SOTA(最先進(jìn))的智能水平。
- 在 Terminal-Bench 2.0 測(cè)試中,GPT-5.5 取得了 82.7% 的準(zhǔn)確率;
- 在評(píng)估 GitHub 問題解決的 SWE-Bench Pro 中達(dá)到 58.6%;在 Expert-SWE 等長(zhǎng)周期任務(wù)中均超越前代模型。
- 早期測(cè)試者反饋,該模型在理解系統(tǒng)架構(gòu)、定位故障及預(yù)測(cè)審查需求方面能力顯著增強(qiáng)。
科研與知識(shí)工作領(lǐng)域迎來質(zhì)變。GPT-5.5 在 GeneBench 基因數(shù)據(jù)分析及 BixBench 生物信息學(xué)基準(zhǔn)測(cè)試中取得領(lǐng)先成績(jī),甚至協(xié)助發(fā)現(xiàn)了關(guān)于 Ramsey Numbers(拉姆齊數(shù))的新證明。
![]()
![]()
在企業(yè)應(yīng)用中,OpenAI 內(nèi)部超 85% 的員工每周使用 Codex,財(cái)務(wù)團(tuán)隊(duì)利用其審核了超 7 萬頁稅務(wù)文件,效率提升顯著。NVIDIA 等合作伙伴證實(shí),該模型將調(diào)試時(shí)間從數(shù)天縮短至數(shù)小時(shí)。
GPT-5.5 目前已向 Plus、Pro 等用戶開放,API 版本即將上線,輸入定價(jià)為每百萬 Token 售價(jià) 5 美元(IT之家注:現(xiàn)匯率約合 34.2 元人民幣),Pro 版本輸入定價(jià)為每百萬 Token 30 美元。
![]()
山姆 · 奧爾特曼稱在 GPT-5.5 模型上,OpenAI 和英偉達(dá)高度合作,推廣 Codex 到英偉達(dá)全公司,并曬出了和黃仁勛的交流郵件:
![]()
英偉達(dá)在新聞稿中指出,OpenAI 發(fā)布的 GPT-5.5 模型是其最新前沿成果,目前已在 NVIDIA GB200 NVL72 機(jī)架級(jí)系統(tǒng)上運(yùn)行,為智能體編程應(yīng)用 Codex 提供核心動(dòng)力。
NVIDIA 內(nèi)部已有超過 10000 名員工率先使用該技術(shù),涵蓋工程、產(chǎn)品、法務(wù)、市場(chǎng)等多個(gè)部門,員工反饋稱其效果令人震撼。
英偉達(dá)工程師通過 Codex 應(yīng)用使用 GPT-5.5 已數(shù)周,基于 GB200 NVL72 系統(tǒng),該模型實(shí)現(xiàn)了極具競(jìng)爭(zhēng)力的經(jīng)濟(jì)效益:相比前代系統(tǒng),百萬 Token 成本降低至 35 分之一,每兆瓦 Token 輸出量提升 50 倍。
![]()
在實(shí)際應(yīng)用中,原本耗時(shí)數(shù)天的調(diào)試周期縮短至數(shù)小時(shí),復(fù)雜多文件代碼庫的實(shí)驗(yàn)周期從數(shù)周壓縮至一夜之間。團(tuán)隊(duì)甚至能通過自然語言提示實(shí)現(xiàn)端到端功能交付。
IT之家附上參考地址
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.