網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

75億參數(shù)打底！GPT-5為何還被罵“人工智障”？

2025-12-20 11:35:08　來(lái)源: 觀察眼看世界

江蘇舉報(bào)

分享至

美國(guó)政府1美元簽的合同，藏著GPT-5最大野心

Claude用戶笑了：GPT-5便宜十二倍但慢兩秒

74.9%準(zhǔn)確率破紀(jì)錄！GPT-5卻栽在初中物理

三類企業(yè)已吃到紅利！GPT-5商用落地超預(yù)期

全球超百萬(wàn)開(kāi)發(fā)者同時(shí)按下刷新鍵的瞬間，OpenAI官網(wǎng)流量飆升到日常的47倍。這源于太平洋時(shí)間8月7日上午10點(diǎn)，GPT-5正式向免費(fèi)用戶開(kāi)放。盡管官網(wǎng)因流量激增短暫癱瘓，但涌入的普通用戶很快發(fā)現(xiàn)，只需輸入郵箱就能直接對(duì)話這個(gè)被薩姆·奧特曼稱為“博士級(jí)專家”的AI。

技術(shù)社區(qū)最初的反應(yīng)卻呈現(xiàn)出兩極分化。GitHub趨勢(shì)榜顯示，發(fā)布會(huì)后8小時(shí)內(nèi)含有“GPT-5”標(biāo)簽的新代碼倉(cāng)庫(kù)暴增12,700個(gè)，但科技論壇Hacker News的熱門帖子卻是《伯努利定律：GPT-5的滑鐵盧》。該貼詳細(xì)指出AI在解釋流體力學(xué)時(shí)的概念混淆——它誤用了早被當(dāng)代物理學(xué)界摒棄的“等時(shí)通過(guò)理論”，而這是高中物理教材明確否定的觀點(diǎn)。

更令人意外的一幕出現(xiàn)在數(shù)據(jù)分析領(lǐng)域。當(dāng)OpenAI工程師演示自動(dòng)制圖功能時(shí)，明明標(biāo)注著o3模型評(píng)分69.1分（柱狀圖應(yīng)為藍(lán)色），GPT-5生成的可視化圖表卻顯示52.8分（綠色）的立柱更高。雖經(jīng)技術(shù)團(tuán)隊(duì)確認(rèn)系圖表模板調(diào)用錯(cuò)誤，但美國(guó)東北大學(xué)人機(jī)交互實(shí)驗(yàn)室主任克里斯蒂娜·羅杰斯認(rèn)為：這說(shuō)明當(dāng)前AI仍無(wú)法真正理解數(shù)據(jù)意義，它僅擅長(zhǎng)模式匹配而非認(rèn)知建構(gòu)。

這些缺陷并未阻礙GPT-5展現(xiàn)突破性進(jìn)步。根據(jù)官方披露的Artificial Analysis全項(xiàng)測(cè)試報(bào)告，在綜合能力評(píng)分中GPT-5(high)達(dá)到68分，不僅超越此前領(lǐng)先的Claude Opus 4.1(64分)，更比自家上代模型GPT-4o提升42%。其中醫(yī)療診斷板塊的躍升尤其顯著，在梅奧診所提供的3,000份匿名檢驗(yàn)單測(cè)試中，GPT-5對(duì)異常指標(biāo)的識(shí)別準(zhǔn)確率比GPT-4提高37%，并能根據(jù)患者病史生成個(gè)性化咨詢建議清單。

真正讓企業(yè)用戶興奮的是成本結(jié)構(gòu)的顛覆。GPT-5系列API定價(jià)顯示，基礎(chǔ)版GPT-5 nano每百萬(wàn)token輸入收費(fèi)僅0.05美元（約人民幣0.36元），相當(dāng)于此前最便宜的GPT-4模型的六分之一。云平臺(tái)服務(wù)商Lambda Labs隨即進(jìn)行壓力測(cè)試：部署同等規(guī)模的自然語(yǔ)言處理系統(tǒng)，采用GPT-5可使中小企業(yè)年度成本降低18-24萬(wàn)美元。不過(guò)技術(shù)負(fù)責(zé)人馬克·陳提醒：需警惕高頻調(diào)用場(chǎng)景下的隱性成本，其團(tuán)隊(duì)實(shí)測(cè)企業(yè)級(jí)應(yīng)用中模型自動(dòng)升級(jí)到high版本的比例達(dá)31%。

編程能力的進(jìn)化直接激活了開(kāi)發(fā)社區(qū)。在權(quán)威測(cè)評(píng)SWE-bench的嚴(yán)格測(cè)試中，GPT-5對(duì)GitHub真實(shí)工單的首次修復(fù)準(zhǔn)確率達(dá)到74.9%，較OpenAI自家o3模型提升8.3個(gè)百分點(diǎn)。代碼工具Cursor的聯(lián)合創(chuàng)始人本·桑德斯坦在發(fā)布會(huì)上演示了10秒修復(fù)Python內(nèi)存泄漏漏洞的過(guò)程，其開(kāi)發(fā)者平臺(tái)已將GPT-5設(shè)為默認(rèn)引擎。但前谷歌工程師王海濤在實(shí)踐后發(fā)現(xiàn)：應(yīng)對(duì)復(fù)雜金融量化系統(tǒng)時(shí)，GPT-5自動(dòng)生成的C++代碼仍需要人工重構(gòu)23%的函數(shù)模塊。

眾多行業(yè)已展開(kāi)實(shí)質(zhì)性部署。華盛頓州退伍軍人事務(wù)局?jǐn)?shù)字轉(zhuǎn)型負(fù)責(zé)人凱倫·米勒證實(shí)，他們?cè)诼?lián)邦協(xié)議支持下正將GPT-5用于醫(yī)療檔案數(shù)字化。在嚴(yán)格設(shè)置數(shù)據(jù)防火墻的前提下，該項(xiàng)目使紙質(zhì)文件處理效率提升14倍。北京某創(chuàng)新藥企研發(fā)總監(jiān)張薇向媒體展示了AI分子篩選成果：原本需要60人日的靶點(diǎn)比對(duì)工作壓縮至7.5小時(shí)完成，但她同時(shí)強(qiáng)調(diào)所有陽(yáng)性結(jié)果必須經(jīng)三次人工復(fù)核。

對(duì)于發(fā)布會(huì)上物理知識(shí)錯(cuò)誤引發(fā)的質(zhì)疑，OpenAI首席技術(shù)官米拉·穆拉蒂回應(yīng)稱這正反映出當(dāng)前AI的局限性：“我們更愿將其定義為具有博士知識(shí)儲(chǔ)備但缺乏常識(shí)判斷的助手。”斯坦福人工智能實(shí)驗(yàn)室主任克里斯托弗·曼寧認(rèn)同該觀點(diǎn)：語(yǔ)言模型的進(jìn)步不能替代人類的批判性思維，他建議企業(yè)用戶建立“人機(jī)雙重驗(yàn)證”工作流。

隨著GPT-5全面開(kāi)放，三類應(yīng)用場(chǎng)景正在凸顯價(jià)值。軟件開(kāi)發(fā)平臺(tái)極狐科技的交付記錄顯示，借助GPT-5的實(shí)時(shí)編程輔助，其企業(yè)客戶App原型設(shè)計(jì)周期平均縮短58%；健康科技公司諾靈醫(yī)療利用模型快速生成合規(guī)的患者隨訪話術(shù)；而知識(shí)管理平臺(tái)Memo則整合GPT-5開(kāi)發(fā)出法律文書語(yǔ)義核驗(yàn)系統(tǒng)。不過(guò)所有成功案例都遵循著相同原則——深度植入業(yè)務(wù)流但不取代人類決策。

全球科技產(chǎn)業(yè)研究機(jī)構(gòu)ABI Research在最新報(bào)告中警示：當(dāng)美國(guó)聯(lián)邦機(jī)構(gòu)以1美元/年的象征性費(fèi)用接入GPT-5時(shí)，市場(chǎng)需警惕基礎(chǔ)模型廠商構(gòu)筑的生態(tài)壟斷。該機(jī)構(gòu)數(shù)據(jù)顯示，政務(wù)AI服務(wù)市場(chǎng)在未來(lái)三年的復(fù)合增長(zhǎng)率將達(dá)211%。人工智能倫理學(xué)者李敏認(rèn)為，技術(shù)普惠不能以數(shù)據(jù)主權(quán)讓渡為代價(jià)：“企業(yè)擁抱大模型時(shí)，應(yīng)像核對(duì)財(cái)務(wù)報(bào)表那樣審視AI輸出的每個(gè)結(jié)論。”

此刻在紐約證券交所，為GPT-5提供算力芯片的英偉達(dá)股價(jià)單日上漲4.2%，而OpenAI競(jìng)爭(zhēng)對(duì)手Anthropic的辦公區(qū)依然燈火通明。技術(shù)演進(jìn)的車輪從未停止，但當(dāng)舊金山發(fā)布會(huì)場(chǎng)的大屏幕打出“重新定義智能”的標(biāo)語(yǔ)時(shí)，波士頓動(dòng)力創(chuàng)始人馬克·雷伯特在社交媒體的評(píng)論獲得最多共鳴：“我們制造的究竟是工具，還是鏡中的自己？”

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.