OpenAI的API更新文檔通常沒人細(xì)讀,直到上周有開發(fā)者發(fā)現(xiàn):o3和o4-mini的定價頁面藏了個腳注,"部分請求可能由其他模型處理"。這句話讓盯著賬單的人集體清醒——他們以為自己買的是保時捷,實(shí)際可能是輛換標(biāo)大眾。
事情發(fā)酵得很快。一位叫Sherman Chann的工程師在X上貼出對比測試:同樣一段代碼,o3-mini-high的響應(yīng)成本在幾小時內(nèi)波動超過300%。「我們按o3的價格付賬,但系統(tǒng)日志顯示執(zhí)行的是GPT-4o-mini。」他的帖子24小時內(nèi)被轉(zhuǎn)了4000多次。
OpenAI的回應(yīng)來得不算慢。產(chǎn)品經(jīng)理Olivier Godement在開發(fā)者論壇承認(rèn),"當(dāng)o3負(fù)載過高時,我們會降級到4o-mini以保證可用性",但強(qiáng)調(diào)"價格按實(shí)際執(zhí)行模型計算"。問題是:用戶事前不會收到通知,事后只能在賬單里猜謎。
這解釋了為什么過去半年,Reddit上總有人吐槽"o3-mini-high有時候聰明得不像那個價,有時候又蠢得離譜"。現(xiàn)在他們知道答案了——那根本不是同一個模型。一位每月燒掉2萬美元API額度的創(chuàng)業(yè)公司CTO說,他們的成本分析工具全成了擺設(shè),"我們以為在優(yōu)化prompt,其實(shí)在賭今天輪到哪個模型"。
OpenAI在更新日志里把這叫"動態(tài)路由優(yōu)化"。但開發(fā)者們找到了更精準(zhǔn)的類比:這像是去米其林餐廳點(diǎn)餐,后廚忙不過來就給你端了份預(yù)制菜,價格按米其林算,理由是"保證你能吃上飯"。目前爭議最大的細(xì)節(jié)是:降級發(fā)生時,響應(yīng)頭部的模型名稱仍顯示為o3-mini——除非你專門去查執(zhí)行日志,否則永遠(yuǎn)不會知道。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.