<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      中國(guó)AI編程面臨殘酷競(jìng)爭(zhēng),OpenAI推出1000token/秒的Codex-Spark |以Agent為馬

      0
      分享至

      當(dāng)AI正在能替人類編程數(shù)個(gè)小時(shí)甚至數(shù)天,編程的速度就愈發(fā)關(guān)鍵;當(dāng)多個(gè)智能體協(xié)作完成更加復(fù)雜的任務(wù),延時(shí)就變得更加不能容忍。

      在推出GPT-5.3-Codex之后一周,OpenAI即推出Codex-Spark。這個(gè)輕量版,可以實(shí)現(xiàn)即時(shí)編程,速度達(dá)到1000token/秒。這也是OpenAI首個(gè)運(yùn)行在英偉達(dá)GPU競(jìng)爭(zhēng)對(duì)手Cerebras芯片上的模型。

      隨著模型功能的日益強(qiáng)大,交互速度顯然成為了瓶頸。這樣的速度,對(duì)于長(zhǎng)程工作、動(dòng)輒耗費(fèi)成上億token的智能體來(lái)說(shuō),會(huì)帶來(lái)產(chǎn)品的差異性競(jìng)爭(zhēng)力。

      以O(shè)penAI為代表的美國(guó)前沿AI實(shí)驗(yàn)室,進(jìn)一步抬高競(jìng)爭(zhēng)門檻,用新一代更強(qiáng)的算力,訓(xùn)練更強(qiáng)大的模型,持續(xù)擴(kuò)展性能邊界,并創(chuàng)造出更好的用戶體驗(yàn)。Blackwell大規(guī)模上市成為主流,TPU-7e即將量產(chǎn)推出,以及更快速的推理芯片如Groq、Cerebras等,正在加快部署。中國(guó)的開源AI軍團(tuán),要快馬加鞭了。

      “響應(yīng)速度即產(chǎn)品”

      OpenAI開始用算力與模型協(xié)同,加入AI編程的殘酷競(jìng)爭(zhēng)。Codex-Spark運(yùn)行在Cerebras的芯片上;雙方宣布合作也僅僅一個(gè)月,即推出首個(gè)模型。Cerebras 的創(chuàng)始人兼CEO Andrew Feldman稱,Codex-Spark 是為實(shí)時(shí)軟件開發(fā)而打造的。“在編程領(lǐng)域,響應(yīng)速度本身就是產(chǎn)品。這不是“錦上添花”,而是剛需?!?/p>

      Codex-Spark針對(duì)定向代碼修改、邏輯調(diào)整和前端迭代進(jìn)行了優(yōu)化,為開發(fā)者提供幾乎即時(shí)的反饋,讓他們保持在高效的心流狀態(tài)中——這對(duì)于10X甚至100X的人才來(lái)說(shuō),具有極高的經(jīng)濟(jì)價(jià)值。


      OpenAI提出了馬年工作重心:提高數(shù)據(jù)中心容量,強(qiáng)化端到端用戶體驗(yàn),并部署更大的前沿模型。

      如OpenAI所說(shuō),其最新的前沿模型在執(zhí)行長(zhǎng)時(shí)間運(yùn)行的任務(wù)方面展現(xiàn)出優(yōu)勢(shì),無(wú)需人工干預(yù)即可自主運(yùn)行數(shù)小時(shí)、數(shù)天甚至數(shù)周。這樣的話,低延時(shí)可以直接縮短任務(wù)完成的時(shí)間,轉(zhuǎn)化為經(jīng)濟(jì)價(jià)值。

      Codex-Spark 成為首個(gè)專為實(shí)時(shí)編程而設(shè)計(jì)的模型,提供128k的上下文窗口,并且僅支持文本。在研究預(yù)覽期間,Codex-Spark 將擁有獨(dú)立的速率限制,其使用量不計(jì)入標(biāo)準(zhǔn)速率限制。但是,當(dāng)需求量較高時(shí),用戶可能會(huì)遇到訪問(wèn)受限或臨時(shí)排隊(duì)的情況,“因?yàn)槲覀冃枰胶獠煌脩舻目煽啃??!?/p>

      速度即智能

      Codex-Spark 針對(duì)交互式工作進(jìn)行了優(yōu)化,在這種工作環(huán)境中,低延遲與智能同樣重要。用戶可以與模型實(shí)時(shí)協(xié)作,在模型運(yùn)行過(guò)程中隨時(shí)中斷或重定向它,并快速迭代,獲得近乎實(shí)時(shí)的響應(yīng)。由于 Codex-Spark 注重速度,因此其默認(rèn)工作方式非常輕量級(jí):它只進(jìn)行最少的、有針對(duì)性的編輯,并且除非用戶口主動(dòng)要求,否則不會(huì)自動(dòng)運(yùn)行測(cè)試。

      Codex-Spark 運(yùn)行在 Cerebras 的晶圓級(jí)引擎(Wafer Scale Engine)3上,這是一款專為高速推理而打造的 AI 加速器,為 Codex 提供了一個(gè)優(yōu)先降低延遲的服務(wù)層。OpenAI與 Cerebras 合作,還將把這條低延遲路徑添加到其他服務(wù)器相同的生產(chǎn)服務(wù)堆棧中,使其能夠在 Codex 上無(wú)縫運(yùn)行,并為支持未來(lái)的模型做好準(zhǔn)備。

      OpenAI特意說(shuō)明,GPU 仍然是其訓(xùn)練和推理流程的基礎(chǔ),能夠提供最具成本效益的token,適用于廣泛的應(yīng)用。Cerebras 則在此基礎(chǔ)上更進(jìn)一步,在對(duì)延遲要求極低的工作流程中表現(xiàn)更好,能夠縮短端到端循環(huán),使 Codex 在迭代過(guò)程中響應(yīng)更加迅速。GPU 和 Cerebras 可以結(jié)合使用,針對(duì)單個(gè)工作負(fù)載實(shí)現(xiàn)最佳性能。

      Codex 將擁有快慢結(jié)合的兩種互補(bǔ)模式:一種是用于長(zhǎng)期推理和執(zhí)行的模式,另一種是用于快速迭代的實(shí)時(shí)協(xié)作模式。隨著時(shí)間的推移,這兩種模式將會(huì)融合,既讓用戶保持緊密的交互循環(huán),又能將耗時(shí)較長(zhǎng)的任務(wù)委托給后臺(tái)運(yùn)行的子代理;或者,當(dāng)需要兼顧廣度和速度時(shí),它還可以將任務(wù)并行分配給多個(gè)模型,因此無(wú)需預(yù)先選擇單一模式。

      關(guān)于Cerebras


      2015年創(chuàng)立,設(shè)計(jì)的處理器,實(shí)現(xiàn)了單晶圓級(jí)的計(jì)算、內(nèi)存和互連架構(gòu)。比H100快10-20倍,在Mistral, Perplexity等模型上使用,速度達(dá)到1000-1200token/秒。

      為什么WSE架構(gòu)在速度上碾壓GPU? GPU將模型權(quán)重保存在 HBM 中,每生成一個(gè) token,整個(gè)模型需要通過(guò)內(nèi)存總線傳輸。受限于帶寬瓶頸,無(wú)論計(jì)算能力,吞吐量都限制在 200-300 tps 左右。而Cerebras 的晶圓級(jí)引擎足夠大,可以將整個(gè)模型存儲(chǔ)在芯片上,無(wú)需外部?jī)?nèi)存,也無(wú)需總線。權(quán)重和計(jì)算都位于同一位置,能實(shí)現(xiàn)2500+ tps 的吞吐量。


      目前大模型的推理已經(jīng)成為瓶頸。訓(xùn)練展現(xiàn)了人工智能的顯著突破,但推理的成本決定了其經(jīng)濟(jì)可行性,維護(hù)和使用前沿模型成本高昂,OpenAI每1美元收入需要3美元成本,急需建立推理的經(jīng)濟(jì)性,不僅需要token的數(shù)量,更需要token的質(zhì)量,即所能創(chuàng)造的經(jīng)濟(jì)價(jià)值,而低延遲是目前在智能體長(zhǎng)程任務(wù)中比較迫切的需求。

      2026正是推理定制芯片戰(zhàn)爭(zhēng)爆發(fā)之年,TPU, Grok(LPU),Cerebras等。每家前沿AI實(shí)驗(yàn)室仍然需要GPU滿足基本的訓(xùn)練推理需求,但是在延遲、總擁有成本(TCO)、功耗等方面的競(jìng)爭(zhēng),其差異化將主要通過(guò)ASIC定制推理芯片實(shí)現(xiàn)。英偉達(dá)花了200億美元將推理芯片初創(chuàng)企業(yè)Groq的核心團(tuán)隊(duì)買下,也是為了把它的護(hù)城河拓得更寬、掘得更深。

      Andrew Feldman說(shuō):當(dāng)推理足夠快時(shí),全新的市場(chǎng)將隨之打開。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      春節(jié)剛過(guò)完,茅臺(tái)價(jià)格又跌下來(lái)了

      春節(jié)剛過(guò)完,茅臺(tái)價(jià)格又跌下來(lái)了

      深水財(cái)經(jīng)社
      2026-03-02 20:35:04
      沒想到竟然這么多工作需要保密的!網(wǎng)友:不讓看非看被一槍斃了

      沒想到竟然這么多工作需要保密的!網(wǎng)友:不讓看非看被一槍斃了

      另子維愛讀史
      2025-12-08 20:58:22
      伊朗高級(jí)教士中,87歲的哈梅內(nèi)伊不算老,有些人都奔著100歲去了

      伊朗高級(jí)教士中,87歲的哈梅內(nèi)伊不算老,有些人都奔著100歲去了

      黃娜老師
      2026-03-03 00:55:17
      阿布扎比再遭襲擊,阿聯(lián)酋發(fā)布全國(guó)緊急警報(bào)

      阿布扎比再遭襲擊,阿聯(lián)酋發(fā)布全國(guó)緊急警報(bào)

      極目新聞
      2026-03-03 07:31:26
      蘇聯(lián)“人猿雜交”實(shí)驗(yàn):5名女孩與11只猩猩參與,結(jié)局如何?

      蘇聯(lián)“人猿雜交”實(shí)驗(yàn):5名女孩與11只猩猩參與,結(jié)局如何?

      談史論天地
      2026-02-28 13:35:18
      讓明星集體“撞衫”,阿迪達(dá)斯急了?

      讓明星集體“撞衫”,阿迪達(dá)斯急了?

      有意思報(bào)告
      2026-03-02 12:01:03
      我存款1500萬(wàn),婆婆問(wèn)有多少,我說(shuō)5萬(wàn),小叔子急了,5萬(wàn)?我本錢誰(shuí)給

      我存款1500萬(wàn),婆婆問(wèn)有多少,我說(shuō)5萬(wàn),小叔子急了,5萬(wàn)?我本錢誰(shuí)給

      奶茶麥子
      2026-03-02 23:49:11
      浴缸陪睡只是冰山一角,多位助理服務(wù)明星方式曝光,一個(gè)個(gè)太離譜

      浴缸陪睡只是冰山一角,多位助理服務(wù)明星方式曝光,一個(gè)個(gè)太離譜

      離離言幾許
      2026-03-02 15:53:17
      巴拿馬運(yùn)河兩端港口運(yùn)營(yíng)恢復(fù),MSC完成首船裝卸

      巴拿馬運(yùn)河兩端港口運(yùn)營(yíng)恢復(fù),MSC完成首船裝卸

      海事服務(wù)網(wǎng)CNSS
      2026-03-02 19:58:04
      美軍瞞不住了!炸航母基地,炸11億美元雷達(dá),幾十萬(wàn)噸燃油被點(diǎn)燃

      美軍瞞不住了!炸航母基地,炸11億美元雷達(dá),幾十萬(wàn)噸燃油被點(diǎn)燃

      通鑒史智
      2026-03-03 10:03:36
      紀(jì)實(shí):浙江幼師幼兒園潛伏22年,警察曝光真實(shí)身份,家長(zhǎng)很后怕

      紀(jì)實(shí):浙江幼師幼兒園潛伏22年,警察曝光真實(shí)身份,家長(zhǎng)很后怕

      談史論天地
      2026-03-01 09:49:38
      內(nèi)塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國(guó)一總領(lǐng)館及一軍事基地,擊落3架美軍機(jī)

      內(nèi)塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國(guó)一總領(lǐng)館及一軍事基地,擊落3架美軍機(jī)

      新民晚報(bào)
      2026-03-02 19:04:01
      英國(guó)宣布參與對(duì)伊朗軍事行動(dòng) 戰(zhàn)機(jī)已升空

      英國(guó)宣布參與對(duì)伊朗軍事行動(dòng) 戰(zhàn)機(jī)已升空

      桂系007
      2026-02-28 23:56:12
      伊朗將回歸世俗社會(huì)

      伊朗將回歸世俗社會(huì)

      八桂知事
      2026-03-02 14:07:58
      霍爾木茲海峽禁航,已有油輪被擊沉!國(guó)內(nèi)船企:未接到封鎖消息,正準(zhǔn)備進(jìn)去裝貨

      霍爾木茲海峽禁航,已有油輪被擊沉!國(guó)內(nèi)船企:未接到封鎖消息,正準(zhǔn)備進(jìn)去裝貨

      第一財(cái)經(jīng)資訊
      2026-03-02 17:30:33
      馬刺整活整出歷史級(jí)浪漫!1-2-3-4-5 號(hào)球衣首發(fā)陣,太炸了!

      馬刺整活整出歷史級(jí)浪漫!1-2-3-4-5 號(hào)球衣首發(fā)陣,太炸了!

      林子說(shuō)事
      2026-03-03 07:48:19
      西班牙拒絕美方使用其基地打擊伊朗

      西班牙拒絕美方使用其基地打擊伊朗

      新華社
      2026-03-02 23:40:05
      為什么美國(guó)、日本第一時(shí)間就知道中國(guó)的決策、軍事及重大的工程等

      為什么美國(guó)、日本第一時(shí)間就知道中國(guó)的決策、軍事及重大的工程等

      Thurman在昆明
      2026-03-02 01:31:00
      娛樂(lè)圈的對(duì)賭協(xié)議有多恐怖?贏的人就是楊冪,輸者直接變成張國(guó)立

      娛樂(lè)圈的對(duì)賭協(xié)議有多恐怖?贏的人就是楊冪,輸者直接變成張國(guó)立

      林輕吟
      2026-03-01 19:35:00
      扎克伯格帶老婆看Prada秀,時(shí)尚圈坐C位!除老婆沒變其余全變了…

      扎克伯格帶老婆看Prada秀,時(shí)尚圈坐C位!除老婆沒變其余全變了…

      商務(wù)范
      2026-03-02 15:47:18
      2026-03-03 13:08:49
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      319文章數(shù) 62關(guān)注度
      往期回顧 全部

      科技要聞

      手機(jī)AI在MWC上卷出了新高度

      頭條要聞

      美國(guó)三架F-15E被擊落 美軍聲明中有個(gè)非常奇怪的地方

      頭條要聞

      美國(guó)三架F-15E被擊落 美軍聲明中有個(gè)非常奇怪的地方

      體育要聞

      35輪后積分-7,他們?cè)庥鍪飞献钤绲慕导?jí)

      娛樂(lè)要聞

      謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

      財(cái)經(jīng)要聞

      霍爾木茲海峽近乎停擺 布油直逼80美元

      汽車要聞

      長(zhǎng)安汽車2月銷量151922輛 環(huán)比逆勢(shì)增長(zhǎng)12.8%

      態(tài)度原創(chuàng)

      時(shí)尚
      旅游
      房產(chǎn)
      公開課
      軍事航空

      普通人穿衣真的很簡(jiǎn)單!單品選對(duì)、搭配合理,大方舒適又得體

      旅游要聞

      從“觀燈”到“玩燈” 達(dá)州“燈會(huì)+”激活夜經(jīng)濟(jì)新動(dòng)能

      房產(chǎn)要聞

      方案突然曝光!??诒睅煷蟾叫?,又有書包大盤殺出!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國(guó)中央司令部透露對(duì)伊朗動(dòng)武全部武器裝備清單

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版