<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Agent運行提速10倍!斯坦福教授押注異構推理,破解AI推理瓶頸

      0
      分享至

      過去兩年,我們已經習慣了與大模型對談,但 AI 的進化并未止步于此。現在,行業正集體轉向一個更具野心的目標——AI Agent。不同于只會見招拆招的聊天機器人,AI Agent 更像是一個擁有自主行動能力的“數字員工”:它會自主上網搜集情報、多維分析海量數據、甚至跨平臺調用各種專業工具完成復雜的業務閉環。

      但問題來了,在一次完整的執行流中,Agent 會產生海量的計算步驟,且各環節對硬件的需求存在本質差異:邏輯推理階段依賴極速計算,知識檢索階段渴求高帶寬存儲,而工具調用則對網絡 I/O 的響應時延有著近乎苛刻的要求。

      這種復雜的、多階段的任務特性,導致了當前算力架構中一個極其尷尬的悖論:由于缺乏精細化的調度能力,開發者往往只能將所有任務都扔到同一種硬件(通常是高端 GPU)上跑,而硬件性能與任務需求其實并不匹配。

      據統計,目前全球數據中心硬件的平均利用率僅維持在 15%-30% 之間。這意味著,在 AI 浪潮狂熱擴張的背后,每年有價值數百億美元的算力資源正處于隱性的閑置與浪費之中。

      為了打破這種桎梏,一個被視為下一代 AI 基礎設施核心的理念——“異構推理”應運而生。異構推理就是讓 AI 在推理時,不再只盯著一種芯片使勁,而是根據任務的不同需求,把工作拆開,分給最適合的多種硬件去協同完成。

      權威 IT 研究與顧問咨詢公司 Gartner 預測,到 2028 年,40% 的領先企業會采用混合計算架構,把 CPU、GPU、ASIC、甚至不同代際的芯片混在一起用。同時,2026 年全球 AI 基礎設施支出預計將達到約 1.36 萬億美元,推理部分占比正快速超過訓練,成為 AI 計算的主戰場。

      近日,總部位于美國舊金山的 AI 基礎設施初創公司 Gimlet Labs 宣布完成 8,000 萬美元 A 輪融資。此輪由知名風投 Menlo Ventures 領投,至此,該公司累計融資達到 9,200 萬美元。

      天使投資人包括紅杉資本的合伙人比爾·科夫蘭(Bill Coughran)、斯坦福大學教授及網絡專家尼克·麥基翁(Nick McKeown)、VMware 前首席執行官拉古·拉古拉姆(Raghu Raghuram)以及英特爾首席執行官陳立武(Lip-Bu Tan)。值得注意的是,英特爾前首席技術與人工智能官 Sachin Katti(薩欽·卡蒂)參與其中,擔任 Gimlet 的顧問,他曾與創始人兼首席執行官 Zain Asgar(扎因·阿斯加)在斯坦福共同授課并合作相關研究。

      Gimlet 針對上述問題推出了一個無服務器的 AI 推理云平臺 Gimlet Cloud。它就像是一個聰明的“云端指揮部”,會自動將復雜的 AI Agent 工作拆解成很多環節,然后根據每個環節的需求,精準地分配給最合適的硬件。比如計算重的用高端 GPU,內存重的找加速器,聯網重的用帶快網的機器。甚至能把英偉達、AMD、英特爾、ARM 等不同廠商、不同代際的芯片混在一起協同工作。

      根據 Gimlet 官方披露的數據,這種異構調度方式能讓同樣的 AI Agent 在不增加電費和硬件投入的情況下,運行速度提升 3 到 10 倍,顯著降低每 token 成本,同時解鎖原本閑置的老舊算力。

      為了讓模型在各種新舊、不同品牌的芯片上都能絲滑運行,Gimlet 還開發了一款工具 kforge,它能用 AI 自己幫模型寫出最優的底層代碼,讓不同硬件自動跑得更順,省掉程序員大量手動調試的功夫。

      正如阿斯加所言,“我們的目標基本上是設法將當今 AI 工作負載的效率提升 10 倍。”

      阿斯加是斯坦福大學的兼職教授,曾在英偉達擔任 GPU 架構師、在谷歌擔任軟件工程師。他與其他三位聯合創始人曾共同創辦了知名可觀測性平臺 Pixie Labs,后被 New Relic 收購。而就在被收購的兩個月前,該公司剛剛完成了由 Benchmark 領投的 900 萬美元 A 輪融資。


      圖 | 創始團隊(來源:Gimlet )

      在宣布融資的同時,Gimlet 還透露,公司目前營收已達八位數,自結束隱身模式以來客戶群增長了兩倍,其客戶群在過去四個月內增長了一倍以上,目前包括一家頂尖的前沿模型實驗室和一家超大規模云服務商,但并未透露兩家公司的名稱。

      此外,該公司還與包括 AMD、ARM、Cerebras、d-Matrix、英特爾和英偉達在內的領先人工智能芯片公司開展合作。

      1.https://gimletlabs.ai/blog/announcing-series-a

      2.https://www.gartner.com/en/newsroom/press-releases/2025-10-20-gartner-identifies-the-top-strategic-technology-trends-for-2026

      運營/排版:何晨龍Agent運行提速10倍!斯坦福教授押注異構推理,破解AI推理瓶頸

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      經伊朗這一戰,中美之間至少50年內不會爆發戰爭,理由主要有三點

      經伊朗這一戰,中美之間至少50年內不會爆發戰爭,理由主要有三點

      南權先生
      2026-04-07 15:31:40
      切爾西曼城搶瘋了!爭冠名帥成香餑餑,他要取代瓜迪奧拉?

      切爾西曼城搶瘋了!爭冠名帥成香餑餑,他要取代瓜迪奧拉?

      瀾歸序
      2026-04-08 05:48:45
      第91分鐘絕殺,阿森納送給葡體本賽季歐冠主場首敗

      第91分鐘絕殺,阿森納送給葡體本賽季歐冠主場首敗

      懂球帝
      2026-04-08 05:15:06
      女首富陳麗華離世,被曝生前已分好遺產,遲重瑞放棄生育獲百億

      女首富陳麗華離世,被曝生前已分好遺產,遲重瑞放棄生育獲百億

      萌神木木
      2026-04-07 12:18:10
      靠著亂翻譯特朗普的話,來獲得快樂,真不太體面!

      靠著亂翻譯特朗普的話,來獲得快樂,真不太體面!

      走讀新生
      2026-04-07 08:58:51
      河北1光棍在弟弟離世后,盡心幫扶弟媳,誰曾想,弟媳竟向他表白

      河北1光棍在弟弟離世后,盡心幫扶弟媳,誰曾想,弟媳竟向他表白

      云景侃記
      2026-04-07 22:25:55
      戶口本或將退出歷史舞臺?5月10日全國通辦,這些事提前了解

      戶口本或將退出歷史舞臺?5月10日全國通辦,這些事提前了解

      復轉這些年
      2026-04-06 22:44:37
      媒體用3D動畫還原安徽女童遇害案:全程一目了然,令人細思極恐

      媒體用3D動畫還原安徽女童遇害案:全程一目了然,令人細思極恐

      南城無雙
      2026-04-08 00:58:55
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      林小異已任常州市委副書記

      林小異已任常州市委副書記

      上觀新聞
      2026-04-07 20:56:18
      美股三大股指期貨短線拉升 市場對美伊協議達成的樂觀情緒升溫

      美股三大股指期貨短線拉升 市場對美伊協議達成的樂觀情緒升溫

      財聯社
      2026-04-07 16:44:04
      伊朗哈爾克島傳出爆炸聲,疑是美軍發起攻擊?

      伊朗哈爾克島傳出爆炸聲,疑是美軍發起攻擊?

      鳳眼論
      2026-04-07 18:45:51
      阿爾特塔:我有過進不了球的感覺,我們總是缺少最后一傳

      阿爾特塔:我有過進不了球的感覺,我們總是缺少最后一傳

      懂球帝
      2026-04-08 05:57:06
      游客稱7人點3盆米飯被收78元,華陰市監局介入,飯店:小份米飯3元,大盆米飯約8小碗,用五常大米和礦泉水蒸煮

      游客稱7人點3盆米飯被收78元,華陰市監局介入,飯店:小份米飯3元,大盆米飯約8小碗,用五常大米和礦泉水蒸煮

      瀟湘晨報
      2026-04-07 17:12:51
      安徽6歲女童遇害:遇害指認現場,群眾含淚發聲,律師建議死刑!

      安徽6歲女童遇害:遇害指認現場,群眾含淚發聲,律師建議死刑!

      眼光很亮
      2026-04-07 11:45:56
      詹姆斯評本季MVP:文班絕對是候選人 但SGA約基奇東契奇略勝一籌

      詹姆斯評本季MVP:文班絕對是候選人 但SGA約基奇東契奇略勝一籌

      羅說NBA
      2026-04-08 06:10:29
      拉亞是世一門嗎?塔帥:不知道該用什么形容詞,很高興擁有他

      拉亞是世一門嗎?塔帥:不知道該用什么形容詞,很高興擁有他

      懂球帝
      2026-04-08 06:29:40
      張雪峰團隊復播!爆了

      張雪峰團隊復播!爆了

      李東陽朋友圈
      2026-04-08 00:20:18
      4月7日俄烏最新:4年來的第一次

      4月7日俄烏最新:4年來的第一次

      西樓飲月
      2026-04-07 20:08:23
      標價近20萬的紅寶石戒指,上海老夫妻花了不到3萬買下,卻被店主尾隨跟蹤并告上法庭!法院判了→

      標價近20萬的紅寶石戒指,上海老夫妻花了不到3萬買下,卻被店主尾隨跟蹤并告上法庭!法院判了→

      縱相新聞
      2026-04-07 08:40:07
      2026-04-08 06:44:50
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16549文章數 514855關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      特朗普稱美方正就伊朗戰爭進行“激烈談判”

      頭條要聞

      特朗普稱美方正就伊朗戰爭進行“激烈談判”

      體育要聞

      霸氣!趙心童:斯諾克的未來定屬于中國 20年后50%選手都是中國人

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產

      財經要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態體驗

      態度原創

      教育
      家居
      手機
      本地
      數碼

      教育要聞

      “祖籍成都?”倆初中男孩合照走紅,網友:正常男生不會這樣坐

      家居要聞

      雅致愜意 感知生活之美

      手機要聞

      榮耀WIN2系列曝光:10000mAh電池+2nm芯片,續航性能雙巔峰!

      本地新聞

      跟著歌聲游安徽,聽古村回響

      數碼要聞

      MacBook Neo爆火背后,蘋果芯片庫存要見底了?

      無障礙瀏覽 進入關懷版