<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI芯片,新混戰

      0
      分享至

      公眾號記得加星標??,第一時間看推送不會錯過。

      2026年春,AI行業又傳出一則重磅消息:據路透社報道,Anthropic正在探索自主設計芯片的可能性。這家年度化營收已突破300億美元、旗下Claude模型用戶激增的AI實驗室,正認真考慮從算力的消費者,演變為算力的定義者。

      消息人士坦承,相關計劃仍處于早期階段,公司尚未確定具體方案,也未組建專門團隊。Anthropic最終仍可能選擇只采購芯片,而非自行設計。但即便只是可能性,也足以說明一些問題。

      目前,Anthropic同時使用谷歌母公司Alphabet設計的TPU張量處理單元,以及亞馬遜的Trainium芯片來開發并運行Claude。就在本周,該公司還與谷歌及博通簽署了一項長期協議,后者正是谷歌TPU的核心設計支持方。一邊簽下百億級的外部采購協議,一邊悄悄探路自研,這種左右兩手并舉的姿態,像極了幾年前的Meta和微軟,而它們在今天都已擁有了自己的專屬芯片。

      設計一款頂級AI芯片,業內估算約需五億美元,但在價格之外更值得關注的,是Anthropic此舉背后的行業信號。當一家純模型公司開始認真思考自研硅片,這場關于AI推理的硬件爭奪戰,實際上已進入了新的烈度。

      推理,成為新的主戰場

      這兩年,AI行業發生了一次劇變,大量算力需求從訓練側迅速轉向推理側。

      訓練階段,動輒耗費數周乃至數月,需要大規模GPU集群并行運算,英偉達在這一側的統治地位已近乎無可撼動。但推理不同。推理是模型每一次響應用戶請求時實時發生的計算,它追求的是低延遲、高吞吐、低能耗,而這些目標,與GPU所擅長的領域并不完全吻合。

      根據巴克萊的預測,到2026年,推理計算需求將占AI總算力需求的70%以上,是訓練需求的4.5倍,可以說,未來AI芯片市場的真正決戰就在推理。

      英偉達在訓練端積累了十年的護城河,若這條護城河無法延伸到推理端,那么整個行業格局就面臨重寫。正因如此,英偉達在去年年底正式出手,宣布與AI推理芯片初創公司Groq達成非獨家許可協議。Groq創始人兼CEO喬納森·羅斯、總裁桑尼·馬德拉及多名核心工程師,隨即加入英偉達。外媒援引知情人士的說法,這筆交易的對價約為200億美元。

      英偉達官方措辭謹慎,強調只是技術授權加人才引入,而非傳統收購。但這種非典型收購的玩法,在硅谷已經相當普遍,它既能規避繁瑣的反壟斷審查,又能實質性地將目標技術和核心團隊收入囊中。

      Groq的故事本來相當精彩。創始人羅斯曾是谷歌TPU項目的核心成員,深知GPU架構在推理場景下的天然局限:數千個并行計算單元、極為復雜的內存調度邏輯,這些特性在訓練時是優勢,在推理時反而造成不可預測的延遲抖動。

      也因為如此,Groq選擇了一條截然不同的路:徹底取消硬件層面的調度器,改由編譯器在代碼階段就確定每一比特數據的流轉路徑,讓芯片像一條精確到納秒的自動化流水線運轉。這種架構被命名為LPU,即語言處理單元,在主流大模型的推理測試中,其單詞生成速度可達英偉達GPU的十倍以上,而每token的能耗僅為后者的十分之一。

      憑借這種極致性能,Groq吸引了超過150萬開發者用戶,并先后獲得思科、三星、貝萊德等頂級機構的多輪投資,估值一度達69億美元。然而成也蕭何,敗也蕭何。正是Groq過于耀眼的推理性能,讓它成為了黃仁勛眼中最需要被鎖定的目標。

      表面上,英偉達收購Groq是在補全推理側的技術版圖,而更深入看,這是一次防御性整合,通過將最強外部挑戰者之一收編進自己的生態,英偉達拿走了那些沒有自研芯片能力的二線云廠商和AI軟件公司手中的議價籌碼。失去了Groq作為替代選項,那些不愿被英偉達征稅的企業,如今面臨的選項驟然收窄。

      巨頭各自磨刀

      然而釜底抽薪的困局,未必會持續太久。

      事實上,早在Groq崛起之前,各大云巨頭就已經在獨立謀劃自己的算力出路。谷歌有TPU,亞馬遜有Trainium,微軟有Maia,這三條自研路線,如今都已走到了可以向外兜售的成熟階段。

      谷歌的第七代TPU,代號Ironwood,2025年底正式發布并上市。與前代相比,其單芯片性能提升4倍以上,單集群最高可互聯9216顆芯片。谷歌對這一代產品的定位毫不掩飾:推理時代最省錢的商業引擎。從2015年因內部算力瓶頸被迫自研,到2025年將TPU開放部署到客戶自有數據中心,谷歌用十年時間,把一個應急項目打磨成了戰略武器。Anthropic宣布未來Claude系列的訓練與部署將使用多達一百萬顆TPU,更讓Ironwood的商業價值得到了市場層面的權威背書。

      亞馬遜走的是另一條路。AWS長期高度依賴旗下Annapurna Labs自研的芯片,Trainium系列大致對標英偉達GPU,但側重點在于降低云基礎設施成本、減少對外部供應商的依賴。此番AWS與Cerebras簽署多年合作協議,計劃將Cerebras的晶圓級引擎WSE芯片引入數據中心,與自研Trainium芯片并行部署,正是這種自研為主、外采為輔邏輯的具體體現。

      AWS的目標非常明確,用Trainium承接低速、低價的推理需求,用Cerebras芯片鎖定那些對延遲極度敏感、愿意為速度付溢價的高端客戶。

      對于推理芯片而言,它不像訓練芯片那樣追求短期的速度,其更看重長期的能耗效益。一塊英偉達GPU功耗約700瓦,而同等算力的專用推理芯片功耗可控制在200瓦以內,對于需要數十萬片推理芯片支撐的超大規模應用,這種差距每年能帶來數億美元的成本節省。這也是谷歌、亞馬遜、Meta等云巨頭爭相押注ASIC專用芯片的核心原因之一。

      據最新消費透露,Meta和博通達成了1Gw的訓練和推理芯片合作協議,這勢必會給本就“混亂”的推理芯片市場,帶來新的催化劑。

      異構時代,新聯盟崛起

      如果說云巨頭的自研路線是一種有充足資源保障的長期賭注,那么英特爾與SambaNova的聯手,則代表了另一種更具現實感的突圍路徑。

      2026年,SambaNova宣布與英特爾推出異構硬件推理方案,采用GPU負責預填充、英特爾至強6處理器作為主控與執行CPU、SambaNova RDU負責解碼的三層架構,專為智能體AI工作負載設計。這套方案將于2026年下半年面向企業、云服務商及主權AI項目開放。

      SambaNova指出,純GPU體系擅長并行化的預填充環節,但在生產環境的推理任務中,CPU的工具調度與專用推理加速器的解碼效率,才是決定整體速度與成本的關鍵變量。

      而其測試數據顯示,英特爾至強6處理器的LLVM編譯速度較基于Arm架構的服務器CPU提升超50%,向量數據庫性能最高快70%,這兩個指標,恰好切中代碼智能體工作流的核心性能瓶頸。

      英特爾在這場合作中的角色耐人尋味。曾經的PC霸主,在GPU時代幾乎被邊緣化出AI芯片主戰場,如今借助至強6的CPU控制調度優勢,正在異構推理方案中重新找回存在感。數據中心軟件生態以x86架構為基礎,也讓英特爾重新回到了AI舞臺中心。

      大芯片,闖入視線

      Cerebras是另一個值得單獨書寫的名字。

      這家專注晶圓級AI芯片的初創公司,曾在2024年提交IPO申請,隨即撤回,資本市場對其前景一度疑慮重重。但隨后,OpenAI與Cerebras簽署了價值超百億美元的合作協議,為ChatGPT提供算力,這一消息讓Cerebras重回公眾視野,也讓那些曾經觀望的機構重新審視其技術價值。2026年2月,Cerebras完成10億美元新一輪融資,總融資額達26億美元,投后估值約230億美元。

      Cerebras的核心技術是晶圓級引擎WSE,將整塊晶圓作為一顆芯片使用,突破了傳統芯片的物理切割限制,在特定推理任務中的延遲表現極為出色。據Cerebras聲稱,其芯片在推理解碼環節的速度,最高可達英偉達GPU的25倍。

      此番AWS宣布與Cerebras簽署多年合作協議,將WSE芯片引入數據中心用于AI推理,標志著這家初創公司完成了一次關鍵的身份躍遷,從融資故事,變成了全球最大云平臺的供應商。

      AWS選擇Cerebras,其背后邏輯與OpenAI的選擇一脈相承:對于編程輔助、智能體任務這類對響應速度極度敏感的場景,每一毫秒的延遲縮減都直接對應用戶體驗和商業價值,而這恰好是GPU的軟肋所在。

      對于Cerebras而言,越來越多的人用AI解決越來越難的問題,對速度的需求只會增不會減。若速度本身就是產品價值所在,那么為速度付溢價就是理所當然的商業行為。這套邏輯,正在越來越多的企業端被接受。

      CoreWeave,

      算力市場的新引力中心

      算力爭奪戰的背面,是基礎設施供給側的重構。而在這一端,CoreWeave的角色愈發不可忽視。

      2025年,Meta率先與CoreWeave簽署供應協議,約定在2031年前采購142億美元的AI算力;近日提交SEC的文件顯示,Meta已追加協議,將在2032年前額外采購210億美元的算力。這筆新協議的加入,將CoreWeave的訂單儲備推至878億美元,其中Meta一家便占去約40%。

      CoreWeave的崛起,是GPU算力由稀缺商品向基礎設施演變這一過程的縮影。作為純粹的算力租賃商,它提供的并非模型能力,而是讓模型跑得起來的底層支撐。在三大云巨頭之外,AI企業需要一個不綁定平臺生態的算力選項,而CoreWeave恰好填補了這個空缺。

      2025年全年,CoreWeave實現銷售額51.3億美元,較上年增長約1.7倍。其數據中心規模已擴至43座,在用電力容量達850兆瓦。公司配備的約60萬張GPU,以英偉達H100、H200為主干,Blackwell系列占比持續提升。簽約總電力容量則已達3500兆瓦,這個數字,是其當前在用容量的四倍有余。

      然而CoreWeave的擴張邏輯,也正是其面臨的最大結構壓力所在。為覆蓋數據中心擴建成本,公司近日宣布定向發行總計47.5億美元債券。在手現金不足40億美元的情況下,要在2026年完成300億至350億美元的資本支出,意味著需要持續依靠外部融資維持高速擴張。CoreWeave的投資方們,顯然下注的是算力需求仍將長期高增長這一核心判斷。

      混戰,仍在繼續

      Anthropic開始自研芯片,英偉達200億美元收購Groq,谷歌十年磨一劍將TPU打造成標桿產品,亞馬遜將Cerebras引入自家數據中心構建差異化推理組合,英特爾聯手SambaNova在異構推理市場爭奪一席之地等等,這些看似分散的事件,其實都指向了推理這一新戰場。

      越多越多人意識到,AI的重心,正在從如何訓練出更好的模型轉向如何以更低的成本、更快的速度推理更多的請求。這個轉變,使得之前以GPU為核心的算力體系,開始進行一場浩浩蕩蕩的轉變。

      這一輪競爭,與早年GPU對CPU的替代并不相同。那是一場新產品對舊產品的單向碾壓。而今天的推理芯片之爭,更像是一個復雜生態內部的分工重組,沒有任何一種架構能獨占所有場景,異構組合正在成為主流。GPU處理高度并行的預填充,專用推理芯片承擔解碼,CPU負責調度協調,云端與邊緣端各有側重,每個環節都有多個玩家競逐。

      這也意味著,勝負遠未分曉。

      對Anthropic而言,探索自研芯片是一種對算力自主權的主動追求,也是一張防止被上游供應商裹挾的保險單。但芯片研發的長周期與高投入,意味著這條路走起來并不輕松。對英偉達而言,CUDA生態護城河依然深厚,但推理端越來越明顯的性能-成本缺口,正在成為所有潛在挑戰者共同瞄準的突破口。對類似Groq的其他技術競爭者而言,技術領先并不必然轉化為商業勝利,被收購的可能性也在不斷增大。

      戰線已經拉開,參與者的名單還在增加。這場AI推理的算力混戰,才剛剛走進它最熱烈的章節。

      *免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。

      今天是《半導體行業觀察》為您分享的第4377內容,歡迎關注。

      加星標??第一時間看推送

      求推薦

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      奧科耶:兩年前我本可以轉會國米,但最終他們簽下了何塞普

      奧科耶:兩年前我本可以轉會國米,但最終他們簽下了何塞普

      懂球帝
      2026-04-18 22:57:54
      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

      干史人
      2026-04-14 21:10:03
      鞏固拓展經濟穩中向好態勢——國家發展改革委介紹“十五五”時期推動經濟社會高質量發展有關情況

      鞏固拓展經濟穩中向好態勢——國家發展改革委介紹“十五五”時期推動經濟社會高質量發展有關情況

      中國日報網
      2026-04-18 08:54:08
      全紅嬋不再隱瞞!坦言身材發胖原因,原來高敏4年內提醒過2次

      全紅嬋不再隱瞞!坦言身材發胖原因,原來高敏4年內提醒過2次

      青橘罐頭
      2026-04-01 17:09:37
      喝酒四巨頭一年內相繼離世,有人當日飲4瓶白酒

      喝酒四巨頭一年內相繼離世,有人當日飲4瓶白酒

      奇怪的鯊魚們
      2026-04-18 04:07:39
      鄧家佳黑絲

      鄧家佳黑絲

      情感大頭說說
      2026-04-16 07:13:06
      【完整版】庫里:希望科爾開心 勇士需重塑基礎而不是天天談奪冠

      【完整版】庫里:希望科爾開心 勇士需重塑基礎而不是天天談奪冠

      畫夕
      2026-04-18 14:16:10
      27公司4月18日上午發布重大利空,終止并購 摘帽2家 大減持公司6家

      27公司4月18日上午發布重大利空,終止并購 摘帽2家 大減持公司6家

      股市皆大事
      2026-04-18 11:42:24
      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      夜深愛雜談
      2026-04-18 21:37:56
      闞清子要是沒胖,能爭一爭門面吧?看到她以前的樣子,迷人四射

      闞清子要是沒胖,能爭一爭門面吧?看到她以前的樣子,迷人四射

      蒂蒂茱家
      2026-04-18 19:22:17
      男演員千萬別整容!鐘漢良新劇里的男四號,臉頰歪的真讓人出戲

      男演員千萬別整容!鐘漢良新劇里的男四號,臉頰歪的真讓人出戲

      往史過眼云煙
      2026-04-16 14:43:01
      新中國對外輸出革命史:上萬知青奔赴緬甸,結局如何?

      新中國對外輸出革命史:上萬知青奔赴緬甸,結局如何?

      談史論天地
      2026-04-18 14:30:03
      那晚我住女朋友家,她媽說你倆今晚敢睡一個被窩,我就掀你們被子

      那晚我住女朋友家,她媽說你倆今晚敢睡一個被窩,我就掀你們被子

      千秋文化
      2026-04-16 20:08:23
      為何越來越多女高管染上艾滋病?2位35歲的女高管,公開講述經歷

      為何越來越多女高管染上艾滋病?2位35歲的女高管,公開講述經歷

      千秋文化
      2026-04-16 20:18:37
      粟裕包圍胡璉主力,毛主席急電:快撤,這是陷阱!粟裕大贊高明

      粟裕包圍胡璉主力,毛主席急電:快撤,這是陷阱!粟裕大贊高明

      史之銘
      2026-04-18 03:28:33
      中央第五巡視組出動了!這些問題抓緊反映,投訴舉報方式公布

      中央第五巡視組出動了!這些問題抓緊反映,投訴舉報方式公布

      細說職場
      2026-04-18 11:39:57
      多名院士調查發現:喝一次酒,就等于洗一次肝,真的假的?

      多名院士調查發現:喝一次酒,就等于洗一次肝,真的假的?

      垚垚分享健康
      2026-04-18 14:32:50
      八年保姆反水?馬筱梅疑似走大 S老路,小楊阿姨直播揭穿其小心思

      八年保姆反水?馬筱梅疑似走大 S老路,小楊阿姨直播揭穿其小心思

      離離言幾許
      2026-03-14 16:47:16
      幾毛錢一包的零食,包裝上寫著“勿忘國恥是每個中國人的出廠設置”,廠家回應:是企業情懷,也是大家共同心聲

      幾毛錢一包的零食,包裝上寫著“勿忘國恥是每個中國人的出廠設置”,廠家回應:是企業情懷,也是大家共同心聲

      觀威海
      2026-04-17 17:52:13
      日本前首相發出滅頂警告:對中國開槍,日本必遭受珍珠港式毀滅

      日本前首相發出滅頂警告:對中國開槍,日本必遭受珍珠港式毀滅

      丹徒生
      2025-12-13 10:10:31
      2026-04-19 00:20:49
      半導體行業觀察 incentive-icons
      半導體行業觀察
      專注觀察全球半導體行業資訊
      13436文章數 34878關注度
      往期回顧 全部

      科技要聞

      傳Meta下月擬裁8000 大舉清退人力為AI騰位

      頭條要聞

      伊朗革命衛隊向油輪開火 伊朗最高領袖發聲

      頭條要聞

      伊朗革命衛隊向油輪開火 伊朗最高領袖發聲

      體育要聞

      時隔25年重返英超!沒有人再嘲笑他了

      娛樂要聞

      劉德華回應潘宏彬去世,拒談喪禮細節

      財經要聞

      "影子萬科"2.0:管理層如何吸血萬物云?

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價14.48萬元起

      態度原創

      藝術
      本地
      房產
      時尚
      公開課

      藝術要聞

      耗資600億,貴陽人的“上海外灘”,現在去看,荒得嚇人

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      房產要聞

      官宣簽約最強城更!海口樓市,突然殺入神秘房企!

      選對發型,真的能少走很多變美彎路

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版