<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI價格倒掛終結:算力、模型同步漲價,純應用公司死局

      0
      分享至

      文 | 舒書

      近日,AI產業的價格邏輯正在發生根本性逆轉。

      過去兩年,算力貴、模型補貼是常態——算力成本高企,但模型API價格被廠商壓到成本線以下,靠資本輸血維持低價幻覺。現在,這條產業鏈正在經歷成本傳導:算力漲價終于傳導到了模型層,模型也開始漲了。

      據IT桔子數據,2026年Q1,已有超過10家AI應用初創公司停止運營或轉型(樣本覆蓋約200家純API創業公司)。這不是短期回調,是AI產業的刮骨療毒——純應用公司的好日子,徹底結束了。

      一、算力漲了多少?——數據說話,但注意價格雙軌

      先看一組可追溯的第三方數據(2025年初→2026年4月):


      注1:TFLOPS(每秒萬億次浮點運算)是衡量AI芯片算力的核心指標。

      注2:463%漲幅是現貨價或補貼退坡后的恢復價。頭部大廠(字節、阿里、騰訊)及AI獨角獸通常與云廠商簽有長協價或擁有自有算力儲備,實際成本漲幅遠低于此。漲價對中小創業者的打擊是毀滅性的,而對有儲備的大廠是利潤修復——馬太效應正在加速行業洗牌。

      算力漲價的底層動因:HBM內存由SK海力士、三星、美光三家壟斷,2025年下半年以來價格漲幅超過50%,直接推高AI芯片成本。CoWoS封裝產能同樣供不應求,臺積電2025年產能翻倍后仍無法滿足需求,2026年訂單已排至年底。這兩個環節是算力漲價的硬約束,短期內無解。

      算力不是成本,是AI產業的硬通貨。HBM和CoWoS不是漲價的誘因,是卡脖子的命門。

      二、Token消耗的真實結構:工具調用才是大頭

      行業熱議思考Token海嘯,但公開數據揭示了另一個真相。

      據OpenAI 2025年12月公開的技術博客,GPT-4的推理成本中,約60-70%來自工具調用和上下文處理,這一比例在復雜Agent任務中會更高。以“訂機票+酒店+租車”的復合任務為例:用戶輸入占比不足1%,模型內部推理(思考鏈)約占5-10%,工具調用(API交互)約占85-90%,最終輸出不足5%。

      關鍵發現:Token消耗的大頭是工具調用,不是模型思考。這意味著關閉思考鏈只能省5-10%,省不了大頭;調用次數由任務復雜度決定,技術優化空間有限;Agent成本大頭是反復調用外部工具,不是模型推理。

      三、誰在受益,誰在受損?——產業鏈傳導分析


      真正的受損者是純API創業公司和出海開發者。它們無自有流量生態、無算力囤貨、無私有化部署能力,更無法向用戶轉嫁成本。

      四、技術壓制:從模型優化到駕馭工程

      漲價沒有失控,是因為技術在反向省Token。但技術不是無限的。技術能緩沖漲價壓力,但擋不住需求爆發——該漲的,終究躲不過。


      技術能省多少?據NVIDIA 2025年GTC大會公開數據,通過量化+KV Cache優化,推理成本可降低50-70%。但同期Agent任務復雜度提升,據OpenAI披露,GPT-4到GPT-4o的推理成本下降了50%,但用戶調用量增長了5倍。技術優化追不上需求膨脹。

      駕馭工程(Harness Engineering)正在成為2026年最關鍵的降本新范式。上述技術屬于模型側優化——讓模型更小、更快。而在應用側,如何通過工程框架約束AI的行為,避免其胡思亂想和無效循環,是更直接的降本手段。

      駕馭工程是一套為AI智能體構建運行環境、約束規則與反饋閉環的工程化新范式。據LangChain 2025年Q4報告(測試場景:復雜Agent任務,如多輪客服、自動化流程),使用完善的Harness框架后,Agent任務的平均Token消耗可降低40-60%。某電商AI客服公司應用Harness框架后,單次對話平均Token消耗從12,000降至5,000,降幅58%。但需注意,簡單任務(如單輪問答)中搭建Harness框架的成本可能高于收益,中小團隊也面臨技術門檻。

      有沒這套馬具,Token消耗可能相差數倍。這不僅是技術優化,更是從算法題轉向工程題的關鍵。

      一位云廠商技術負責人在2025年Q4公開演講中指出:“我們的推理成本每年能降30%,但客戶用量每年漲200%。技術是緩沖器,不是剎車。”

      五、開源模型:純應用公司的替代路徑

      前面我們討論的都是閉源模型API漲價,但開源模型提供了另一條路。

      Llama 3、Qwen2.5、DeepSeek-V3等開源模型,允許企業私有化部署。據Meta 2025年7月發布的Llama 3技術報告,在多項基準測試中,Llama 3 70B的性能已接近GPT-4,但部署成本僅為GPT-4 API調用的20-30%。

      開源模型的破局價值:

      成本斷崖下降:部署開源模型后,邊際成本趨近于“電費+硬件折舊”

      數據安全:私有化部署,數據不出域

      可定制:企業可根據場景精調,不受API限制

      但開源模型不是萬能藥:

      部署門檻高:需要自建算力、運維團隊。據智東西2026年1月調研,一個3人精調團隊在一線城市的年薪資成本約150萬

      模型能力與閉源頂尖仍有差距:據LMSYS Chatbot Arena Leaderboard 2026年2月數據,Llama 3 405B與GPT-4o仍有約5%的Elo分差

      精調需要專業人才:不是“下載即用”

      一位AI基礎設施服務商在2026年Q1公開分享中指出:“我們的客戶中,約60%已從純API轉向開源模型+私有化部署,平均成本降低60-70%。”

      六、國產替代:昇騰的真實水平

      華為昇騰是國產替代的核心選項。根據華為2025年9月全聯接大會公開數據及IDC 2025年Q4報告:


      遷移的核心難點:CUDA代碼需重寫為CANN,部分算子缺失需自研,集群穩定性仍在追趕。

      華為官方數據顯示,昇騰910B在典型推理場景中可達H100的70-80%性能。據華為昇騰社區2026年1月公開案例,某互聯網公司從英偉達遷移到昇騰,耗時5個月,綜合算力成本降低35%。

      轉型失敗案例:據InfoQ 2025年12月報道,某AI公司因未充分評估遷移成本,倉促從英偉達遷移到昇騰,3個月后因集群穩定性問題導致服務中斷,最終放棄遷移,損失超200萬。教訓:國產替代需要充分的技術儲備和測試周期,不是即插即用。

      中小企業實操路徑:

      • 算力租賃:華為云、曙光智算等平臺提供昇騰算力租賃,按小時計費,無需自建
      • 開源+國產算力組合:Qwen/Llama + 昇騰,形成“軟件+硬件”雙國產化
      • 參考成本:昇騰算力租賃約¥8-12/卡/小時,約為H100國內租賃價的40-50%
      七、中美差異:美國漲價是賺更多,中國漲價是活下去


      本質差異:美國漲價是賺更多,中國漲價是活下去。這種差異正在產生深遠影響:一是倒逼國內企業加速國產算力替代,昇騰、寒武紀等廠商迎來窗口期;二是迫使中小企業從燒錢換增長轉向精細化運營,不具備成本控制能力的玩家將被加速淘汰。

      據公開財報,OpenAI 2025年營收37億美元,目標2026年翻倍。字節豆包、阿里千問至今仍在虧損。一位云廠商高管在2026年Q1公開采訪中坦言:“我們在中國的API定價是全球最低的,漲一點只是從虧本變成微虧。”

      八、端側遷移:純應用公司的逃生通道

      端側AI正在成為純應用公司的諾亞方舟。隨著2025-2026年手機和PC NPU性能爆發(驍龍8 Gen 5 NPU算力達45 TOPS,蘋果M4芯片NPU達38 TOPS),大量輕量級應用正在從云端遷移到端側。

      端側遷移的具體路徑:

      • 端側模型選型:輕量級任務用MobileLLM、TinyLlama(百MB級別),中等任務用Phi-3、Qwen-1.8B(1-3GB)
      • 部署成本:端側推理邊際成本為零,但需投入開發成本(模型轉換、端側適配),據行業調研,單次端側適配成本約20-50萬
      • 適用場景:修圖、翻譯、語音助理、本地文檔處理等對實時性要求高、對模型能力要求適中的場景

      據Counterpoint 2025年Q4報告,2026年全球端側AI推理占比預計將從2024年的15%提升至35%。端側推理不僅是技術路徑,更是純應用公司對抗云端漲價的唯一逃生通道。

      九、隱性驗證成本與數據閉環:從成本中心到戰略投資

      單純看Token價格是不夠的。對于B2B應用,最大的成本往往不是生成Token,而是人工驗證AI輸出是否正確。

      隨著模型漲價,純應用公司為了省錢會使用更便宜的模型,這會導致準確率下降,進而人工審核成本上升,最終出現省了Token錢,賠了人工費的惡性循環。

      但這里存在一個戰略選擇:這筆高昂的人工驗證成本是純粹的損耗,還是可以轉化為未來的資產?

      • 純損耗型驗證:僅為了糾錯而進行的人工審核,是純粹的成本中心。這是大多數純應用公司的現狀。
      • 投資型驗證:將人工糾正后的正確數據回流到系統中,用于精調自己的小模型。

      據Scale AI 2025年Q4報告(模型能力衡量標準為任務準確率),采用投資型驗證策略的AI公司,平均6-9個月后模型準確率提升40-60%,API調用量下降50-70%。

      中小企業低成本搭建數據閉環的簡化路徑:

      • 無專業精調團隊時:使用開源精調平臺(如Unsloth、Axolotl),降低技術門檻
      • 數據量不足時:采用LoRA等低秩適應方法,僅需數百條標注數據即可啟動
      • 驗證成本分攤:將人工審核視為數據生產,而非成本消耗

      這是純應用公司從死局走向破局的唯一路徑——用短期驗證成本換取長期數據壁壘。

      十、未來拐點:三種情景推演


      關鍵變量:據晚點LatePost 2026年2月報道,字節自研AI芯片預計2026年Q4量產,騰訊自研芯片計劃2027年Q2落地;據Gartner 2025年Q4預測,2026年Agentic AI市場規模將增長300%;據36氪2026年3月報道,頭部云廠商已形成不打價格戰的默契。

      十一、結語:未來1-2年,AI產業將迎來洗牌期

      算力即鑄幣權。有算力囤貨的廠商能穿越周期,沒有算力、沒有私有化部署能力的純應用公司,正在被擠出牌桌。

      駕馭工程是純應用公司活下去的必修課。沒有Harness框架的AI應用,Token消耗可能是別人的2-3倍。這不是錦上添花,是生死線。但需注意,簡單任務中搭建Harness框架的成本可能高于收益,企業應根據任務復雜度評估投入產出比。

      數據閉環是純應用公司翻盤的唯一機會。用短期驗證成本換取長期數據壁壘——這是從死局走向破局的唯一路徑。

      端側遷移是輕量級應用的逃生通道。對于非重度依賴大算力的應用,遷移到用戶本地NPU可將Token成本降為零。

      未來1-2年,AI產業將迎來洗牌期。存活者必是具備算力或數據壁壘的企業。這場算力漲價是AI產業從草莽時代走向精耕時代的轉折。純應用公司的紅利期,結束了。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      美軍向一艘伊朗貨船開火并控制,伊方稱逼退美軍;伊朗拒絕參加第二輪談判;3天內12306拒絕出票超百萬張;人形機器人半馬冠軍出爐丨每經早參

      美軍向一艘伊朗貨船開火并控制,伊方稱逼退美軍;伊朗拒絕參加第二輪談判;3天內12306拒絕出票超百萬張;人形機器人半馬冠軍出爐丨每經早參

      每日經濟新聞
      2026-04-20 05:59:45
      普京訪華行程敲定,特朗普已下命令,中國向全球通告,無懼美國

      普京訪華行程敲定,特朗普已下命令,中國向全球通告,無懼美國

      玲兒愛唱歌
      2026-04-20 08:25:32
      《乘風2026》王濛出場費25萬,范瑋琪100萬,評論:不公平

      《乘風2026》王濛出場費25萬,范瑋琪100萬,評論:不公平

      廖四勇
      2026-04-19 11:33:18
      賽力斯申請車載馬桶專利:語音控制伸縮,排泄物竟能原地烘干!

      賽力斯申請車載馬桶專利:語音控制伸縮,排泄物竟能原地烘干!

      飄逸的云朵
      2026-04-18 13:51:27
      63歲王姬難逃命運磋磨:兒子自閉,女兒重蹈覆轍,風光背后皆是債

      63歲王姬難逃命運磋磨:兒子自閉,女兒重蹈覆轍,風光背后皆是債

      不寫散文詩
      2026-04-17 14:15:35
      斯諾克決出5席16強!上屆冠亞軍晉級,肖國棟復仇,中國2人掉隊!

      斯諾克決出5席16強!上屆冠亞軍晉級,肖國棟復仇,中國2人掉隊!

      劉姚堯的文字城堡
      2026-04-20 07:34:36
      涉黃的寶寶巴士被罰!網友:成人巴士!

      涉黃的寶寶巴士被罰!網友:成人巴士!

      廣告創意
      2026-03-18 08:29:53
      突然發現高市不簡單?韓國回過神來,要將美軍請走,槍口對準日本

      突然發現高市不簡單?韓國回過神來,要將美軍請走,槍口對準日本

      浪子阿邴聊體育
      2026-04-20 07:24:00
      臺灣回歸新方案浮出水面:國民黨若同意,解放軍或無需動武

      臺灣回歸新方案浮出水面:國民黨若同意,解放軍或無需動武

      今墨緣
      2026-04-19 20:18:55
      這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

      這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

      喜歡歷史的阿繁
      2026-04-16 11:17:28
      利好!央視重磅發聲!這一方向全球爆單,或迎超級大周期(附股)

      利好!央視重磅發聲!這一方向全球爆單,或迎超級大周期(附股)

      時尚的弄潮
      2026-04-20 03:29:37
      公安部發警告:這些借貸行為查到就判刑,千萬別抱僥幸心理!

      公安部發警告:這些借貸行為查到就判刑,千萬別抱僥幸心理!

      娛樂圈的筆娛君
      2026-04-20 06:38:14
      《八千里路云和月》大結局,田家泰犧牲,七哥的真正身份曝光

      《八千里路云和月》大結局,田家泰犧牲,七哥的真正身份曝光

      看盡落塵花q
      2026-04-19 23:49:01
      廣東隊爆發內訌?杜鋒公開抱怨慘遭“架空”,換帥基本成定局!

      廣東隊爆發內訌?杜鋒公開抱怨慘遭“架空”,換帥基本成定局!

      緋雨兒
      2026-04-19 11:18:30
      孫中山曾說:中國要想在亞洲當大國,必須把首都設在這三個地方

      孫中山曾說:中國要想在亞洲當大國,必須把首都設在這三個地方

      棠棣分享
      2026-04-18 15:39:18
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      院士候選人,嚴重違紀違法,被雙開!

      院士候選人,嚴重違紀違法,被雙開!

      新浪財經
      2026-04-19 19:41:09
      王毅通告全世界,53國獲零關稅特權,唯獨一國沒得到,中方選邊站

      王毅通告全世界,53國獲零關稅特權,唯獨一國沒得到,中方選邊站

      觸摸史跡
      2026-04-20 03:39:03
      韓國一美女因晨跑健身“走紅”,身材緊致太吸睛,網友:太漂亮了

      韓國一美女因晨跑健身“走紅”,身材緊致太吸睛,網友:太漂亮了

      馬拉松跑步健身
      2026-04-19 06:30:13
      國家緊急預警!供應鏈投毒集中爆發,所有人盡快自查防護

      國家緊急預警!供應鏈投毒集中爆發,所有人盡快自查防護

      娛樂圈見解說
      2026-04-19 02:48:57
      2026-04-20 09:03:00
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      132476文章數 862107關注度
      往期回顧 全部

      科技要聞

      藍色起源一級火箭完美回收 客戶衛星未入軌

      頭條要聞

      牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發飆了

      頭條要聞

      牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發飆了

      體育要聞

      湖人1比0火箭:老詹比烏度卡像教練

      娛樂要聞

      何潤東漲粉百萬!內娛隔空掀桌第一人

      財經要聞

      月之暗面IPO迷局

      汽車要聞

      29分鐘大定破萬 極氪8X為什么這么多人買?

      態度原創

      手機
      本地
      旅游
      房產
      軍事航空

      手機要聞

      紅米K100系列再次曝光:BOSE揚聲器+超強馬達,沖高不靠風扇!

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      旅游要聞

      渝見好“村”光|大足和平村:城市后花園 鄉村新浪潮

      房產要聞

      官宣簽約最強城更!海口樓市,突然殺入神秘房企!

      軍事要聞

      特朗普:美艦向伊朗貨船開火炸出個洞

      無障礙瀏覽 進入關懷版