<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      全村人都在等著DeepSeek上桌吃飯了

      0
      分享至

      上個周末,包括英國《金融時報》在內的一些外媒報道稱:DeepSeek V4將在本周一(3月2日)發布。還有報道宣稱,V4將針對國產芯片進行優化,是該系列大模型當中第一個完全基于國產算力生態的云云。這一消息很快被大量國內媒體轉載,大家都期待著V4早日露出真容——可是什么都沒有發生。

      大家盼望DeepSeek V4發布,已經有一個多月了。之前很多人預測它將于春節期間發布,不過也有消息稱,春節還太早了一點。其實,春節期間,豆包、千問、GLM……等競爭對手爭先恐后地發布新版本,在一定程度上可以視為對DeepSeek的一種“預防性競爭行為”:只要V4發布,其光芒就會過于強大,遮蓋一切競品;所以競品必須趕緊也拿出高水平的新版本才行。

      春節前不久,DeepSeek做了一次更新,擴大了上下文窗口,并一度被誤傳為“V4已經開始灰度測試”。那段時間,我的朋友圈到處有人在問:“你被V4灰度到了嗎?怎么拿邀請碼?”事實證明那次更新并不是V4,雖然被廣泛稱為"V4Lite",但畢竟不是正式版V4;它的跑分處于國產大模型的第一梯隊,但更新尚未達到讓人眼睛一亮的程度。

      我在AI圈的朋友,普遍對DeepSeek V4仍然抱有很大希望,其原因有二:

      從梁文鋒署名的一系列論文看,DeepSeek團隊在基礎研發方面是有想法的,正在力圖進行創新,其站位高于大部分大模型創業團隊;

      今年1月底,梁文鋒曾頗有自信地預告過不久后的新版本,“根據他的性格,沒有把握的事情是不會事先宣傳的”。



      從DeepSeek團隊發表的論文看,最近一段時間它的研發似乎聚焦于兩個方向:一個是編程,一個是多模態。前者非常自然,因為AI編程是發展最快、成熟度最高的大模型應用,今年以來發布的Claude Code with Opus 4.6以及ChatGPT-5.3-Codex再次刷新了AI編程的上限。這是一條已經被證實的坦途,DeepSeek的前幾個小版本在這方面進步也很大,V4再次取得巨大進展是可以理解的。

      后者則是在補齊軟肋——DeepSeek迄今最大的弱點就是沒有多模態功能,這一點不但限制了它的C端應用,而且限制了它的B端應用。因為B端收入的來源是客戶對Token的消耗,多模態的Token消耗比傳統的文本生成高了一個、甚至好幾個數量級。不久前Seedance 2.0的發布,再次證明了優秀的多模態大模型具備多高的用戶基礎和商業潛力。從已發表的論文看,DeepSeek肯定不滿足做一個“文生文”大模型,已經在多模態方面下了不少工夫。

      現在全村人都在等著DeepSeek V4上桌吃飯了,究竟什么時候才能真正開飯呢?我認為,這里有一個非常重要的因素:V3/R1是當時全世界最出色的開源大模型,尤其在推理成本控制方面取得了巨大進展,所以震驚了世界;此時此刻,V4必須也成為全世界最出色的開源大模型(至少是之一),才能再次震驚世界。這是成功者必須面臨的問題:成功的標桿越抬越高,每一次的挑戰都更大。

      還有一個重要因素:當初震驚世界的主要是R1,也就是深度推理大模型。如果沒有深度推理功能,至少對于一般用戶而言,DeepSeek不會顯得那么特殊。假設DeepSeek先推出“普通版本”的V4,過一段時間再推出“深度推理”的R2,市場是否會覺得解渴?當然,有一種更穩妥的方式,就是同時推出V4和R2,不過這需要更多的資源,對于一家仍處于創業級別的公司而言,未必合適。我相信,在決定新版本大模型上線節奏的時候,DeepSeek團隊肯定考慮到了上述全部因素。

      還有一個問題:大模型開發,比拼的既是基礎研發,也是工程執行。我們目前能看到的公開信息,主要是基礎研發層面的,例如DeepSeek團隊發布的學術論文;我們對于背后的工程課題、工程瓶頸,知之甚少。迄今為止,關于DeepSeek新版本訓練過程的一切媒體報道,其實都是捕風捉影,沒有得到官方的任何承認,也缺乏第三方信源參考。舉個例子:谷歌在大模型基礎研發方面一直保持領先,但是在Bard以及Gemini早期,工程執行方面犯下了很多錯誤,直到2024年下半年才趕上來。如果DeepSeek過去一段時間致力于解決一些工程環節的細節問題,我不會感到奇怪。

      假設DeepSeek V4真的像英國《金融時報》報道的那樣,全面擁抱國產算力體系的話,在工程方面的挑戰就更大了。要知道,哪怕同樣是在英偉達框架之內,硅谷大廠把訓練任務從Hopper架構轉向Blackwell架構,也需要花一段時間;何況是在兩個完全不同的框架之間調整?這樣的工程問題注定難以在短期內得到解決,能解決就不錯了,無法強求。

      但是,需要強調的是:目前關于V4訓練細節的報道,無論來自外媒還是國內媒體,基本都是根據間接渠道的猜測、整合,從未得到官方的任何認可。真正的訓練細節,只有在新版本發布的那一刻才會被外界得知,而且也不可能是全部細節。只能說:一切皆有可能,但不是每種可能性都值得現在就討論。

      話說回來,哪怕在長達一年多沒有大版本更新(中間有2-3次小版本更新)的情況下,而且是在極少做市場活動的情況下,DeepSeek APP的MAU仍然超過1億,在國內AI應用中位居第四或第五名,哪怕是在春節期間砸了重金的元寶也無法超過它(這在一定程度上要感謝V4Lite的更新)。假如現在推出V4,那么DeepSeek仍然有希望一波沖到全國AI前三的水平;假如再晚一些,就不好說了,因為互聯網大廠圍繞AI的軍備競賽愈演愈烈,DeepSeek在今年面對的競爭密度遠高于去年,國內如此,國外也是如此。

      不管怎么說,既然市場上頻繁傳出“DeepSeek V4即將發布”的消息,至少說明新版本發布已經不再遙遠了。我非常希望能盡快看到V4,因為迄今為止,DeepSeek仍是我使用頻率最高的四個大模型之一(另外三個是GPT、Gemini、Grok),也是我使用頻率最高的國產大模型。我一定會在發布之日立即嘗試,并且詢問AI圈的朋友的使用體驗。希望我們都不會失望!

      本文沒有得到DeepSeek或其任何競爭對手的資助或背書。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      林志穎長子Kimi正臉曝光,17歲Kimi竟然長成了陳若儀翻版!

      林志穎長子Kimi正臉曝光,17歲Kimi竟然長成了陳若儀翻版!

      娛樂順風車666
      2026-04-13 11:34:58
      華工科技:預計2026年第一季度凈利潤為6億元~6.4億元,同比增長46.38%~56.13%

      華工科技:預計2026年第一季度凈利潤為6億元~6.4億元,同比增長46.38%~56.13%

      每日經濟新聞
      2026-04-13 16:24:21
      高盛:未來3年,上海、深圳房價上漲15%

      高盛:未來3年,上海、深圳房價上漲15%

      地產觀點
      2026-04-13 14:00:06
      美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

      美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

      有范又有料
      2026-04-13 15:53:13
      鄭麗文返臺,“三駕馬車”親自迎接、釋放2大信號!1人現身不簡單

      鄭麗文返臺,“三駕馬車”親自迎接、釋放2大信號!1人現身不簡單

      時尚的弄潮
      2026-04-13 12:11:58
      今明兩天!北京大范圍降雨!

      今明兩天!北京大范圍降雨!

      美麗大北京
      2026-04-13 19:03:54
      真膈應啊!一老人走了,鄰居發帖稱家門被貼了塊紅布,又懵又火大

      真膈應啊!一老人走了,鄰居發帖稱家門被貼了塊紅布,又懵又火大

      火山詩話
      2026-04-13 10:40:34
      德國站隊了!正式向世界宣布:以色列若繼續打黎巴嫩,會讓他好看

      德國站隊了!正式向世界宣布:以色列若繼續打黎巴嫩,會讓他好看

      Ck的蜜糖
      2026-04-13 17:50:08
      解放軍這40天,要把美日韓逼瘋!

      解放軍這40天,要把美日韓逼瘋!

      Ck的蜜糖
      2026-04-13 07:27:43
      莫妮卡·貝魯奇:歲月不敗的“地球球花”,黑裙封神

      莫妮卡·貝魯奇:歲月不敗的“地球球花”,黑裙封神

      述家娛記
      2026-04-11 13:36:04
      富得流油,法國國家隊三套鋒線組合總身價8.55億歐元

      富得流油,法國國家隊三套鋒線組合總身價8.55億歐元

      懂球帝
      2026-04-13 18:45:06
      知名國企集團,六個月沒發工資了

      知名國企集團,六個月沒發工資了

      新浪財經
      2026-04-13 04:16:19
      西方國家為什么都不喜歡中國?英國專家:中國有一個“老問題”

      西方國家為什么都不喜歡中國?英國專家:中國有一個“老問題”

      甜到你心坎
      2026-04-12 22:42:27
      主持人魏笑的最后3天:15號生日,16號領證,17號婚禮成葬禮

      主持人魏笑的最后3天:15號生日,16號領證,17號婚禮成葬禮

      就一點
      2026-03-19 10:47:51
      蘋果贏麻了!iPhone17國內銷量突破2700萬臺,是Mate80的五倍不止

      蘋果贏麻了!iPhone17國內銷量突破2700萬臺,是Mate80的五倍不止

      互聯魚
      2026-04-12 18:13:54
      以色列誰都敢打,為何唯獨不敢動巴基斯坦?核武只是冰山一角

      以色列誰都敢打,為何唯獨不敢動巴基斯坦?核武只是冰山一角

      泠泠說史
      2026-04-11 23:48:34
      孕婦吃水果被罵后續:手術已做完,聽勸解救了自己,全網力挺點贊

      孕婦吃水果被罵后續:手術已做完,聽勸解救了自己,全網力挺點贊

      千言娛樂記
      2026-04-13 11:33:13
      13歲男孩騎車被繩子割喉,忍痛跑回家求救!警方已介入

      13歲男孩騎車被繩子割喉,忍痛跑回家求救!警方已介入

      上觀新聞
      2026-04-13 17:52:16
      萬惡的舊社會?15張1944年照片,這就是真實的“舊社會”

      萬惡的舊社會?15張1944年照片,這就是真實的“舊社會”

      棠棣分享
      2026-04-11 22:53:08
      不知悔改!47歲女作家拒道歉+繼續侮辱全紅嬋:縱容隊友被霸凌

      不知悔改!47歲女作家拒道歉+繼續侮辱全紅嬋:縱容隊友被霸凌

      念洲
      2026-04-13 08:50:12
      2026-04-13 20:48:49
      互聯網怪盜團丶 incentive-icons
      互聯網怪盜團丶
      互聯網行業觀察者
      404文章數 375關注度
      往期回顧 全部

      科技要聞

      "抄作業"近四年,馬斯克版微信周五上線

      頭條要聞

      媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

      頭條要聞

      媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

      體育要聞

      一支球隊不夠爛,也是一種悲哀

      娛樂要聞

      初代“跑男團”合體,鄧超、鹿晗缺席

      財經要聞

      今夜,出大事了,3種結果

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      健康
      手機
      房產
      教育
      藝術

      干細胞抗衰4大誤區,90%的人都中招

      手機要聞

      OPPO影像機皇來了!雙2億像素+10倍光變,外觀也被公布了

      房產要聞

      6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

      教育要聞

      燕子飛時 | 麥田團隊動態20260413期

      藝術要聞

      22位中國當代名家油畫作品

      無障礙瀏覽 進入關懷版