<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      像梁文峰一樣誠實

      0
      分享至

      文|象先志

      「不誘于譽,不恐于誹,率道而行,端然正己。」

      原話出自《荀子·非十二子》,這次被 DeepSeek 放到發布稿的結尾。

      《非十二子》本身就不是一篇溫吞的文章。荀子在里面逐一批評當時有影響力的學說和人物,甚至連儒家內部的子思、孟子也沒有放過。

      所謂"非十二子",不是簡單地否定別人,而是在一個思想市場極度熱鬧、各種聲音都試圖爭奪解釋權的時候,重新辨認什么是真正可靠的道路。

      梁文鋒當然不是想批評別人,他甚至連對外講兩句都沒興趣。這只是一種自我說明,和自我道路的確認。

      外界 care 我們,但我們不 TM care。

      過去一段時間,DeepSeek 處在一種很特殊的位置上。

      V4 遲遲沒有發布,又不斷被各種融資、延期、人才流動的猜測包圍。

      AGI 夢想在前,贊譽、質疑、情緒和輿論,全是噪聲。

      外界可以有很多評價,但最后能回應一切的,還是模型和產品。

      這也是梁文鋒和 DeepSeek 特別的地方。他們身上有一種少見的理想主義,但這種理想主義不是輕飄飄的口號,而是非常工程化、非常具體的東西:模型做強,成本打低,上下文擴張,Agent 能力補上,把真實使用體驗擺到用戶面前。

      而且還很誠實。

      理想主義的人不一定誠實。

      比如馬斯克顯然有理想主義,星際移民和通用 AGI 都在射程之內。但馬斯克顯然不夠誠實。對于今天模型圈的人來說,誠實是個更加稀缺的品質。

      今天新模型發布后,你已經很難直接獲得關于模型能力的相對客觀的評價了。你看到一堆跑分和基準測試,跟實際體驗是兩個東西。

      DeepSeek 文章里給出了他們內部的真實體驗判斷:目前 DeepSeek-V4 已成為公司內部員工使用的 Agentic Coding 模型,據評測反饋使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。

      相當清楚,一目了然,基本鎖死外部野生評測員的補位空間。

      所以我建議所有模型廠商,模型發布的時候,除了那批已經沒啥人看的跑分,都加上自己內部蓋戳認證的真實印象。

      這個東西很關鍵。

      因為 Agentic Coding 不是考試題。模型在一個榜單里多拿幾分,和你真的把它放進一個代碼倉庫里,讓它讀需求、看文件、改代碼、跑測試、修 bug、繼續迭代,是兩回事。

      真實體驗里有很多 benchmark 很難覆蓋的東西。任務一長就丟失目標,用著用著就忘掉前面的約束,改我不讓它改的文件,真的讓人抓狂。

      所以 DeepSeek 這段話不是覺得自己很強,不是benchmark說我很強,而是它給了一個非常接近真實用戶語言的坐標。

      強在哪里,接近誰,和誰還有差距,說得很明白。這種表達其實比"全面超越某某模型"高級得多,也有用得多。

      具體聊下模型。

      1M上下文

      現在很多模型的默認上下文還是256K這個級別。對普通聊天來說,這已經很長了。但對 Agent 任務來說,其實經常不夠。vibe coding的時候,或者跑個龍蝦跑匹馬的時候,模型需要在一個很長的任務過程中持續保留信息。

      很多時候模型任務失敗,不是它單點智力不夠,而是因為工作記憶不夠。

      它前面讀過的東西,后面就忘了;用戶一開始強調的要求,做著做著丟了;項目結構剛理解完,改到第三輪又開始漂移。上下文不夠的時候,Agent 很容易變成一個短視的執行器,很難跑完整個任務。

      1M 上下文的意義就在這里。它讓模型更像一個能長時間工作的協作者。

      嚴格來說,這還不是參數意義上的"持續學習",因為模型權重沒有更新。

      但從產品體驗上講,它已經接近一種上下文內的持續學習:模型可以在同一個任務窗口里不斷吸收資料、用戶反饋、歷史決策和中間產物,然后把這些東西帶到后面的推理和執行里。

      未來很多 AI 應用不會是"我問一句,你答一句",而是"我給你一個目標,你陪我把一件復雜的事做完"。這時候上下文就是模型的工作臺,也是它的短期記憶。上下文越長,模型越有機會從單輪工具變成持續協作系統。

      為了更好地支持長上下文,DeepSeek 重新處理了 Transformer 最昂貴的那一層東西:注意力。


      傳統注意力的問題大家都知道,它越往長上下文走,成本越不講道理。因為模型不是把前文當成一篇文章粗略掃一眼,而是每生成一個位置,都要和前面大量位置建立關系。上下文長度擴大以后,計算和顯存壓力會以非常陡的方式上升。

      V4 的思路是把"看上下文"這件事拆得更細。它不再要求模型在所有層里都用同一種方式平鋪直敘地看完整歷史,而是讓不同注意力模塊承擔不同尺度的記憶任務。

      一部分模塊負責做比較細的壓縮和篩選:先把連續的小段 token 整理成更緊湊的記憶單元,再讓當前位置只去關注其中最相關的一部分。

      另一部分模塊則負責更粗尺度的全局感知,把更長的一段歷史壓成更少的記憶節點,然后在這些節點之間做相對完整的關聯。它犧牲了一些局部細節,但換來的是對超長歷史的整體把握。

      這個方向我覺得非常 DeepSeek。

      因為 DeepSeek 過去兩年最關鍵的技術氣質,一直不是"堆大",而是"稀疏化",是降成本。

      V2、V3 的 MoE 是參數層面的稀疏化:模型總容量很大,但每個 token 只調用一部分專家,所以能力上去,成本沒有按同等比例爆炸。

      V4 這次更進一步,把稀疏化推進到了上下文本身:不是所有歷史 token 都以同等分辨率進入注意力,而是經過壓縮、篩選、分層之后,再被模型使用。

      所以這次 1M 上下文,我覺得不能只當成一個產品賣點。

      它更像是 DeepSeek 技術路線的一次延伸:先用 MoE 解決"模型容量和推理成本"的矛盾,再用新的注意力結構解決"上下文長度和計算成本"的矛盾。前者讓大模型變得更便宜,后者讓長任務變得更可行。

      API價格


      DeepSeek 去年之所以能掀起那么大的轟動,不只是因為它強,也不只是因為它便宜,而是它讓所有人第一次非常強烈地意識到:強和便宜原來可以同時成立。

      這件事對行業心理的沖擊很大。因為過去大家默認頂級模型就是貴的,低價模型往往就要在能力上做妥協。但 DeepSeek 把這個默認前提打穿了。便宜但不好用,不會改變行業;強但太貴,也只能服務少數場景。但又強價格又低,就會改變成本結構,成本一動上面的生態就會跟著動。

      拿公開 API 價格粗略看一下。deepseek-v4-pro的價格基本跟最新發布的kimi-k2.6一致,前者在緩存未命中情況下更貴,輸出則更便宜一點。

      不過k2.6價格是256K的上下文長度,而deepseek-v4-pro則是1M的上下文。按照之前小米MiMo token plan的計費規則,從256k到1m上下文增長,API價格要翻倍。

      而且這里需要看到下面灰色的補充信息。目前受限于高端算力,Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。

      說明當前Pro版本的價格是被刻意調高,因為推力算力還沒有跟上。未來Pro版本價格大幅下調,不排除在現有價格的基礎上對折甚至再對折。

      國產算力齊活

      之前一直有傳聞,說 DeepSeek-V4 這次沒有按照行業慣例,把早期適配優先權交給英偉達,而是先給了華為等國產芯片廠商。

      當時這個說法聽起來還有點像江湖傳聞,因為大模型行業過去的默認流程就是圍著 CUDA 轉。模型廠商發新模型之前,先讓英偉達這些硬件和軟件生態的核心玩家提前適配,確保模型一上線就能在主流 GPU 上跑得又快又穩。

      現在看來,國產全棧AI基本齊活了。

      上面我們提到,DeepSeek 自己在發布稿里寫了,受限于高端算力,目前 Pro 的服務吞吐十分有限,預計下半年昇騰 950 超節點批量上市后,Pro 的價格會大幅下調。

      華為計算公眾號也說,昇騰一直同步支持 DeepSeek 系列模型,這次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持 DeepSeek V4 系列模型。昇騰 CANN 還安排了 DeepSeek V4 昇騰首發直播。

      CUDA 的優勢不是英偉達某一張卡很強,而是模型、框架、算子庫、開發工具、部署經驗、工程人才,全都圍著它長了很多年。你要從 CUDA 遷到 CANN,大量底層算子、精度對齊、通信、調度、推理服務都要能跑通,而且要跑得足夠好。

      DeepSeek-V4 能在昇騰超節點上作為重要服務底座跑起來,這對國產算力是一次非常關鍵的驗收。DeepSeek 的性價比不是憑空來的,它背后一定要有算力供給。

      如果永遠依賴昂貴、受限、供給不穩定的外部 GPU,再強的模型也很難長期維持低價。國產算力如果能接上,DeepSeek 才有可能繼續把"強模型 + 低價格"這件事往下打。

      所以這件事我覺得可以說是 DeepSeek-V4 里最硬的產業信號之一:模型有了,長上下文有了,Agent 能力有了,API 有了,現在連國產算力底座也開始接上了。

      閉環開始形成。

      DeepSeek 負責把模型能力和成本曲線打出來,華為昇騰負責把高端推理算力和超節點供給接上,CANN 負責補國產軟件棧,開發者和 Agent 產品負責把需求跑起來。

      為什么 DeepSeek-V4 這次發布很振奮。

      它不是一個孤零零的模型更新,而是把很多原本分散的線索接到了一起:梁文鋒的理想主義,DeepSeek 的誠實表達,1M 上下文,Agent 能力,低價 API,昇騰超節點,國產算力放量。

      每一個單獨看都重要,但合在一起,才是真正讓人興奮的地方。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      以指數為舟,載信任遠行,走進中銀基金量化指數團隊

      以指數為舟,載信任遠行,走進中銀基金量化指數團隊

      投資時間網
      2026-04-07 10:19:59
      “雙一流”名校教授,突發疾病逝世

      “雙一流”名校教授,突發疾病逝世

      雙一流高校
      2026-04-28 00:08:47
      黃一鳴回應:沒結婚一天找8個男的也沒關系 承認跟40歲大叔交往過

      黃一鳴回應:沒結婚一天找8個男的也沒關系 承認跟40歲大叔交往過

      法老不說教
      2026-04-25 14:34:56
      送走馬蓉又來馮清,43歲的"老實人"王寶強,還是沒逃出"女人圈"

      送走馬蓉又來馮清,43歲的"老實人"王寶強,還是沒逃出"女人圈"

      趣知史館
      2026-03-10 20:20:03
      30歲少婦婚后不孕,70歲大爺要求同居治療,結果讓她悔不當初

      30歲少婦婚后不孕,70歲大爺要求同居治療,結果讓她悔不當初

      丫頭舫
      2026-04-22 15:24:46
      裁員裁到大動脈是什么后果?網友:我高興的像自己賺了30萬一樣

      裁員裁到大動脈是什么后果?網友:我高興的像自己賺了30萬一樣

      夜深愛雜談
      2026-04-23 07:31:00
      凌晨4點,遼寧艦甲板上的生死40分鐘:當殲-15掛著實彈壓向2000米

      凌晨4點,遼寧艦甲板上的生死40分鐘:當殲-15掛著實彈壓向2000米

      荷蘭豆愛健康
      2026-04-27 13:20:59
      特朗普政府解散美國國家科學委員會 全體成員被撤職

      特朗普政府解散美國國家科學委員會 全體成員被撤職

      財聯社
      2026-04-28 10:00:21
      這才是提高數學成績最好的方法!(建議永久收藏)

      這才是提高數學成績最好的方法!(建議永久收藏)

      戶外阿毽
      2026-04-27 09:46:34
      “揚州女首富”的半導體企業,被歐盟列入制裁名單

      “揚州女首富”的半導體企業,被歐盟列入制裁名單

      觀察者網
      2026-04-27 20:43:21
      文旅部集中整治景區擺渡車,點名龍虎山、長白山、稻城亞丁等

      文旅部集中整治景區擺渡車,點名龍虎山、長白山、稻城亞丁等

      南方都市報
      2026-04-27 16:21:12
      國乒60人團隊去倫敦,出征儀式取消,馬琳王皓心態不同,不會換人

      國乒60人團隊去倫敦,出征儀式取消,馬琳王皓心態不同,不會換人

      體育大學僧
      2026-04-27 09:55:16
      吐槽老詹、理解老詹、成為老詹,渴望父子同臺,胡金秋要打到40歲

      吐槽老詹、理解老詹、成為老詹,渴望父子同臺,胡金秋要打到40歲

      兵哥籃球故事
      2026-04-28 11:37:03
      山西澤州發生重大刑案,警方最高懸賞5萬元緝兇,為何不公布全名?律師:或為偵查保密,實踐中無統一標準

      山西澤州發生重大刑案,警方最高懸賞5萬元緝兇,為何不公布全名?律師:或為偵查保密,實踐中無統一標準

      極目新聞
      2026-04-27 23:22:34
      我給保姆兩年漲薪五次,她臨別提醒:太太,你最好看看天花板上面

      我給保姆兩年漲薪五次,她臨別提醒:太太,你最好看看天花板上面

      千秋文化
      2026-04-25 20:32:18
      上海地鐵搶座反轉:兩人都有座位,目擊者曝料細節,果然不簡單

      上海地鐵搶座反轉:兩人都有座位,目擊者曝料細節,果然不簡單

      超喜歡我
      2026-04-27 12:41:17
      東風-27疑似量產,令美軍如芒在背!

      東風-27疑似量產,令美軍如芒在背!

      楊風
      2026-04-26 23:04:04
      禍不單行!湖人G4輸球還破財,兩將狂噴裁判被重罰6萬刀

      禍不單行!湖人G4輸球還破財,兩將狂噴裁判被重罰6萬刀

      仰臥撐FTUer
      2026-04-28 11:22:07
      日本,急了,晚了,難了

      日本,急了,晚了,難了

      華商韜略畢亞軍
      2026-04-27 14:59:04
      印媒曾曝料:2020年若不是中國99A坦克急上高原,印度或真會動手

      印媒曾曝料:2020年若不是中國99A坦克急上高原,印度或真會動手

      別吵吵
      2026-04-28 09:22:17
      2026-04-28 11:47:00
      藍鯨新聞 incentive-icons
      藍鯨新聞
      財經信息服務平臺
      131713文章數 193851關注度
      往期回顧 全部

      藝術要聞

      靜·觀--第二屆全國靜物油畫作品展 作品選刊

      頭條要聞

      美軍事資產被指"損失慘重" 修復費用可能高達50億美元

      頭條要聞

      美軍事資產被指"損失慘重" 修復費用可能高達50億美元

      體育要聞

      人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

      娛樂要聞

      楊冪險遭蒸汽眼罩毀容!傷照曝光…

      財經要聞

      俞敏洪再遭重擊

      科技要聞

      10億周活目標落空!傳OpenAI爆發內部分歧

      汽車要聞

      上汽大眾“攻山頭” ID.ERA 9X劍指細分前三

      態度原創

      家居
      藝術
      健康
      數碼
      公開課

      家居要聞

      江景風格 流動的秩序

      藝術要聞

      靜·觀--第二屆全國靜物油畫作品展 作品選刊

      干細胞治療燒燙傷三大優勢!

      數碼要聞

      首款華為MatePad Pro Max平板曝光,將于5月面向全球發布

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人性做爰片免费视频| 91精品人妻一区二区| 91网站免费在线观看| 亚洲精品国偷拍自产在线观看| 亚洲日本高清一区二区三区| 日韩黄色av一区二区三区| 日韩av在线一二三四区| 德昌县| 精品欧美一区手机在线观看| 日屄影视| 中文字幕精品亚洲无线码二区| 欧美性69式xxxx护士| 久久人妻精品白浆国产| 91视频网站免费观看| 蜜臀久久99精品久久久久久酒店| 赤壁市| 欧美人妻aⅴ中文字幕| 国产又色又爽无遮挡免费动态图| 国产91色综合久久高清| 成人免费区一区二区三区| 国产精品三级在线专区1| 亚洲精品美女久久久久久久| 亚洲成av人片一区二区| 亚洲精品无码永久中文字幕| 久久精品国产亚洲AV麻豆网站| 资中县| 公与媳妻hd中文在线观看| 大石桥市| 国产九九在线| 亚洲色婷婷久久精品av蜜桃久久 | 免费网站看sm调教视频| 威海市| 国产精品嫩草影院一二三区入口| 日韩人妻无码一区二区三区久久| 又黄又无遮挡AAAAA毛片| 国产国语一级毛片| 少妇熟女视频一区二区三区| 狠狠躁夜夜躁人人爽天天| 这里只有精品在线播放| 亚洲熟妇夜夜一区二区三区| 欧美成人黄在线观看|