<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      像梁文峰一樣誠實

      0
      分享至

      「不誘于譽,不恐于誹,率道而行,端然正己。」

      原話出自《荀子·非十二子》,這次被 DeepSeek 放到發布稿的結尾。

      《非十二子》本身就不是一篇溫吞的文章。荀子在里面逐一批評當時有影響力的學說和人物,甚至連儒家內部的子思、孟子也沒有放過。

      所謂“非十二子”,不是簡單地否定別人,而是在一個思想市場極度熱鬧、各種聲音都試圖爭奪解釋權的時候,重新辨認什么是真正可靠的道路。

      梁文鋒當然不是想批評別人,他甚至連對外講兩句都沒興趣。這只是一種自我說明,和自我道路的確認。

      外界 care 我們,但我們不 TM care。

      過去一段時間,DeepSeek 處在一種很特殊的位置上。

      V4 遲遲沒有發布,又不斷被各種融資、延期、人才流動的猜測包圍。

      AGI 夢想在前,贊譽、質疑、情緒和輿論,全是噪聲。

      外界可以有很多評價,但最后能回應一切的,還是模型和產品。

      這也是梁文鋒和 DeepSeek 特別的地方。他們身上有一種少見的理想主義,但這種理想主義不是輕飄飄的口號,而是非常工程化、非常具體的東西:模型做強,成本打低,上下文擴張,Agent 能力補上,把真實使用體驗擺到用戶面前。

      而且還很誠實。

      理想主義的人不一定誠實。

      比如馬斯克顯然有理想主義,星際移民和通用 AGI 都在射程之內。但馬斯克顯然不夠誠實。對于今天模型圈的人來說,誠實是個更加稀缺的品質。

      今天新模型發布后,你已經很難直接獲得關于模型能力的相對客觀的評價了。你看到一堆跑分和基準測試,跟實際體驗是兩個東西。

      DeepSeek 文章里給出了他們內部的真實體驗判斷:目前 DeepSeek-V4 已成為公司內部員工使用的 Agentic Coding 模型,據評測反饋使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。

      相當清楚,一目了然,基本鎖死外部野生評測員的補位空間。

      所以我建議所有模型廠商,模型發布的時候,除了那批已經沒啥人看的跑分,都加上自己內部蓋戳認證的真實印象。

      這個東西很關鍵。

      因為 Agentic Coding 不是考試題。模型在一個榜單里多拿幾分,和你真的把它放進一個代碼倉庫里,讓它讀需求、看文件、改代碼、跑測試、修 bug、繼續迭代,是兩回事。

      真實體驗里有很多 benchmark 很難覆蓋的東西。任務一長就丟失目標,用著用著就忘掉前面的約束,改我不讓它改的文件,真的讓人抓狂。

      所以 DeepSeek 這段話不是覺得自己很強,不是benchmark說我很強,而是它給了一個非常接近真實用戶語言的坐標。

      強在哪里,接近誰,和誰還有差距,說得很明白。這種表達其實比“全面超越某某模型”高級得多,也有用得多。

      具體聊下模型。

      1M上下文

      現在很多模型的默認上下文還是256K這個級別。對普通聊天來說,這已經很長了。但對 Agent 任務來說,其實經常不夠。vibe coding的時候,或者跑個龍蝦跑匹馬的時候,模型需要在一個很長的任務過程中持續保留信息。

      很多時候模型任務失敗,不是它單點智力不夠,而是因為工作記憶不夠。

      它前面讀過的東西,后面就忘了;用戶一開始強調的要求,做著做著丟了;項目結構剛理解完,改到第三輪又開始漂移。上下文不夠的時候,Agent 很容易變成一個短視的執行器,很難跑完整個任務。

      1M 上下文的意義就在這里。它讓模型更像一個能長時間工作的協作者。

      嚴格來說,這還不是參數意義上的“持續學習”,因為模型權重沒有更新。

      但從產品體驗上講,它已經接近一種上下文內的持續學習:模型可以在同一個任務窗口里不斷吸收資料、用戶反饋、歷史決策和中間產物,然后把這些東西帶到后面的推理和執行里。

      未來很多 AI 應用不會是“我問一句,你答一句”,而是“我給你一個目標,你陪我把一件復雜的事做完”。這時候上下文就是模型的工作臺,也是它的短期記憶。上下文越長,模型越有機會從單輪工具變成持續協作系統。

      為了更好地支持長上下文,DeepSeek 重新處理了 Transformer 最昂貴的那一層東西:注意力。



      傳統注意力的問題大家都知道,它越往長上下文走,成本越不講道理。因為模型不是把前文當成一篇文章粗略掃一眼,而是每生成一個位置,都要和前面大量位置建立關系。上下文長度擴大以后,計算和顯存壓力會以非常陡的方式上升。

      V4 的思路是把“看上下文”這件事拆得更細。它不再要求模型在所有層里都用同一種方式平鋪直敘地看完整歷史,而是讓不同注意力模塊承擔不同尺度的記憶任務。

      一部分模塊負責做比較細的壓縮和篩選:先把連續的小段 token 整理成更緊湊的記憶單元,再讓當前位置只去關注其中最相關的一部分。

      另一部分模塊則負責更粗尺度的全局感知,把更長的一段歷史壓成更少的記憶節點,然后在這些節點之間做相對完整的關聯。它犧牲了一些局部細節,但換來的是對超長歷史的整體把握。

      這個方向我覺得非常 DeepSeek。

      因為 DeepSeek 過去兩年最關鍵的技術氣質,一直不是“堆大”,而是“稀疏化”,是降成本。

      V2、V3 的 MoE 是參數層面的稀疏化:模型總容量很大,但每個 token 只調用一部分專家,所以能力上去,成本沒有按同等比例爆炸。

      V4 這次更進一步,把稀疏化推進到了上下文本身:不是所有歷史 token 都以同等分辨率進入注意力,而是經過壓縮、篩選、分層之后,再被模型使用。

      所以這次 1M 上下文,我覺得不能只當成一個產品賣點。

      它更像是 DeepSeek 技術路線的一次延伸:先用 MoE 解決“模型容量和推理成本”的矛盾,再用新的注意力結構解決“上下文長度和計算成本”的矛盾。前者讓大模型變得更便宜,后者讓長任務變得更可行。

      API價格



      DeepSeek 去年之所以能掀起那么大的轟動,不只是因為它強,也不只是因為它便宜,而是它讓所有人第一次非常強烈地意識到:強和便宜原來可以同時成立。

      這件事對行業心理的沖擊很大。因為過去大家默認頂級模型就是貴的,低價模型往往就要在能力上做妥協。但 DeepSeek 把這個默認前提打穿了。便宜但不好用,不會改變行業;強但太貴,也只能服務少數場景。但又強價格又低,就會改變成本結構,成本一動上面的生態就會跟著動。

      拿公開 API 價格粗略看一下。deepseek-v4-pro的價格基本跟最新發布的kimi-k2.6一致,前者在緩存未命中情況下更貴,輸出則更便宜一點。

      不過k2.6價格是256K的上下文長度,而deepseek-v4-pro則是1M的上下文。按照之前小米MiMo token plan的計費規則,從256k到1m上下文增長,API價格要翻倍。

      而且這里需要看到下面灰色的補充信息。目前受限于高端算力,Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。

      說明當前Pro版本的價格是被刻意調高,因為推力算力還沒有跟上。未來Pro版本價格大幅下調,不排除在現有價格的基礎上對折甚至再對折。

      國產算力齊活

      之前一直有傳聞,說 DeepSeek-V4 這次沒有按照行業慣例,把早期適配優先權交給英偉達,而是先給了華為等國產芯片廠商。

      當時這個說法聽起來還有點像江湖傳聞,因為大模型行業過去的默認流程就是圍著 CUDA 轉。模型廠商發新模型之前,先讓英偉達這些硬件和軟件生態的核心玩家提前適配,確保模型一上線就能在主流 GPU 上跑得又快又穩。

      現在看來,國產全棧AI基本齊活了。

      上面我們提到,DeepSeek 自己在發布稿里寫了,受限于高端算力,目前 Pro 的服務吞吐十分有限,預計下半年昇騰 950 超節點批量上市后,Pro 的價格會大幅下調。

      華為計算公眾號也說,昇騰一直同步支持 DeepSeek 系列模型,這次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持 DeepSeek V4 系列模型。昇騰 CANN 還安排了 DeepSeek V4 昇騰首發直播。

      CUDA 的優勢不是英偉達某一張卡很強,而是模型、框架、算子庫、開發工具、部署經驗、工程人才,全都圍著它長了很多年。你要從 CUDA 遷到 CANN,大量底層算子、精度對齊、通信、調度、推理服務都要能跑通,而且要跑得足夠好。

      DeepSeek-V4 能在昇騰超節點上作為重要服務底座跑起來,這對國產算力是一次非常關鍵的驗收。DeepSeek 的性價比不是憑空來的,它背后一定要有算力供給。

      如果永遠依賴昂貴、受限、供給不穩定的外部 GPU,再強的模型也很難長期維持低價。國產算力如果能接上,DeepSeek 才有可能繼續把“強模型 + 低價格”這件事往下打。

      所以這件事我覺得可以說是 DeepSeek-V4 里最硬的產業信號之一:模型有了,長上下文有了,Agent 能力有了,API 有了,現在連國產算力底座也開始接上了。

      閉環開始形成。

      DeepSeek 負責把模型能力和成本曲線打出來,華為昇騰負責把高端推理算力和超節點供給接上,CANN 負責補國產軟件棧,開發者和 Agent 產品負責把需求跑起來。

      為什么 DeepSeek-V4 這次發布很振奮。

      它不是一個孤零零的模型更新,而是把很多原本分散的線索接到了一起:梁文鋒的理想主義,DeepSeek 的誠實表達,1M 上下文,Agent 能力,低價 API,昇騰超節點,國產算力放量。

      每一個單獨看都重要,但合在一起,才是真正讓人興奮的地方。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      我國拒接美8500億債務,專家:救美國就是救中國的時代已經結束了

      我國拒接美8500億債務,專家:救美國就是救中國的時代已經結束了

      近史談
      2026-04-19 22:55:22
      【精選研報】醫療反腐“兩高”新規專屬解讀:3大變化+5大行業趨勢

      【精選研報】醫療反腐“兩高”新規專屬解讀:3大變化+5大行業趨勢

      風云藥談
      2026-04-28 20:48:10
      14歲被送上導演的床,17歲拍全裸寫真,被操控半生,如今怎樣了

      14歲被送上導演的床,17歲拍全裸寫真,被操控半生,如今怎樣了

      喜歡歷史的阿繁
      2026-04-26 11:01:11
      厄德高:我們處于很好的位置去創造歷史,這也是我們想去做的

      厄德高:我們處于很好的位置去創造歷史,這也是我們想去做的

      懂球帝
      2026-04-29 03:26:05
      DeepSeek“嚇崩”智譜和MiniMax,但摩根大通認為:V4打破算力束縛,是行業利好

      DeepSeek“嚇崩”智譜和MiniMax,但摩根大通認為:V4打破算力束縛,是行業利好

      華爾街見聞官方
      2026-04-27 09:59:20
      為什么大家都說這個熱巴是假的?細思極恐,真的熱巴去哪里了?

      為什么大家都說這個熱巴是假的?細思極恐,真的熱巴去哪里了?

      娛樂小丸子
      2026-03-30 09:53:37
      一個家庭最大悲哀:不是沒錢,而是子女30歲了,還在做這4件蠢事

      一個家庭最大悲哀:不是沒錢,而是子女30歲了,還在做這4件蠢事

      藝鑒在線
      2026-04-25 11:27:17
      商業航天步入新階段,新一輪“卡位戰”打響

      商業航天步入新階段,新一輪“卡位戰”打響

      每日經濟新聞
      2026-04-28 22:40:03
      扎哈羅娃拳打澤連斯基腳踢歐盟,烏克蘭軍力躍居全球排行榜第12位

      扎哈羅娃拳打澤連斯基腳踢歐盟,烏克蘭軍力躍居全球排行榜第12位

      史政先鋒
      2026-04-28 12:47:48
      “不給6套房加1個億,不搬”,釘子戶張新國堅守14年,終敗給現實

      “不給6套房加1個億,不搬”,釘子戶張新國堅守14年,終敗給現實

      紅夢史說
      2025-07-11 11:23:39
      剛剛,一線城市房價集體上漲,釋放了什么信號?

      剛剛,一線城市房價集體上漲,釋放了什么信號?

      毒sir財經
      2026-04-28 22:03:11
      40歲32天,諾伊爾成出戰歐冠半決賽第三年長球員

      40歲32天,諾伊爾成出戰歐冠半決賽第三年長球員

      懂球帝
      2026-04-29 03:41:16
      1951年,戴笠獨子被處決的消息傳到臺灣,蔣介石給毛人鳳下了一條命令

      1951年,戴笠獨子被處決的消息傳到臺灣,蔣介石給毛人鳳下了一條命令

      曉張說
      2026-04-27 07:18:18
      賈國龍再看3家燜面店,有店鋪評分3.8分,網友:賈總這是兇多吉少

      賈國龍再看3家燜面店,有店鋪評分3.8分,網友:賈總這是兇多吉少

      番外行
      2026-04-24 09:01:19
      炒股其實很簡單,每逢股價暴漲前,“主升浪”都會出現這樣的特征

      炒股其實很簡單,每逢股價暴漲前,“主升浪”都會出現這樣的特征

      股經縱橫談
      2026-03-25 22:26:52
      10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

      10億都救不了一命!京東副總裁蔡磊,生命進入倒計時

      聽風喃
      2026-04-06 11:16:04
      美國沒想到鄭麗文會來這一招,反對統一?洪秀柱:應該謀求統一!

      美國沒想到鄭麗文會來這一招,反對統一?洪秀柱:應該謀求統一!

      破鏡難圓
      2026-02-08 14:10:34
      鏡報:卡塞米羅將拒絕沙特高薪,決定加盟邁阿密國際

      鏡報:卡塞米羅將拒絕沙特高薪,決定加盟邁阿密國際

      懂球帝
      2026-04-29 00:11:25
      北控男籃大換血!更換主帥,15人合同到期,功勛外援續約

      北控男籃大換血!更換主帥,15人合同到期,功勛外援續約

      體壇瞎白話
      2026-04-28 09:42:13
      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      瑛派兒老黃
      2025-12-02 21:11:13
      2026-04-29 04:31:00
      象先志 incentive-icons
      象先志
      專注互聯網、電商,聚焦產業、核心,洞察前沿、趨勢
      150文章數 9關注度
      往期回顧 全部

      藝術要聞

      京東浙江總部公示,99.99米高,中國第一民企落子民營大省!

      頭條要聞

      19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

      頭條要聞

      19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

      體育要聞

      魔術黑八活塞,一步之遙?!

      娛樂要聞

      蔡卓妍官宣結婚,老公比她小10歲

      財經要聞

      中央政治局會議定調,八大看點速覽!

      科技要聞

      10億周活目標落空!傳OpenAI爆發內部分歧

      汽車要聞

      拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

      態度原創

      健康
      家居
      游戲
      藝術
      軍事航空

      干細胞治療燒燙傷三大優勢!

      家居要聞

      江景風格 流動的秩序

      這不爽翻了?曝PS6或能穩穩運行60幀+光追的游戲畫面

      藝術要聞

      京東浙江總部公示,99.99米高,中國第一民企落子民營大省!

      軍事要聞

      德國總理默茨:美國正遭受伊朗領導層的羞辱

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美日产国产精品| 中国普通话特级毛片| 国产精品人妻在线观看| 恭城| 国产精品成人久久电影| 淫色综合网| 天干天干啦夜天干天天爽| 中文字幕在线观看一区二区| 欧美日韩中文字幕久久伊人| 久久www免费人成_网站| 天祝| 熟妇人妻不卡中文字幕 | 91在线精品免费免费播放| 日本真人做爰免费的视频| 万荣县| 久久久www成人免费精品| 波多野在线影院| 无码色综合| av色蜜桃一区二区三区| 二区三区国产在线观看| 亚洲午夜精品久久久久久app| 中字无码av电影在线观看网站| 美女18禁一区二区三区视频| 国产免费AV网站| 大陆熟妇丰满多毛xxxⅹ| 亚洲AV电影网| 狠狠?综合?精品?伊人| 国产乱人伦无无码视频| 亚洲AV乱码一区二区三区按摩| 一本无码在线观看| 日韩内射美女人妻一区二区三区| 亚洲成人高清无码| 啦啦啦啦www日本在线观看| 欧美老肥妇做爰bbww| 精品国产自拍在线视频| 久久精品成人无码观看免费| 舟曲县| 好吊妞无缓冲视频观看| 18禁网址| 亚洲欭美日韩颜射在线二| 99视频在线播放|