網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

剛剛，DeepSeek 大升級，V4 真的不遠(yuǎn)了｜附體驗(yàn)細(xì)節(jié)

2026-04-08 06:09:22　來源: AppSo

廣東舉報(bào)

分享至

就在剛剛，DeepSeek 網(wǎng)頁端迎來大更新。

沒有發(fā)布會，沒有 blog，甚至連一條官方推文都沒有。DeepSeek 網(wǎng)頁端的輸入框上方多了兩個(gè)圖標(biāo)——一個(gè)閃電，一個(gè)鉆石，分別對應(yīng)「快速模式」和「專家模式」。

懸停一下，提示語出來了：快速模式「適合日常對話，即時(shí)響應(yīng)」，專家模式「擅長復(fù)雜問題，高峰需等待」。

目前從實(shí)測和網(wǎng)友拆解來看，兩個(gè)模式的差異大概是這樣的：

快速模式，可以識別圖片和文件中的文字，速度快，響應(yīng)即時(shí)。代價(jià)是，背后跑的大概率是一個(gè)更輕量的 V4 Lite 模型，但針對速度做了優(yōu)化。

專家模式，疑似路由到了更大、更強(qiáng)的模型——很可能就是 DeepSeek V4 正式版的某個(gè)形態(tài)。但目前它不支持文件上傳，也沒有多模態(tài)能力。等等，更強(qiáng)的模型，反而功能更少？

上下滑動查看更多內(nèi)容

我們也做了一輪簡單測試。

比如讓兩個(gè)模式各自寫一個(gè) p5.js 程序，模擬球在旋轉(zhuǎn)六邊形內(nèi)彈跳，要求受重力和摩擦力影響。結(jié)果顯示專家模式給出的結(jié)果更符合物理直覺，落點(diǎn)更準(zhǔn)，彈跳軌跡更真實(shí)。

對比之下，快速模式給出的的結(jié)果肉眼可見差了一個(gè)檔次。

這種差距，其實(shí)挺能說明問題的。物理仿真對數(shù)學(xué)推理能力要求高，弱一點(diǎn)的模型容易出現(xiàn)「看起來像物理但實(shí)際上不對」的結(jié)果。專家模式在這里的表現(xiàn)，是實(shí)打?qū)嵉哪芰Σ町悺?/p>

但網(wǎng)友 @AiBattle_ 讓其制作的太空侵略者游戲結(jié)果卻讓人有點(diǎn)意外：專家模式的輸出和快速模式差距并不明顯。

做測試的網(wǎng)友給出了一個(gè)判斷：「我估計(jì)專家模式現(xiàn)在路由的仍然是某個(gè)版本的 V4 Lite。要看到完整版 V4 在網(wǎng)頁端上線，可能還得再等一陣。」這個(gè)判斷和外部報(bào)道的時(shí)間線基本吻合——晚點(diǎn) LatePost 報(bào)道，V4 正式版預(yù)計(jì)今年 4 月亮相，屆時(shí)大概率仍是開源最強(qiáng)，但報(bào)道也點(diǎn)明「很難是碾壓級的強(qiáng)」。

換句話說，這次灰度上線的「專家模式」，未必就是最終形態(tài)。

創(chuàng)意寫作方面，我給兩種模式出了一道辯論寫作題，題目是「替無聊辯護(hù)，論證無聊是現(xiàn)代人的奢侈品」。

專家模式的輸出更長，邏輯鏈更完整；快速模式的文風(fēng)則相對自然樸實(shí)。

上下滑動查看快速模式（前）和專家模式（后）

有意思的是，在這個(gè)任務(wù)上，兩個(gè)模式的速度差距并不明顯，甚至專家模式的思考時(shí)間更短。這有點(diǎn)反直覺，但可能和任務(wù)性質(zhì)有關(guān)——創(chuàng)意寫作對模型規(guī)模的敏感度，遠(yuǎn)低于數(shù)學(xué)推理類任務(wù)。

對于簡單任務(wù)，兩個(gè)模式差異有限；越是需要深度推理的場景，專家模式的優(yōu)勢越明顯。

在數(shù)學(xué)邏輯題「繩子繞地球一圈，加長 1 米均勻撐開，縫隙多高？」中，盡管兩個(gè)模式給出了相同的答案，但過程截然不同。快速模式的回答很簡略；專家模式則一步一步拆解，每個(gè)推導(dǎo)環(huán)節(jié)都交代清楚，更接近「把思考過程寫出來」這個(gè)指令要求。

上下滑動查看更多內(nèi)容

值得一提的是，目前網(wǎng)頁端實(shí)際上線的只有快速和專家兩個(gè)模式，但此前的爆料顯示，還有第三個(gè)選項(xiàng)正在路上——「Vision 模式」。

圖片來自互聯(lián)網(wǎng)

關(guān)注 DeepSeek 技術(shù)路線的博主 Teortaxes 認(rèn)為：把 Vision 單獨(dú)列為一個(gè)類，是很不尋常的設(shè)計(jì)。他提到，DeepSeek 此前拒絕在網(wǎng)頁端部署 DS-VL 系列，原因是「尚未成熟」。如果 Vision 模式真的上線，背后支撐它的，很可能已經(jīng)是一個(gè)「完全功能化」的 VLM。

而 Teortaxes 在他的長評里，給出了一個(gè)更大膽的猜測——這個(gè)視覺模型，有可能不是常規(guī)的 VLM，而是某種「深度統(tǒng)一世界模型」，是 Janus 系列的下一步演化，或者其他更非傳統(tǒng)的架構(gòu)。

當(dāng)然，這僅僅只是他的猜測，也有網(wǎng)友 @xhyctf 表示，DeepSeek 被逆向的前端代碼顯示，Vision 模式，根本就沒有獨(dú)立的模型。所謂「視覺理解」，只是在快速模式下悄悄加了一個(gè)參數(shù)——filefeature.vision = true。

盡管如此，有一點(diǎn)是確定的：DeepSeek 在多模態(tài)方向一直都有所布局，或許只是差一個(gè)良好的時(shí)間窗口。而把快速、專家等入口擺在用戶面前，背后其實(shí)是一個(gè)更值得關(guān)注的方向：

DeepSeek 開始做產(chǎn)品分層了。

自去年初爆火以來，DeepSeek 的產(chǎn)品邏輯一直是高度「反商業(yè)」的——API 定價(jià)較低，網(wǎng)頁端完全免費(fèi)，功能也沒什么門檻區(qū)分。但問題也隨之而來：長期維持這種「全免費(fèi)、無分層」的運(yùn)營方式，商業(yè)上是不可持續(xù)的。

現(xiàn)在，DeepSeek 開始把「更強(qiáng)的模型」和「更基礎(chǔ)的模型」做成兩個(gè)入口。專家模式目前還是免費(fèi)的，但這個(gè)架構(gòu)一旦搭好，后續(xù)要在上面做付費(fèi)體系，技術(shù)上已經(jīng)不是問題了。

當(dāng)然，分層的目的，未必只是為了收費(fèi)。

把用戶自然地分流到兩個(gè)入口，讓真正需要深度推理的請求走專家模式，日常對話走快速模式——這本身就是一種算力調(diào)度策略，限額限流，緩解峰值壓力。

收費(fèi)是一條路，限額是另一條路，兩條路都能走，也可以同時(shí)走。而這整件事拼起來看，也是一個(gè)很完整的鋪墊路徑：

先灰度上線分層入口 → 讓用戶感知差異 → 打通多模態(tài)和文件能力 → 視覺模式開閘 → 限額/給更強(qiáng)大的模式定價(jià)。當(dāng)然，這僅僅是我個(gè)人的推測，畢竟 DeepSeek 從來不按常理出牌。

誠然，大家給 DeepSeek 貼了太多標(biāo)簽——技術(shù)理想主義、反商業(yè)、普惠 AI。然而， GPU 的推理成本每個(gè)月都是實(shí)打?qū)嵉摹；梅降牧炕找嬖儇S厚，也很難靠賣 API 填完一個(gè)全球級 AI 服務(wù)無限期免費(fèi)運(yùn)營的窟窿。

DeepSeek 攪動了整個(gè) AI 圈，但現(xiàn)實(shí)也終將攪動 DeepSeek。

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」（請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.