就在剛剛,DeepSeek 網(wǎng)頁端迎來大更新。
沒有發(fā)布會,沒有 blog,甚至連一條官方推文都沒有。DeepSeek 網(wǎng)頁端的輸入框上方多了兩個(gè)圖標(biāo)——一個(gè)閃電,一個(gè)鉆石,分別對應(yīng)「快速模式」和「專家模式」。
![]()
![]()
懸停一下,提示語出來了:快速模式「適合日常對話,即時(shí)響應(yīng)」,專家模式「擅長復(fù)雜問題,高峰需等待」。
目前從實(shí)測和網(wǎng)友拆解來看,兩個(gè)模式的差異大概是這樣的:
快速模式,可以識別圖片和文件中的文字,速度快,響應(yīng)即時(shí)。代價(jià)是,背后跑的大概率是一個(gè)更輕量的 V4 Lite 模型,但針對速度做了優(yōu)化。
![]()
專家模式,疑似路由到了更大、更強(qiáng)的模型——很可能就是 DeepSeek V4 正式版的某個(gè)形態(tài)。但目前它不支持文件上傳,也沒有多模態(tài)能力。等等,更強(qiáng)的模型,反而功能更少?
![]()
![]()
上下滑動查看更多內(nèi)容
我們也做了一輪簡單測試。
比如讓兩個(gè)模式各自寫一個(gè) p5.js 程序,模擬球在旋轉(zhuǎn)六邊形內(nèi)彈跳,要求受重力和摩擦力影響。結(jié)果顯示專家模式給出的結(jié)果更符合物理直覺,落點(diǎn)更準(zhǔn),彈跳軌跡更真實(shí)。
![]()
對比之下,快速模式給出的的結(jié)果肉眼可見差了一個(gè)檔次。
![]()
這種差距,其實(shí)挺能說明問題的。物理仿真對數(shù)學(xué)推理能力要求高,弱一點(diǎn)的模型容易出現(xiàn)「看起來像物理但實(shí)際上不對」的結(jié)果。專家模式在這里的表現(xiàn),是實(shí)打?qū)嵉哪芰Σ町悺?/p>
但網(wǎng)友 @AiBattle_ 讓其制作的太空侵略者游戲結(jié)果卻讓人有點(diǎn)意外:專家模式的輸出和快速模式差距并不明顯。
![]()
做測試的網(wǎng)友給出了一個(gè)判斷:「我估計(jì)專家模式現(xiàn)在路由的仍然是某個(gè)版本的 V4 Lite。要看到完整版 V4 在網(wǎng)頁端上線,可能還得再等一陣。」這個(gè)判斷和外部報(bào)道的時(shí)間線基本吻合——晚點(diǎn) LatePost 報(bào)道,V4 正式版預(yù)計(jì)今年 4 月亮相,屆時(shí)大概率仍是開源最強(qiáng),但報(bào)道也點(diǎn)明「很難是碾壓級的強(qiáng)」。
換句話說,這次灰度上線的「專家模式」,未必就是最終形態(tài)。
創(chuàng)意寫作方面,我給兩種模式出了一道辯論寫作題,題目是「替無聊辯護(hù),論證無聊是現(xiàn)代人的奢侈品」。
專家模式的輸出更長,邏輯鏈更完整;快速模式的文風(fēng)則相對自然樸實(shí)。
![]()
![]()
上下滑動查看快速模式(前)和專家模式(后)
有意思的是,在這個(gè)任務(wù)上,兩個(gè)模式的速度差距并不明顯,甚至專家模式的思考時(shí)間更短。這有點(diǎn)反直覺,但可能和任務(wù)性質(zhì)有關(guān)——創(chuàng)意寫作對模型規(guī)模的敏感度,遠(yuǎn)低于數(shù)學(xué)推理類任務(wù)。
對于簡單任務(wù),兩個(gè)模式差異有限;越是需要深度推理的場景,專家模式的優(yōu)勢越明顯。
在數(shù)學(xué)邏輯題「繩子繞地球一圈,加長 1 米均勻撐開,縫隙多高?」中,盡管兩個(gè)模式給出了相同的答案,但過程截然不同。快速模式的回答很簡略;專家模式則一步一步拆解,每個(gè)推導(dǎo)環(huán)節(jié)都交代清楚,更接近「把思考過程寫出來」這個(gè)指令要求。
![]()
![]()
上下滑動查看更多內(nèi)容
值得一提的是,目前網(wǎng)頁端實(shí)際上線的只有快速和專家兩個(gè)模式,但此前的爆料顯示,還有第三個(gè)選項(xiàng)正在路上——「Vision 模式」。
![]()
圖片來自互聯(lián)網(wǎng)
關(guān)注 DeepSeek 技術(shù)路線的博主 Teortaxes 認(rèn)為:把 Vision 單獨(dú)列為一個(gè)類,是很不尋常的設(shè)計(jì)。他提到,DeepSeek 此前拒絕在網(wǎng)頁端部署 DS-VL 系列,原因是「尚未成熟」。如果 Vision 模式真的上線,背后支撐它的,很可能已經(jīng)是一個(gè)「完全功能化」的 VLM。
而 Teortaxes 在他的長評里,給出了一個(gè)更大膽的猜測——這個(gè)視覺模型,有可能不是常規(guī)的 VLM,而是某種「深度統(tǒng)一世界模型」,是 Janus 系列的下一步演化,或者其他更非傳統(tǒng)的架構(gòu)。
當(dāng)然,這僅僅只是他的猜測, 也有網(wǎng)友 @xhyctf 表示,DeepSeek 被逆向的前端代碼顯示,Vision 模式,根本就沒有獨(dú)立的模型。所謂「視覺理解」,只是在快速模式下悄悄加了一個(gè)參數(shù)——filefeature.vision = true。
盡管如此,有一點(diǎn)是確定的:DeepSeek 在多模態(tài)方向一直都有所布局,或許只是差一個(gè)良好的時(shí)間窗口。而把快速、專家等入口擺在用戶面前,背后其實(shí)是一個(gè)更值得關(guān)注的方向:
![]()
DeepSeek 開始做產(chǎn)品分層了。
自去年初爆火以來,DeepSeek 的產(chǎn)品邏輯一直是高度「反商業(yè)」的——API 定價(jià)較低,網(wǎng)頁端完全免費(fèi),功能也沒什么門檻區(qū)分。但問題也隨之而來:長期維持這種「全免費(fèi)、無分層」的運(yùn)營方式,商業(yè)上是不可持續(xù)的。
現(xiàn)在,DeepSeek 開始把「更強(qiáng)的模型」和「更基礎(chǔ)的模型」做成兩個(gè)入口。專家模式目前還是免費(fèi)的,但這個(gè)架構(gòu)一旦搭好,后續(xù)要在上面做付費(fèi)體系,技術(shù)上已經(jīng)不是問題了。
當(dāng)然,分層的目的,未必只是為了收費(fèi)。
把用戶自然地分流到兩個(gè)入口,讓真正需要深度推理的請求走專家模式,日常對話走快速模式——這本身就是一種算力調(diào)度策略,限額限流,緩解峰值壓力。
![]()
收費(fèi)是一條路,限額是另一條路,兩條路都能走,也可以同時(shí)走。而這整件事拼起來看,也是一個(gè)很完整的鋪墊路徑:
先灰度上線分層入口 → 讓用戶感知差異 → 打通多模態(tài)和文件能力 → 視覺模式開閘 → 限額/給更強(qiáng)大的模式定價(jià)。當(dāng)然,這僅僅是我個(gè)人的推測,畢竟 DeepSeek 從來不按常理出牌。
誠然,大家給 DeepSeek 貼了太多標(biāo)簽——技術(shù)理想主義、反商業(yè)、普惠 AI。然而, GPU 的推理成本每個(gè)月都是實(shí)打?qū)嵉摹;梅降牧炕找嬖儇S厚,也很難靠賣 API 填完一個(gè)全球級 AI 服務(wù)無限期免費(fèi)運(yùn)營的窟窿。
DeepSeek 攪動了整個(gè) AI 圈,但現(xiàn)實(shí)也終將攪動 DeepSeek。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.