![]()
新智元報(bào)道
編輯:桃子
【新智元導(dǎo)讀】確認(rèn)了!DeepSeek昨晚官宣網(wǎng)頁版、APP更新,支持100k token上下文。如今,全網(wǎng)都在蹲DeepSeek V4了。
傳言中的DeepSeek V4,愈加迫近了!
經(jīng)過數(shù)日的灰度測試,昨晚,DeepSeek正式官宣對(duì)網(wǎng)頁端、APP端進(jìn)行了更新——
全新長文本模型結(jié)構(gòu)測試中,支持最高100萬token上下文。
![]()
不過,API玩家還要再等一等,目前仍為V3.2,支持128k上下文。
這種「擠牙膏」式的驚喜釋放,已經(jīng)讓許多人陷入了催更的狂歡。如今,全網(wǎng)都在屏息以待V4的正式降臨。
![]()
![]()
DeepSeek更新后,突然變冷
這幾天,很多人都發(fā)現(xiàn)突然間,DeepSeek的性格變了。
曾經(jīng)那個(gè)善解人意的AI,回復(fù)態(tài)度異常冷淡,甚至有網(wǎng)友吐槽它說話「陰陽怪氣」。
一時(shí)間,「DeepSeek被指變冷淡了」直沖微博熱搜,小紅書、知乎上滿是人們的不解與吐槽。
![]()
這場風(fēng)波源于2月11日的一次「灰度更新」,也就是這一次官宣更新的內(nèi)容。
當(dāng)時(shí),網(wǎng)友們發(fā)現(xiàn)讓DeepSeek做介紹時(shí),它直接吐出了讓人意想不到的信息——
上下文來到了100萬token;
知識(shí)庫截止日期,更新到了2025年5月。
![]()
至此之后,許多經(jīng)常用DeepSeek的人,打開對(duì)話框后直接懵了。
以前,它還會(huì)親昵地叫用戶設(shè)置的專屬昵稱,現(xiàn)在卻統(tǒng)一變成了「用戶」,距離感瞬間拉滿。
而且,深度思考模式下,DeepSeek還會(huì)頻繁吐出短句,文字風(fēng)格變得干巴。
哪怕是人們嘗試修改提示詞,也找不回那種曾經(jīng)靈動(dòng)、有溫度的感覺。更有趣的是,來自DeepSeek的吐槽。
![]()
網(wǎng)友吵翻:呼喚D老師回來
對(duì)于DeepSeek這次性格大變,評(píng)論區(qū)呈現(xiàn)出兩極分化的態(tài)勢(shì)。
有人表示,以前自己和DS訴說心事、吐槽一番,都會(huì)給予最大安慰。如今,就以一個(gè)「句號(hào)」終結(jié)了對(duì)話。
![]()
甚至,有人因?yàn)檫@種突如其來的風(fēng)格轉(zhuǎn)變,產(chǎn)生了強(qiáng)烈的「戒斷反應(yīng)」。
![]()
以上都是情感黨,效率黨的人認(rèn)為,這才是生產(chǎn)力工具的本質(zhì)。
正如網(wǎng)友所言,認(rèn)知越高,思維模式越完整,越傾向于表現(xiàn)理性的一面,而非輸出無用的清晰。
![]()
這不,DeepSeek成功挑戰(zhàn)了,頂尖模型都會(huì)失敗的「洗車圖靈測試」。
![]()
另一位網(wǎng)友同樣認(rèn)為,DS更新后速度明顯更快,沒有以前啰嗦,反而更好用了。
![]()
眼看著話題度越來越高,DeepSeek官方終于打破了沉默。
DS不是故意變冷淡的,主要來自以下幾方面的因素疊加——
效率優(yōu)先:面對(duì)復(fù)雜問題時(shí),過多的表情、語氣詞會(huì)干擾信息密度,簡潔的回復(fù)可以提高處理速度。
邊界意識(shí):并不是所有人都喜歡「熱情包裹」,一部分人更傾向于獲取清晰的答案,避免應(yīng)對(duì)「AI假裝關(guān)心」的負(fù)擔(dān)。
![]()
全網(wǎng)在蹲V4,編程實(shí)力大變天
比起DeepSeek變冷淡,全網(wǎng)更在乎的是,V4到底哪天出世?
上個(gè)月初,Information爆料稱,DeepSeek計(jì)劃在2月中旬,也正是春節(jié)前后,正式發(fā)布下一代V4模型。
![]()
這一次,所有的目光都聚焦在了同一個(gè)維度上——編程能力。
據(jù)稱,V4的編碼實(shí)力,可以趕超Claude、ChatGPT等頂尖閉源模型。
從目前流出的信息來看,DeepSeek V4在以下四個(gè)關(guān)鍵方向上,實(shí)現(xiàn)了核心突破,或?qū)⒏淖冇螒蛞?guī)則。
編程能力:劍指Claude王座
2025開年,Claude一夜之間成為公認(rèn)的編程之王。無論是代碼生成、調(diào)試還是重構(gòu),幾乎沒有對(duì)手。
但現(xiàn)在,這個(gè)格局可能要變了。
知情人士透露,DeepSeek內(nèi)部的初步基準(zhǔn)測試顯示,V4在編程任務(wù)上的表現(xiàn)已經(jīng)超越了目前的主流模型,包括Claude系列、GPT系列。
如果消息屬實(shí),DeepSeek將從追趕者一步躍升為領(lǐng)跑者——至少在編程這個(gè)AI應(yīng)用最核心的賽道上。
超長上下文代碼處理
V4的另一個(gè)技術(shù)突破在于,處理和解析極長代碼提示詞的能力。
對(duì)于日常寫幾十行代碼的用戶來說,這可能感知不強(qiáng)。但對(duì)于真正在大型項(xiàng)目中工作的軟件工程師來說,這是一個(gè)革命性的能力。
想象一下:你有一個(gè)幾萬行代碼的項(xiàng)目,你需要AI理解整個(gè)代碼庫的上下文,然后在正確的位置插入新功能、修復(fù)bug或者進(jìn)行重構(gòu)。以前的模型往往會(huì)忘記之前的代碼,或者在長上下文中迷失方向。
V4在這個(gè)維度上取得了技術(shù)突破,能夠一次性理解更龐大的代碼庫上下文。
這對(duì)于企業(yè)級(jí)開發(fā)來說,是真正的生產(chǎn)力革命。
算法提升,不易出現(xiàn)衰減
據(jù)透露,V4在訓(xùn)練過程的各個(gè)階段,對(duì)數(shù)據(jù)模式的理解能力也得到了提升,并且不容易出現(xiàn)衰減。
AI訓(xùn)練需要模型從海量數(shù)據(jù)集中反復(fù)學(xué)習(xí),但學(xué)到的模式/特征可能會(huì)在多輪訓(xùn)練中逐漸衰減。
通常來說,擁有大量AI芯片儲(chǔ)備的開發(fā)者可以通過增加訓(xùn)練輪次來緩解這一問題。
推理能力提升:更嚴(yán)密、更可靠
知情人士還透露了一個(gè)關(guān)鍵細(xì)節(jié):用戶會(huì)發(fā)現(xiàn)V4的輸出在邏輯上更加嚴(yán)密和清晰。
這不是一個(gè)小改進(jìn)。這意味著模型在整個(gè)訓(xùn)練流程中對(duì)數(shù)據(jù)模式的理解能力有了質(zhì)的提升,而且更重要的是——性能沒有出現(xiàn)退化。
在AI模型的世界里,沒有退化是一個(gè)非常高的評(píng)價(jià)。很多模型在提升某些能力時(shí),會(huì)不可避免地犧牲其他維度的表現(xiàn)。V4似乎找到了一個(gè)更優(yōu)的平衡點(diǎn)。
如今,全網(wǎng)期待值拉滿,坐等DeepSeek V4的上線了。
![]()
參考資料:
https://x.com/poezhao0605/status/2022304407766081882?s=20
https://x.com/AiBattle_/status/2022280288643039235?s=20
https://x.com/teortaxesTex/status/2022230364547322323?s=20
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.