瑞財(cái)經(jīng) 吳文婷 千呼萬喚始出來。
4月24日,DeepSeek全新系列模型DeepSeek-V4的預(yù)覽版本正式上線并同步開源。
![]()
據(jù)官方介紹,DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。
模型按大小分為pro和flash兩個(gè)版本,DeepSeek-V4-Flash是更快捷高效的經(jīng)濟(jì)之選。
官方稱DeepSeek-V4開創(chuàng)了一種全新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力(DeepSeek Sparse Attention),實(shí)現(xiàn)了全球領(lǐng)先的長上下文能力,并且相比于傳統(tǒng)方法大幅降低了對計(jì)算和顯存的需求。從現(xiàn)在開始,1M(一百萬)上下文將是DeepSeek所有官方服務(wù)的標(biāo)配。
與此同時(shí),華為發(fā)文表示,昇騰一直同步支持DeepSeek系列模型,本次通過雙方芯模技術(shù)緊密協(xié)同,實(shí)現(xiàn)昇騰超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型。
據(jù)其指出,昇騰950通過融合kernel和多流并行技術(shù)降低Attention計(jì)算和訪存開銷,大幅提升推理性能,結(jié)合多種量化算法,實(shí)現(xiàn)了高吞吐、低時(shí)延的DeepSeek V4模型推理部署。
![]()
寒武紀(jì)發(fā)文表示,寒武紀(jì)已基于vLLM推理框架完成對深度求索公司最新開源模型285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的Day 0適配,適配代碼已開源到GitHub社區(qū)。
![]()
值得關(guān)注的是,曾讓無數(shù)投資人吃了閉門羹的DeepSeek,近期陸續(xù)傳出開放融資的消息。
4月22日,關(guān)于騰訊與阿里巴巴正就投資DeepSeek展開洽談的消息刷屏。據(jù)媒體報(bào)道,騰訊控股和阿里巴巴集團(tuán)正在洽談投資DeepSeek。一位知情人士透露,DeepSeek的目標(biāo)估值已從最初的至少100億美元上調(diào)至逾200億美元(約合人民幣1365億元),融資規(guī)模亦可能隨之?dāng)U大。
![]()
業(yè)內(nèi)人士指出,這是DeepSeek成立以來的首次外部融資,標(biāo)志著DeepSeek創(chuàng)始人梁文鋒長期堅(jiān)守的“不引入外部資金”立場出現(xiàn)重大轉(zhuǎn)變。
公開資料顯示,DeepSeek(深度求索)成立于2023年,由量化私募巨頭幻方量化創(chuàng)立,總部位于杭州,核心研發(fā)團(tuán)隊(duì)位于北京。該公司以開源大模型和極致性價(jià)比著稱,曾于2025年初引爆全球AI圈,其創(chuàng)始人梁文鋒以極致低調(diào)聞名。
據(jù)《2025新財(cái)富500富人榜》,40歲的梁文鋒,首次上榜即晉級(jí)前十,持股市值達(dá)1846.2億元。
![]()
相關(guān)公司:寒武紀(jì)sh688256
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.