<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      梁文鋒署名DeepSeek新論文,“突破GPU內存限制”

      0
      分享至

      【文/觀察者網 熊超然】1月12日晚間,中國人工智能(AI)初創公司DeepSeek創始人梁文鋒與北京大學研究人員共同署名發表了一篇技術論文,提出了一種新的模型訓練技術。他們表示,該技術可以通過繞過圖形處理單元(GPU)內存限制,實現“參數的積極擴展”。

      香港《南華早報》1月13日報道指出,此舉凸顯了DeepSeek在算力相對美國行業領先企業存在差距的情況下,持續專注于最大限度地提高成本效率。與此同時,外界猜測該公司將在今年春節之前發布一款重要的新模型。

      報道稱,這篇技術含量極高的論文將受到中國和美國業內人士的廣泛關注,他們希望從中了解DeepSeek所取得的最新進展。在過去一年中,DeepSeek一直是中國AI領域創新的典范。


      DeepSeek與北京大學研究人員合作發表論文,梁文鋒在列論文截圖

      據報道,在這篇題為《基于可擴展查找的條件記憶:大語言模型稀疏性的新維度》(Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models)的最新論文中,介紹了一種名為“Engram”(記憶痕跡)的“條件記憶”(conditional memory)技術。

      該技術用以解決擴大AI模型規模時的一個關鍵瓶頸——GPU高帶寬內存(HBM)容量有限的問題。

      現有的大型語言模型(LLM)通過計算來檢索基礎信息,而這一過程需要大量的計算能力。然而,研究人員表示,這種方式浪費了寶貴的“序列深度”(sequential depth),這些“序列深度”本可以被分配用于更高層次推理的瑣碎操作。

      《南華早報》指出,HBM是中國在AI硬件方面與美國之間最大的差距之一。韓國半導體行業分析機構SemiAnalysis的分析師Ray Wang表示,盡管近年來取得了穩步進展,但中國存儲芯片巨頭長鑫存儲(CXMT)仍然比韓國的三星電子和SK海力士以及美國的美光科技等行業領軍者落后數年。

      在論文中,DeepSeek和北京大學的研究人員表示,通過將計算與存儲“解耦”,Engram可以讓模型更高效地“查找”這些基礎信息。

      他們提到的新技術,還能夠提升模型在處理長上下文(即較長輸入)時的效率,而這正是將AI聊天機器人轉變為現實世界中有用的AI代理所面臨的最大挑戰之一。

      研究人員在一個擁有270億個參數的模型中驗證了這一技術,發現它使主要行業基準測試的表現提升了幾個百分點。關鍵在于,這也為模型執行計算需求更高的復雜推理保留了更多容量。

      他們寫道:“我們認為條件記憶將成為下一代稀疏模型中不可或缺的建模原語。”研究人員將Engram的潛在影響比作他們自己開發的一種“混合專家”(MoE)技術,該技術使模型規模的擴大無需按比例增加計算量,并且此后已被其他中國競爭對手采用。


      DeepSeek創始人梁文鋒 視頻截圖

      目前,行業中最大的模型擁有數萬億個參數。開源開發者平臺Hugging Face的研究工程師埃利·巴庫奇(Elie Bakouch)在社交媒體上對這篇論文大加稱贊,稱其“在推理和訓練時用硬件上驗證了這一技術”。

      據報道,這篇論文列出了14位共同作者,除了梁文鋒之外,還包括北京大學王選計算機研究所助理教授、前微軟亞洲研究院首席研究員張輝帥。

      去年年初,DeepSeek發布的大模型DeepSeek-R1,使用由英偉達H800 GPU驅動的數據中心進行訓練,僅用兩個月就完成了訓練,成本為550萬美元,僅為OpenAI等美國公司所花費金額的一小部分。卻實現了足以匹敵美國頂尖AI模型的效果,震撼業界的同時引發多國關注,尤其是美國。

      當地時間1月12日,據英國《金融時報》報道,微軟總裁布拉德·史密斯(Brad Smith)警告稱,在爭奪西方以外用戶的競爭中,美國AI公司正被中國競爭對手超越,中國低成本的“開源”模型是一大優勢所在。

      他表示,中國AI初創公司DeepSeek的技術在非洲等新興市場快速普及,凸顯了美國公司在全球面臨的競爭。“我們必須認識到,與一年前不同,現在中國擁有一個,而且越來越多地擁有不止一個具有競爭力的開源模型。”

      報道指出,史密斯發表這番言論之際,微軟的一項新研究發現,DeepSeek一年前發布的R1大型語言模型,因其“易用性和低成本”,幫助加速了AI在全球范圍內的普及,尤其是在全球南方國家。這也讓中國在“開源”AI模型的全球市場份額方面超越了美國,這些模型通常可以免費供開發人員使用、修改和集成。

      《南華早報》指出,在DeepSeek發布其R1模型一周年之際,外界對其即將推出一款新的重要模型的期待正在升溫。美國硅谷的新興科技媒體“The Information”當地時間1月9日報道稱,DeepSeek預計將在今年2月中旬推出一款具備強大編程能力的新V4模型。

      本文系觀察者網獨家稿件,未經授權,不得轉載。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不算分!U23國足VS泰國,開球時間確定,李昊和拜合拉木影響出線

      不算分!U23國足VS泰國,開球時間確定,李昊和拜合拉木影響出線

      體育大學僧
      2026-01-13 10:08:59
      李訥晚年回憶,曾問父親和誰關系最好,毛主席干脆利落地說出4人

      李訥晚年回憶,曾問父親和誰關系最好,毛主席干脆利落地說出4人

      興趣知識
      2025-12-04 20:47:30
      加密貨幣草案擬將XRP、Solana和狗狗幣歸于比特幣同等法律地位

      加密貨幣草案擬將XRP、Solana和狗狗幣歸于比特幣同等法律地位

      奔跑財經
      2026-01-14 11:20:57
      蒼天好輪回!徐帆回應離婚5個月后,馮小剛終于迎來"反噬"

      蒼天好輪回!徐帆回應離婚5個月后,馮小剛終于迎來"反噬"

      諾諾談史
      2026-01-12 19:25:53
      江蘇一批省管領導干部明確新職務

      江蘇一批省管領導干部明確新職務

      無線徐州
      2026-01-13 20:36:01
      3大信號已發出,美軍要突襲伊朗,戰斗隨時打響,不走就來不及了

      3大信號已發出,美軍要突襲伊朗,戰斗隨時打響,不走就來不及了

      小陳講史
      2026-01-13 11:20:04
      A股:權威定調,人民日報放大招,一個重要信號,周三迎關鍵變化

      A股:權威定調,人民日報放大招,一個重要信號,周三迎關鍵變化

      云鵬敘事
      2026-01-14 00:00:06
      賽季至今,36歲哈登得了927分,37歲的杜蘭特得了多少分呢?

      賽季至今,36歲哈登得了927分,37歲的杜蘭特得了多少分呢?

      越嶺尋蹤
      2026-01-14 06:32:33
      原中央黨校副校長總結“中國官場三大定律”

      原中央黨校副校長總結“中國官場三大定律”

      霹靂炮
      2026-01-12 21:18:44
      落草鳳凰不如雞?40歲女神“下海”拍短劇,老公于三年前被判無期

      落草鳳凰不如雞?40歲女神“下海”拍短劇,老公于三年前被判無期

      鹿楠
      2025-12-31 21:25:03
      我國004型航母將是世界上最大的核動力航母

      我國004型航母將是世界上最大的核動力航母

      起喜電影
      2026-01-14 08:15:59
      韓國U23輸球名宿震怒:若再遇到中國隊我會很焦慮,而不是高興

      韓國U23輸球名宿震怒:若再遇到中國隊我會很焦慮,而不是高興

      行舟問茶
      2026-01-14 10:07:51
      輕取公牛!杜蘭特28+10,史密斯救命8分,火箭該讓雨姐首發了

      輕取公牛!杜蘭特28+10,史密斯救命8分,火箭該讓雨姐首發了

      巴叔GO聊體育
      2026-01-14 11:54:15
      島內突然爆料,民進黨官員已經去過大陸,未來或接受九二共識?

      島內突然爆料,民進黨官員已經去過大陸,未來或接受九二共識?

      DS北風
      2026-01-13 17:42:13
      形勢危急:據稱,伊朗抗議活動的死亡人數急劇上升到500多人

      形勢危急:據稱,伊朗抗議活動的死亡人數急劇上升到500多人

      一種觀點
      2026-01-12 08:13:06
      經濟崩了,盟友全跑了,和中國決裂的歐洲小國,現在想找中國填坑

      經濟崩了,盟友全跑了,和中國決裂的歐洲小國,現在想找中國填坑

      溫讀史
      2026-01-14 11:45:06
      曾因“臟臟包”爆紅,如今一年關店132家!初代網紅品牌店退出多地市場

      曾因“臟臟包”爆紅,如今一年關店132家!初代網紅品牌店退出多地市場

      都市快報橙柿互動
      2026-01-13 23:17:54
      朱雨玲奪冠24小時內現丑聞,孫穎莎王曼昱被波及

      朱雨玲奪冠24小時內現丑聞,孫穎莎王曼昱被波及

      琨玉秋霜
      2026-01-14 01:05:00
      直線拉升!剛剛,美聯儲,降息大消息

      直線拉升!剛剛,美聯儲,降息大消息

      中國基金報
      2026-01-13 23:13:56
      曼聯的痛!24歲格林伍德戴帽+2妙傳+賽季第19球+領跑法甲射手榜

      曼聯的痛!24歲格林伍德戴帽+2妙傳+賽季第19球+領跑法甲射手榜

      側身凌空斬
      2026-01-14 09:08:58
      2026-01-14 12:28:49
      觀察者網 incentive-icons
      觀察者網
      全球視野,中國關懷
      132269文章數 1849672關注度
      往期回顧 全部

      科技要聞

      美國批準英偉達H200賣給中國,但有條件

      頭條要聞

      委方:美國襲擊爆炸威力巨大 無法對殘骸進行DNA鑒定

      頭條要聞

      委方:美國襲擊爆炸威力巨大 無法對殘骸進行DNA鑒定

      體育要聞

      牛津學霸買下兒時主隊,讓它成為英超黑馬

      娛樂要聞

      何晴去世30天,許亞軍終于發聲

      財經要聞

      "死了么"App爆火:流量來了 困境未解

      汽車要聞

      曝Model Y或降到20萬以內!

      態度原創

      房產
      本地
      時尚
      教育
      公開課

      房產要聞

      熱銷17億后!天正·三亞灣壹號,被爆違建!

      本地新聞

      云游內蒙|到巴彥淖爾去,赴一場塞上江南的邀約

      【年度愛用】她們2025年買得最值的,是這些

      教育要聞

      跟大鵬老師學將軍飲馬,通熟易懂!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品视频免费看| 伊人久久大香线焦av综合影院| 欧美日本精品一本二本三区| 国语自产拍在线观看hd| 99精品无码一区二区| 泰宁县| 成人国产欧美大片一区| 隔壁老王国产在线精品| 久久无码人妻热线精品| 九九热视频在线播放| jizzjizz韩国| 色综合色综合久久综合频道| 亚洲久悠悠色悠在线播放| 中文字幕av久久爽Av| 亚洲综合成人亚洲| 尹人香蕉久久99天天拍| 亚洲精品女同午夜在线| 成在人线av无码免费高潮水老板| 金湖县| 亚洲一码二码三码精华液| 久久久久成人片免费观看蜜芽| 亚洲已满18点击进入在线看片| 国产桃色在线成免费视频| 亚洲老熟女| a色毛片免费视频| 伊人无码网| 先锋影音av最新资源| www插插插无码免费视频网站| 久久99精品视频| 无码成人午夜在线观看| 拍拍拍| 亚洲gv天堂gv无码男同| 欧美一区二区三区欧美日韩亚洲| 探花无码| 亚洲欧美日韩第一页| 色中色资源站手机在线观看| 性夜夜春夜夜爽夜夜免费视频| 久久99久久99精品免视看看| 五月婷婷开心中文字幕| 人人妻人人妻人人片色AV| 日韩经典午夜福利发布|