<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      姚順雨的最新成果,才是騰訊發完 10 億紅包后決戰 AI 的關鍵

      0
      分享至

      還沒有進入春節,各大廠商已經迫不及待了:前有元寶大派紅包,馬上千問就豪請奶茶——花不了多少錢,30 個小目標罷了。


      預算在前面燒,基建在后面搭,畢竟等推廣預算燒完,能做到多少用戶留存,就要看產品本身了。這樣一看,騰訊在下半年把前 OpenAI 研究員、清華姚班的天才少年姚順雨挖到手,可謂計之長遠。

      執掌騰訊 AI 之后,近日姚順雨終于發出了第一項署名研究,這是騰訊混元團隊聯合復旦大學發布的研究,把目光聚集到了上下文。這似乎是一個略顯冷門的技術點,但研究的發現是能讓所有日常都在玩 AI 的用戶背脊一涼的:如果我們把大模型從「背書模式」切換到「現學現賣模式」,即使是目前地球上最強的 AI,得分率也只有慘淡的 23.7%。

      這項研究遠不止是一個技術圈的八卦,它直接揭示了為什么作為普通用戶的你,經常覺得 AI 「聽不懂人話」、「死腦筋」或者「胡說八道」。如果說有什么是 AI 的阿喀琉斯之踵,那上下文(Context)當如是。

      上下文:AI 的靈魂

      要理解這項研究的價值,我們需要先搞清楚大模型運作的兩個基本階段。

      第一個階段是預訓練。在這個過程中,模型通過閱讀互聯網上浩如煙海的數據,記住了海量的知識和模式。這一點現在大家應該都不陌生了。這是 AI 知識儲備的來源,也是它能夠回答通用問題的基礎。


      但問題在于,預訓練數據是靜態的,它反映的是模型訓練截止日期之前的世界。一旦脫離了這個范圍,模型就會變得盲目——而真實世界是動態的。

      這就來到第二個階段,情境學習,也就是我們常說的上下文處理。當你把一段全新的、內部的、或者是極其復雜的規則文本發給 AI 時,你實際上是在要求它跳出預訓練的記憶,根據眼前的信息進行實時推理和判斷。

      像什么呢?比如公司內部剛剛開完會之后的紀要,或者你玩的游戲有了新活動,這些知識從未在互聯網上出現過,只能由你把規則、信息(即「上下文」)扔給 AI,讓它根據這些新知識來回答問題。

      這才是現實,互聯網上并非應有盡有,模型對于上下文的學習能力可以說是非常重要,甚至可以說:上下文,就是 AI 的靈魂。


      如果 AI 記不住、或者理解錯了上下文,它就會開始編造(幻覺),可能會根據它「記憶」里通用規則來回答——會議紀要里明明說行政部要負責下午茶,它卻說是產品經理管這事兒。

      這就是混元團隊這次建設 CL-bench 在干的事情。他們構建了近 2000 個從未在互聯網上公開過的、由專家精心構造的「全新情境」,有虛構的法律體系,新的編程語言語法等等。


      根據 CL-bench 的排行榜,目前最先進的 GPT-5.1 (High) 模型的正確率僅為 23.7%,Claude Opus 4.5 約為 21.1%,而其他的模型大都在 10%-18% 之間徘徊。

      這意味著,當我們要求 AI 「忘掉你以前學的,只看我發給你的這段話」時,它們大概率會搞砸。它們就像那些固執的學生,哪怕老師已經在黑板上寫了「今天 1+1=3」,它還是會大聲喊出「1+1=2」,因為新知識對它而言都「超綱」了。


      CL-bench 的研究揭示了幾個導致模型在情境學習中失敗的深層原因,這些原因解釋了為什么我們在使用 AI 時會感到它有時聰明、有時愚蠢。

      最常見的翻車原因。模型在預訓練里學到的東西太「根深蒂固」了。當模型接收到新的上下文時,它往往無法有效抑制住預訓練數據中那些根深蒂固的模式。

      比如,在 CL-bench 的一個測試案例中,研究人員構建了一個虛構的軟件開發包 Skynet SDK。雖然這只是個虛構的名字,但因為「Skynet(天網)」在 AI 的潛意識(預訓練數據)里太出名了,模型可能會下意識地把《終結者》電影里的設定帶入進來,從而無視說明文檔里枯燥的代碼規則。


      另外,復雜邏輯的推演能力依然是目前技術的瓶頸——這點多少有些令人意外,都 2026 了,AI 處理超長文本不是早已經駕輕就熟嗎?但實際上,雖然模型能吞下幾萬字,它并不一定能從數據海洋里面精準地撈出那一根針。研究發現,當提供的上下文非常長、邏輯非常復雜(比如復雜的邏輯推理鏈條、多輪的交互依賴)時,模型的表現會直線下降。

      如果上下文僅僅是「知識檢索」(比如從文檔里找一個名字),現在的模型還湊合。但一旦涉及到「邏輯推理」,模型的解決率就暴跌。

      為什么是騰訊來做?

      CL-bench 是姚順雨入主騰訊后,首次署名的研究成果。如果把它放到騰訊龐大的產品矩陣中去審視,就會發現「上下文學習」和這家互聯網巨頭自身業務邏輯之間的關系。


      與其他更偏向搜索或通用生產力工具的科技公司不同,騰訊的根基深深扎根于「社交」與「內容」的土壤之中,而這兩個領域對 AI 上下文能力的要求可謂極其苛刻。

      想象一下微信或 QQ 的使用場景。這里產生的數據并非孤立的問答,而是連綿不斷、高度碎片化的對話流——最新的元寶派就是例子。當用戶試圖在一個擁有數百條消息的群聊中讓 AI 總結重點,或者在一段長達數月的私聊記錄中尋找某個約定的細節時,AI 面臨的挑戰正是 CL-bench 所測試的極限:它必須在不依賴外部通用知識的前提下,精準地理解這段封閉對話中特有的語境、人際關系和隱含邏輯。


      如果 AI 無法妥善處理這種高密度的上下文,它就無法真正融入十億用戶的社交鏈路,只能作為一個甚至會打斷對話流暢度的累贅存在。

      另外,騰訊在游戲與企業服務領域的布局,也決定了它對「情境學習」的渴求。游戲自不用說,各家都在探索 AI 如何根據即時的操作和游戲內的實時局勢(即游戲上下文)做出反應,而不是機械地背誦預訓練好的臺詞。

      在企業微信和騰訊會議的場景中,用戶需要的往往是基于特定會議紀要或私有文檔的精準分析。在這些場景下,通用的預訓練知識不僅無效,甚至可能因為「幻覺」而帶來嚴重的誤導。

      「在場景中演滿分的學生,未必能勝任真實世界的工種」—— 混元團隊意識到了這一點,這也恰恰是對當下 AI 最好的注腳。對于坐擁海量應用場景的騰訊來說,一個能在復雜上下文中保持清醒、邏輯嚴密的模型,遠比一個博學但只會死記硬背的模型,具有更大的商業價值和落地潛力。

      歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      死于220年,神化到2026年

      死于220年,神化到2026年

      最愛歷史
      2026-02-23 18:22:55
      撒貝寧一家走完親戚返京!老婆蜂腰翹臀太漂亮,龍鳳胎身高不隨爹

      撒貝寧一家走完親戚返京!老婆蜂腰翹臀太漂亮,龍鳳胎身高不隨爹

      天天熱點見聞
      2026-02-24 09:18:53
      朝鮮勞動黨九大,崔龍海的退出

      朝鮮勞動黨九大,崔龍海的退出

      周邊問題研究所
      2026-02-24 14:14:10
      遭30歲老將逼入絕境!橋本0-2落后逆轉仰天閉目 日乒最強成笑談

      遭30歲老將逼入絕境!橋本0-2落后逆轉仰天閉目 日乒最強成笑談

      顏小白的籃球夢
      2026-02-24 20:28:33
      一箱油可橫跨北美 本田新型小飛機賣爆:購買意向達產能10倍

      一箱油可橫跨北美 本田新型小飛機賣爆:購買意向達產能10倍

      快科技
      2026-02-24 08:21:03
      劉青石:若朱楓按我的方式撤離,吳石不會犧牲,蔡孝乾也不會被抓

      劉青石:若朱楓按我的方式撤離,吳石不會犧牲,蔡孝乾也不會被抓

      冰雅憶史
      2026-02-24 10:11:08
      一女子坐牢20年終于出獄,去辦身份證時警察竟淚灑當場

      一女子坐牢20年終于出獄,去辦身份證時警察竟淚灑當場

      故事秘棧
      2025-05-27 18:56:51
      15天內開戰?伊朗迎來強援:2500枚導彈、16架蘇35

      15天內開戰?伊朗迎來強援:2500枚導彈、16架蘇35

      兵國大事
      2026-02-24 00:05:12
      宋彬彬晚年回國道歉仍不被原諒,其父宋任窮也不愿提起她,為何

      宋彬彬晚年回國道歉仍不被原諒,其父宋任窮也不愿提起她,為何

      春秋硯
      2026-02-24 12:25:08
      谷愛凌14歲就說自己是中國人:我不是老外 會不會說中文有打區別

      谷愛凌14歲就說自己是中國人:我不是老外 會不會說中文有打區別

      念洲
      2026-02-24 16:34:24
      巴拿馬政府強行進入并接管港口,李嘉誠旗下長和回應:相關行動不合法,構成嚴重風險,將研究所有可行途徑

      巴拿馬政府強行進入并接管港口,李嘉誠旗下長和回應:相關行動不合法,構成嚴重風險,將研究所有可行途徑

      都市快報橙柿互動
      2026-02-24 14:12:41
      體制內情商高能帶來啥意外驚喜?網友:別在地鐵看,別問我為什么

      體制內情商高能帶來啥意外驚喜?網友:別在地鐵看,別問我為什么

      帶你感受人間冷暖
      2026-02-24 01:03:13
      顧順章叛變后,交代了四名中共負責人,第一個名字就讓徐恩曾傻眼

      顧順章叛變后,交代了四名中共負責人,第一個名字就讓徐恩曾傻眼

      大運河時空
      2026-02-23 11:10:03
      內地多名“億萬富豪”在香港被抓!

      內地多名“億萬富豪”在香港被抓!

      港港地
      2026-02-24 10:03:12
      家里有這4款老酒,別喝掉更別賣掉,如今的價值不輸飛天茅臺

      家里有這4款老酒,別喝掉更別賣掉,如今的價值不輸飛天茅臺

      濤哥美食匯
      2026-02-24 08:49:53
      確認訪華后,特朗普宣布對華加稅!要在中國下賭注,卻迎2大噩耗

      確認訪華后,特朗普宣布對華加稅!要在中國下賭注,卻迎2大噩耗

      古史青云啊
      2026-02-24 11:35:42
      38歲中國商人在土耳其被綁架殺害,其遭同行女子引誘擄上車,10名嫌疑人已落網

      38歲中國商人在土耳其被綁架殺害,其遭同行女子引誘擄上車,10名嫌疑人已落網

      揚子晚報
      2026-02-24 14:21:20
      再也不小瞧“空氣炸鍋”了!果然,只要思路打開,就好用到離譜

      再也不小瞧“空氣炸鍋”了!果然,只要思路打開,就好用到離譜

      美家指南
      2026-02-24 15:48:11
      荷蘭沒回頭路了!中國子公司宣布:正式換國內供應商,不再合作!

      荷蘭沒回頭路了!中國子公司宣布:正式換國內供應商,不再合作!

      通鑒史智
      2026-02-24 14:19:15
      一個非常不好的消息:中國超2億獨生子女面臨的非常嚴峻問題。

      一個非常不好的消息:中國超2億獨生子女面臨的非常嚴峻問題。

      百態人間
      2026-02-05 15:39:14
      2026-02-24 21:28:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6125文章數 26774關注度
      往期回顧 全部

      科技要聞

      宇樹科技發布四足機器人Unitree As2

      頭條要聞

      20家日本實體被列入管制名單 中方:完全正當 合理合法

      頭條要聞

      20家日本實體被列入管制名單 中方:完全正當 合理合法

      體育要聞

      蘇翊鳴總結米蘭征程:我仍是那個熱愛單板滑雪的少年

      娛樂要聞

      汪小菲官宣三胎出生:承諾會照顧好3個孩子

      財經要聞

      縣城消費「限時繁榮」了十天

      汽車要聞

      入門即滿配 威蘭達AIR版上市 13.78萬元起

      態度原創

      游戲
      手機
      教育
      親子
      軍事航空

      天國拯救影視化官宣!主創卸任創意總監全力投身

      手機要聞

      折疊屏大戰!OPPO Find N6與榮耀Magic V6均已官宣,選擇卻糾結了

      教育要聞

      初試調整!多所院校發布2027考研初試科目調整公告!

      親子要聞

      萌娃質問老爸:媽媽為什么嫁給你,老爸的回答竟讓萌娃面露難色

      軍事要聞

      美軍參聯會主席警告:對伊朗動武可能帶來重大風險

      無障礙瀏覽 進入關懷版