![]()
林俊旸,生于1993年,阿里Qwen技術負責人,最年輕的P10級技術專家。
楊植麟,生于1993年,月之暗面創始人,公司賬上躺著100億元。
姚順雨,生于1998年,前OpenAI員工、剛上任騰訊AI首席科學家。
面對他們,剛完成公司上市,今年49歲的智譜創始人唐杰不得不感慨,長江后浪推前浪。在他邊上,1953年出生的中國科學院院士張鈸笑稱,那我被拍了一波又一波。
在一片祥和里,中國的AI屆迎來了開年以來最強閉門會議。由清華大學基礎模型北京市重點實驗室發起的“AGI-Next”峰會,幾乎聚集了國內這一領域最強的青年代表。從另一個角度來看,除了DeepSeek,三大開源模型的核心人員都在了。
DeepSeek的缺席也情有可原。據The information透露,他們正在憋大招,可能會在春節前后發布V4版本,編程能力將有跨越式的提升。
但這并不妨礙像姚順雨這樣備受期待的天才少年們閃亮登場。
![]()
![]()
清華大學教授、智譜創始人唐杰:
Chat之戰已結束,下一戰是“做事”
![]()
1. 范式轉折點已到:隨著DeepSeek等大模型的出現,純聊天(Chat)的競爭已基本結束,下一階段的競爭核心是“行動”(Action)與“做事情”(Doing things)。
2. 專注代碼(Coding)與智能體(Agent):智譜團隊經過多次爭論后,將主要精力投入在Coding能力上,并認為Agent是未來關鍵方向之一。
3. Agent成功三要素:真實價值(解決實際問題)、成本可控、執行速度(搶出時間窗口)。
4. 智能效率:創新的爆發,往往是因為對某件事投入巨大,效率卻不再提升。未來我們應該定義一個衡量收益的新范式:智能效率(Intelligence Efficiency)。提升智能上限,擴大規模(Scaling)可能是最“笨”的辦法,真正的挑戰在于:如何用更少的Scaling,獲得同樣的智能提升。
5. 2026年將有新范式突破:隨著學術界算力提升、工業界效率瓶頸顯現,持續學習(Continual Learning)、記憶(Memory)、多模態等領域,可能在2026年出現范式變革。
6. 中國AI的機會在于環境與堅持:90后、00后更具冒險精神,呼吁為敢冒險的年輕一代提供更好的創新環境,并相信“笨笨的堅持”可能讓中國團隊最終走在前沿。
![]()
阿里千問大模型技術負責人林俊旸:
研究員本身就是產品經理
Agent與具身智能結合會更有意思
![]()
1. 市場分化邏輯:OpenAI做To C平臺,Anthropic深度服務企業(在與金融領域客戶深度交流中發現真實機會),分化是自然發生的,是順應市場需求后的自然結果;在美國,Coding任務的Token(文本處理的最小單元)消耗量巨大,這一點目前中國市場還沒達到同等量級。
2. AGI的服務本質:今天To B也好,To C也好,我們都是要解決真實的問題,怎么把人類世界變得更好。
3. 強化學習(RL)潛力未充分釋放:目前的強化學習范式尚處早期,潛力遠未被充分挖掘,全球范圍內仍面臨基礎設施等瓶頸。而下一代范式的核心在于“自主進化”與“主動性”,只是自主進化用什么技術手段、是否需要更新參數,見仁見智。
4. Agent的“模型即產品”思維:研究員本身就是產品經理,需要有產品思維,能端到端地把東西做出來。未來的Agent應該是托管式的,你給它一個模糊通用指令,它能在長周期的執行中自我決策和進化。另外,只有當AI與真實物理世界交互,才是Agent真正能長時間工作的場景。未來3-5年,Agent與具身智能的結合,會更有意思。
5. 通用Agent的機會在于長尾:要不要做通用Agent?如果你是“套殼”高手,套 得 可以比模型公司做 得 更好,我覺得可以去做。否則可以留給模型公司,因為它們有算力和數據優勢。
6. 對中國AI發展謹慎樂觀:未來3-5年中國公司引領全球的概率有多大,這是一個“危險”的問題,從概率角度談談中美差異:中美算力差距1-2個數量級;目前美國將更多算力投入前沿研究,中國更多用于交付;“窮則思變”,軟硬件協同可能孕育新機會。再加上中國新一代人的成長和營商環境的改善,有機會但面臨的困難非常大。
7. Qwen下一步發展的三個重點:
(1)構建具備視覺輸出和推理能力的Omni模型,把能力真正收斂到多模態模型,不僅能接收文本、圖像和語音,而且也要具備同時生成這些模態的能力。
(2)從訓練模型轉向訓練Agent,尤其是通過多輪強化學習和環境反饋,實現面向長時任務的推理能力。
(3)把語言模型進一步轉化為具備行動能力的(具身智能)Embodied模型。
![]()
騰訊“CEO/總裁辦公室”首席AI科學家姚順雨:
To B與To C明顯分化,自主學習已在發生
![]()
1. 對市場分化的兩大觀察:
(1)To B與To C的分化:To C對智能上限要求不高,更像是“搜索引擎加強版”;To B則呈現“越強越付費”邏輯——企業只愿意為最強的模型支付溢價,所以在To B市場,強模型和弱模型的分化會越來越明顯。
(2)垂直整合與分層模式的分化:To C產品中,模型與產品是強耦合、緊密迭代的;而To B場景中,趨勢似乎相反:模型層專注于把模型做得越來越強,應用層則想用最好的模型賦能不同的生產力環節。
2. 騰訊的雙軌策略:To C:聚焦上下文(Context)和環境信息,通過額外輸入提供價值(比如問“今天吃什么”,如果加上“今天很冷”“我在哪個商圈”等信息,又或者直接把相關聊天記錄丟給AI,回答的價值會完全不同);To B:作為一家萬人規模的大公司,思考的是如何先“服務好自己”,充分利用內部場景沉淀真實數據。
3. 自主學習(Self-learning)的現在時:自主學習已成為非常熱門的詞匯,它并非單一方法論,而是高度依賴于具體的“數據與任務”的場景化實踐。聊天變得個性化、像博士一樣探索新科學,這些都是不同維度的自主學習。因此,自主學習這件事“已經在發生了”,但目前受限于場景和效率,是“漸變而非突變”。
4. 想象力的問題:要實現真正的自主學習,現在最大的問題是想象力。我們還沒定義好驗證它的“任務”,是一個能賺錢的交易系統,還是解決人類未解的科學難題?我們需要先想象出它的樣子。
5. 2026年Agent展望:To B Agent進入上升通道,不依賴花哨創新,靠扎實的預訓練和后訓練;即使模型停止進化,僅靠更好地部署現有模型到真實場景,也能帶來10-100倍效率提升,對GDP產生5%-10%的影響,現在還遠沒到1%。
6. 中國AI的優勢與瓶頸:優勢在于工程能力、產業化效率、人才密度;瓶頸在于算力(光刻機、軟件生態)、To B市場成熟度、國際商業環境;核心挑戰,不斷涌現的人才能否引領新范式,需要更多冒險精神和長期探索文化。
7. 回國的感覺還是挺好的,吃 得 好很多。
![]()
月之暗面創始人楊植麟:
做模型本質上是在創造一種世界觀
![]()
1. Kimi的技術重點:2025年,月之暗面的兩個技術進化主線是:提升Token效率,以在有限的數據下沖擊更高的智能上限;擴展長上下文能力,以滿足智能體化時代越來越長程的任務對模型的記憶能力需求。
2. 智能的獨特性:智能和電力不一樣,它不是等價交換品。你在深圳用的1度電,和在北京用的1度電,完全一樣,但一個CEO產生的智能,和一個設計師、一個音樂家產生的智能,截然不同。
3. 模型競爭的核心:未來的模型競爭,比的就是誰更有Taste,誰更有品味。做模型本質上是在創造一種世界觀,即你覺得什么樣的東西是好的,一個好的AI應該有什么樣的表現,應該追求什么樣的價值觀。所以,你在這個模型里注入了什么,它就會涌現出什么樣的智能。
4. 生態多樣性:不用擔心未來會有單一的模型一統世界,因為智能Taste的差異是巨大的。
5. AI的安全問題:AI可能是人類探索未知的鑰匙,能幫我們攻克癌癥、解決能源危機、探索宇宙。雖然有風險,但放棄發展就等于放棄人類文明的上限(最后一句援引自他和Kimi的聊天記錄)。
文 | 童蔚
VIEW MORE
@紐約時報這篇報道,讓美國網友破防了>>
@當AI眼鏡陷作弊疑云>>
@他用20年時間打破腔鏡手術機器人的進口壟斷>>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.