網易首頁 > 網易號 > 正文申請入駐

AI拼研究了｜筆記

2026-01-11 18:45:27　來源: 未盡研究

上海舉報

分享至

伊利亞在去年底說，要回歸研究；2026進入新年，頂尖的和新型的AI實驗室，都已經開始只爭朝夕了。

中美都在發力AI下一個范式

a16z的創始人安德森，最近融了一筆150億美元的基金，他展望2026年時說，看好伊利亞(Ilya Sutskever)，Mira (Murady)，李飛飛、Cursor團隊等，這一批業內頂尖的科學家和研究團隊，新型AI研究將有可能顛覆硅谷。當然，他也看好中國的團隊，如月之暗面Kimi，已經達到GPT-5的水平。

月之暗面創始人楊植麟最近在一個內部行業論壇中說，“所有的技術突破都伴隨著風險，但我們不能因恐懼而停滯不前。因此，我們希望在接下來的十年、二十年里，繼續把K4、K5到K100做得更好。”

楊植麟談到了在中國做研究非常稀缺的一種東西taste (品味），月之暗面要堅持taste，它手握百億元現金，也給了它這樣做的底氣。這類似于DeepSeek，堅持純粹的AGI追求，決定了可以長期保持taste。保持taste，需要不停地拓展模型的邊界。Kimi明確提出了兩個目標，一個是token效率，一個是長文本（long context）。

這是清華大學基礎模型北京市重點實驗室、智譜AI發起的AGI-Next發起的前沿峰會。而中國的“大模型第一股”智譜上市之后，其創始人兼首席科學家唐杰，也要求大家馬上回歸研究。

TML（Thinking Machine Lab）甚至很鮮明地提出，研究即產品（Researcher is Product）。這家公司在OpenAI前首席技術官Mira帶領下，聚集包括OpenAI聯合創始人舒曼和翁荔等在內的一批頂尖研究員。這其實也支持了模型即產品這一觀點。

阿里千問技術負責人林俊旸認為，現在的研究究員，都愿意做面向真實世界的研究。他特別提出了目前AI所處的工作環境，就是在電腦里，而幾乎無法也電腦之外的工作環境交互。“如果AI能和真實物理世界交互，那才是我想象中Agent能做長時間工作的情景，而不是說僅僅是在電腦當中。”

即使在一兩年內，AI能實現在電腦上干幾天的活，但真正廣闊的，是電腦屏幕之外真實的物理世界，所以，具身智能是更有價值的追求。

但林俊旸也吐槽，即使在大廠中，也面臨研究算力不夠的問題。

“如果從概率上來說，我可能想說一下我感受到的中國和美國的差異，比如說美國的Compute（算力）可能整體比我們大1-2個數量級，但我看到不管是OpenAI還是其他，他們大量的Compute投入到的是下一代的Research當中去。”

“我們今天相對來說，捉襟見肘，光交付可能就已經占據了我們絕大部分的Compute，這會是一個比較大的差異，這可能是歷史以來就有的問題。”

不過，林俊旸也圓回了話鋒，如果是“GPT窮人”的話，可能會更有動力去做一些軟硬件協同、高性價比的創新，他談到兩三年前，阿里內部芯片設計團隊曾與大模型團隊交流，但沒有協同起來，感到有些遺憾。

相比大廠，大學等研究機構，今年可以發揮更大的作用。唐杰談到，目前高校等學術界，科學家手中已經不再像幾年前那樣缺卡，與業界相比那么寒磣了，現在手里都有足夠多的卡，可能進行大模型新范式的探索和研究。

中國做To B難，創業者想打海外

大家也提到了Mamus，這家所謂“套殼”的產品公司，卻得到了幾十億美元的估值。中國做To B確實很難，初創公司還要想去打海外市場。

剛從美國OpenAI回到中國，加入騰訊擔任首席科學家的姚順雨認為，今天我們看到很多做生產力或者做To B的模型或者應用，還是會誕生在美國，因為支付意愿更強，文化更好。

今天在國內做這個事情很難，所以大家都會選擇出海或者國際化的事情，這兩個是比較大的客觀上的因素。“很多做Coding Agent的公司其實也是要去打海外市場。”

中美之間的差距

唐杰向中國開發者潑了一點冷水：“美國和中國大模型之間的差距，說不定并沒有縮小，因為美國還有大量閉源模型沒有開源。” 這與DeepSeek-V3.2的論文結論基本一致，開源模型與閉源模型之間的性能差距并沒有收斂，反而呈現出擴大的趨勢。DeepSeek警告中國開源模型：“在越來越復雜的任務中，專有閉源系統展現出了顯著更強的能力優勢，并在處理高復雜、多步驟、交互式問題時體現出的領先幅度在擴大。”

2025/12/2，閱讀全文>

但中國跟著美國開創的范式，哪怕追趕得再快，也是跟隨。它極大地降低了探索的成本，同時能在工程上做性價比的創新。

唐杰認為，制定新標準非常重要。未盡研究從2025年到2026年的AI展望中，都提到了標準的問題。1，數據污染問題，2，數據飽和的問題，3，自說自話問題，如圍繞自己的數據集和范式設定標準，4，高分低能問題：標準與實際工作脫節。

中國能否開創自己的AI范式，一個最重要的標志，就是中國的AGI探索者，大廠、新上市企業、獨角獸等，制定出一些中國的測試標準。

唐杰觀察到，如今瘋狂的RL、Scaling，收益已經大不如從前。因此，他定義了一個衡量智力水平的新范式，智能效率（Intelligence Efficiency），用于衡量模型投入和智力收益的ROI。

效率和性價比，這可能是自DeepSeek以來，中國的開源模型最得到國際公認的一點，也是把模型推向應用的最重要的標準。

姚順雨則比較樂觀，以電動車為例，認為三五年內全球最領先的AI公司會出現在中國，前提是中國要有光刻機。

“概率還挺高的，我還是挺樂觀的。目前看起來，任何一個事情一旦被發現，在中國就能夠很快的復現，在很多局部做得更好，包括之前制造業、電動車這樣的例子已經不斷地發生。”

“我覺得可能有幾個比較關鍵的點，一個可能是中國的光刻機到底能不能突破，如果最終算力變成了Bottleneck（瓶頸），我們能不能解決算力問題，目前看起來，我們有很好的電力優勢，有很好的基礎設施的優勢。”

To B與To C，通用與垂直，模型與應用

To B和To C，通用和垂直，模型和應用，一直是行業內爭論不休的問題。姚順雨認為，2C的場景下，垂直整合是成立的。但2B場景下，模型公司專注把模型做強，應用公司則追求用最強的模型來提升生產力。這樣看來，2B與2C正在分化。

Coding是第一個被驗證為收入百億美元級別、估值數千億美元級別的應用領域。它消耗的token數量是巨大的，但它能真正提升了編程的效率，也賣得出高價，付得起這個算力成本。

林俊旸與美國API廠商的交流中發現，Anthropic總是在服務客戶中發現新的需求，特別是在一些高價值場景中的需求，除了編程，還有金融等。這樣的領域，可能還有醫療、法律、咨詢等。

姚順雨認為，模型能力越強，解決問題的能力越強，也就越能在服務客戶的過程中發現更多可以解決的問題，這是Anthropic道路給大家的啟示。

顯然，Anthropic道路，相比OpenAI，正在吸引越來越多中國的大模型和應用公司，如智譜等。

姚順雨指出：OpenAI做To C的問題我們都知道，To C的DAU和模型智能，很多時候是不相關的，甚至有相反的關系。

一個明顯的例子是，GPT-5推出后，許多用戶要求回到GPT-4o。

參考：

https://mp.weixin.qq.com/s/IToXOrPJ-fi3B3sJQuxLpQ

https://mp.weixin.qq.com/s/8sfZIkC8wt22OiJFnvnF3w

https://mp.weixin.qq.com/s/6Jyh2RCQuvD38CCGHVix-Q

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.