伊利亞在去年底說,要回歸研究;2026進入新年,頂尖的和新型的AI實驗室,都已經開始只爭朝夕了。
中美都在發力AI下一個范式
a16z的創始人安德森,最近融了一筆150億美元的基金,他展望2026年時說,看好伊利亞(Ilya Sutskever),Mira (Murady),李飛飛、Cursor團隊等,這一批業內頂尖的科學家和研究團隊,新型AI研究將有可能顛覆硅谷。當然,他也看好中國的團隊,如月之暗面Kimi,已經達到GPT-5的水平。
月之暗面創始人楊植麟最近在一個內部行業論壇中說,“所有的技術突破都伴隨著風險,但我們不能因恐懼而停滯不前。因此,我們希望在接下來的十年、二十年里,繼續把K4、K5到K100做得更好。”
楊植麟談到了在中國做研究非常稀缺的一種東西taste (品味),月之暗面要堅持taste,它手握百億元現金,也給了它這樣做的底氣。這類似于DeepSeek,堅持純粹的AGI追求,決定了可以長期保持taste。保持taste,需要不停地拓展模型的邊界。Kimi明確提出了兩個目標,一個是token效率,一個是長文本(long context)。
這是清華大學基礎模型北京市重點實驗室、智譜AI發起的AGI-Next發起的前沿峰會。而中國的“大模型第一股”智譜上市之后,其創始人兼首席科學家唐杰,也要求大家馬上回歸研究。
TML(Thinking Machine Lab)甚至很鮮明地提出,研究即產品 (Researcher is Product)。這家公司在OpenAI前首席技術官Mira帶領下,聚集包括OpenAI聯合創始人舒曼和翁荔等在內的一批頂尖研究員。這其實也支持了模型即產品這一觀點。
阿里千問技術負責人林俊旸認為,現在的研究究員,都愿意做面向真實世界的研究。他特別提出了目前AI所處的工作環境,就是在電腦里,而幾乎無法也電腦之外的工作環境交互。“如果AI能和真實物理世界交互,那才是我想象中Agent能做長時間工作的情景,而不是說僅僅是在電腦當中。”
即使在一兩年內,AI能實現在電腦上干幾天的活,但真正廣闊的,是電腦屏幕之外真實的物理世界,所以,具身智能是更有價值的追求。
但林俊旸也吐槽,即使在大廠中,也面臨研究算力不夠的問題。
“如果從概率上來說,我可能想說一下我感受到的中國和美國的差異,比如說美國的Compute(算力)可能整體比我們大1-2個數量級,但我看到不管是OpenAI還是其他,他們大量的Compute投入到的是下一代的Research當中去。”
“我們今天相對來說,捉襟見肘,光交付可能就已經占據了我們絕大部分的Compute,這會是一個比較大的差異,這可能是歷史以來就有的問題。”
不過,林俊旸也圓回了話鋒,如果是“GPT窮人”的話,可能會更有動力去做一些軟硬件協同、高性價比的創新,他談到兩三年前,阿里內部芯片設計團隊曾與大模型團隊交流,但沒有協同起來,感到有些遺憾。
相比大廠,大學等研究機構,今年可以發揮更大的作用。唐杰談到,目前高校等學術界,科學家手中已經不再像幾年前那樣缺卡,與業界相比那么寒磣了,現在手里都有足夠多的卡,可能進行大模型新范式的探索和研究。
中國做To B難,創業者想打海外
大家也提到了Mamus,這家所謂“套殼”的產品公司,卻得到了幾十億美元的估值。中國做To B確實很難,初創公司還要想去打海外市場。
剛從美國OpenAI回到中國,加入騰訊擔任首席科學家的姚順雨認為,今天我們看到很多做生產力或者做To B的模型或者應用,還是會誕生在美國,因為支付意愿更強,文化更好。
今天在國內做這個事情很難,所以大家都會選擇出海或者國際化的事情,這兩個是比較大的客觀上的因素。“很多做Coding Agent的公司其實也是要去打海外市場。”
中美之間的差距
唐杰向中國開發者潑了一點冷水:“美國和中國大模型之間的差距,說不定并沒有縮小,因為美國還有大量閉源模型沒有開源。” 這與DeepSeek-V3.2的論文結論基本一致,開源模型與閉源模型之間的性能差距并沒有收斂,反而呈現出擴大的趨勢。DeepSeek警告中國開源模型:“在越來越復雜的任務中,專有閉源系統展現出了顯著更強的能力優勢,并在處理高復雜、多步驟、交互式問題時體現出的領先幅度在擴大。”
2025/12/2, 閱讀全文>
但中國跟著美國開創的范式,哪怕追趕得再快,也是跟隨。它極大地降低了探索的成本,同時能在工程上做性價比的創新。
唐杰認為,制定新標準非常重要。未盡研究從2025年到2026年的AI展望中,都提到了標準的問題。1,數據污染問題,2,數據飽和的問題,3,自說自話問題,如圍繞自己的數據集和范式設定標準,4,高分低能問題:標準與實際工作脫節。
中國能否開創自己的AI范式,一個最重要的標志,就是中國的AGI探索者,大廠、新上市企業、獨角獸等,制定出一些中國的測試標準。
唐杰觀察到,如今瘋狂的RL、Scaling,收益已經大不如從前。因此,他定義了一個衡量智力水平的新范式,智能效率(Intelligence Efficiency),用于衡量模型投入和智力收益的ROI。
效率和性價比,這可能是自DeepSeek以來,中國的開源模型最得到國際公認的一點,也是把模型推向應用的最重要的標準。
姚順雨則比較樂觀,以電動車為例,認為三五年內全球最領先的AI公司會出現在中國,前提是中國要有光刻機。
“概率還挺高的,我還是挺樂觀的。目前看起來,任何一個事情一旦被發現,在中國就能夠很快的復現,在很多局部做得更好,包括之前制造業、電動車這樣的例子已經不斷地發生。”
“我覺得可能有幾個比較關鍵的點,一個可能是中國的光刻機到底能不能突破,如果最終算力變成了Bottleneck(瓶頸),我們能不能解決算力問題,目前看起來,我們有很好的電力優勢,有很好的基礎設施的優勢。”
To B與To C,通用與垂直,模型與應用
To B和To C,通用和垂直,模型和應用,一直是行業內爭論不休的問題。姚順雨認為,2C的場景下,垂直整合是成立的。但2B場景下,模型公司專注把模型做強,應用公司則追求用最強的模型來提升生產力。這樣看來,2B與2C正在分化。
Coding是第一個被驗證為收入百億美元級別、估值數千億美元級別的應用領域。它消耗的token數量是巨大的,但它能真正提升了編程的效率,也賣得出高價,付得起這個算力成本。
林俊旸與美國API廠商的交流中發現,Anthropic總是在服務客戶中發現新的需求,特別是在一些高價值場景中的需求,除了編程,還有金融等。 這樣的領域 ,可能還有醫療、法律、咨詢等。
姚順雨認為,模型能力越強,解決問題的能力越強,也就越能在服務客戶的過程中發現更多可以解決的問題,這是Anthropic道路給大家的啟示。
顯然,Anthropic道路,相比OpenAI,正在吸引越來越多中國的大模型和應用公司,如智譜等。
姚順雨指出:OpenAI做To C的問題我們都知道,To C的DAU和模型智能,很多時候是不相關的,甚至有相反的關系。
一個明顯的例子是,GPT-5推出后,許多用戶要求回到GPT-4o。
參考:
https://mp.weixin.qq.com/s/IToXOrPJ-fi3B3sJQuxLpQ
https://mp.weixin.qq.com/s/8sfZIkC8wt22OiJFnvnF3w
https://mp.weixin.qq.com/s/6Jyh2RCQuvD38CCGHVix-Q
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.