![]()
這支團隊,做過AI史上最酷的事
“你不能指望僅僅通過prompt設計,就讓一個Agent變得穩定、可靠。你需要的是能夠‘犯錯-糾正-在交互中持續改進’的模型,并在這個過程中發展出真正的推理能力。”
這句話出自Striker Venture Partners的合伙人Brian Zhan。2025年初,當AI市場都在聚焦Transformer的Scaling Law、熱議參數與算力時,他領投了一家當時估值還不到6億美元的小公司——Reflection AI。
在接受Z Potentials采訪時,他表示他的判斷依據很簡單:這支團隊把世界上最優秀的一批強化學習研究者聚到了一起,而強化學習(RL)才是讓Agent基礎模型真正“好用、可靠”的關鍵突破口。
十個月后,Reflection AI成為了2025年最耀眼的AI獨角獸之一。再過去五個月,它的估值又翻了整整三倍。
2026年3月26日,《華爾街日報》爆料:Reflection AI正在進行新一輪融資,投前估值250億美元,預計融資25億美元。JPMorgan Chase計劃通過其新成立的Security and Resiliency Initiative參與本輪投資,其早期投資者Disruptive也計劃繼續跟投。
而就在十天前,這家公司也剛剛成為英偉達Nemotron Coalition的創始成員——這是一個由英偉達牽頭、旨在推動開源前沿模型發展的全球AI聯盟。
從2024年3月成立至今,Reflection AI用了兩年時間走完了從0到250億美元(約1728億元人民幣)的估值躍遷。2024年它的收入還是0,2025年收入已經有2000萬美元,而它的團隊只有79個人。
同時,它也被譽為“美國版DeepSeek”,肩負著西方開源AI陣營對抗中國模型的“戰略使命”。黃仁勛不僅為它投了8億美元,還派出了工程師幫它優化芯片性能。前Google CEO Eric Schmidt、Zoom創始人Eric Yuan、光速創投、紅杉資本……一眾硅谷頂級資本也悉數入場給它投了錢。
Reflection AI,到底是一家怎樣的公司?
從AlphaGo到Gemini:這支團隊做過AI史上“最酷的事”
Reflection AI的故事要從兩個人說起。
Misha Laskin,Reflection AI的創始人兼CEO,俄羅斯裔以色列人,耶魯本科學的物理,同時也是芝加哥大學的理論物理博士。2017年,他入選福布斯30 under 30,那時候他剛結束第一段創業——一家做零售庫存預測的Y Combinator公司,Claire。在與Manifold的采訪中,他回憶那段創業經歷時坦言:“我學到了很多,但主要是明白了自己不想要什么。”他發現自己對零售行業并沒有“深層的共情”,而他職業生涯真正的轉折點是在2016年——當他看到了AlphaGo。
“那改變了我的人生軌跡,”Misha說,“我當時就覺得,這是我這個時代最重要的科學。”他放下一切,自學編程,去UC Berkeley做博士后研究深度學習和強化學習。后來加入了Google DeepMind,領導Gemini項目的獎勵模型開發。
在Manifold采訪中,他回憶起ChatGPT發布的那天,他正在新奧爾良的一個會議上做演講,“我突然有一種抽離感——我為什么要說這些話?”
那一刻他意識到,語言模型已經解決了AI的“泛化問題”。在此之前,強化學習算法雖然強大,但只能在非常狹窄的領域工作——AlphaGo下圍棋無敵,但換個游戲就要重新訓練。而ChatGPT展示了一種前所未有的通用性:你可以向它提問任何問題,它基本上都能給出合理的回答。
“這是一個從0到1的時刻,”Misha說,“歷史學家們回頭看,就會看到那是一個斷層。”
Reflection AI的另一位創始人Ioannis Antonoglou的來頭更大。他是DeepMind的創始工程師,AlphaGo的核心開發者之一。2016年那場震驚世界的圍棋“人機大戰”,李世石輸掉的四局棋,背后就有他的手筆。
Misha回憶AlphaGo那手被驚呼“非人類下法”的“第37步”棋時說:“那一步太壯觀了……它展示了系統對游戲有深刻的理解,它有創造力,它能想到人類從未想到過的東西。”
在AlphaGo之后,Ioannis進一步推進了AlphaZero——完全通過自我對弈學習、無需人類指導就能掌握游戲的AI;還有MuZero——連游戲規則都不需要被告知,就能征服圍棋、國際象棋、將棋、Atari游戲的更高級突破。
Misha與Ioannis是在DeepMind相識的,一個專注強化學習,一個深耕大語言模型。2024年3月,他們離開Google,創立了Reflection AI。
這個團隊的其他成員同樣星光熠熠:Deep Q Networks、PaLM、Character AI、ChatGPT、Gemini……這些AI史上最重要的突破,都有Reflection團隊成員的參與。用紅杉資本合伙人Stephanie Zhan的話說:“這不是一群想做AI的人,這是一群已經做過AI領域最酷的事的人。”
他們的融資歷程堪稱火箭速度:
2025年3月,彭博社曝出Reflection AI共完成了1.3億美元融資,當時估值5.8億美元,其中包含紅杉資本和CRV領投的2500萬美元天使輪,以及光速創投(Lightspeed Venture Partners)和CRV領投的1.05億美元A輪融資;
2025年10月,B輪融資20億美元,估值80億美元,Reflection AI正式成為了獨角獸;本輪融資英偉達領投8億美元,DST、1789 Capital(Donald Trump Jr.,特朗普的小兒子為合伙人的機構)、谷歌前CEO Eric Schmidt、Zoom創始人Eric Yuan都進行了投資,光速創投和紅杉資本繼續加碼。
2026年3月,Reflection AI正在新一輪融資洽談中,投前估值達到了250億美元,JPMorgan Chase和Disruptive等機構計劃參與本輪融資。
從5.8億到80億再到250億,估值漲幅超過40倍,Reflection AI只用了兩年的時間。
![]()
圖源:Reflection AI官網
開源還是閉源?AI世界的“路線之爭”
Reflection AI選擇了一條與OpenAI、Anthropic截然不同的路——開源。
什么是開源?簡單說,就是把AI模型的權重和架構公開,任何人都可以下載、使用、修改、再分發。與之相對的閉源,就是把模型當成“黑盒”,用戶只能通過API調用,看不到內部結構,更無法修改。
目前大模型主要分為開源與閉源兩大陣營,開源陣營包括Meta的Llama系列、以及中國的DeepSeek、阿里的千問系列等;閉源陣營有OpenAI的GPT系列、Anthropic的Claude、Google的Gemini,還有字節跳動的豆包等。行業中也存在部分介于開源與閉源之間的混合開放形態模型。
為什么Reflection AI要開源?Misha Laskin在英偉達官宣它得開源聯盟Nemotron Coalition時給出了答案:“技術進步是由開放和協作的價值觀驅動的。Reflection正在確保智能基礎保持開放——不被少數人控制——并在全球范圍內可及。”
這背后的真實原因還有一個:在開源AI領域,美國正在輸給中國。
根據Hugging Face的數據,2024年中國開源模型的下載份額達到17%,超過了美國模型的15.8%。DeepSeek憑借免費、高性能、可定制的策略,在全球南部市場快速擴張。而在LMArena的AI模型排行榜上,截至2025年8月,前30名開源模型中無一款來自美國公司。
Misha Laskin在《紐約時報》的專訪中直言:“美國在開源領域,正存在一個DeepSeek式的空白。”他認為,如果西方世界沒有自己的開源前沿模型,其他國家最終會選擇中國技術。
開源模型的優勢在于:成本更低、可定制性更強、數據安全可控。企業可以針對自己的業務場景進行微調,而不必把敏感數據發給第三方API。對于政府和大型企業來說,“主權AI”的概念越來越重要——他們希望AI基礎設施掌握在自己手里,而不是依賴某個美國或中國公司的閉源系統。
Reflection AI的核心技術叫Reflection-Tuning,它讓模型能夠檢測和糾正自己的推理錯誤。這種技術的本質是讓AI具備“自我反思”能力——當模型發現自己犯了錯誤時,能夠主動修正并從中學習。這與傳統的監督學習不同,后者只是讓模型模仿人類標注的數據,而Reflection-Tuning讓模型在交互中持續改進。
他們開發的自主編程Agent叫Asimov,能夠直接接入企業的代碼庫,自動完成重構、測試、部署等工程任務。與GitHub Copilot等代碼助手不同,Asimov的目標不是輔助程序員寫代碼,而是完全自主地完成工程任務。它可以理解整個代碼庫的架構,自動發現bug、優化性能、生成測試用例,甚至部署到生產環境。
2025年10月,Asimov開始為Reflection AI產生收入;到2025年底,它的年收入達到了2000萬美元。對于一個當時成立不到兩年的公司來說,這個商業化速度相當驚人。
2026年3月16日,英偉達官宣Nemotron Coalition,Reflection AI與Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Sarvam、Thinking Machines Lab成為了創始成員。這個聯盟的目標是共同開發開源前沿模型,第一款模型將由Mistral AI和英偉達聯合開發,聯盟成員貢獻數據、評估和領域專業知識。
Reflection AI在這個聯盟中的角色是:貢獻構建可靠開放系統的專業知識。換句話說,它要幫英偉達打造一個“可信的開源生態”。英偉達在這個聯盟中扮演的角色不言自明:提供算力基礎設施。聯盟開發的第一款模型將在NVIDIA DGX Cloud上訓練,并作為NVIDIA Nemotron 4系列模型的基礎開源發布。
黃仁勛在官宣聲明中說:“開放模型是創新的生命線,是全球參與AI革命的引擎——對學生、科學家、初創公司和整個行業都是如此。”
“美版DeepSeek”背后,中美AI正在互相“偷師”
Reflection AI被稱為“美國版DeepSeek”,這個標簽既是一種贊譽,也是一種焦慮。
贊譽在于,它代表了西方開源陣營;焦慮在于,這個標簽本身就說明DeepSeek已經定義了開源AI的標準。
DeepSeek做了什么?2024年底,這家中國公司發布了DeepSeek-V3和R1系列模型,性能接近OpenAI的GPT-4,但訓練成本只有后者的十分之一,而且是完全開源的。它用工程創新打破了“堆算力”的“迷信”,證明了中國公司在前沿AI領域的競爭力。
但中國AI大模型的崛起,也引發了西方業界的警惕與焦慮。2026年2月23日,Anthropic在官方博客發布聲明,指控DeepSeek、月之暗面(Moonshot AI)和MiniMax對其Claude模型發起了“工業級蒸餾攻擊”——簡單說,就是涉嫌用Anthropic的模型輸出來訓練自己的模型。而這類蒸餾行為在AI領域本就十分普遍,馬斯克甚至還公然嘲諷了Anthropic的這一表態。
諷刺的是,僅僅一個月后,劇情反轉。2026年3月20日,硅谷編程工具巨頭Cursor發布了一款“自研突破”產品,卻被扒出核心模型來自中國AI公司月之暗面的Kimi K2.5。Cursor的宣傳文案里,只字未提Kimi的名字。
這是當下中美AI競爭的真實寫照:互相借鑒、互相警惕、互相超越。
Reflection AI的應對策略是“主權AI”。2026年初,它與韓國新世界集團(Shinsegae Group)達成協議,投入數十億美元開發韓語定制模型,數千塊英偉達芯片將支撐這個項目的數據中心。Reflection的計劃是:與全球美國盟友合作,成為各國“主權云”的默認開源選擇。
這種模式的優勢在于他們的雙贏:各國獲得了AI主權,Reflection獲得市場和收入,英偉達賣出更多芯片。正如Misha Laskin所言:“開放模型是其配套基礎設施的特洛伊木馬。”
Reflection AI與英偉達的關系遠比普通投資關系更緊密。據《華爾街日報》報道,英偉達不僅給它投了8億美元,還派出多名工程師與Reflection AI合作,幫助優化其最新一代AI芯片的性能。這種“投資+技術賦能”的模式,讓Reflection AI在算力競爭中占據了獨特優勢。
但挑戰同樣巨大。Reflection AI能否真正成為“西方的DeepSeek”,還要看它接下來的模型表現和商業化進展。
更重要的是,Reflection AI需要證明開源模式能夠支撐起一個可持續的商業模式。目前它的收入主要來自企業客戶訂閱,但2000萬美元的年收入相對于250億美元的估值來說仍然微不足道。投資者押注的是未來——當AI Agent成為企業標配時,Reflection AI能否占據一席之地?
更宏觀地看,中美AI競爭正在進入一個新階段。第一階段是比誰參數多、算力強;第二階段是比誰成本低、效率高;現在進入了第三階段——比誰生態開放、誰盟友多。開源vs閉源、主權AI vs全球云、中國模式vs美國模式……這些路線之爭將定義未來十年的AI格局。
從全球視角來看,AI競爭已經不僅僅是技術層面的較量,更是地緣政治博弈的延伸。美國政府正在積極扶持本土開源AI企業,以應對中國大模型的崛起。白宮科技政策辦公室主任Michael Kratsios在2026年2月表示:“政府的目標是創造一個讓開源模型能夠蓬勃發展的生態系統。”據《金融時報》報道,美國政府甚至考慮與Reflection AI簽訂合約,將其作為OpenAI和Anthropic閉源模型的替代方案。
這種戰略考量背后,是美國對于AI主權的深層焦慮。閉源模型雖然性能強大,但企業或政府無法完全控制自己的數據;而開源模型允許本地部署、自主定制,對于重視數據安全的主權國家來說更具吸引力。Reflection AI正是看準了這一趨勢,將自己定位為“西方開源陣營的領導者”。
Misha Laskin在接受《紐約時報》采訪時放話:“我預計我們有望成長為比當下超大規模云服務商更具規模的公司。”兩位見證過AlphaGo擊敗李世石的AI先行者,正以Reflection AI為支點,對開源AI的未來發起新的下注。
結語
Reflection AI,是一個關于“信念”的故事。
Misha Laskin在博士畢業時放棄了自己深耕近十年的理論物理,因為“很難想象要等幾十年才能知道自己做的東西是否有成果”。
直覺式的判斷,最終讓他和Ioannis Antonoglou一起,在2024年3月創立了Reflection AI。他們的信念很簡單:強化學習+大語言模型=超級智能Agent,而開源是讓這項技術惠及世界的最佳方式。
兩年過去,這支79人的團隊從0做到250億美元估值,從默默無聞到成為英偉達戰略版圖的核心一環。他們的投資者名單里,既有硅谷最激進的風險資本,也有傳統金融巨頭,甚至還有特朗普家族的身影。
它代表著開源AI陣營的崛起,代表著美國對中國AI的焦慮,也代表著AI行業未來或將從“閉源壟斷”走向“開放生態”。
正如Misha Laskin所說:“AlphaGo從未停止進化。若投入十倍、甚至百倍的資源,就能得到一個智能水平更高的超級AlphaGo。本質上,這類系統的學習潛力沒有上限,完全取決于你愿意投入多少資源。”
Reflection AI的旅程,才剛剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.