對于谷歌(Google)而言,剛剛過去的一周可以看作其人工智能戰(zhàn)略轉(zhuǎn)型的關(guān)鍵節(jié)點(diǎn)。隨著 Gemini 3 的正式發(fā)布,以及名為 Nano Banana Pro 的新模型在社交媒體與開發(fā)者社區(qū)中迅速走紅,這家科技公司正在重新找回自己在 AI 領(lǐng)域的節(jié)奏與底氣。
在 Google DeepMind 發(fā)布的最新一期《Release Notes》播客中,Alphabet 兼谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)與主持人洛根·基爾帕特里克(Logan Kilpatrick)進(jìn)行了一次持續(xù)近一個(gè)小時(shí)的對話。
這次訪談既回顧了 Gemini 系列模型的演進(jìn),也透露出谷歌在基礎(chǔ)設(shè)施、終端系統(tǒng)和長周期項(xiàng)目上的布局思路。
![]()
圖丨相關(guān)播客(來源:Youtube)
在對話中,皮查伊不斷強(qiáng)調(diào),當(dāng)前的集中發(fā)布并不是“突然爆發(fā)”,而是基于過去近十年圍繞全棧 AI 所做的投入與調(diào)整。在外界看來,谷歌近兩年的動(dòng)作常常被放進(jìn)與競爭對手的“軍備競賽”敘事之中,但在他的表述里,谷歌試圖構(gòu)建的是一個(gè)由 Gemini 串聯(lián)起的龐大生態(tài)系統(tǒng),讓 AI 像基礎(chǔ)設(shè)施一樣滲透進(jìn)搜索、云計(jì)算、Waymo 自動(dòng)駕駛以及各類終端設(shè)備。
從“AI-first”到“被迫加速”
皮查伊喜歡把今天的一切追溯到 2012 年那篇“識(shí)貓”論文。Google Brain 團(tuán)隊(duì)當(dāng)時(shí)用深度學(xué)習(xí)識(shí)別 YouTube 視頻里的貓,被視為業(yè)界第一次具有標(biāo)志意義的大規(guī)模深度網(wǎng)絡(luò)實(shí)驗(yàn);2014 年,谷歌收購 DeepMind;2016 年年初,AlphaGo 擊敗李世石;同年 5 月,第一代張量處理器 TPU(Tensor Processing Unit,張量處理芯片)發(fā)布。
![]()
圖丨相關(guān)論文(來源:Google)
“2016 年我要求整個(gè)公司轉(zhuǎn)向‘AI-first’,”他在播客里回憶,當(dāng)時(shí)已經(jīng)能“很清楚地感覺到我們正在經(jīng)歷一個(gè)新的平臺(tái)遷移”。
在這個(gè)判斷背后,是一次關(guān)于技術(shù)棧的押注:從自研芯片到云端基礎(chǔ)設(shè)施,再到搜索、Android、YouTube 等應(yīng)用層產(chǎn)品,都要按照 AI 優(yōu)先的思路重新搭建。
問題在于,當(dāng) ChatGPT 在 2022 年底突然出現(xiàn)在公眾面前時(shí),這個(gè)“AI-first”并沒有在面向消費(fèi)者的產(chǎn)品形態(tài)上體現(xiàn)出預(yù)期中的領(lǐng)先。
OpenAI 把一個(gè)尚會(huì)“胡說八道”的聊天機(jī)器人首先推向大眾,而谷歌內(nèi)部類似項(xiàng)目仍被困在“安全風(fēng)險(xiǎn)”和“社會(huì)影響”的內(nèi)部審查流程中。相關(guān)報(bào)道顯示,在 ChatGPT 發(fā)布后,谷歌高層啟動(dòng)了一個(gè) 100 天沖刺計(jì)劃,希望用 Bard 迅速回應(yīng)微軟-OpenAI 聯(lián)盟的攻勢。
為了趕在 Bing 新版發(fā)布前一天搶先亮相,Bard 在 2023 年 2 月匆忙開放測試,卻在營銷示例中搞錯(cuò)了詹姆斯·韋伯太空望遠(yuǎn)鏡的“第一張系外行星照片”,引發(fā)股價(jià)大跌和內(nèi)部士氣波動(dòng)。
負(fù)責(zé)審核的團(tuán)隊(duì)隨后抱怨,生成式產(chǎn)品“以任何代價(jià)上線”的壓力,使得原本層層把關(guān)的流程被壓縮甚至繞過;從 Bard 到早期版本的 Gemini 圖像生成器,再到 AI Overviews,外界看到的,是一個(gè)頻繁在細(xì)節(jié)上出錯(cuò)的谷歌。
這與皮查伊在最初幾年強(qiáng)調(diào)的穩(wěn)健形成了鮮明對比——多年來,谷歌正是因?yàn)閾?dān)心偏見、幻覺和監(jiān)管風(fēng)險(xiǎn),而遲遲不愿像初創(chuàng)公司那樣在未經(jīng)充分驗(yàn)證的情況下大規(guī)模放出產(chǎn)品。
這種反差最終逼迫公司做出結(jié)構(gòu)性調(diào)整。2023 年,谷歌將 Brain 與 DeepMind 合并為新的 Google DeepMind(GDM),由 Demis Hassabis 統(tǒng)一負(fù)責(zé)基礎(chǔ)模型研發(fā),明確以 Gemini 為核心路線,把此前分散在各個(gè)團(tuán)隊(duì)的語言、視覺、多模態(tài)研究整合到一個(gè)旗艦項(xiàng)目之下,同時(shí)大幅增加在基礎(chǔ)設(shè)施、數(shù)據(jù)中心以及 TPU 和 GPU 上的投入在山景城,GDM 搬進(jìn)了全新的高安全等級圓頂建筑 Gradient Canopy,與皮查伊的辦公室在同一層。
聯(lián)合創(chuàng)始人謝爾蓋·布林(Sergey Brin)成為這里的常客,管理層也要求更多的線下協(xié)作時(shí)間。與谷歌慣常的開放氛圍不同,大多數(shù)其他員工不被允許進(jìn)入 Gradient Canopy,也無法訪問 GDM 的關(guān)鍵訓(xùn)練代碼。
![]()
圖丨 Gradient Canopy(來源:Google)
在這棟建筑里,一度重新出現(xiàn)了類似谷歌草創(chuàng)時(shí)期的氛圍。皮查伊特別提到其中一個(gè)被稱為“藍(lán)色微廚房”(Blue MK)的空間,他將其視為谷歌 AI 創(chuàng)新的縮影。
“那里讓我想起了 Google 的早期。Sergey(謝爾蓋·布林)、Jeff Dean、Sanjay 等人以前常在那里自己做濃縮咖啡,討論并行程序。那里充滿了思想的碰撞。”在他看來,這種在同一空間內(nèi)的高密度溝通,是后續(xù)技術(shù)路線逐漸收斂、節(jié)奏逐步統(tǒng)一的重要推動(dòng)力。
這些變化在 2023 年底 Gemini 1.0 發(fā)布時(shí)開始顯現(xiàn)成效,并在隨后一年中通過 Gemini 1.5 的長上下文(Long Context)能力逐步追平對手。在長文檔理解、代碼分析等場景中,Gemini 的表現(xiàn)明顯改善。
而到了 2025 年末,隨著 Gemini 3 的問世,皮查伊終于有足夠理由表示,谷歌不僅完成了追趕,而且開始嘗試重新設(shè)定比賽的節(jié)奏。
Gemini 3 作為“統(tǒng)一線程”
如果單純從公開的技術(shù)指標(biāo)來看,Gemini 3 的確是一代跨越幅度較大的模型。根據(jù)谷歌披露的數(shù)據(jù),它在 WebDev Arena、SWE-bench 等編碼和工具使用基準(zhǔn)上,相比 Gemini 2.5 Pro 有明顯提升,在多類綜合推理基準(zhǔn)上也刷新了前沿模型的表現(xiàn)。
不過,對谷歌而言,這一代模型更重要的意義,在于它被塑造成谷歌產(chǎn)品線的“統(tǒng)一線程”。在公司內(nèi)部的規(guī)劃中,Gemini 不再只是某個(gè)聊天機(jī)器人或獨(dú)立 API,而是貫穿多個(gè)層級的基礎(chǔ)組件。
在消費(fèi)端,搜索中的 AI 模式和 AI Overviews 已逐步切換至由 Gemini 3 提供支持;Gemini 應(yīng)用以及 Android 系統(tǒng)中的部分智能功能,也以這一代模型為主。
在企業(yè)端,Workspace 中的寫作助手、文檔摘要、演示文稿生成等功能,統(tǒng)一基于 Gemini 模型系列。在云端,Vertex AI 和 Gemini API 面向開發(fā)者開放同一組模型,既服務(wù)于聊天應(yīng)用,也支持代碼、搜索和數(shù)據(jù)處理等多種場景。
![]()
圖丨 Google 搜索中的 Gemini 3(來源:Google)
這種“同步切換”的方式,直接反映了谷歌在分發(fā)上的優(yōu)勢。單從獨(dú)立應(yīng)用的下載量看,Gemini 仍落后于 ChatGPT,但谷歌通過搜索、瀏覽器和 Workspace 將生成式功能嵌入既有入口,使得 Gemini 能在較短時(shí)間內(nèi)覆蓋龐大的存量用戶群。
根據(jù)公司對外披露的數(shù)據(jù),AI Overviews 已經(jīng)在數(shù)十個(gè)市場落地,覆蓋數(shù)十億級用戶;Gemini 在 Workspace 中的付費(fèi)使用者和 API 調(diào)用量,也成為 Google Cloud 新增收入的重要來源之一。
在皮查伊的敘述中,這背后依托的,是谷歌多年來構(gòu)建的“全棧”能力。所謂全棧,指的是從底層芯片(TPU)、到數(shù)據(jù)中心基礎(chǔ)設(shè)施、再到中間層模型(Gemini)、以及最上層應(yīng)用(Search、YouTube、Waymo)的高度一體化與可控性。
“人們往往只看到應(yīng)用層的熱鬧,卻忽略了底層的積累,”他在節(jié)目中說,“如果你退一步看,正是這種全棧方法,讓每一層的創(chuàng)新都能貫穿整個(gè)系統(tǒng),最終流向頂層。”
最典型的例子是 TPU(Tensor Processing Unit,張量處理單元)。早在十多年前,谷歌就開始針對自家 AI 負(fù)載設(shè)計(jì)專用芯片,這在當(dāng)時(shí)被視為一種投入巨大的“偏執(zhí)選擇”。而在英偉達(dá)(Nvidia)GPU 供應(yīng)緊張、價(jià)格居高不下的今天,TPU 成為了谷歌最重要的戰(zhàn)略資產(chǎn)之一。
這項(xiàng)資產(chǎn)不僅支撐了谷歌自身對 Gemini 的訓(xùn)練和部署,也開始對外釋放影響力。近期有消息傳出,Meta 正在與谷歌洽談,計(jì)劃自 2027 年起在其數(shù)據(jù)中心中使用谷歌的芯片。
這不僅意味著 Google Cloud 在重點(diǎn)客戶上的一次擴(kuò)展,也標(biāo)志著谷歌從過去相對封閉的算力生態(tài),逐步走向面向同行開放的芯片和基礎(chǔ)設(shè)施供應(yīng)商角色;與 Anthropic 高達(dá)數(shù)十億美元的 TPU 合作協(xié)議,更是這一趨勢的直接例證。
“當(dāng)你控制了全棧,你就擁有了乘數(shù)效應(yīng),”皮查伊在訪談中總結(jié),“你改進(jìn)了基礎(chǔ)設(shè)施,預(yù)訓(xùn)練就更快;你在模型層面的優(yōu)化,又能直接反映在產(chǎn)品的生成式界面上。”
從太空算力到 Aluminium OS:全棧向兩端延伸
在訪談中,皮查伊還談及了谷歌在更長周期上的探索。在基礎(chǔ)設(shè)施一端,2025 年 11 月,公司在研究博客中公布了 Project Suncatcher 的初步設(shè)想:通過在近地軌道部署由太陽能驅(qū)動(dòng)的衛(wèi)星,在太空中構(gòu)建一個(gè)由 Trillium TPU 組成的小型算力集群。
根據(jù)公開信息,首批搭載四顆 TPU 的試驗(yàn)衛(wèi)星預(yù)計(jì)在 2027 年發(fā)射,遠(yuǎn)期目標(biāo)是擴(kuò)展到由幾十顆衛(wèi)星構(gòu)成的陣列。
從成熟度看,這仍處于早期研究階段,距離規(guī)模化落地還有相當(dāng)距離。但項(xiàng)目本身折射出谷歌對未來約束條件的判斷:如果大模型訓(xùn)練與推理長期維持高能耗、高成本特征,那么單純在地面擴(kuò)建數(shù)據(jù)中心的方式會(huì)遇到愈發(fā)明顯的瓶頸,利用太空中的持續(xù)太陽能和不同的散熱條件,至少為下一階段算力布局提供了一種可探索的路徑。
此外,在更貼近用戶的一端,近期有消息傳出谷歌正在推進(jìn)一個(gè)代號為 Aluminium OS(ALOS)的新系統(tǒng)。根據(jù)公開招聘信息和相關(guān)報(bào)道,這一項(xiàng)目以 Android 為基礎(chǔ),吸收 ChromeOS 的部分能力,目標(biāo)是為手機(jī)、平板和 PC 設(shè)備提供統(tǒng)一的平臺(tái)。
招聘啟事中明確寫明,Aluminium 將“以 AI 為核心構(gòu)建”,未來將運(yùn)行在筆記本、可拆卸設(shè)備、平板和電視盒子等多種形態(tài)之上,并在相當(dāng)一段時(shí)間內(nèi)與 ChromeOS 并存,逐步完成遷移。
如果這一規(guī)劃按預(yù)期推進(jìn),Gemini 將不再只以應(yīng)用形式出現(xiàn),而是成為操作系統(tǒng)的一個(gè)基礎(chǔ)能力:窗口管理、通知體系、文件與搜索、輸入方式和助手功能,都將圍繞 AI 重新設(shè)計(jì)。
對谷歌而言,這相當(dāng)于在桌面和筆記本電腦上,再做一次類似 Android 在智能手機(jī)時(shí)代扮演過的角色,只是這一次,AI 能力被前置到了更接近系統(tǒng)底層的位置。
另一方面,基于 Gemini 多模態(tài)能力的 Gemini Robotics 項(xiàng)目,則試圖將這套模型進(jìn)一步擴(kuò)展到物理世界,讓機(jī)器人能夠在云端統(tǒng)一“視覺-語言-動(dòng)作”表示,理解自然語言指令并執(zhí)行相對復(fù)雜的操作。
谷歌已經(jīng)在倉儲(chǔ)、實(shí)驗(yàn)室和模擬家居環(huán)境中進(jìn)行了一系列實(shí)驗(yàn),驗(yàn)證將大模型作為機(jī)器人“高層控制器”的可行性。
![]()
圖丨 Gemini Robotics 項(xiàng)目(來源:Google)
橫向展開來看,這些項(xiàng)目構(gòu)成了皮查伊所說“全棧戰(zhàn)略”的不同側(cè)面:底層是 TPU 以及未來可能部分上移到太空中的新型算力;中間是包括 Gemini 3 在內(nèi)的一系列模型及其云端服務(wù);上層則是搜索、YouTube、Workspace、地圖、Android/Aluminium OS 與 Waymo 等面向終端的產(chǎn)品。
這種全棧布局的直接好處在于,谷歌可以在更大程度上掌控技術(shù)和產(chǎn)品的節(jié)奏。一方面,谷歌不必完全依賴外部芯片供應(yīng)商,可以自主安排模型訓(xùn)練與推理能力的演進(jìn)節(jié)奏;另一方面,它掌握著全球范圍內(nèi)最重要的一批分發(fā)入口,即便 Gemini 應(yīng)用本身的下載量暫時(shí)落后,搜索、Chrome、Gmail 和 Android 等入口仍牢牢掌握在自己手中。
反超之后的問題
當(dāng)然,這一切并不意味著谷歌已經(jīng)沒有壓力。
除去其他 AI 巨頭在模型和平臺(tái)上的競爭不談,搜索業(yè)務(wù)作為谷歌立身之本,很難不受到生成式搜索形態(tài)的影響。AI Overviews 讓用戶在搜索結(jié)果頁上就能獲得高度概括的答案,顯然會(huì)減少一部分外鏈點(diǎn)擊。
出版商和內(nèi)容網(wǎng)站擔(dān)心,哪怕總查詢量上升,他們獲得的流量卻在下降;Cloudflare 首席執(zhí)行官甚至警告,如果不改變現(xiàn)有模式,“網(wǎng)絡(luò)的商業(yè)模式難以為繼”。
對監(jiān)管者而言,谷歌一方面是“可能被 AI 浪潮沖擊的既有巨頭”,另一方面又是“有能力利用 AI 鞏固既有優(yōu)勢的平臺(tái)”。
美國最新一輪反壟斷訴訟最終并未走向拆分,這在一定程度上是因?yàn)楸O(jiān)管機(jī)構(gòu)也把 OpenAI 和其他新玩家視為對谷歌市場力量的制衡因素。但一旦 AI 搜索和 AI 助手成為新的流量入口,圍繞數(shù)據(jù)使用、廣告展示與平臺(tái)責(zé)任的博弈,很可能會(huì)以新的形式回到臺(tái)面上。
在這些不確定性面前,皮查伊的回應(yīng)仍然是“拉長時(shí)間軸”。他在訪談中反復(fù)提到,十年前押注 AI、YouTube 和云服務(wù),是現(xiàn)在局面的前提;未來十年,他同樣看好量子計(jì)算、航空航天算力和機(jī)器人等更長線的方向。
“量子有一天會(huì)像今天的 AI 一樣令人興奮,”他說,“Sun Catcher、AlphaFold、Wing 無人機(jī)、機(jī)器人,這些都是需要二十年視角的項(xiàng)目。”
他也仍然愿意用 Waymo 做類比:“記住,現(xiàn)在你看到的是 Waymo 有史以來‘最差’的一刻,它只會(huì)越來越好。”在他看來,用 Gemini 3 做 Vibe Coding、用 Nano Banana Pro 生成信息圖、讓機(jī)器人執(zhí)行自然語言命令的今天,同樣是這些工具“最差的一刻”——真正的臨界點(diǎn)還沒有到來。
從 2016 年那句“AI-first”到今天的 Gemini 3、Vibe Coding 和全棧戰(zhàn)略,谷歌用近十年的時(shí)間證明了一件事:在平臺(tái)遷移時(shí)期,擁有全棧技術(shù)和全球分發(fā)網(wǎng)絡(luò)本身并不能保證勝利,但至少可以避免過早被排除出局。
那些關(guān)于“谷歌會(huì)被 ChatGPT 淘汰”的判斷,已經(jīng)顯得與現(xiàn)實(shí)不符。不過,在如何重塑搜索、如何為網(wǎng)絡(luò)生態(tài)和開發(fā)者提供相對公平的空間、以及如何在巨額算力投資與氣候成本之間尋找平衡這些問題上,這家公司仍未給出定論。
皮查伊顯然相信,只要那條從 TPU、太空數(shù)據(jù)中心、Gemini 模型一直延伸到 Vibe Coding 和日常搜索框的技術(shù)鏈路保持完整,谷歌就有機(jī)會(huì)在下一個(gè)十年繼續(xù)“厚積薄發(fā)”。而對于整個(gè)行業(yè)而言,更值得關(guān)注的問題是:當(dāng)一個(gè)掌握全棧的參與者再次加速時(shí),留給其他公司尋找差異化路徑的時(shí)間,還剩多少。
參考資料:
1.https://www.youtube.com/watch?v=iFqDyWFuw1c
2.https://www.wired.com/story/google-openai-gemini-chatgpt-artificial-intelligence/
3.https://www.businessinsider.com/google-openai-gemini-chatgpt-ai-search-future-web-2025-11
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.