鷺羽 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
如何回顧2025年的AI進(jìn)展?
今年王者歸來(lái)的谷歌,剛剛由Jeff Dean和哈薩比斯牽頭,完成了年度總結(jié)和趨勢(shì)展望報(bào)告——
- 這是AI Agent、推理和科學(xué)發(fā)現(xiàn)的一年。

報(bào)告最后梳理出了八大研究方向,系統(tǒng)性地回答了一個(gè)更重要的問題:
當(dāng)大模型進(jìn)入推理時(shí)代,AI 正在變成什么?
從Gemini的推理能力、多模態(tài)理解,到Agent、機(jī)器人、科學(xué)研究和物理世界建模,谷歌正在描繪一個(gè)可以協(xié)作、可以行動(dòng)、甚至開始參與科學(xué)發(fā)現(xiàn)的智能系統(tǒng)。
- 模型的推理、多模態(tài)理解、生成能力及效率得到顯著提升。
- AI已廣泛融入谷歌的主要產(chǎn)品中。
- 2025年創(chuàng)造性AI工具全面提升。
- AI在科學(xué)和數(shù)學(xué)領(lǐng)域?qū)崿F(xiàn)多項(xiàng)成果,尤其是數(shù)學(xué)和編程競(jìng)賽表現(xiàn)優(yōu)異。
- 谷歌始終強(qiáng)調(diào)安全、責(zé)任與合作開放生態(tài)。
![]()
以下是量子位的原文總結(jié),在不改變?cè)獾幕A(chǔ)上,進(jìn)行了適當(dāng)修改潤(rùn)色:
谷歌年度回顧全文
回顧2025年,這是研究領(lǐng)域取得非凡進(jìn)展的一年。
在人工智能方面,可以清晰地看到其發(fā)展軌跡正從一種工具轉(zhuǎn)變?yōu)橐环N實(shí)用手段:從人們使用的東西變成了可以投入工作使用的東西。
如果說(shuō)2024年是為這個(gè)時(shí)代奠定多模態(tài)基礎(chǔ)的一年,那么2025年就是人工智能開始真正與人類一同思考、行動(dòng)和探索世界的一年。
在量子計(jì)算領(lǐng)域,谷歌也在邁向?qū)嶋H應(yīng)用方面取得了進(jìn)展。
概括來(lái)講,在各個(gè)領(lǐng)域,谷歌都正在助力將研究轉(zhuǎn)化為現(xiàn)實(shí),讓功能更強(qiáng)大、更實(shí)用的產(chǎn)品和工具對(duì)人們的生活產(chǎn)生積極影響。
基礎(chǔ)模型能力突破
首先今年,谷歌在推理、多模態(tài)理解、模型效率和生成能力方面均取得了突破性進(jìn)展,顯著提升了模型性能。
這一系列進(jìn)展始于3月份發(fā)布的Gemini 2.5,一直到在11月推出了Gemini 3,并于12月推出了Gemini 3 Flash。
基于最先進(jìn)的推理技術(shù),Gemini 3 Pro是谷歌迄今為止最強(qiáng)大的模型,旨在幫助用戶將想法變?yōu)楝F(xiàn)實(shí)。
它在LMArena排行榜上位于榜首,并憑借在人類終極考試以及GPQA Diamond等基準(zhǔn)測(cè)試中的突破性分?jǐn)?shù),重新定義了多模態(tài)推理。
它還為數(shù)學(xué)領(lǐng)域的前沿模型樹立了新標(biāo)準(zhǔn),在MathArena Apex上創(chuàng)下了23.4%的最新紀(jì)錄。
隨后,谷歌推出了Gemini 3 Flash,它融合了Gemini 3的專業(yè)級(jí)推理能力與Flash級(jí)別的延遲、效率和成本優(yōu)勢(shì),使其成為同尺寸下性能最佳的模型。
Gemini 3 Flash的質(zhì)量超越了谷歌之前的Gemini 2.5 Pro規(guī)模模型的能力,價(jià)格卻只有它的一小部分,且延遲顯著降低,延續(xù)了Gemini時(shí)代的趨勢(shì)——
下一代的Flash模型優(yōu)于上一代的Pro模型。
![]()
另外,谷歌今年也致力于通過(guò)最先進(jìn)的開源模型,讓實(shí)用的AI技術(shù)變得更易于獲取。
谷歌的Gemma系列模型不僅具有輕量級(jí)特性,而且開源。在今年,還成功引入了多模態(tài)能力,大幅度增加了上下文窗口,拓展了多語(yǔ)言功能,并提升了效率和性能。
AI產(chǎn)品的深度集成與創(chuàng)新
2025年,谷歌繼續(xù)推動(dòng)AI從工具轉(zhuǎn)向?qū)嵱霉ぞ撸瑧{借全新、強(qiáng)大的Agent能力改造現(xiàn)有的產(chǎn)品組合。
谷歌重新構(gòu)想了軟件開發(fā),不再局限于輔助編碼工具,而是引入能與開發(fā)者協(xié)作的強(qiáng)大Agent系統(tǒng),比如Gemini 3高超的編碼能力以及Google Antigravity的推出,都標(biāo)志著AI輔助軟件開發(fā)邁入了一個(gè)新時(shí)代。
![]()
這一演變同樣也在谷歌的核心產(chǎn)品中清晰可見,從Pixel 10上的AI功能、搜索中AI模式的更新,到類似Gemini應(yīng)用和NotebookLM這類的AI創(chuàng)新產(chǎn)品,而這些產(chǎn)品均增加了深度研究等高級(jí)功能。
AI賦能創(chuàng)造力
2025年也是生成式媒體變革的一年,AI為創(chuàng)意提供了全新且前所未有的能力。
用于視頻、圖像、音頻和虛擬世界的生成式媒體模型及工具變得更加高效,應(yīng)用也更為廣泛,其中突破性的Nano Banana和Nano Banana Pro在原生圖像生成與編輯方面展現(xiàn)出了前所未有的能力。
谷歌還與創(chuàng)意行業(yè)人士合作,開發(fā)了Flow和Music AI Sandbox等工具,讓它們能更好地輔助創(chuàng)意工作流程。
同時(shí),谷歌通過(guò)谷歌藝術(shù)與文化實(shí)驗(yàn)室推出全新的AI驅(qū)動(dòng)體驗(yàn)、對(duì)Gemini應(yīng)用中的圖像編輯功能進(jìn)行了重大升級(jí),以及引入Veo 3.1、Imagen 4和Flow等強(qiáng)大的新型生成式媒體模型,為人們拓展了創(chuàng)意可能性。

今年谷歌實(shí)驗(yàn)室也進(jìn)行了一些極具吸引力的實(shí)驗(yàn),包括:
- Pomelli:AI用于品牌營(yíng)銷內(nèi)容;
- Stitch:能在幾分鐘內(nèi)將提示詞和圖像輸入轉(zhuǎn)化為復(fù)雜用戶界面設(shè)計(jì)和前端代碼;
- Jules:異步編碼Agent,可作為開發(fā)者的協(xié)作伙伴;
- Google Beam:3D視頻通信平臺(tái),利用AI拓展了遠(yuǎn)程在場(chǎng)的可能性。
推動(dòng)科學(xué)與數(shù)學(xué)發(fā)展
2025年也是AI科學(xué)進(jìn)步的標(biāo)志性一年,生命科學(xué)、健康、自然科學(xué)和數(shù)學(xué)領(lǐng)域均在AI幫助下取得了諸多進(jìn)展。
這一年里,谷歌在構(gòu)建AI資源和工具方面取得了進(jìn)展,這些資源和工具為研究人員賦能,幫助他們?cè)卺t(yī)療健康領(lǐng)域理解、識(shí)別和開發(fā)新的治療手段。
在基因組學(xué)領(lǐng)域,谷歌已將先進(jìn)技術(shù)應(yīng)用于研究長(zhǎng)達(dá)十余年,如今谷歌超越了測(cè)序階段,正在利用AI來(lái)解讀最復(fù)雜的數(shù)據(jù)。
谷歌在今年也紀(jì)念了AlphaFold問世的第五周年,這一榮獲諾貝爾獎(jiǎng)的AI系統(tǒng)解決了困擾學(xué)界50年的蛋白質(zhì)折疊問題。目前它已被190多個(gè)國(guó)家的300多萬(wàn)名研究人員使用。

而Gemini的高級(jí)思考能力,包括Deep Think,也在數(shù)學(xué)和編程領(lǐng)域取得了歷史性進(jìn)展。
Deep Think已經(jīng)能夠理解需要深度抽象推理的問題,并在兩項(xiàng)國(guó)際競(jìng)賽中達(dá)到了金牌水平。
推進(jìn)計(jì)算和物理世界研究
谷歌今年在量子計(jì)算、能源和突破性技術(shù)等領(lǐng)域也取得了重大發(fā)現(xiàn),并吸引了前所未有的關(guān)注。
其中量子計(jì)算在現(xiàn)實(shí)世界應(yīng)用方面的進(jìn)展尤為顯著,例如Quantum Echoes項(xiàng)目。
值得一提的是,谷歌員工Michel Devoret與前谷歌員工John Martinis以及UC伯克利的John Clarke共同獲得了2025年諾貝爾物理學(xué)獎(jiǎng),以表彰他們?cè)?0世紀(jì)80年代的基礎(chǔ)量子研究。
2025年,谷歌繼續(xù)推進(jìn)為AI提供動(dòng)力的核心基礎(chǔ)設(shè)施,重點(diǎn)關(guān)注硬件設(shè)計(jì)的突破和能源效率的提升,包括推出Ironwood,一款為推理時(shí)代打造的新型TPU,它是采用名為AlphaChip的方法設(shè)計(jì)的,同時(shí)谷歌還致力于衡量技術(shù)對(duì)環(huán)境的影響。
![]()
谷歌在機(jī)器人技術(shù)和視覺理解方面的研究,也將AI Agent帶入了物理世界和虛擬世界,比如基礎(chǔ)性的Gemini Robotics模型、更先進(jìn)的Gemini Robotics 1.5,以及Genie 3的推出,其中Genie 3成為了通用世界模型的新前沿。
![]()
應(yīng)對(duì)全球性挑戰(zhàn)與機(jī)遇
谷歌今年的工作直觀展示了AI驅(qū)動(dòng)的科學(xué)進(jìn)步,如何直接應(yīng)用于解決世界上最關(guān)鍵和普遍存在的挑戰(zhàn)。
通過(guò)利用最先進(jìn)的基礎(chǔ)模型和Agent推理,谷歌極大地加深了對(duì)地球及其系統(tǒng)的理解,同時(shí)在氣候韌性、公共衛(wèi)生和教育等領(lǐng)域提供了影響力解決方案。
例如,谷歌正利用最先進(jìn)的基礎(chǔ)模型和代理推理來(lái)幫助加深對(duì)地球的理解,涵蓋天氣預(yù)報(bào)、城市規(guī)劃、公共衛(wèi)生等多個(gè)領(lǐng)域。例如,谷歌的洪水預(yù)報(bào)信息目前已覆蓋全球150個(gè)國(guó)家超20億人口。
而谷歌最先進(jìn)、最高效的預(yù)報(bào)模型WeatherNext 2,生成預(yù)報(bào)的速度能快8倍,且分辨率可達(dá)1小時(shí)。借助這項(xiàng)技術(shù),谷歌通過(guò)實(shí)驗(yàn)性的氣旋預(yù)測(cè),支持氣象機(jī)構(gòu)做出有效決策。
![]()
谷歌也正在與合作伙伴攜手,將AI驅(qū)動(dòng)的科學(xué)進(jìn)展更貼近患者,為疾病管理和療法研發(fā)開辟新途徑。
此外,AI正被證明是教育領(lǐng)域的一個(gè)強(qiáng)大工具,通過(guò)LearnLM和Gemini中的引導(dǎo)式學(xué)習(xí),它能促成新的理解形式并激發(fā)學(xué)生更多好奇心。
谷歌今年將Gemini最強(qiáng)大的翻譯能力引入谷歌翻譯,使其能提供更智能、更自然且更準(zhǔn)確的翻譯,并試點(diǎn)了新的語(yǔ)音互譯功能。
重視責(zé)任與安全
谷歌將研究突破與責(zé)任和安全相結(jié)合。
隨著模型能力不斷增強(qiáng),谷歌正持續(xù)改進(jìn)和發(fā)展旗下的工具、資源及安全框架,以預(yù)測(cè)并降低風(fēng)險(xiǎn)。
Gemini 3就切實(shí)展現(xiàn)了這種觀念:它是谷歌迄今為止最安全的模型,并且經(jīng)過(guò)了最全面的安全評(píng)估。
此外,谷歌還在展望更長(zhǎng)遠(yuǎn)的未來(lái),探索通往AGI的負(fù)責(zé)任之路,將準(zhǔn)備工作、主動(dòng)風(fēng)險(xiǎn)評(píng)估以及與更廣泛的人工智能社區(qū)合作置于優(yōu)先地位。
提供跨界合作與開放生態(tài)
谷歌認(rèn)為,要負(fù)責(zé)任地推進(jìn)人工智能的前沿領(lǐng)域,需要全社會(huì)各方面的協(xié)作。
2025年,谷歌與頂尖的人工智能實(shí)驗(yàn)室合作,成立了Agentic AI基金會(huì),并支持開放標(biāo)準(zhǔn),以確保Agentic AI擁有一個(gè)負(fù)責(zé)任且具備互操作性的未來(lái)。
在教育領(lǐng)域,谷歌也與教育機(jī)構(gòu)合作,幫助學(xué)生掌握AI技能。并與加州大學(xué)伯克利分校、耶魯大學(xué)、芝加哥大學(xué)等眾多高校研究合作,一起推動(dòng)前沿研究。
此外,谷歌正與多個(gè)實(shí)驗(yàn)室合作,協(xié)同改變科學(xué)研究的開展方式。與電影制作人和其他創(chuàng)意開發(fā)者合作,為他們提供最優(yōu)質(zhì)的AI工具,探索人工智能時(shí)代的新的敘事方式。
2026年,谷歌希望能夠繼續(xù)安全且負(fù)責(zé)任地推進(jìn)前沿技術(shù),為人類謀福祉。
參考鏈接:
[1]https://blog.google/technology/ai/2025-research-breakthroughs/
[2]https://x.com/i/trending/2003527758127989012
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.