![]()
編輯|sia
推理模型賽道,已經(jīng)近乎肉搏。
一邊是 OpenAI o1 系列,主打「多想一步」的強(qiáng)化推理路線,用更長思考時(shí)間換更穩(wěn)的結(jié)論。
一邊是 Anthropic 的 Claude Thinking,深耕研究與分析場景,強(qiáng)調(diào)長上下文下的審慎與可靠。
現(xiàn)在,谷歌也重兵壓上——Gemini 3 Deep Think 迎來重大升級(jí)。
不過真正吸睛的,早就不是又贏了幾個(gè) benchmark,而是它的定位:「參與科研和工程決策」的實(shí)力。
業(yè)內(nèi)一直流傳一套很經(jīng)典的民間壓力測試,讓模型生成「一只騎自行車的鵜鶘」(A pelican riding a bicycle)的 SVG 代碼。
題目看起來像 meme,但懂的人都知道,它同時(shí)卡三件事:空間邏輯、結(jié)構(gòu)正確性、細(xì)節(jié)遵從能力。
已有網(wǎng)友放出相當(dāng)驚艷的版本,也是我見過最好的一張。
![]()
案例來自 https://simonwillison.net/
加碼難度,上硬核約束:
Generate an SVG of a California brown pelican riding a bicycle. The bicycle must have spokes and a correctly shaped bicycle frame. The pelican must have its characteristic large pouch, and there should be a clear indication of feathers. The pelican must be clearly pedaling the bicycle. The image should show the full breeding plumage of the California brown pelican.
難度瞬間從「會(huì)畫圖」,躍遷到「會(huì)建模 + 會(huì)生物 + 會(huì)物理」。
尤其是,畫出「加州褐鵜鶘繁殖羽」。這不是隨便涂個(gè)顏色就能糊弄的。繁殖期它的頭部會(huì)偏黃,頸部呈紅棕色,要求模型具備非常專業(yè)的生物知識(shí)。
「正在蹬踏」要求 AI 能正確處理肢體與機(jī)械的交互:動(dòng)物的腳丫子,必須對準(zhǔn)踏板。
結(jié)果,Gemini 3 Deep Think 還能穩(wěn)定交出質(zhì)量很高的 SVG。
![]()
案例來自 https://simonwillison.net/
這里釋放的信號(hào)其實(shí)很清晰:Gemini 3 Deep Think 追求的不是「更會(huì)想」,而是在科研級(jí)、工程級(jí)、多條件約束問題上,能更可靠地把事情做對。
從「紙上談兵」進(jìn)化到「動(dòng)手造物」,更明顯的用例,是它能把用戶的要求、草圖甚至照片,直接建模成可 3D 打印的實(shí)體文件
![]()

來自谷歌軟件工程師@rakyll

其實(shí),谷歌也在推廣中主打Deep Think會(huì)分析圖紙,構(gòu)建復(fù)雜的形狀,并生成文件,使用3D打印機(jī)創(chuàng)建實(shí)體對象。
要知道 AI 以前只是個(gè)畫家,你給它看一張鍋的照片,它能臨摹出一張一模一樣的畫,但那只是平面的影子。
現(xiàn)在, Gemini 3 Deep Think 看一眼照片,就能腦補(bǔ)全這張鍋在各個(gè)角度的長寬高、厚度甚至把手的弧度,直接變出一個(gè)立體實(shí)物原型。
換句話說,它不止要會(huì)空間推理(理解結(jié)構(gòu)、體積、厚度、連接),還要考慮一個(gè)更現(xiàn)實(shí)的問題:這東西能不能被制造出來、能不能被真實(shí)使用。
答案是肯定的。
![]()
![]()
它甚至開始帶著審美與結(jié)構(gòu)意圖去做生成設(shè)計(jì)。
這是它設(shè)計(jì)的一個(gè)花盆。
![]()
來自x網(wǎng)友@ytiskw,「請?jiān)O(shè)計(jì)一個(gè)全新的時(shí)尚花盆,并使用 Python 輸出為 STL 文件。條件:可以排水……」
從不同角度看,「面」和「角」的視覺會(huì)發(fā)生變化,立體感和現(xiàn)代感都很強(qiáng),不像是單純堆幾何體,更像是在做造型語言。
還有更硬核的玩法。
這位 MIT 教授先給它一張 3D 蜘蛛網(wǎng)圖片,要求生成交互式設(shè)計(jì)工具。
結(jié)果,它一步到位,直接產(chǎn)出了一整套完整的設(shè)計(jì)套件,涵蓋程序化控制、仿真與優(yōu)化流程,并支持 STL 文件導(dǎo)出。
https://x.com/ProfBuehlerMIT/status/2022635227609268480
教授甚至用這套工具設(shè)計(jì)了全新的超材料結(jié)構(gòu),以及一款受蜘蛛網(wǎng)啟發(fā)的橋梁方案。
![]()
3D 打印后,還做了受力測試(用的是 nvidia DGX Spark ,大約 2 斤半重),確認(rèn)結(jié)構(gòu)在工程上也立得住。
![]()
想象一下,你在網(wǎng)上刷到一個(gè)造型奇特的設(shè)計(jì)。
過去你想 3D 打印一個(gè)相近的,得會(huì) Blender、Fusion 360 這類軟件,拉曲面、調(diào)尺寸、做厚度,新手往往得學(xué)好幾周。
現(xiàn)在,截圖給 AI → 輸出 STL → 丟進(jìn) 3D 打印機(jī) → 幾小時(shí)后實(shí)物到手,等于把專業(yè) 3D 建模幾乎壓縮成了「一鍵生成」。
再看看另一個(gè)用例。用 Deep Think 把周圍的 WiFi 網(wǎng)絡(luò)空間化、可視化,用 3D 方式展示信號(hào)強(qiáng)度和可能的物理位置關(guān)系。
平時(shí)手機(jī)里的 WiFi 列表按信號(hào)強(qiáng)度(RSSI)排序,但在物理空間里,強(qiáng)度不等于距離。比如,離你 2 米、隔著承重墻的路由器,可能比 10 米外空曠區(qū)域的路由器還要弱。
這里, Deep Think 聰明地引入了統(tǒng)計(jì)關(guān)聯(lián),如皮爾遜相關(guān)分析,去推斷哪些 AP在物理上更可能彼此接近。
此外,還有更典型的科研敘事。比如,Deep Think 能審閱高度專業(yè)的數(shù)學(xué)論文,指出同行評(píng)審漏掉的細(xì)微邏輯缺陷,也被用于優(yōu)化半導(dǎo)體晶體生長流程。
換句話說,谷歌想證明的不是它更會(huì)「想」,而是它開始真的能「干活」。
它盯住的是科研與工程里的硬骨頭:沒有明確邊界、沒有唯一答案、數(shù)據(jù)又臟又亂的真實(shí)研究問題。
而且,不只是卷數(shù)學(xué)、編程,而是把觸角伸向化學(xué)、物理(包括理論物理)等多個(gè)科學(xué)領(lǐng)域,全面鋪開。
隨著通用對話能力快速商品化,那些真正能處理復(fù)雜財(cái)務(wù)模型、實(shí)驗(yàn)數(shù)據(jù)與工程設(shè)計(jì)的深度推理能力,正在成為新的競爭高地。
谷歌正在試圖把大模型從信息助手,推向科研與工程體系里的「第二大腦」。如果后續(xù)真實(shí)采用率跟得上,這一步的分量,可能會(huì)比單純的性能提升更大。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.