今天凌晨,谷歌 DeepMind 的掌門人在自己的社交賬號發了四個鉆石表情。
留言區有人說,這估計是有什么大招要放。
![]()
幾個小時后,謎底揭曉。
谷歌發布了迄今為止最強大的開源模型家族:Gemma 4。
注意,是 Gemma,不是 Gemini。
可能有讀者不知道 Gemma 和 Gemini 有什么區別,這里我簡單介紹一下。
Gemma 是輕量、開源、可本地部署的開放模型,適合開發者定制。而 Gemini 是谷歌的重量級、閉源、主要以 API 形式提供服務的旗艦模型。
看完 Gemma 的介紹,我第一個感受是:谷歌這次是真的被逼急了,但也真的放大招了。
這四個鉆石,代表了四個不同尺寸的模型。其中最讓人震驚的,是一個叫作 31B 的版本。
![]()
在 AI 圈里,模型的參數量就像是一頭大象的體重。過去大家普遍認為,體量越大,能力越強。
現在市面上最頂級的開源模型,動輒就是 4000 億甚至更大的參數量,是個絕對的龐然大物。
但 Gemma 4 這個只有 310 億參數的模型在最具權威的 Arena AI 排行榜上,直接沖到了全球開源模型第三名。
另外,在模型尺寸和性能對比上,31B 的這個版本甚至直接被拿來和國內那些頂級模型做對比,比如 Kimi K2.5 和 qwen 3.5。
![]()
這意味著什么?
說明它在性能上擊敗了一大堆參數量是自己十幾倍、甚至二十倍的對手。
如果你對這個數字沒感覺,我換個說法你就明白了。
這就像是一家公司里,原本需要一個 400 人的龐大團隊才能搞定的復雜業務,現在來了一個 30 人的精銳小分隊,不僅把活干完了,而且干得比大多數 400 人的團隊還要好。
那么,這種降維打擊是怎么做到的?
因為谷歌直接把自家不開源的旗艦模型 Gemini 3 的核心底層技術,下放給了這個開源系列,他們把這叫作「每參數智能」。
說白了,就是不再追求把大腦搞得無限大,而是追求每一根神經元的效率最大化。
帶來的直接結果,就是算力成本的斷崖式暴跌。
我知道現在很多人用類似 OpenClaw 的 Agent 產品時都覺得 token 貴,因此也不敢去用一些頂級模型。
但我覺得,這只是暫時的。
做產品的都知道,凡是有需求的地方,就一定會有解決方案。所以未來 token 成本降低是個必然事件,且模型能力會越來越強。
以前你想跑一個頂級聰明的 AI,得花大幾萬塊買最頂級的專業顯卡。現在,一張普通人買得起的消費級顯卡就能輕松搞定。
這還不算完。
Gemma 4 這次發布非常聰明,它不是只給了一個大錘子,而是給了一整套工具箱,四個版本分工極其明確,這也是為什么他們老大要發四個鉆石的推文的原因。
除了那個負責拔高上限的 31B 版本,它還出了一個 26B 的版本,用了一種叫「混合專家」的技術。
![]()
聽著很玄乎,其實道理很簡單。
就像是一個有 26 個頂尖專家的顧問團,每次遇到問題,不是所有人一窩蜂上,而是只叫醒最擅長這個問題的 3、4 個人去解答。
這樣一來,反應速度極快,既省了算力,又保證了回答質量。
最讓我覺得具有風向標意義的,是另外兩個最小的版本,它們是專門為移動設備設計的。
你可以把一個足夠聰明的 AI 完全下載到你的安卓手機里,甚至放在一個幾十塊錢的樹莓派小電腦上運行,延遲幾乎為零。
不需要連網,不需要買云服務,更不用擔心你的私人數據被傳到大廠的服務器上,當然也不用擔心 token 消耗。
很多人還在把 AI 當作一個需要花錢調用、必須存在云端的神秘工具。但很多敏銳的開發者和公司,已經開始把 AI 塞進各種普通設備,變成一種像計算器一樣普及的端側能力。
未來,當智能變得越來越便宜且隨處可見時,傳統的商業模式就會被重構。
除了技術上的碾壓,更讓我意外的,是谷歌這次徹底放下了大廠的傲慢。
之前發布上一代模型時,谷歌搞了一個自己定制的開源協議,里面有一堆彎彎繞繞的限制條款。甚至你用它生成的數據,它都要管,隨時還能單方面修改規則。
當時開發者們怨聲載道,覺得這根本不是真開源。
但這一次,谷歌直接換成了業界最成熟、最寬松的 Apache 2.0 協議。
沒有那些亂七八糟的限制,你可以放心大膽地拿去商用。
大廠為什么突然變得這么聽勸?
在我看來,不是因為情懷,而是因為實實在在的競爭壓力。
在這之前,不管是國內的 DeepSeek 還是 Qwen,都在開源賽道上大殺四方,不僅性能強悍,而且極其開放,在全球圈粉無數。甚至在很多場景下,把谷歌壓著打。
谷歌很清楚,如果再在協議上扭扭捏捏,開發者就會徹底用腳投票。
在這場沒有硝煙的生態爭奪戰里,誰能讓開發者用得爽,誰才能活到最后。
所以,這件事真正值得普通職場人和創業者看見的,其實是一個強烈的時代信號。
上半場,大家都在卷誰的模型更大、誰的參數更多、誰能考出更高的分數,那是一場屬于巨頭和資本的燒錢游戲。
下半場比拼的,不再是造出多大的神,而是誰能把神拉下神壇,變成每個人手里的趁手兵器。
當頂級模型的智力被無損壓縮到手機里,當本地調用的成本趨近于零,AI 就不再是一個高高在上的技術名詞,而是會變成像水電煤一樣的基礎設施。
在這個階段,再去糾結底層技術原理已經沒有意義了。
真正拉開差距的,是誰能最快把這些好用的、觸手可及的智能,應用到自己的工作流里。
然后,用最低的成本,解決最具體的業務問題。
很多人還在觀望,覺得 AI 離自己很遠。但其實,那個更聰明、更便宜、而且完全受你掌控的 AI,馬上就會來到你的設備里。
只有知道 AI 世界里每天在真實的發生著什么,我們才能身臨其境感受到那個正在發生的未來。
這是個不能辜負的時代,屬于個體能力被無限放大的時代。
················· 唐韌出品 ·················
安可時刻
這幾天我把自己的幾個 AI 員工全都換了一遍腦子,現在是混合使用 Claude、GPT、Gemini 的模型,從之前的國產 Coding Plan 切換過來了。
這么做雖然更貴了,但你感受過那種生產力躍遷的時候,這筆賬也就能算明白了。
有種感覺,就是體驗過就回不去了。
當然,我們的國產模型也一定會越來越強。
這是我半天的用量。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.