兩年前,AI創(chuàng)業(yè)的關鍵詞還是“百模大戰(zhàn)”。從通用大模型到行業(yè)模型,參數(shù)規(guī)模不斷刷新紀錄,融資金額屢創(chuàng)新高,市場一度形成“誰不做大模型,誰就會被淘汰”的共識。
但近階段,風向正在發(fā)生明顯變化。無論是在硅谷,還是在國內(nèi)創(chuàng)投圈,純粹以“再做一個大模型”為核心賣點的創(chuàng)業(yè)項目,正快速降溫。取而代之的,是輕量化小模型、AI Agent以及設備端(On-Device)AI等方向。
這并非技術熱情消退,而是一場由成本、商業(yè)化和資本邏輯共同驅(qū)動的理性回歸。在2026年的國際消費類電子產(chǎn)品展覽會(CES)上,這一趨勢尤其明顯。第一財經(jīng)獨家采訪了設備端(On-Device)AI創(chuàng)業(yè)公司Aizip的聯(lián)合創(chuàng)始人陳羽北。他是典型的在美華人工程師代表,曾于清華大學和加州大學伯克利分校分別獲得學士和博士學位,如今在加州大學戴維斯分校任教并進行創(chuàng)業(yè)項目。
陳羽北表示,設備端AI正在成為創(chuàng)業(yè)公司的新賽道。通過“用大模型生成小模型”的方法,通過收集數(shù)據(jù)、購買數(shù)據(jù)和大模型蒸餾三種途徑獲取所需數(shù)據(jù),使AI能夠直接在終端設備上運行,無須依賴云端或網(wǎng)絡。這種模式不僅降低了成本,也保證了數(shù)據(jù)隱私,并使智能應用能夠快速落地。當前,這一設備端AI模型已經(jīng)在多個終端品牌落地,與全球多家頭部硬件廠商展開合作,包括軟銀、ARM、Microchip等知名上市公司。
![]()
不再死磕算力、效率先行
2025年12月,OpenAI的CEO山姆·奧特曼(Sam Altman)發(fā)出“紅色警報”(Code Red),要求公司加速推進在ChatGPT方面的工作,推遲其他產(chǎn)品的開發(fā),以應對來自谷歌Gemini3等對手的擠壓。
盡管大模型之戰(zhàn)越發(fā)白熱化,但進入該賽道的競爭者不增反減,行業(yè)的共識也逐漸形成,這將成為幾個資本雄厚的巨頭之間的爭奪。
多位參與CES的風投圈人士和AI企業(yè)創(chuàng)業(yè)者對第一財經(jīng)表示,大模型已經(jīng)成為一場高度資本密集型的競賽。千億參數(shù)模型的單次訓練成本動輒數(shù)千萬美元,而推理階段的算力消耗同樣驚人。隨著GPU價格高企、云算力賬單持續(xù)攀升,大模型的“邊際成本”并未如預期般快速下降。
對于創(chuàng)業(yè)公司而言,這意味著兩點現(xiàn)實壓力:資金消耗速度遠超傳統(tǒng)軟件創(chuàng)業(yè);即便模型性能提升,商業(yè)化路徑仍高度不確定。多位投資人私下直言,大模型項目正在變成“技術上成立,但財務模型難以自洽”的典型案例。
于是,更多資本和AI創(chuàng)業(yè)者將目光投向輕量化模型和AIAgent(AI智能體),Aizip也是其中之一。盡管大模型縮放定律,即scaling law,訓練數(shù)據(jù)和模型參數(shù)越大,模型的智能越強,這仍然有效,但AI從業(yè)者也認識到了不死磕算力的關鍵性。
陳羽北表示,博士畢業(yè)后,他意識到自己在工程能力上尚有短板,于是選擇加入Yann LeCun的團隊,在Facebook AI Reserch以及紐約大學從事博士后研究,這段經(jīng)歷也幫助他補齊了模型工程化與規(guī)模化模型訓練方面的能力。
“當時,我們能直接使用每次訓練配備512張V100顯卡的大規(guī)模算力。我們寫一篇論文消耗的計算資源可能就要花上百萬美元。scaling確實有效——更多的數(shù)據(jù)、更大的模型以及更直接的優(yōu)化通常能帶來性能提升,但并非總是成正比。”他稱。
比如,數(shù)據(jù)規(guī)模擴大300倍,模型性能可能只提升個位數(shù)的百分點。這讓他開始反思數(shù)據(jù)質(zhì)量、模型結構、工程嚴謹性等因素的實際影響。換句話說,有了充足資源后,才真正知道哪些研究方向值得投入,哪些在資源有限時可以回避。
事實上,近年來,很多AI創(chuàng)業(yè)公司盲目推高模型規(guī)模,資源已經(jīng)用到極限,卻很難再從scaling中獲得突破。于是,陳羽北也越發(fā)認為,要尊重scalinglaw,但不能迷信它。“特別是在創(chuàng)業(yè)時,我們的思路是反向而行的——不是做更大,而是做‘全球最小、最高效’的AI系統(tǒng)。這和主流強調(diào)通用人工智能(AGI)、取代人的方向并不一致。”他說。
設備端AI萌芽
在這一背景下,設備端AI已經(jīng)成為全球AI界頗為熱門的新興方向之一。
簡單來說,設備端AI直接跑在手機、筆記本、相機等設備上,不依賴云,甚至不需要互聯(lián)網(wǎng)。其特點在于,輕量化模型適合本地處理少量數(shù)據(jù),響應快,低延遲。數(shù)據(jù)不出設備,更安全。以我們熟悉的應用為例,手機拍照自動美顏/夜景增強。iPhone上的Siri或照片識別。智能門鎖或家用機器人做語音/圖像處理。
陳羽北表示,專注于設備端AI的Aizip本質(zhì)上是一家純軟件公司,只做AI模型的研發(fā),本質(zhì)上是在大模型的基礎上訓練、生成適合于各種垂直小模型。同時,創(chuàng)業(yè)團隊對硬件有非常深的理解,聯(lián)合創(chuàng)始人過去創(chuàng)立的公司曾服務于Apple等客戶。
“設備端AI模型的訓練,主要通過收集數(shù)據(jù)、購買數(shù)據(jù)和大模型蒸餾三種途徑,同時也要評估數(shù)據(jù)合規(guī)性,使用高質(zhì)量產(chǎn)品級數(shù)據(jù)。”他稱,盡管目前專注的是本地化智能賽道,但也會對標Gemini等最優(yōu)越的模型,在細分應用上追求達到或超越其性能,可利用視覺語言模型(VLM)。盡管scalinglaw仍然有效,但在需求明確的應用上,大模型scalinglaw可能會逐步失效。
據(jù)第一財經(jīng)觀察,當前三類應用場景的商業(yè)化前景已經(jīng)頗為突出——卡拉OK聲音解決方案、智能攝像頭、智能喚醒助手。
以卡拉OK聲音解決方案為例,在傳統(tǒng)的卡拉OK或在線唱歌應用中,用戶往往只能使用原版伴奏或在線處理,而端側解決方案能夠直接在用戶設備上完成聲音分離,即識別歌曲中的人聲部分,并將其消除,只保留背景音樂。無須上傳歌曲到云端或依賴在線計算。
再以智能攝像頭為例,端側識別與安全報警的功能也具備商用前景。AI解決方案使得攝像頭能夠在設備端完成復雜的圖像識別任務,例如區(qū)分來訪人員身份,是快遞員,還是潛在的偷取快遞的陌生人,并實時提醒無法全程監(jiān)控環(huán)境的用戶,如果識別到異常行為,攝像頭能夠自動發(fā)出報警信號,提示用戶采取措施。對家庭、社區(qū)和物流企業(yè)來說,這種模式具備實時性、安全性和隱私保護的三重優(yōu)勢。用戶無須擔心攝像頭數(shù)據(jù)被傳到云端或被第三方訪問,同時能夠在第一時間獲得安全警示。
陳羽北表示,客觀來說,目前真正的設備端AI革命尚未到來,不過市場熱度比之前更高,從產(chǎn)品化、落地和客戶需求能看出,進入真實產(chǎn)品場景增多。未來發(fā)展的催化劑在于,有更多剛需應用,如智能手表語音能力、嬰兒監(jiān)控攝像頭等,能培養(yǎng)用戶習慣,且注重隱私保護,將AI能力放到本地。
他也坦言,當前行業(yè)對AI模型訓練人才和算力需求依然極高,華人工程師在AI浪潮中更是扮演了關鍵角色,這也源于他們本身的優(yōu)勢——數(shù)理基礎好、工作努力,學新技術速度快,解決工程類問題能力強,在既定賽道發(fā)展較快。相比之下,美國的頂尖工程師亦有自己的特長,他們的思想則更不羈,更敢進行打破常規(guī)的想象,在創(chuàng)造新路線方面更有創(chuàng)新思考能力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.