![]()
出品 | 創(chuàng)業(yè)最前線
作者 | 白華
編輯 | 閃電
美編 | 邢靜
審核 | 頌文
過(guò)去三年,AI賽道的競(jìng)爭(zhēng)焦點(diǎn)清晰聚焦在“感知力”上——大模型(LLM)突破理解與生成邊界,多模態(tài)技術(shù)讓AI能看、能聽(tīng)、能說(shuō),整個(gè)行業(yè)都在解決一個(gè)問(wèn)題:AI能接觸多少世界?
但現(xiàn)在,風(fēng)向變了。
要讓AI真正具備跨時(shí)間的關(guān)聯(lián)、推理與成長(zhǎng)能力,長(zhǎng)期記憶是繞不開(kāi)的關(guān)鍵;如今,記憶早已不是“加個(gè)功能”那么簡(jiǎn)單,而是上升為AI Agent競(jìng)爭(zhēng)的“戰(zhàn)略層高地”。
這一判斷正被全球巨頭密集驗(yàn)證:OpenAI已正式推出Memory API,允許開(kāi)發(fā)者為AI接入長(zhǎng)期記憶;Google在Gemini Memory項(xiàng)目上加速實(shí)驗(yàn)室攻堅(jiān),內(nèi)部?jī)?yōu)先級(jí)拉滿;Anthropic、Meta也在低調(diào)籌備顯式記憶模型,多家大廠甚至專門(mén)成立“Memory專項(xiàng)團(tuán)隊(duì)”。
而在微軟CEO納德拉與Stripe聯(lián)合創(chuàng)始人約翰·科里森(John Collison)近期的深度對(duì)話中,也同樣提出“一個(gè)有效的Agent系統(tǒng)必須具備三個(gè)模型之外的要素:記憶(長(zhǎng)期信用分配)、權(quán)限(嚴(yán)格遵守訪問(wèn)限制)和有效的行動(dòng)空間。”
巨頭們的動(dòng)作已經(jīng)說(shuō)明,記憶賽道,戰(zhàn)事已起。
而在這一輪競(jìng)賽中,一家中國(guó)初創(chuàng)公司——記憶張量,正以“操作系統(tǒng)級(jí)”的架構(gòu)脫穎而出。2024年7月就在WAIC發(fā)布業(yè)內(nèi)首個(gè)記憶分層大模型,2025年又趁熱推出MemOS 1.0,同步啟動(dòng)OpenMem開(kāi)源社區(qū),把“AI記憶操作系統(tǒng)”從概念變成了可落地的工具。
![]()
近期,MemOS更發(fā)布兩大核心產(chǎn)品:
MemOS云平臺(tái):企業(yè)可像購(gòu)買(mǎi)云服務(wù)器一樣,按需調(diào)用“長(zhǎng)期智能能力”,無(wú)需自建記憶系統(tǒng);
![]()
MindDock:用戶首次擁有AI記憶產(chǎn)權(quán),支持跨平臺(tái)遷移(如ChatGPT→Gemini),并將偏好、知識(shí)封裝為“個(gè)人經(jīng)驗(yàn)資產(chǎn)”。
這是一場(chǎng)范式轉(zhuǎn)移:記憶第一次成為可審計(jì)、可回滾、可遷移的系統(tǒng)資產(chǎn)——這意味著,AI智能將真正具備“復(fù)利效應(yīng)”。而MemOS也極有可能成為“可治理記憶層的代表”,那MemOS到底是什么?做了哪些創(chuàng)新呢?
1、沒(méi)有記憶的AI,永遠(yuǎn)完不成商業(yè)化
在討論MemOS之前,我們必須回答一個(gè)根本問(wèn)題:AI為什么非要“有記憶”?
一個(gè)殘酷的事實(shí),沒(méi)有記憶的Agent,只是高級(jí)聊天機(jī)器人。當(dāng)前主流AI系統(tǒng)雖然能流暢對(duì)話、生成內(nèi)容,卻始終困在“金魚(yú)記憶”的循環(huán)里,因?yàn)槊看谓换ザ枷竦谝淮我?jiàn)面,無(wú)法累積經(jīng)驗(yàn)、無(wú)法形成身份、無(wú)法建立信任。這種“一次性智能”在娛樂(lè)場(chǎng)景尚可應(yīng)付,但在需要連續(xù)性、責(zé)任性和復(fù)利效應(yīng)的真實(shí)商業(yè)場(chǎng)景中,幾乎寸步難行。
長(zhǎng)期記憶,是Agent從“看上去聰明”走向“真正能工作”的分水嶺。
行業(yè)其實(shí)很早就意識(shí)到“記憶很重要”,但過(guò)去的技術(shù)策略都比較粗糙,更多是用各種“補(bǔ)丁”在彌補(bǔ)大模型沒(méi)有長(zhǎng)期記憶的問(wèn)題,而非系統(tǒng)資產(chǎn)。最主流的做法是兩類:一類是長(zhǎng)上下文,把歷史對(duì)話原樣塞進(jìn)prompt里,這種方式成本高、效率低、不可治理;另一類是RAG,用向量檢索拉回相關(guān)知識(shí)再拼進(jìn)輸入。這兩種方式都只能提供一次性的、表層的“記住”。大廠這兩年也在做記憶,但多半停留在“功能級(jí)”。
過(guò)往的大部分方案本質(zhì)仍是短時(shí)記憶的堆砌,不具備審計(jì)、回滾、遷移、復(fù)用等系統(tǒng)能力。更致命的是:它們的記憶不屬于用戶,也不屬于AI,而是鎖死在產(chǎn)品內(nèi)部——既不能跨平臺(tái)遷移,也無(wú)法被用戶治理。
![]()
(圖 / 過(guò)去主流方案存在明顯局限)
這樣的方案造成結(jié)果就是,AI能算,卻不會(huì)成長(zhǎng);能聊,卻不能積累價(jià)值。企業(yè)投入大量算力,卻得不到ROI復(fù)利。
2、MemOS重構(gòu)AI記憶的底層邏輯
要理解記憶對(duì)AI的真正價(jià)值,首先需要打破一個(gè)認(rèn)知誤區(qū):記憶的本質(zhì)不是“存信息”,而是讓AI擁有可治理、可復(fù)用、可遷移的經(jīng)驗(yàn)資產(chǎn)。這才是AI從“單次響應(yīng)工具”升級(jí)為“長(zhǎng)期智能體”的關(guān)鍵。
而MemOS的核心突破,正在于精準(zhǔn)落地了這一本質(zhì)邏輯:它跳出了“功能級(jí)記憶”的窠臼,直接以“操作系統(tǒng)”視角重構(gòu)AI的智能積累機(jī)制。
根據(jù)「創(chuàng)業(yè)最前線」了解,MemOS不是一個(gè)記憶插件,也不是一個(gè)數(shù)據(jù)庫(kù)封裝,而是行業(yè)首個(gè)面向AI的記憶操作系統(tǒng)。其核心理念是:讓AI擁有一套“像操作系統(tǒng)一樣管理記憶”的底層機(jī)制,而不是靠上下文堆砌、規(guī)則拼接來(lái)維持所謂的“記住”。
而為了實(shí)現(xiàn)這個(gè)目標(biāo),MemOS創(chuàng)新了三大機(jī)制,可以讓記憶真正“可用、可信、可復(fù)利”。具體來(lái)看就是為AI管理整個(gè)記憶生命周期:解釋寫(xiě)入→回滾→遷移→復(fù)用。這個(gè)機(jī)制的重大意義就好像云計(jì)算之于服務(wù)器、支付系統(tǒng)之于交易——MemOS正在改變“智能如何積累”的底層規(guī)則。
其三層架構(gòu)的創(chuàng)新價(jià)值尤為突出:在應(yīng)用&API層,可以提供保存、更新、遷移、回滾等統(tǒng)一接口,將所有記憶能力做成標(biāo)準(zhǔn)化算子,開(kāi)發(fā)者可以像調(diào)用API一樣使用記憶抽取、壓縮、回溯、遷移等功能,無(wú)需理解底層機(jī)制,就能構(gòu)建具備長(zhǎng)期偏好、穩(wěn)定人設(shè)和跨任務(wù)狀態(tài)的智能體。
在系統(tǒng)層,MemOS最獨(dú)特的模塊是記憶調(diào)度器,可以對(duì)參數(shù)記憶、激活記憶與明文記憶進(jìn)行預(yù)測(cè)性、異步調(diào)度。它負(fù)責(zé)管理記憶的全生命周期:哪些信息值得被抽取、何時(shí)總結(jié)、如何壓縮、何時(shí)遺忘、任務(wù)之間如何共享、沖突如何消解,以及執(zhí)行時(shí)應(yīng)該把哪些記憶喂給模型。這些都不再靠開(kāi)發(fā)者寫(xiě)規(guī)則,而由系統(tǒng)與小模型共同決策,讓記憶具備“自治調(diào)度能力”。
![]()
在存儲(chǔ)與基礎(chǔ)層,支持用戶記憶、領(lǐng)域記憶、專家記憶的封裝與跨模型遷移與恢復(fù)。不是把記憶當(dāng)成外掛,而是通過(guò)后訓(xùn)練、自蒸餾、記憶提純等方式,讓模型具備“記憶原生”的表征能力。長(zhǎng)期偏好、任務(wù)狀態(tài)、上下文演化會(huì)被模型內(nèi)化為穩(wěn)定表征,類似人腦把長(zhǎng)期記憶壓縮進(jìn)皮層結(jié)構(gòu)。這一點(diǎn)讓MemOS區(qū)別于市面上大多數(shù)仍依賴檢索和上下文拼接的方案。
最終的效果是,MemOS能讓模型不再是“無(wú)狀態(tài)推理器”,而是一個(gè)能基于自身歷史不斷進(jìn)化的智能系統(tǒng)。它不像傳統(tǒng)方案那樣堆信息、從零開(kāi)始,模型能夠在長(zhǎng)期使用中持續(xù)積累經(jīng)驗(yàn)、參與決策并不斷演化。讓智能第一次變成“沉淀資產(chǎn)”,而不是一次性算力行為。
3、誰(shuí)最需要MemOS?
技術(shù)架構(gòu)的價(jià)值,終要通過(guò)場(chǎng)景驗(yàn)證。那么哪些行業(yè)可以先做長(zhǎng)期智能?
![]()
答案是,并非所有場(chǎng)景與行業(yè)都必須率先需要長(zhǎng)期記憶,同時(shí)滿足以下三個(gè)條件的行業(yè),才會(huì)率先擁抱MemOS:一是決策高度依賴歷史數(shù)據(jù),二是操作依賴經(jīng)驗(yàn)連續(xù)性,三是錯(cuò)誤成本極高。
例如金融行業(yè),需記錄用戶風(fēng)險(xiǎn)偏好、投資歷史,且任何幻覺(jué)都可能導(dǎo)致重大損失;工業(yè)/運(yùn)維行業(yè),設(shè)備生命周期長(zhǎng)達(dá)數(shù)十年,故障診斷、維護(hù)策略必須基于長(zhǎng)期運(yùn)行數(shù)據(jù)沉淀;客服/投顧/運(yùn)營(yíng)行業(yè),“一次訓(xùn)練,多次復(fù)用”可以大幅壓降人機(jī)協(xié)作成本;人格/陪伴類AI助手,因?yàn)橛脩絷P(guān)系即資產(chǎn),失憶等于關(guān)系歸零。
以個(gè)性化AI金融投顧客服為例,金融場(chǎng)景對(duì)“穩(wěn)定性”和“個(gè)性化”要求極高。過(guò)去的智能客服最大的痛點(diǎn)是,每次都是從頭問(wèn)、從頭解釋,越聊越像機(jī)器人。接入MemOS后,系統(tǒng)能自動(dòng)記住用戶的風(fēng)險(xiǎn)偏好、過(guò)往問(wèn)題、賬戶習(xí)慣、資產(chǎn)結(jié)構(gòu)等長(zhǎng)期信息。效果非常明顯:同一個(gè)用戶反復(fù)來(lái)咨詢,系統(tǒng)能保持一致的策略和人設(shè),重復(fù)溝通減少超過(guò)60%,準(zhǔn)確命中用戶需求的比例也顯著提升。更重要的是,它在業(yè)務(wù)越跑越熟,真正具備了“經(jīng)驗(yàn)積累”。
當(dāng)然,MemOS的能力不僅體現(xiàn)在理念與客戶驗(yàn)證上,更經(jīng)過(guò)四大權(quán)威Benchmark的硬核驗(yàn)證,覆蓋事實(shí)記憶、偏好理解、跨會(huì)話推理等全維度。
一是在算法效果上,MemOS不僅在所有核心指標(biāo)上奪冠,并且在多個(gè)維度上實(shí)現(xiàn)了顯著的Token優(yōu)化。可以直接減少推理成本,提高毛利率。
具體來(lái)看,在最懂用戶的PrefEval(個(gè)性化)方面,MemOS的個(gè)性化回答率(77.20%/71.90%)均位列第一,且“未感知偏好”的錯(cuò)誤率僅為4.60%/7.40%,為全場(chǎng)最低,展現(xiàn)了對(duì)用戶偏好的穩(wěn)定識(shí)別與長(zhǎng)期記憶魯棒性。在PersonaMem(?戶畫(huà)像)方面,MemOS以61.17%的準(zhǔn)確率位列第?,同時(shí)上下?開(kāi)銷(xiāo)(Context Token)相較最強(qiáng)競(jìng)品Memobase?幅節(jié)省31.93%。
![]()
(圖 / PersonaMem評(píng)測(cè)結(jié)果)
二是在核心記憶能力(LoCoMo&LongMemEval)方面,MemOS同樣表現(xiàn)卓越,均位列第一,確保了Agent的基礎(chǔ)“記憶”功能穩(wěn)定可靠。
在LoCoMo方面,MemOS以75.80%的Overall得分奪冠,相較最優(yōu)競(jìng)品Memobase(72.01%)?出5.26%。在LongMemEval方面,MemOS以77.8%的Overall成績(jī)登頂,并在信息提取、跨會(huì)話、時(shí)間推理三項(xiàng)上均為T(mén)op-1。更重要的是,在實(shí)現(xiàn)更強(qiáng)效果的同時(shí),Token消耗相?最強(qiáng)競(jìng)品Memobase節(jié)省了7.1%。
![]()
(圖 / LoCoMo評(píng)測(cè)結(jié)果)
![]()
(圖 / LongMemEval評(píng)測(cè)結(jié)果)
工業(yè)級(jí)統(tǒng)治力方面,MemOS是唯一100%成功率的。在40 QPS壓力下,所謂的主流競(jìng)品普遍嚴(yán)重失穩(wěn),成功率甚至跌至40%以下,基本處于不可用狀態(tài)。而MemOS穩(wěn)如磐石,Add接口平均時(shí)延僅192ms,MemOS的平均檢索時(shí)延為440.5ms,實(shí)現(xiàn)真正的“即寫(xiě)即查”。
![]()
(圖 / 核心接口性能壓測(cè)對(duì)比(Add/Search))
三是在防幻覺(jué)記憶層面,記憶張量聯(lián)合中國(guó)電信研究院正式發(fā)布業(yè)內(nèi)首個(gè)針對(duì)AI記憶系統(tǒng)的幻覺(jué)評(píng)估框架——HaluMem,它的出現(xiàn),讓AI記憶系統(tǒng)首次具備了“自檢”與“溯源”能力。
不同于以往只能評(píng)估整體表現(xiàn)的黑箱方法,HaluMem首創(chuàng)了,并將記憶過(guò)程拆分為三個(gè)關(guān)鍵階段:在記憶抽取(Extraction)階段,可以評(píng)估AI是否正確抓取關(guān)鍵信息;在記憶更新(Update)階段,可以評(píng)估在修改舊信息時(shí)是否出現(xiàn)誤寫(xiě)或偏差;在記憶問(wèn)答(Usage)階段,可以評(píng)估AI回答問(wèn)題時(shí)是否調(diào)用了正確記憶。
![]()
這種“操作級(jí)”評(píng)估方式,能夠精準(zhǔn)定位幻覺(jué)來(lái)源,讓開(kāi)發(fā)者真正理解——模型是在哪一步開(kāi)始出現(xiàn)問(wèn)題。
4、結(jié)語(yǔ)
現(xiàn)在的MemOS,已經(jīng)不是實(shí)驗(yàn)室里的demo,不僅和阿里云、天翼云等達(dá)成深度合作,還在金融投顧、工業(yè)運(yùn)維、AI游戲等場(chǎng)景簽下商業(yè)訂單,真正讓“長(zhǎng)期智能”從概念變成了企業(yè)能用的基礎(chǔ)設(shè)施。
![]()
(圖 / 攝圖網(wǎng),基于VRF協(xié)議)
隨著落地案例的增多,AI行業(yè)的競(jìng)爭(zhēng)邏輯也愈發(fā)清晰,過(guò)去以算力、模型參數(shù)為核心的單一壁壘正在失效,長(zhǎng)期智能效率成為新護(hù)城河。擁有記憶資產(chǎn)的企業(yè)和個(gè)人,將獲得成本遞減、價(jià)值遞增的復(fù)利。因此,未來(lái)企業(yè)比拼的不再是“誰(shuí)能生成內(nèi)容”,而是“誰(shuí)擁有可治理、可復(fù)用的經(jīng)驗(yàn)”。
在這場(chǎng)科技與產(chǎn)業(yè)變革中,MemOS的定位已十分明確,它如同信息時(shí)代的數(shù)據(jù)庫(kù)——數(shù)據(jù)庫(kù)曾成為所有信息系統(tǒng)的底層支撐,而MemOS正成為AI時(shí)代的“AI記憶基礎(chǔ)設(shè)施”,為各類AI Agent提供不可或缺的記憶底座。未來(lái)的AI Agent要真正“能干活、干好活”,或許都繞不開(kāi)這層“記憶底座”——而MemOS,已經(jīng)走在了前面。
*注:文中題圖來(lái)自界面圖庫(kù)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.