![]()
作者 | 黃小藝
郵箱 | huangxiaoyi@pingwest.com
今天的AI,很強,但不認識你。
它不知道你昨天經歷了什么,不知道你正處于人生的哪個階段,不知道今天的你和一個月前有什么不同。所以它只能等你問、等你發起一切——然后盡可能給出一個“正確”的回應。
這是被動智能。
當然,很多公司已經開始做“記憶”了。模型公司在做,希望讓回答更個性化;應用層也在做,希望讓AI更有溫度、讓對話更連貫。但這些記憶,本質上都是服務于具體場景的——讓AI更好地即時“響應”你,而不是真正“理解”你。
丘腦智能想做的事情不太一樣。他們想把記憶變成一種基礎設施,理解你是誰、你在變成誰、你可能需要什么。
這件事分兩步走。
第一步,是讓記憶完整。現在大多數記憶方案只能處理文本,但人的生活還有照片、有語音、有視頻、有各種各樣的數據痕跡。而且這些信息是有時間順序的,今天發生的事和三年前發生的事,意義完全不同。丘腦智能第一個要解決的,就是“時序性”和“全模態”——讓AI能理解你生活中所有類型的信息,并且知道它們在時間軸上的位置。
這一步的地基已經打下——12月,丘腦智能基于自研的時空知識圖譜框架(STKG,Spatio-Temporal Knowledge Graph),在多項長程記憶評測中刷新了SOTA記錄。
在針對Agent長期對話記憶的權威榜單LoCoMo測試中,他們的核心產品OmniMemory在保證P95檢索延遲低于2秒的前提下,綜合準確率達到82.5%,躋身全球AI記憶方案的第一梯隊,并于1月開始內測。
![]()
第二步,是真正的躍遷:主動智能。
當AI擁有了完整的、有時間感的記憶,它就能夠主動預判你的需求。
這背后的邏輯是:人是有軌跡的。你今天的狀態,是昨天的延續;你明天的需求,往往藏在今天的變化里。如果AI能看到這條軌跡,它就能推斷你接下來可能需要什么。
這讓我想到一個視角:人其實是“三維半”的生物。我們生活在三維空間,同時擁有過去、現在、未來,但我們對時間的掌控力很弱。過去只能記住一部分,很多塑造我們的東西早已被遺忘;未來充滿不確定性,我們只能模糊地猜測。
即使是今天的推薦算法,只知道“你刷了什么就推什么”。它假設你是靜止的,你昨天喜歡的東西今天還喜歡。但人是變化的。如果AI能理解你在時間軸上的變化,它就不會把你鎖死在信息繭房里,而是能預判你正在變成什么樣的人、未來可能需要什么。
這是交互范式的改變。從“人找信息”到“信息找人”,再到“AI懂人”。
丘腦智能正在做的,就是這個范式轉換的基礎層。在這次對話中,丘腦智能的CEO張源、CTO趙翔聊了聊他們對記憶、對時間、對AI與人關系的思考。
這些思考也許還在演化中,但指向一個清晰的方向:給AI一個時間軸,給人一個時間軸上的AI。
以下是對話實錄:
一張藍圖繪到底,做“時序性+全模態”的高精度記憶架構
硅星人:可以先向大家介紹一下你們自己和你們的產品。
張源:我和趙博是2023年初認識的,當時OpenAI的模型把大家都震撼了,我們都覺得未來十年甚至更長時間都是AI的黃金時期,非常想在AI領域創業。
但那時候百度剛發了文心一言,國內反饋挺激烈,我意識到國內基模可能還需要迭代一段時間。所以我們決定先各自積累——趙博在浙大做相關研究,我去了一家做自動駕駛域控的公司,做了兩年COO,從0到1走了一遍創業流程。
到2025年初,DeepSeek讓我們覺得基模能力到了一個節點,是創業的好時機。又因為我自己是高頻AI用戶,首先感受到了記憶孤島問題——在Gemini、GPT、豆包上輸了很多prompt,不滿意換一個基模還要重復輸入偏好,非常麻煩。我搜解決方案,發現大家做memory都做得不好。趙博剛好也在關注這個方向,我們就決定自己來解決這個問題。
趙翔: 對,我們的Omimemory 1.0,是把Memory能力封裝成SDK和API。技術上我們做的是時空知識圖譜(STKG),把時間和空間作為記憶的物理錨點,支持視頻、音頻、對話、圖片等全模態輸入。12月我們刷新了Memory領域的SOTA,今年1月開始產品內測。
硅星人:從25年下半年開始到現在,市面上已經有非常多的memory解決方案了。Omimemory 和它們的區別是什么?
趙翔:現在市面上的memory產品,大多數是基于RAG的方案,就是把用戶的對話、文檔切片存到向量數據庫里,需要的時候檢索出來。這種方式有幾個問題:一是檢索精度受限于embedding模型的能力,二是缺乏對時間和空間維度的建模,三是沒有辦法做跨模態的關聯。
我們的核心區別在于,我們把時間和空間作為記憶的物理錨點。比如用戶說“上周在杭州見了一個朋友”,我們不只是把這句話存下來,而是構建一個結構化的知識節點,包含時間、地點、人物、事件之間的關系。當用戶后來問“我上次去杭州是什么時候”或者“我最近見過哪些朋友”,系統都能準確召回。
硅星人:時間性在你們看來為什么這么重要?其他記憶產品處理時間的方式和你們有什么不一樣?
張源:我們認為,做Memory無論技術路徑怎么收斂,唯一綁不開的就是時間。人去回憶一件事情會說“去年冬天咱們一起吃火鍋的時候怎么樣”,是沿著時間軸去做漏斗篩選的。
趙翔:其他產品的時間是作為節點的屬性掛在下面的,記錄這個節點什么時候寫進來。但召回的時候還是靠語義,可以加一個時間漏斗過濾,但在這個時間范圍內召回節點時,還是先用語義把相近的召回,再排序。
這就不可避免地會把昨天和今天完全相反的兩個記憶都召回來。比如用戶昨天說“我最近失眠很嚴重”,今天說“我昨晚睡眠好多了”,RAG方案可能會把這兩條都召回來,因為它們語義上都和“睡眠”相關。兩個完全相反的事實放在面前,模型就會困惑,隨便挑一個回答。
而我們的時空知識圖譜會識別這是同一個狀態維度上的變化——“睡眠狀態”從“失眠”轉換到了“改善”。召回的時候,系統知道應該用最新的那個狀態。
硅星人:這是一套很復雜的架構,具體是怎么搭建的?
趙翔:我們可以看這張圖,最底層是時間維度,這是基礎。
![]()
接著是支持全模態的原始素材層,視頻幀里可以抽取人臉、物體、動作、場景這些信息,和身份綁定在一起。文本對話按turn組織成結構化seission然后提交到服務端,語音可以做embedding同時轉ASR變成文本。
再上一層是認知層,我們模仿人的認知。人記東西一般記的是事件,很少直接記很細的東西。這是從原始素材里抽象出來的時序事件。事件里有身份Entity,通過算法把這些聚類起來,就是“誰在哪里做了什么”。
最上一層是狀態State,這是更細粒度的狀態轉換。比如“我今天上火”和“我明天好了”就是一個狀態轉化,模型看到這個,就會判斷他現在能不能吃辣。
整體架構是在模擬人的認知,從物理到感知再到認知。
硅星人:最近兩年,記憶架構一直在迭代,最開始做的都還比較粗糙,你們是從一開始就決定要做這么高精度的解決方案嗎?
張源:我們認為要一張藍圖繪到底,先想清楚最終要實現什么目標、這個目標是不是真實的需求、能不能帶來范式迭代,然后倒推現在該怎么做。中間的研究困難、工程卡點,都可以通過資源整合去解決。
所以,我們希望去解決未來的問題。我們判斷AI的終局是主動智能,就是AI不只是被動回答問題,而是能主動理解你、幫你做事,那記憶的底層架構從第一天就必須是高精度的,包括時序性的、全模態的。
硅星人:可以舉幾個例子來說明嗎?比如,從物理到感知到認知的memory過程。
張源:比如這周你口腔潰瘍、上火、失眠,首先是在上周這個物理時間段發生的,其次,這是一個新發生的感知,并抽象出了一個你當前的狀態,比如,你不能吃辣、喝咖啡,過段時間不管你變好了,還是變壞了,這個狀態都會進一步跟隨時間軸更新。
硅星人:可能抽象出更高的狀態,比如“我冬天容易上火”,可以這樣理解嗎?
張源:對。
潛空間記憶:從被動響應到主動智能
硅星人:你們說的主動智能是什么?
張源:主動智能出現的前提是它能向前預測你的習慣,主動來提醒你,而不是像定鬧鐘一樣你去告訴它什么時候提醒,或者像現在的陪伴產品一樣你得主動找它。
硅星人:相當于AI基于AI與用戶聊天的軌跡,不斷更新下一步如何與用戶交互?
趙翔: 可以這么理解。現在的RAG、Graph RAG,有點像全部塞到上下文里面讓模型去讀一大堆信息,顯得好像跟你很熟,這個很死板。
實際上,用戶在和AI交互的過程中會積累很多偏好和習慣。每一次交互,其實都是一個偏好信號。這些東西對于個性化來說非常有價值。
但這種細粒度的偏好量非常大,所以我們現在在做一個叫潛空間記憶的東西。像推薦算法一樣,在大量反饋信號的基礎上,從圖里抽取偏好信息做一個子圖,把子圖壓成一個稠密向量。這個稠密向量人看不懂,但模型看到以后,會非常自然地了解你的每一個點。
可能有一點抽象,但就像抖音一樣,冷啟動的時候刷了一堆不喜歡的視頻,點了幾個贊之后,刷到的就全部都想看了。
張源:對,當時互聯網初期,大家都在百度、Google搜索,有了推薦算法之后長出了抖音這樣的超級應用。現在AI生態大家都是去DeepSeek、ChatGPT上問一下,都是通用的。我覺得可能會有一個面向C端的主動智能超級應用長出來。
硅星人: 這么做的難點在哪里?
趙翔: 確實有點壁壘。關于潛空間注入,如何讓模型把我們非常稠密的信息精準挖出來不丟失語義,有對齊的困難。
這個困難主要來自于:我們怎么去構造端到端的數據?如果不構造端到端數據,用DPO進行強化學習的話,reward信號該怎么打造?這里面有一些非常細的工程難點,但從理論上,目前研究和前景都是可觀的。
硅星人: 工程上的難點反而是好事,因為有壁壘。
趙翔:是的,研究和Infra、工程之間是緊密耦合在一起的。
張源:潛空間記憶是我們正在做的下一步方向,是跨代際的,想象空間非常大。但我們必須先有第一個基礎——把數據存好、提取好,才能做好用戶的特征向量,一步步來。
從陪伴、硬件到具身,做深物理AI
硅星人: Memory主要是To B的,你們的客戶是誰?
張源: 我們現在已經開始內測了。從產品層面來說,我們第一步對標是supabase,最大程度的降低大家使用記憶的門檻,第二步是在我們記憶底座能力足夠扎實的基礎上,期待順其自然生長出來主動智能的ToC的超級應用。這個定位決定了我們更關注技術指標和可集成性。
現在找過來的客戶,有一些做IP的,比如拿了北京動物園大熊貓萌蘭IP的;有一些做解決方案的供應商,專門給陪伴類做解決方案的;還有一些純軟件的陪伴產品。我們挑了一些物理距離上離我們近的做內測。
硅星人: 為什么先選陪伴類?
張源: 因為陪伴先商業化了,大家在商業化過程中越來越意識到缺乏記憶是很痛的痛點——相當于市場對于記憶需求的成熟度比較高。
硅星人: 除了陪伴類,還有什么行業呢?
張源: AI硬件、具身機器人,還有一些法律、金融這種垂類Agent也來找我們。因為我們不僅是多模態的,而且圖譜所有召回的記憶都是可審計的,有堅實證據,所以一些比較嚴肅嚴謹的行業也有需求。
硅星人: 不同行業對記憶的需求有什么差異?
張源: 面向女性用戶的伴侶產品會更需要高精度記憶,用戶更關注的是AI能夠記得習慣喜好,還有戀愛當中的一些小細節。
具身對記憶的需求非常剛性。比如Figure描述的那樣,具身機器人給你做家務,你的身份證或錢包放在茶幾上,它給你收拾起來放到某個抽屜里。過了一個多月你再用的時候,如果它只有視覺識別沒有Memory,它就忘了放哪了找不到了。
硅星人: 不同行業的客戶對你們的價值是怎樣的?我知道很多AI陪伴公司其實盈虧很難平衡,行業也不是很有錢,他們會介意成本嗎?
張源:我們按照客戶的付費能力和對隱私的敏感程度,把客戶分成了B+、B和B-。
B+是有很高付費能力的,公司有品牌,可能Day 1就全球收美國訂閱。他們對隱私要求非常高,也不在乎方案多花10萬、20萬。這種就是私有化部署加API,數據物理隔離。
B-是付費能力幾乎沒有,但路子很野,出貨量特別大。對這部分客戶,我們更側重通過脫敏的方式“聯合建模”,積累用戶的通用“Life Context”。
B類客戶可以case by case。所以從收費模式上,目前客戶的反饋都還挺好的。
硅星人: Life Context的數據積累,就是做潛空間記憶。
張源: 我們去打了一些benchmark榜單,刷新了SOTA,但我們覺得這個事別人花點時間也能刷上來,但潛空間記憶是我們最終想做的,一個真正的跨代際提升,這需要積累更多的人生上下文。
趙翔: 對,潛空間記憶需要把海量的交互行為壓縮為機器可讀的稠密向量。這些向量是去標識化的,不包含任何個人身份信息(PII),但包含了人類通用的行為邏輯——比如“當人類表達憤怒時,通常希望得到怎樣的安撫”。
就像抖音一樣,冷啟動的時候刷了一堆不喜歡的視頻,點了幾個贊之后系統捕捉到了行為模式,刷到的就全部都想看了。沒有足夠多的行為樣本,就訓練不出足夠懂人的潛空間模型。
張源:所以,商業化上,要么對接Agent,要么對接AI硬件,要么對接GPT wrapper,誰先落地我們就接誰。
硅星人: 記憶產品因企業而異、需求而異,要考慮效率、成本等多維度因素。你們現在對接客戶難嗎?
張源: 我們現在的狀態是——深圳那邊好多做陪伴的,華強北超級多。我們更希望做長期主義的事情,現在他們來找我們,我們先開放一個口做內測,測得好再簽。因為我們想做長期主義的事情,跟客戶長期交朋友,測試客戶找物理距離相對近的方便客戶隨時面對面的給我們提出建議。
硅星人: 你們自己的成本高嗎?
張源: 我們做過極限測試,用了1000萬的向量邊的約束,測了存儲極限,不考慮遺忘的情況下是1570天。如果考慮遺忘,就可以用極低成本做到終身記憶。所以我們成本不高。
先跑完milestone,再見投資人
硅星人: 你們未來想做成什么樣的公司?
張源: 從0到1是做記憶領域的Supabase,我們想做的事情是降低大家使用Memory的門檻,讓記憶成為大家在AI時代做任何AI應用的標配。通用、標準、更低門檻。
硅星人: 團隊是什么時候創立的,做了多久了?
張源: 從25年3月份開始攢這個事情,11月份注冊公司,12月份我們Benchmark刷新了SOTA,1月開始線上內測。
硅星人: 你們現在融資情況怎么樣?
張源: 融資肯定是需要的。12月上旬刷新SOTA之后,反饋非常好。前段時間中關村四杰預測26年什么事情比較熱,大家一致結論是要做好Memory的理解,可能才能拿到26年的第一張船票。種種因素把整個賽道熱度推起來了。
最近好多投資人、投資機構主動找過來,我們也非常感謝大家關注,目前正在積極推進。
硅星人: 在融資之前,你們是怎么運轉的?之前聊過投資人嗎?
張源: 在產品出來前,我們完全沒找,就是決定用自己的錢。
尤其我們作為創始團隊應該考慮:在極限條件約束下,你還想不想做這個事情?還有沒有信心做好?客觀上能不能做好?三個答案都是yes才能著手做。所以我們在創業第一天就說,在最早期、第一個milestone出來之前,必須花自己的錢養團隊、做支出。
硅星人: 你們會考慮開源嗎?
張源: 一方面是代差代際開源,另一方面是我們想做的事情是降低大家使用Memory的門檻。比如即使有一些友商開源之后,也只是一些有水平的開發者能用,并沒有實現Memory能力的平權。
我們想做的是讓記憶成為大家在AI時代做任何AI應用的標配,可能是自然語言調用,可能是一行代碼調用。所以我們非常看重開發者生態、開發者關系、開發者聲量。
畢竟每一次交互范式變革都會引發新一輪高增長,從諾基亞按鍵手機到iPhone是,從搜索到推薦是,我們相信從被動到主動也會是。這種變革能帶來巨大的創業機會。
而我們要做的是,成為 AI時代主動智能超級應用的基礎建設。
![]()
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.