![]()
“像設(shè)計芯片一樣設(shè)計流計算。
初冬的黃浦江畔寒意料峭,但在“第八屆金猿大數(shù)據(jù)產(chǎn)業(yè)發(fā)展論壇”的現(xiàn)場,關(guān)于“AI Infra”的討論卻熱度驚人。這并非一場普通的行業(yè)聚會,在大數(shù)據(jù)國家戰(zhàn)略落地十周年的節(jié)點(diǎn)上,技術(shù)圈的焦慮與興奮并存:當(dāng)大模型狂飆突進(jìn)兩年之后,企業(yè)界赫然發(fā)現(xiàn),那個被寄予厚望的“Data Agent”,正被陳舊的數(shù)據(jù)基礎(chǔ)設(shè)施卡住了脖子。
“在數(shù)字孿生的世界里,你的最終用戶不一定是人,它可能是一個Agent。”
站在聚光燈下的程訓(xùn)燾語速極快,透著技術(shù)專家的干練。作為浙江智臾科技DolphinDB的首席架構(gòu)師,他在當(dāng)天的演講《實(shí)時決策時代:AI與低延時計算如何重塑數(shù)字孿生》中,拋出了一個讓在場眾多CIO(首席信息官)深思的命題:當(dāng)數(shù)據(jù)庫的“甲方”從秒級反應(yīng)的人類,變成了微秒級反應(yīng)的AI智能體,我們的基礎(chǔ)設(shè)施該如何重構(gòu)?
當(dāng)用戶不再是“人”
“過去十年,我們所有的軟件界面、查詢速度、交互邏輯,本質(zhì)上都是為人設(shè)計的。”程訓(xùn)燾在演講開篇便直擊痛點(diǎn)。
人類是感性的,也是遲緩的。在傳統(tǒng)的商業(yè)智能場景中,一個SQL查詢?nèi)绻茉?秒內(nèi)返回報表,分析師就會覺得“很快”。然而,這種“快”在AI Agent眼中,無異于慢動作回放。
程訓(xùn)燾打了個比方:“人不可能像機(jī)器一樣以微秒級的速度去對一個事件作出響應(yīng)。但是進(jìn)入了智能時代,Agent不知疲倦,它可能在短短一小時內(nèi),代表幾百萬個消費(fèi)者對你的廣告策略進(jìn)行了一輪又一輪的模擬反饋。在這個過程中,它對底層數(shù)據(jù)的吞吐量和延遲要求,是人類用戶的成千上萬倍。”
這種用戶主體的變更,正在倒逼底層架構(gòu)發(fā)生地質(zhì)層級的斷裂。
在程訓(xùn)燾看來,傳統(tǒng)的以“存儲+事后分析”為主的數(shù)據(jù)庫模式,已經(jīng)無法支撐Agent的需求。Agent需要的是“感知-決策-行動”的實(shí)時閉環(huán)。他描繪了一個典型的金融場景:在瞬息萬變的A股市場,當(dāng)某只股票的價格觸發(fā)了特定指標(biāo),人類交易員可能需要5秒鐘來反應(yīng)、確認(rèn)、下單,而這5秒鐘,“市場已經(jīng)變了”。但對于一個裝備了高性能計算底座的Agent來說,從捕捉信號到完成風(fēng)控計算再到發(fā)出指令,只需要“幾微秒”。
“這不僅僅是速度的提升,這是維度的跨越。”程訓(xùn)燾強(qiáng)調(diào),“當(dāng)計算延時被壓縮到微秒級,量變就引發(fā)了質(zhì)變。我們不再是看著后視鏡開車,而是讓AI坐在駕駛位上,實(shí)時規(guī)避路面上的每一顆石子。”
為了應(yīng)對這種變革,DolphinDB在2025年密集推出了被稱為“深海艦隊”的新產(chǎn)品矩陣,包括CPU-GPU異構(gòu)計算平臺Shark、極速嵌入式引擎Swordfish以及企業(yè)級流計算平臺Orca。這些產(chǎn)品的命名本身就帶有強(qiáng)烈的攻擊性與速度感,似乎在暗示DolphinDB正如海豚一般,在數(shù)據(jù)的深海中構(gòu)建起敏捷而龐大的生態(tài)系統(tǒng)。
超越物理的“邏輯孿生”
演講過程中,程訓(xùn)燾對當(dāng)下火熱的“數(shù)字孿生”概念進(jìn)行了祛魅與重構(gòu)。
“以前大家談數(shù)字孿生,想到的就是GIS或者BIM。我們要把物理世界1:1地復(fù)刻進(jìn)電腦里,每一根水管、每一面墻都要對得上。”程訓(xùn)燾認(rèn)為,這種基于物理復(fù)刻的孿生雖然在無人機(jī)導(dǎo)航、城市規(guī)劃中價值巨大,但它有一個致命弱點(diǎn),“你在這個模型里跑一次仿真,可能需要幾個小時。”
DolphinDB眼中的新一代數(shù)字孿生,是“邏輯孿生”。
“數(shù)字世界沒有必要跟物理世界長得一模一樣,”程訓(xùn)燾指出,“它不需要遵守物理定律,它只需要遵守業(yè)務(wù)邏輯。”
他舉了電商的例子,企業(yè)不需要在數(shù)字世界里復(fù)刻商場的物理貨架,而是需要復(fù)刻幾百萬消費(fèi)者的購買行為邏輯。當(dāng)企業(yè)向市場推出新化妝品時,Agent可以模擬海量用戶的點(diǎn)擊、瀏覽、下單行為。這種仿真不依賴物理空間的坐標(biāo),而是依賴海量事件流的實(shí)時計算。
“這才是流計算真正的戰(zhàn)場。”程訓(xùn)燾表示,無論是工業(yè)物聯(lián)網(wǎng)中對發(fā)電機(jī)組震動的實(shí)時監(jiān)控,還是金融市場中對千只股票的毫秒級盯盤,本質(zhì)上都是在對“邏輯世界”進(jìn)行實(shí)時推演。
然而,要支撐這種“邏輯孿生”,現(xiàn)有的技術(shù)棧顯得捉襟見肘。傳統(tǒng)的SQL數(shù)據(jù)庫只能處理靜態(tài)的關(guān)系數(shù)據(jù),無法表達(dá)復(fù)雜的流式邏輯;而專業(yè)的流計算框架對于普通業(yè)務(wù)開發(fā)者來說,門檻又太高。
“你很難想象一個業(yè)務(wù)專家去手寫幾千行代碼來管理流計算的狀態(tài)水位線,”程訓(xùn)燾搖了搖頭,“這就像讓建筑師去親手燒磚一樣荒謬。”
![]()
像設(shè)計芯片一樣設(shè)計流計算
如何解決“好用”與“高性能”的矛盾?程訓(xùn)燾給出的答案是聲明式流計算。
“以前設(shè)計芯片,工程師不可能手動去擺放每一個加法器和乘法器,也不可能手動布線,因為約束條件太多,人腦處理不過來。EDA軟件解決了這個問題,它讓工程師只關(guān)注邏輯,軟件自動完成布局布線。”
程訓(xùn)燾透露,DolphinDB正在做的事情,就是構(gòu)建流計算領(lǐng)域的“EDA”。
“我們希望用戶只需要聲明他的意圖:‘我要監(jiān)控這1000個傳感器,如果過去5分鐘的平均溫度超過標(biāo)準(zhǔn)值的20%,就給我報警’。至于這個數(shù)據(jù)流怎么拆分、中間狀態(tài)怎么存儲、是在內(nèi)存里算還是落盤算,用戶不需要關(guān)心。”程訓(xùn)燾解釋道,“系統(tǒng)會自動推導(dǎo)依賴關(guān)系,自動生成底層的計算圖,自動部署分布式引擎。”
這種“聲明式”的變革,不僅解放了人類開發(fā)者,更重要的是,它對AI Agent極度友好。
“讓Agent去寫復(fù)雜的C++代碼是不現(xiàn)實(shí)的,但讓Agent用自然語言描述一個業(yè)務(wù)規(guī)則,然后轉(zhuǎn)化為聲明式的腳本,這是目前大模型最擅長的事情。”程訓(xùn)燾興奮地表示。
在DolphinDB的架構(gòu)圖中,存在著獨(dú)特的“流數(shù)據(jù)表”設(shè)計。程訓(xùn)燾將其比作“河流上的碼頭”。數(shù)據(jù)像河流一樣奔涌而下,流數(shù)據(jù)表就是沿途的碼頭。數(shù)據(jù)可以在碼頭暫存、清洗,或者直接流向下個碼頭。用戶可以根據(jù)業(yè)務(wù)拓?fù)洌杂啥x這些“碼頭”的功能,是作為短期記憶的緩存,還是作為長期記憶的倉庫。
誰為Agent提供“海馬體”?
隨著演講的深入,話題不可避免地觸及了AI落地的深水區(qū),記憶與隱私。
在程訓(xùn)燾提出的“智能化底座三層架構(gòu)”中,“認(rèn)知記憶管理”被擺在核心位置。他認(rèn)為,當(dāng)前的大模型雖然智商很高,但普遍患有“健忘癥”,上下文窗口有限,且難以利用企業(yè)私有的行業(yè)知識。
“如果把大模型比作大腦的皮層,那DolphinDB正在試圖成為它的海馬體(負(fù)責(zé)記憶)和神經(jīng)末梢(負(fù)責(zé)感知)。”
程訓(xùn)燾詳細(xì)拆解了這個“認(rèn)知記憶系統(tǒng)”:最前端是感知層,處理傳感器和市場的原始流數(shù)據(jù),這需要極高的寫入吞吐量;中間是短期記憶層,為Agent提供當(dāng)下的工作上下文。“這部分?jǐn)?shù)據(jù)必須駐留在內(nèi)存中,哪怕DRAM價格再貴,為了微秒級的響應(yīng),這個成本是必須付出的。”
后端是長期記憶層,存儲企業(yè)沉淀下來的規(guī)則、預(yù)案和歷史數(shù)據(jù)。“比如電網(wǎng)公司在臺風(fēng)天氣的應(yīng)急預(yù)案,或者資深醫(yī)生的診療路徑。這些數(shù)據(jù)是企業(yè)的核心資產(chǎn),絕不能上傳到公有云去訓(xùn)練大模型。”
為了打通這三層記憶,DolphinDB研發(fā)了跨模態(tài)聯(lián)合索引技術(shù)。以醫(yī)療場景為例,一個病人在醫(yī)院的活動,會產(chǎn)生血液檢測的浮點(diǎn)數(shù)、CT掃描的圖像數(shù)據(jù)、醫(yī)生診斷的文本數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)庫是將這些數(shù)據(jù)割裂存儲的,浮點(diǎn)數(shù)存時序庫,圖像存文件系統(tǒng),文本存搜索引摯。
“但這在邏輯上是同一個病人。”程訓(xùn)燾強(qiáng)調(diào),“我們的底座必須有能力打破這些數(shù)據(jù)的‘次元壁’,將不同模態(tài)的數(shù)據(jù)關(guān)聯(lián)到同一個自然實(shí)體上。只有這樣,Agent才能像一個經(jīng)驗豐富的主任醫(yī)師一樣,綜合所有信息做出精準(zhǔn)判斷。”
![]()
突圍:從金融腹地到工業(yè)藍(lán)海
作為技術(shù)驅(qū)動型公司,智臾科技的發(fā)展路徑帶有鮮明的“硬科技”色彩。
自2016年成立以來,DolphinDB選了全棧自研這條最艱難的道路。在那個開源數(shù)據(jù)庫大行其道的年代,他們堅持不基于任何開源項目二次開發(fā),從底層存儲引擎到計算引擎一行行代碼寫起。官方數(shù)據(jù)顯示,其核心代碼自研率超過95%。
這種“笨功夫”在初期不僅研發(fā)周期長,還面臨著商業(yè)化的巨大壓力。但程訓(xùn)燾堅信,只有掌握底層代碼,才能在性能優(yōu)化上做到極致。
事實(shí)證明,這條路走通了。DolphinDB首先攻下的,是對性能要求最苛刻的量化金融領(lǐng)域。國泰海通證券、華泰證券、華夏基金等頭部機(jī)構(gòu)紛紛成為其客戶。在金融這個“練兵場”里,DolphinDB經(jīng)過了高并發(fā)、低延遲的極限壓測,練就一身“金鐘罩”。
“如果你能處理好每秒百萬筆的股票交易數(shù)據(jù),那你去處理工廠里的傳感器數(shù)據(jù),就是降維打擊。”
隨著工業(yè)4.0的推進(jìn),DolphinDB正在快速將金融級的能力復(fù)制到工業(yè)物聯(lián)網(wǎng)領(lǐng)域。長江電力的發(fā)電機(jī)組監(jiān)測、比亞迪的智能制造、甚至新能源車的電池?zé)崾Э仡A(yù)警,都開始出現(xiàn)DolphinDB的身影。在DB-Engines的全球排名中,DolphinDB已穩(wěn)居國產(chǎn)時序數(shù)據(jù)庫第一名,并在全球榜單中躋身前列。
資本市場也敏銳地嗅到這股技術(shù)紅利。雖然程訓(xùn)燾在采訪中對融資細(xì)節(jié)保持低調(diào),但公開資料顯示,智臾科技已完成了由方廣資本領(lǐng)投的億元級B輪融資,投資方名單中不乏朗瑪峰創(chuàng)投等硬科技推手。
![]()
演講臨近結(jié)束時,程訓(xùn)燾談到了對未來的展望。
他坦言,數(shù)據(jù)主權(quán)與技術(shù)共享之間存在著天然的張力。企業(yè)既想利用最先進(jìn)的AI能力,又恐懼核心數(shù)據(jù)資產(chǎn)的流失。對此,他提出了“開源數(shù)據(jù)標(biāo)準(zhǔn)+商業(yè)化計算引擎”的解題思路。
“數(shù)據(jù)的格式應(yīng)該是開源的,比如Parquet、Arrow,這樣用戶的數(shù)據(jù)不會被鎖定。但處理數(shù)據(jù)的引擎,應(yīng)該是商業(yè)化的、私有的。”程訓(xùn)燾總結(jié)道,“就像電網(wǎng)是通用的,但你家里的電器可以是高端定制的。企業(yè)可以用DolphinDB這樣的商業(yè)引擎在本地安全地處理標(biāo)準(zhǔn)數(shù)據(jù),既享受了極致性能,又守住了數(shù)據(jù)安全。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.