DolphinDB：實(shí)時決策時代——AI與低延時計算如何重塑數(shù)字孿生

2026-01-22 12:05:10　來源: 數(shù)據(jù)猿DataYuan

內(nèi)蒙古舉報

分享至

“像設(shè)計芯片一樣設(shè)計流計算。

初冬的黃浦江畔寒意料峭，但在“第八屆金猿大數(shù)據(jù)產(chǎn)業(yè)發(fā)展論壇”的現(xiàn)場，關(guān)于“AI Infra”的討論卻熱度驚人。這并非一場普通的行業(yè)聚會，在大數(shù)據(jù)國家戰(zhàn)略落地十周年的節(jié)點(diǎn)上，技術(shù)圈的焦慮與興奮并存：當(dāng)大模型狂飆突進(jìn)兩年之后，企業(yè)界赫然發(fā)現(xiàn)，那個被寄予厚望的“Data Agent”，正被陳舊的數(shù)據(jù)基礎(chǔ)設(shè)施卡住了脖子。

“在數(shù)字孿生的世界里，你的最終用戶不一定是人，它可能是一個Agent。”

站在聚光燈下的程訓(xùn)燾語速極快，透著技術(shù)專家的干練。作為浙江智臾科技DolphinDB的首席架構(gòu)師，他在當(dāng)天的演講《實(shí)時決策時代：AI與低延時計算如何重塑數(shù)字孿生》中，拋出了一個讓在場眾多CIO（首席信息官）深思的命題：當(dāng)數(shù)據(jù)庫的“甲方”從秒級反應(yīng)的人類，變成了微秒級反應(yīng)的AI智能體，我們的基礎(chǔ)設(shè)施該如何重構(gòu)？

當(dāng)用戶不再是“人”

“過去十年，我們所有的軟件界面、查詢速度、交互邏輯，本質(zhì)上都是為人設(shè)計的。”程訓(xùn)燾在演講開篇便直擊痛點(diǎn)。

人類是感性的，也是遲緩的。在傳統(tǒng)的商業(yè)智能場景中，一個SQL查詢?nèi)绻茉?秒內(nèi)返回報表，分析師就會覺得“很快”。然而，這種“快”在AI Agent眼中，無異于慢動作回放。

程訓(xùn)燾打了個比方：“人不可能像機(jī)器一樣以微秒級的速度去對一個事件作出響應(yīng)。但是進(jìn)入了智能時代，Agent不知疲倦，它可能在短短一小時內(nèi)，代表幾百萬個消費(fèi)者對你的廣告策略進(jìn)行了一輪又一輪的模擬反饋。在這個過程中，它對底層數(shù)據(jù)的吞吐量和延遲要求，是人類用戶的成千上萬倍。”

這種用戶主體的變更，正在倒逼底層架構(gòu)發(fā)生地質(zhì)層級的斷裂。

在程訓(xùn)燾看來，傳統(tǒng)的以“存儲+事后分析”為主的數(shù)據(jù)庫模式，已經(jīng)無法支撐Agent的需求。Agent需要的是“感知-決策-行動”的實(shí)時閉環(huán)。他描繪了一個典型的金融場景：在瞬息萬變的A股市場，當(dāng)某只股票的價格觸發(fā)了特定指標(biāo)，人類交易員可能需要5秒鐘來反應(yīng)、確認(rèn)、下單，而這5秒鐘，“市場已經(jīng)變了”。但對于一個裝備了高性能計算底座的Agent來說，從捕捉信號到完成風(fēng)控計算再到發(fā)出指令，只需要“幾微秒”。

“這不僅僅是速度的提升，這是維度的跨越。”程訓(xùn)燾強(qiáng)調(diào)，“當(dāng)計算延時被壓縮到微秒級，量變就引發(fā)了質(zhì)變。我們不再是看著后視鏡開車，而是讓AI坐在駕駛位上，實(shí)時規(guī)避路面上的每一顆石子。”

為了應(yīng)對這種變革，DolphinDB在2025年密集推出了被稱為“深海艦隊”的新產(chǎn)品矩陣，包括CPU-GPU異構(gòu)計算平臺Shark、極速嵌入式引擎Swordfish以及企業(yè)級流計算平臺Orca。這些產(chǎn)品的命名本身就帶有強(qiáng)烈的攻擊性與速度感，似乎在暗示DolphinDB正如海豚一般，在數(shù)據(jù)的深海中構(gòu)建起敏捷而龐大的生態(tài)系統(tǒng)。

超越物理的“邏輯孿生”

演講過程中，程訓(xùn)燾對當(dāng)下火熱的“數(shù)字孿生”概念進(jìn)行了祛魅與重構(gòu)。

“以前大家談數(shù)字孿生，想到的就是GIS或者BIM。我們要把物理世界1:1地復(fù)刻進(jìn)電腦里，每一根水管、每一面墻都要對得上。”程訓(xùn)燾認(rèn)為，這種基于物理復(fù)刻的孿生雖然在無人機(jī)導(dǎo)航、城市規(guī)劃中價值巨大，但它有一個致命弱點(diǎn)，“你在這個模型里跑一次仿真，可能需要幾個小時。”

DolphinDB眼中的新一代數(shù)字孿生，是“邏輯孿生”。

“數(shù)字世界沒有必要跟物理世界長得一模一樣，”程訓(xùn)燾指出，“它不需要遵守物理定律，它只需要遵守業(yè)務(wù)邏輯。”

他舉了電商的例子，企業(yè)不需要在數(shù)字世界里復(fù)刻商場的物理貨架，而是需要復(fù)刻幾百萬消費(fèi)者的購買行為邏輯。當(dāng)企業(yè)向市場推出新化妝品時，Agent可以模擬海量用戶的點(diǎn)擊、瀏覽、下單行為。這種仿真不依賴物理空間的坐標(biāo)，而是依賴海量事件流的實(shí)時計算。

“這才是流計算真正的戰(zhàn)場。”程訓(xùn)燾表示，無論是工業(yè)物聯(lián)網(wǎng)中對發(fā)電機(jī)組震動的實(shí)時監(jiān)控，還是金融市場中對千只股票的毫秒級盯盤，本質(zhì)上都是在對“邏輯世界”進(jìn)行實(shí)時推演。

然而，要支撐這種“邏輯孿生”，現(xiàn)有的技術(shù)棧顯得捉襟見肘。傳統(tǒng)的SQL數(shù)據(jù)庫只能處理靜態(tài)的關(guān)系數(shù)據(jù)，無法表達(dá)復(fù)雜的流式邏輯；而專業(yè)的流計算框架對于普通業(yè)務(wù)開發(fā)者來說，門檻又太高。

“你很難想象一個業(yè)務(wù)專家去手寫幾千行代碼來管理流計算的狀態(tài)水位線，”程訓(xùn)燾搖了搖頭，“這就像讓建筑師去親手燒磚一樣荒謬。”

像設(shè)計芯片一樣設(shè)計流計算

如何解決“好用”與“高性能”的矛盾？程訓(xùn)燾給出的答案是聲明式流計算。

“以前設(shè)計芯片，工程師不可能手動去擺放每一個加法器和乘法器，也不可能手動布線，因為約束條件太多，人腦處理不過來。EDA軟件解決了這個問題，它讓工程師只關(guān)注邏輯，軟件自動完成布局布線。”

程訓(xùn)燾透露，DolphinDB正在做的事情，就是構(gòu)建流計算領(lǐng)域的“EDA”。

“我們希望用戶只需要聲明他的意圖：‘我要監(jiān)控這1000個傳感器，如果過去5分鐘的平均溫度超過標(biāo)準(zhǔn)值的20%，就給我報警’。至于這個數(shù)據(jù)流怎么拆分、中間狀態(tài)怎么存儲、是在內(nèi)存里算還是落盤算，用戶不需要關(guān)心。”程訓(xùn)燾解釋道，“系統(tǒng)會自動推導(dǎo)依賴關(guān)系，自動生成底層的計算圖，自動部署分布式引擎。”

這種“聲明式”的變革，不僅解放了人類開發(fā)者，更重要的是，它對AI Agent極度友好。

“讓Agent去寫復(fù)雜的C++代碼是不現(xiàn)實(shí)的，但讓Agent用自然語言描述一個業(yè)務(wù)規(guī)則，然后轉(zhuǎn)化為聲明式的腳本，這是目前大模型最擅長的事情。”程訓(xùn)燾興奮地表示。

在DolphinDB的架構(gòu)圖中，存在著獨(dú)特的“流數(shù)據(jù)表”設(shè)計。程訓(xùn)燾將其比作“河流上的碼頭”。數(shù)據(jù)像河流一樣奔涌而下，流數(shù)據(jù)表就是沿途的碼頭。數(shù)據(jù)可以在碼頭暫存、清洗，或者直接流向下個碼頭。用戶可以根據(jù)業(yè)務(wù)拓?fù)洌杂啥x這些“碼頭”的功能，是作為短期記憶的緩存，還是作為長期記憶的倉庫。

誰為Agent提供“海馬體”？

隨著演講的深入，話題不可避免地觸及了AI落地的深水區(qū)，記憶與隱私。

在程訓(xùn)燾提出的“智能化底座三層架構(gòu)”中，“認(rèn)知記憶管理”被擺在核心位置。他認(rèn)為，當(dāng)前的大模型雖然智商很高，但普遍患有“健忘癥”，上下文窗口有限，且難以利用企業(yè)私有的行業(yè)知識。

“如果把大模型比作大腦的皮層，那DolphinDB正在試圖成為它的海馬體（負(fù)責(zé)記憶）和神經(jīng)末梢（負(fù)責(zé)感知）。”

程訓(xùn)燾詳細(xì)拆解了這個“認(rèn)知記憶系統(tǒng)”：最前端是感知層，處理傳感器和市場的原始流數(shù)據(jù)，這需要極高的寫入吞吐量；中間是短期記憶層，為Agent提供當(dāng)下的工作上下文。“這部分?jǐn)?shù)據(jù)必須駐留在內(nèi)存中，哪怕DRAM價格再貴，為了微秒級的響應(yīng)，這個成本是必須付出的。”

后端是長期記憶層，存儲企業(yè)沉淀下來的規(guī)則、預(yù)案和歷史數(shù)據(jù)。“比如電網(wǎng)公司在臺風(fēng)天氣的應(yīng)急預(yù)案，或者資深醫(yī)生的診療路徑。這些數(shù)據(jù)是企業(yè)的核心資產(chǎn)，絕不能上傳到公有云去訓(xùn)練大模型。”

為了打通這三層記憶，DolphinDB研發(fā)了跨模態(tài)聯(lián)合索引技術(shù)。以醫(yī)療場景為例，一個病人在醫(yī)院的活動，會產(chǎn)生血液檢測的浮點(diǎn)數(shù)、CT掃描的圖像數(shù)據(jù)、醫(yī)生診斷的文本數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)庫是將這些數(shù)據(jù)割裂存儲的，浮點(diǎn)數(shù)存時序庫，圖像存文件系統(tǒng)，文本存搜索引摯。

“但這在邏輯上是同一個病人。”程訓(xùn)燾強(qiáng)調(diào)，“我們的底座必須有能力打破這些數(shù)據(jù)的‘次元壁’，將不同模態(tài)的數(shù)據(jù)關(guān)聯(lián)到同一個自然實(shí)體上。只有這樣，Agent才能像一個經(jīng)驗豐富的主任醫(yī)師一樣，綜合所有信息做出精準(zhǔn)判斷。”

突圍：從金融腹地到工業(yè)藍(lán)海

作為技術(shù)驅(qū)動型公司，智臾科技的發(fā)展路徑帶有鮮明的“硬科技”色彩。

自2016年成立以來，DolphinDB選了全棧自研這條最艱難的道路。在那個開源數(shù)據(jù)庫大行其道的年代，他們堅持不基于任何開源項目二次開發(fā)，從底層存儲引擎到計算引擎一行行代碼寫起。官方數(shù)據(jù)顯示，其核心代碼自研率超過95%。

這種“笨功夫”在初期不僅研發(fā)周期長，還面臨著商業(yè)化的巨大壓力。但程訓(xùn)燾堅信，只有掌握底層代碼，才能在性能優(yōu)化上做到極致。

事實(shí)證明，這條路走通了。DolphinDB首先攻下的，是對性能要求最苛刻的量化金融領(lǐng)域。國泰海通證券、華泰證券、華夏基金等頭部機(jī)構(gòu)紛紛成為其客戶。在金融這個“練兵場”里，DolphinDB經(jīng)過了高并發(fā)、低延遲的極限壓測，練就一身“金鐘罩”。

“如果你能處理好每秒百萬筆的股票交易數(shù)據(jù)，那你去處理工廠里的傳感器數(shù)據(jù)，就是降維打擊。”

隨著工業(yè)4.0的推進(jìn)，DolphinDB正在快速將金融級的能力復(fù)制到工業(yè)物聯(lián)網(wǎng)領(lǐng)域。長江電力的發(fā)電機(jī)組監(jiān)測、比亞迪的智能制造、甚至新能源車的電池?zé)崾Э仡A(yù)警，都開始出現(xiàn)DolphinDB的身影。在DB-Engines的全球排名中，DolphinDB已穩(wěn)居國產(chǎn)時序數(shù)據(jù)庫第一名，并在全球榜單中躋身前列。

資本市場也敏銳地嗅到這股技術(shù)紅利。雖然程訓(xùn)燾在采訪中對融資細(xì)節(jié)保持低調(diào)，但公開資料顯示，智臾科技已完成了由方廣資本領(lǐng)投的億元級B輪融資，投資方名單中不乏朗瑪峰創(chuàng)投等硬科技推手。

演講臨近結(jié)束時，程訓(xùn)燾談到了對未來的展望。

他坦言，數(shù)據(jù)主權(quán)與技術(shù)共享之間存在著天然的張力。企業(yè)既想利用最先進(jìn)的AI能力，又恐懼核心數(shù)據(jù)資產(chǎn)的流失。對此，他提出了“開源數(shù)據(jù)標(biāo)準(zhǔn)+商業(yè)化計算引擎”的解題思路。

“數(shù)據(jù)的格式應(yīng)該是開源的，比如Parquet、Arrow，這樣用戶的數(shù)據(jù)不會被鎖定。但處理數(shù)據(jù)的引擎，應(yīng)該是商業(yè)化的、私有的。”程訓(xùn)燾總結(jié)道，“就像電網(wǎng)是通用的，但你家里的電器可以是高端定制的。企業(yè)可以用DolphinDB這樣的商業(yè)引擎在本地安全地處理標(biāo)準(zhǔn)數(shù)據(jù)，既享受了極致性能，又守住了數(shù)據(jù)安全。”

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.