![]()
數睿數據技術
該技術由數睿數據投遞并參與金猿組委會×數據猿×上海大數據聯盟共同推出的《2025大數據產業年度創新技術》榜單/獎項評選。
本公開的實施例公開了數據表關聯方法、裝置、電子設備和計算機可讀介質。該方法的一具體實施方式包括:響應于確定目標數據庫中存在觸發數據表重關聯條件的數據表,確定目標數據表集合中的每個目標數據表對應的數據表操作信息;對于目標數據表,響應于確定目標數據表對應的數據表操作記錄序列中存在操作類型為預設操作類型、且操作狀態為已執行狀態的數據表操作記錄,將目標數據表確定為過濾后數據表;確定過濾后數據表對應的數據表描述信息;確定針對過濾后數據表集合的歷史數據表關聯圖;對歷史數據表關聯圖進行關聯圖更新;對更新后數據表關聯圖對應的過濾后數據表進行數據表壓縮。該實施方式實現了自動數據表關聯,提高了數據表的關聯效率。
關鍵突破性技術說明
在傳統數據庫管理中,數據表之間的關聯關系(如外鍵、連接關系)通常需要人工預先設置和維護。當數據表的結構或關聯關系發生變動時(例如,新增字段、修改表結構、變更業務關系),數據庫管理員(DBA)或開發人員需要手動重新檢查并更新這些關聯關系,這一過程存在明顯問題:
效率低下:人工處理耗時耗力,尤其在表數量多、結構復雜或變動頻繁的系統中。
容易出錯:人工操作易遺漏或關聯錯誤,影響數據查詢的準確性和一致性。
資源浪費:未經優化的表結構中可能存在大量重復字段,導致存儲空間浪費和查詢性能下降。
該專利旨在通過“自動化、智能化的數據表關聯與壓縮”來解決上述問題。
專利提出一套全自動的數據表關聯管理流程,主要包括以下幾個步驟:
1.觸發與感知
監測目標數據庫,當檢測到觸發“數據表重關聯條件”(如表結構修改、關聯關系變更等操作)時,啟動自動化流程。
提取觸發時段內的數據表操作日志,解析出關鍵操作記錄。
2.智能過濾
基于操作日志,過濾出真正發生過預設修改類型(如表關聯關系修改、表結構修改)且已成功執行的表,作為“過濾后數據表集合”。避免了對所有表的無效掃描,節約計算資源。
3.雙態描述信息提取
為每個過濾后的數據表提取兩套描述信息:歷史數據表描述信息:重關聯條件觸發前的表狀態(字段、結構、關聯關系)。實時數據表描述信息:觸發后的最新表狀態。為后續的對比與更新提供依據。
4.構建與更新關聯圖
利用鄰接矩陣構建“歷史數據表關聯圖”,刻畫表之間已有的外鍵等關聯關系。根據最新的實時描述信息,動態更新該關聯圖,得到反映當前最新關聯狀態的“更新后數據表關聯圖”。
5.語義驅動的數據表壓縮
在關聯圖的基礎上,智能識別跨表的語義關聯字段(如不同表中的“客戶名稱”、“用戶名”可能指向同一實體)。
判斷字段的“原子性”(是否可拆分),并進行智能合并或關聯:
字段冗余消除:刪除同一表內可由原子字段組合而成的復合字段。
跨表關聯優化:若語義關聯的原子字段分布在多張表中,則自動創建表間關聯,并刪除冗余的復合字段,實現數據壓縮。
![]()
其技術亮點在于:
該專利通過“操作感知→智能過濾→雙態對比→圖關聯更新→語義壓縮”的閉環流程,實現了一種高度自動化、智能化的數據表關聯管理與優化方法。它不僅解決了人工維護關聯效率低、易出錯的核心痛點,還能主動優化數據結構、減少冗余,從而提升數據庫的存儲效率、查詢性能和數據一致性。
這項技術特別適用于:
大型企業級數據庫系統
微服務架構下的多數據庫治理
數據倉庫與數據湖的元數據管理
需要頻繁進行數據模型迭代的業務場景
專利技術應用產品/服務
目前,此技術方法已使用在數睿數據核心產品數據驅動的企業級AI原生開發平臺smardaten中,顯著提升了應用構建過程、數據分析場景中數據表關聯的效率,同時在解決方案產品數據通里,結合該技術進一步提升AI智能問數和取數分析,大大提升數據分析決策效率。300多家企業客戶基于本平臺進行數字化應用構建或軟件項目交付,如中移研究院、中廣核、奧克斯、衛健委等,已在工業制造、數字政務、能源電力等10多個行業場景實現數字化落地。
開發團隊
·帶隊負責人姓名:車文彬
大連理工大學博士,數睿數據AI科學家,從事人工智能與大數據分析挖掘相關領域研究數十年,先后在華為擔任數據科學家、在360擔任高級算法專家等職務。在數據安全相關領域專注同態加密、聯邦學習、數據水印等技術的研究,并發表專利10余項。負責smardaten中AI技術的研究與應用,涉及增強分析、自動化開發、無代碼GPT等應用場景。
團隊其他重要成員姓名:郭麗娜、易岸霖、陳逸帆、李鴻飛
·隸屬機構
數睿數據是領先的數智化軟件產品與服務提供商,全國9大代表處,新加坡設立子公司,員工規模近400人。以“讓天下數據快速使用”為使命、“讓人人盡享數據價值”為愿景,通過豐富的產品矩陣、領先的AI技術、完善的服務體系和創新應用場景,全面助力行業數智化轉型升級。
數睿數據打造的核心產品smardaten數據驅動的企業級AI原生開發平臺,以“AI原生+數據驅動”為核心,推動軟件工程與數據應用全鏈路革新。通過將多場景AI Agent貫穿一體化平臺,加速數字化應用構建、提高數據治理與應用決策效能,實現讓軟件快速定制、讓數據快速使用。已實現在智慧城市、工業制造、智慧政務、企業數字化、智慧能源等10多個行業領域的標桿應用打造。
公司已獲得包括CMMI5認證、國家高新技術企業、國家級專精特新“小巨人”企業、江蘇省軟件核心競爭力企業(創新型)等資質認證,參與低代碼應用開發國家標準編制,積累30多項技術專利和100余項軟件著作權。
相關評價
數睿數據憑借這個一站式的數據治理和數據一體這兩個最大的優點,成為我們的數據治理供應商,一階段的數據治理平臺,把業務的數據查詢率提升到了90%,因為數據錯誤導致的投訴減少大概70%。我們也會在26年將與數睿一起從三個方面深化數據驅動價值的目標,比如主動數據治理和AI智能問數,去助力奧克斯集團的一個數字化轉型。
——奧克斯集團數據管理體系負責人 黃總
全市40多家的醫療機構,以前構建一份醫療數據報告需要從各醫院調取、手動整理,耗時長達3周,現在基于專家庫模型、自動映射和智能分析,同樣的報告生成僅需一個多小時!數據使用效率比過去高了很多。
——某市衛健委信息中心主任
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.