<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      從“道生萬物”到“語言成圖”:一篇受道家啟發的 LGM 論文

      0
      分享至

      ——讀《LGM: Enhancing Large Language Models with Conceptual Meta-Relations and Iterative Retrieval》

      推薦論文:LGM: Enhancing Large Language Models with Conceptual Meta-Relations and Iterative Retrieval
      論文在arxiv中的文章編號為2511.03214
      代碼已經在Github上開源,可以在上面搜索language-graph-model
      團隊:Philisense(作者:雷文昌、鄒萍、王玥、孫峰、趙磊)

      在這篇蘭州理工大學碩士雷文昌主導的LGM論文把“大模型怎么讀懂世界”這件事,拉回到一個非常東方的出發點——道家哲學中那句耳熟能詳的話:

      “道生一,一生二,二生三,三生萬物。”

      在他的設計下,復雜的文本世界被抽象成“概念 + 元關系”的網絡:
      從“道生萬物”的哲學觀,走向“關系生知識”的工程方案,讓大模型不再只是在長文里“背”,而是沿著概念結構去“懂”。

      一、為什么傳統 RAG 碰到多跳推理就“失靈”?

      RAG(檢索增強生成)已經成了大模型落地的標配:
      切文檔、做向量、相似度檢索,再把一堆文本塞給大模型,讓它在“增強上下文”里作答。

      但當場景變復雜時,幾個典型問題會集中爆發:

      ?多跳推理難
      問題往往跨越多個段落、多個文檔,僅靠“相似度”很難一次撞中所有關鍵證據;

      ?概念層級復雜
      同一個概念有上位詞、別名、組成結構,傳統 RAG 并不真正理解它們,只是在做“詞面匹配”;

      ?超長文本昂貴
      企業知識庫動輒幾十萬字,單次上下文窗口無論多長都不夠“粗暴塞”。

      結果是:

      ?要么漏證據:回答看似正確,實則缺關鍵鏈條;

      ?要么費算力:無限拉長上下文,成本與時延都難以接受。

      LGM 的切入點很直接:
      與其繼續堆上下文,不如先承認“知識本身是結構化的”,把結構提取出來再讓大模型用。

      二、從道家哲學到“三類元關系”:道生萬物,關系生知識

      道家講“道生一,一生二,二生三,三生萬物”,
      LGM 則用三類元關系,構造出萬千知識之間的“骨架”。

      1. 繼承:從“一生二”到“種屬關系”

      繼承關系(Inheritance)描述的是“誰是誰的一種”:

      ?“蘋果是水果的一種”;

      ?“Llama 是大語言模型的一種”;

      ?“SUV 是汽車的一種”。

      在概念層級上,可以把“水果”的屬性(比如“富含維生素”)往下繼承到“蘋果”,
      讓模型明白:即便某個文本沒寫“蘋果富含維生素”,只要提到了“蘋果是水果”,也有足夠的間接證據。

      2. 組成:從“二生三”到“部分–整體”

      組成關系(Composition)描述的是“誰由誰組成”:

      ?“計算機由 CPU、內存、硬盤組成”;

      ?“企業組織由不同部門構成”;

      ?“產品由多個功能模塊組成”。

      復雜對象的能力與約束,可以拆解到組成部分上,再合并回來。
      這讓系統在追溯問題根因時,可以從整體一路追到局部。

      3. 別名:從“三生萬物”到“名稱的多樣性”

      別名關系(Alias)處理“同物異名”:

      ?“DNA / 脫氧核糖核酸”;

      ?“kg / 千克”;

      ?產品內部代號 vs 市場名稱。

      別名系統解決的是一個很現實的問題:
      用戶和文檔很少用同一種叫法。
      如果不能把這些名字統一成一個“概念節點”,檢索就永遠在“詞語表面”打轉。

      三、兩張圖:SRG + CRG,把自然語言“翻譯”成語言圖

      LGM 把文本世界翻譯成一張“語言圖”(Language Graph),由兩部分構成:語法關系圖 SRG概念關系圖 CRG


      圖1:從人類認知到語言圖的整體視角

      1. SRG:語法關系圖,保證“原句可追溯”

      SRG(Syntactic Relation Graph)負責保留文本的“語言形態”:

      ?節點:章節、段落、句子、詞元;

      ?邊:依存關系、段落隸屬、指代關系等;

      ?特點:

      –對代詞做了指代消解(把“它/他/他們”換回具體實體);

      –對句子做了詞形還原(便于不同形態統一檢索)。

      SRG 的作用,是讓系統在任何推理路徑最后,都能回到一條人類可讀的原句證據,支撐可解釋性。

      2. CRG:概念關系圖,承載“元關系結構”

      CRG(Concept Relation Graph)則是 LGM 的“概念骨架”:

      ?節點:詞形還原后的概念,如 apples → apple

      ?邊:繼承 / 組成 / 別名三類元關系;

      ?所有概念最終匯聚到一個抽象的根節點 “Thing”。


      圖2:語法關系圖(SRG)與概念關系圖(CRG)

      SRG 管“說了什么”,CRG 管“誰跟誰是什么關系”。
      兩張圖疊加,既能在概念層面擴展,又能在句子層面取證。

      四、兩大階段:從“學習語言圖”到“概念迭代檢索”

      LGM 的運行可以拆成兩大階段:

      1.Learning 階段:從文檔中自動構建 SRG 和 CRG;

      2.概念迭代檢索階段:圍繞用戶問題,在圖上展開檢索與推理。


      圖3:LGM 的整體工作流

      4.1 Learning:把長文檔“轉譯”為語言圖

      在 Learning 階段,系統會對文檔做一條完整的處理流水線:

      1.NLP 預處理

      –分句、分詞、依存句法分析、指代消解、詞形還原;

      –結果寫入 SRG,既保存原始語義,又方便后續檢索。

      2.元關系抽取

      –利用大模型和 Prompt 模板,從句子中抽取三類元關系:

      ?“A 是 B 的一種” → 繼承;

      ?“A 由 B 和 C 組成” → 組成;

      ?“A 又稱為 B” → 別名。

      3.Reflection 反思機制(過濾錯誤關系)

      –首先移除直接陳述該關系的句子;

      –僅憑“間接證據”,讓大模型判斷關系是否成立;

      –無效的關系被丟棄,“不確定”的暫時保留,等待更多證據。

      這一套設計,讓語言圖既能充分吸收知識,又不過度依賴單次抽取的“第一印象”。

      4.2 概念迭代檢索:從問題出發,在圖上“走幾步”

      真正回答問題時,LGM 采用的是概念迭代檢索(Concept Iterative Retrieval)


      圖4:概念迭代檢索流程

      整體思路可以簡化為幾步:

      1.從問題中抽取概念

      –抓出問題里的關鍵名詞、實體,作為起始概念。

      2.沿 CRG 擴展概念閉包

      –通過繼承、組成、別名關系找到相關的父類、子類、組成部分和別名;

      –得到一個圍繞問題的“概念閉包”。

      3.在 SRG 中檢索證據句

      –查找所有包含這些概念的句子,并記錄所在文檔和上下文位置。

      4.分塊并行抽取支持句

      –把證據句切成若干塊,每塊和問題一起交給大模型;

      –標記出“支持該問題答案”的關鍵句子。

      5.合并與壓縮

      –將支持句合并,如果過長則用大模型壓縮、摘要、去冗余。

      6.ROUGE 截斷(當長度仍超限)

      –用 ROUGE 相似度選出與問題最相關的證據子集,控制在上下文預算內。

      7.生成答案,如有缺口再“補一輪概念”

      –讓大模型在當前證據上生成答案;

      –如仍缺關鍵概念,就把這些概念送回 CRG 繼續擴展,再來一輪迭代檢索。

      這樣一來,無論知識庫有多大,真正進入上下文的永遠是一小撮“高度相關的概念 + 原句證據”

      五、實驗結果:在多跳問答上全面壓過多種 RAG 方案

      論文選取了兩個經典多跳問答數據集進行評測:

      ?HotpotQA:英文維基多跳問答;

      ?Musique:由多個單跳問題組合而成的復雜多跳數據集。

      并在兩種基礎大模型上,對比了多種主流 RAG 方案(GraphRAG、LightRAG、FastRAG、Dify 等)。

      5.1 F1 分數對比:LGM 穩居第一梯隊

      核心結果如下表(Table 3):



      可以看到:

      ?在 HotpotQAMusique上,LGM 的平均 F1 都排在首位;

      ?相比 GraphRAG 這類圖 + RAG 方案,LGM 通過更精細的元關系建模 + 概念迭代檢索取得了更穩的表現。

      5.2 對上下文窗口“不敏感”:真正走出了“長上下文依賴”

      論文還分析了當最大輸入上限從 120k 逐漸壓到 30k 時,LGM 性能的變化:
      F1 和 Recall 曲線整體非常平滑,沒有出現傳統 RAG 那種“窗口一縮,性能猛跌”的情況。


      圖5:不同上下文窗口大小對 LGM 性能的影響

      這說明:

      LGM 的效果主要來自語言圖結構和概念級檢索,而不是依賴超長上下文的“粗暴兜底”。

      六、典型應用場景:從企業檢索到合規審計

      從工程與產品視角看,LGM 天然適合這些場景:

      1. 企業知識問答與內部檢索

      ?別名、縮寫、歷史名字統一收斂到概念節點;

      ?組織架構、系統模塊以組成關系串聯;

      ?回答可以附上原句證據,便于內部核查與對外回復。

      2. 客服與工單定位

      ?用戶問題往往要跨文檔、多版本追溯;

      ?概念級檢索可以串聯起“問題 → 模塊 → 配置 → 變更記錄”;

      ?多跳追根溯源遠比關鍵詞檢索穩定可靠。

      3. 合規與審計

      ?涉及角色、權限、流程、條款等高度結構化概念;

      ?可以用概念圖梳理條款之間的關系與約束;

      ?自動回答時附上條款原句,為審計與追責提供依據。

      七、結語:從“道生萬物”到“關系生推理”

      如果只看工程實現,LGM 是一套“語言圖 + 概念檢索 + 迭代推理”的系統;
      但如果把視野拉高,會發現這篇工作背后有一條很清晰的思想線索:

      ?世界是結構化的
      不只是文本集合,更是概念與關系構成的網絡;

      ?語言可以成圖
      通過元關系,我們可以把“萬物”拉回到“道”式的抽象結構上;

      ?檢索也可以成“悟”
      不再只比相似度,而是沿著概念關系“走幾步”,找到真正的證據。

      在這條路上,LGM 給當下的大模型應用提供了一個頗具東方氣質的答案:
      用關系重構知識,用概念組織檢索,讓模型從“會背文檔”走向“會懂世界”。

      而這背后,既有大模型時代的工程思維,也有道家“以一貫萬”的哲學影子。
      從“道生一,一生二,二生三,三生萬物”,到“語言成圖,圖生推理”,
      這是一次從古老哲思通向前沿 AI 的有趣回響。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      被拐30年兒子認親14小時就走,全程冷臉,網友:窮家標簽太刺眼

      被拐30年兒子認親14小時就走,全程冷臉,網友:窮家標簽太刺眼

      老特有話說
      2025-12-06 17:31:27
      上海一大媽走后留700萬,銀行要求本人簽字才給,女兒做法太解氣

      上海一大媽走后留700萬,銀行要求本人簽字才給,女兒做法太解氣

      蘭姐說故事
      2025-03-19 15:00:05
      廣州,已倒閉餐廳最意難平top1…

      廣州,已倒閉餐廳最意難平top1…

      羊城攻略
      2025-12-18 18:37:03
      偉大的3-2!馬競鐵衛轉型主帥:將巴黎拖進點球大戰!1年奪5冠1亞

      偉大的3-2!馬競鐵衛轉型主帥:將巴黎拖進點球大戰!1年奪5冠1亞

      球場沒跑道
      2025-12-18 09:13:28
      “柬埔寨生命科學院”再被指發布虛假信息,南華大學附二院否認與其合作

      “柬埔寨生命科學院”再被指發布虛假信息,南華大學附二院否認與其合作

      澎湃新聞
      2025-12-17 13:14:26
      90分鐘鏖戰!中國隊生死戰以2-1擊敗日本隊,保留出線希望

      90分鐘鏖戰!中國隊生死戰以2-1擊敗日本隊,保留出線希望

      羅掌柜體育
      2025-12-18 13:33:15
      泰國重申停火必要條件, 柬埔寨暫無回應

      泰國重申停火必要條件, 柬埔寨暫無回應

      每日經濟新聞
      2025-12-17 23:00:35
      勞森兩雙納托爾27+6+6,阿不都17分齊麟5記三分,新疆力克北控

      勞森兩雙納托爾27+6+6,阿不都17分齊麟5記三分,新疆力克北控

      釘釘陌上花開
      2025-12-18 21:27:36
      美國施壓歐盟放棄用俄被凍資產援烏!澤連斯基:若不能及時獲得資金撥付,烏將大幅削減無人機生產

      美國施壓歐盟放棄用俄被凍資產援烏!澤連斯基:若不能及時獲得資金撥付,烏將大幅削減無人機生產

      每日經濟新聞
      2025-12-18 22:48:31
      不甩鍋、不欠薪!廣東35年老牌港資廠突然結業,員工哭著說感恩!

      不甩鍋、不欠薪!廣東35年老牌港資廠突然結業,員工哭著說感恩!

      搗蛋窩
      2025-12-18 17:43:12
      段永平:遺囑早就寫好了,我賺的錢是個麻煩,留給孩子會害了他們

      段永平:遺囑早就寫好了,我賺的錢是個麻煩,留給孩子會害了他們

      削桐作琴
      2025-12-18 18:29:56
      吳京認祖多爾袞?原諒我不厚道地笑了,這文化水平實在笑死個人啊

      吳京認祖多爾袞?原諒我不厚道地笑了,這文化水平實在笑死個人啊

      寒士之言本尊
      2025-12-18 12:10:25
      新疆一滑雪場雪崩,一名被埋人員已無生命體征

      新疆一滑雪場雪崩,一名被埋人員已無生命體征

      澎湃新聞
      2025-12-18 21:13:14
      特朗普向全國發表電視講話,指責拜登,自我表揚,支持率顯示民眾并不買賬

      特朗普向全國發表電視講話,指責拜登,自我表揚,支持率顯示民眾并不買賬

      極目新聞
      2025-12-18 15:14:48
      泰國軍方發言人:鏟平所有電詐園區

      泰國軍方發言人:鏟平所有電詐園區

      Ck的蜜糖
      2025-12-16 15:25:09
      1984年他一聲令下,把老山幾千噸炮彈當水潑,2019年葬禮現場,昔日部下已是軍委副主席,含淚送別這位鐵血師長!

      1984年他一聲令下,把老山幾千噸炮彈當水潑,2019年葬禮現場,昔日部下已是軍委副主席,含淚送別這位鐵血師長!

      史海孤雁
      2025-12-17 16:50:24
      李湘為女鋪路太過,帶16歲王詩齡,硬往何超瓊霍啟剛等大佬圈層擠

      李湘為女鋪路太過,帶16歲王詩齡,硬往何超瓊霍啟剛等大佬圈層擠

      洲洲影視娛評
      2025-12-17 16:32:09
      快到年底了,一大波軍工企業又要出來騙經費了

      快到年底了,一大波軍工企業又要出來騙經費了

      超級學爸蛋總
      2025-12-17 18:54:55
      被日企 “盜用”的中國軸承鋼,10倍天價困境下,終讓日本自食惡

      被日企 “盜用”的中國軸承鋼,10倍天價困境下,終讓日本自食惡

      青途歷史
      2025-12-17 18:53:13
      國民女神又出新片,太刺激了

      國民女神又出新片,太刺激了

      來看美劇
      2025-12-18 17:14:35
      2025-12-18 23:28:49
      歐聚聚科技互聯
      歐聚聚科技互聯
      一重山,兩重山。山遠天高煙水寒,相思楓葉丹。
      399文章數 175關注度
      往期回顧 全部

      教育要聞

      舌戰群雄的全省辯論冠軍!平均年齡才14歲,而且全部是新手

      頭條要聞

      在野黨參議員問了句日本"存亡危機" 高市早苗瞬間冷臉

      頭條要聞

      在野黨參議員問了句日本"存亡危機" 高市早苗瞬間冷臉

      體育要聞

      紐約尼克斯,板正的球隊

      娛樂要聞

      絲芭放大招了!實名舉報鞠婧祎經濟犯罪

      財經要聞

      尹艷林:呼吁加快2.5億新市民落戶進程

      科技要聞

      2025新一代人工智能創業大賽總決賽收官

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

      態度原創

      健康
      游戲
      時尚
      數碼
      本地

      這些新療法,讓化療不再那么痛苦

      德瑪西亞杯:痛苦終于結束了,TT零封ZSM!

      鞋子專場||穿了五年十年,掏心窩子說,最常穿的還是這一雙!

      數碼要聞

      豪威集團發布超低功耗單芯片全彩場序微顯示器賦能新一代智能眼鏡

      本地新聞

      云游安徽|決戰烽火照古今,千秋一脈看宿州

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产欧美日韩va另类在线播放| 性人久久久久| 蜜臀久久99精品久久久酒店新书| 长兴县| 久久精品高清一区二区三区| 久久亚洲色www成人欧美| 日韩在线视频观看免费网站| 91视频网站| 大丰市| 久久无码av中文出轨人妻| 91视频免费观看| 亚洲成av人片大线观看| 在线色综合| 使劲快高潮了国语对白在线| 国产98色在线 | 日韩| 亚洲国产精品久久久天堂麻豆宅男 | 国产成人精品av| 在线综合亚洲欧美网站| 老熟妇一区二区三区啪啪| 怀安县| 无码人妻视频一区二区三区| 国产成人免费一区二区三区| 色www88| 亚洲一卡二卡精久久| 无为县| 马山县| 午夜性福利| 色偷偷女人的天堂亚洲网| 国产人妻精品午夜福利免费 | 中国大陆高清aⅴ毛片| 国产系列丝袜熟女精品视频| jizz麻豆| 欧美色人妻| 亚洲丰满熟女一区二区v| 最近免费中文字幕大全| 色窝窝一区二区| 精品亚洲天堂| 亚洲综合无码一区二区三区不卡| 亚洲国产精品人人做人人爱| 亚洲国产精品VA在线看黑人| 伊人久久大香线蕉综合影院首页|