<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      句子級溯源+生成式歸因,C2-Cite重塑大模型可信度

      0
      分享至



      在人工智能快速發(fā)展的今天,大語言模型已經(jīng)深入到我們工作和生活的方方面面。然而,如何讓AI生成的內(nèi)容更加可信、可追溯,一直是學術界和工業(yè)界關注的焦點問題。想象一下,當你向ChatGPT提問時,它不僅給出答案,還能像學術論文一樣標注每句話的信息來源——這就是"溯源大語言模型"要解決的核心問題。

      北郵百家AI團隊聯(lián)合小米大模型團隊提出的溯源大模型C2-Cite,首創(chuàng)上下文感知的歸因生成技術,不僅能讓大模型在生成內(nèi)容時自動標注精準的信息來源,更能確保生成內(nèi)容與引用的外部知識高度語義對齊,實現(xiàn)每一處表述都有溯源依據(jù)、與參考來源深度協(xié)同,從根本上解決大模型生成內(nèi)容的可信度問題。該工作已被國際頂級會議WSDM 2026收錄。C2-Cite針對現(xiàn)有歸因模型存在的關鍵缺陷,通過引入"上下文感知"機制,讓引用標記從被動的占位符轉(zhuǎn)變?yōu)閹в猩舷挛恼Z義的特殊令牌,顯著提升了引用質(zhì)量和模型回答準確性。



      • 論文標題:

      C2-Cite:Contextual-Aware Citation Generation for Attributed Large Language Models

      • 論文鏈接:

      https://github.com/BAI-LAB/c2cite/blob/main/paper_wsdm_c2cite.pdf

      • 代碼倉庫:

      https://github.com/BAI-LAB/c2cite

      引言

      在信息爆炸的時代,大語言模型雖然能夠生成流暢的文本,但"幻覺"問題(即生成虛假或不準確的內(nèi)容)始終困擾著研究者。為了增強模型輸出的可信度,研究人員提出了歸因技術——在生成內(nèi)容中添加明確的引用標記(如[1]、[2]),將每句話鏈接到具體的信息源。然而現(xiàn)有歸因模型存在顯著缺陷:

      1.技術路徑存在固有局限:上下文學習歸因(P-ICL/I-ICL)依賴提示工程或迭代檢索,耗時且泛化性弱;指令微調(diào)歸因過度依賴高質(zhì)量訓練數(shù)據(jù),缺乏對引用上下文的主動關聯(lián),大大削弱大模型的溯源能力;事后歸因(Post-Hoc)采用兩階段處理,難以精確到句子級別,缺乏內(nèi)在歸因能力。

      2.引用標記淪為“通用占位符”:現(xiàn)有模型未賦予引用標記(如 [i])上下文語義,僅將其視為無意義符號,導致引用與所指內(nèi)容脫節(jié)、知識整合效果差;

      3.引用質(zhì)量與回答準確性失衡:部分模型雖能提升引用精準度,但會破壞回答的語義連貫性和正確性;另一部分模型則因引用混亂,難以支撐回答可信度;

      這些問題導致現(xiàn)有模型要么引用錯誤/ 虛構、溯源失效,要么回答邏輯斷裂、準確性下滑,難以同時滿足 “引用可信” 與 “回答有效” 的核心需求。

      C2-Cite溯源機制

      為解決上述缺陷,北郵百家AI團隊聯(lián)合小米提出上下文感知的溯源大模型框架(C2-Cite),核心思路是通過“上下文語義融入” 讓引用標記從被動占位符轉(zhuǎn)變?yōu)閹в忻鞔_語義指向的主動知識指針,具體包含三大關鍵組件:

      1.上下文感知嵌入機制(Contextual-Aware Embedding):將多令牌引用標記(如“[i]”)標準化為單一引用符號令牌(如“?>”),并通過均值池化計算對應檢索文檔的語義嵌入,替換傳統(tǒng)無意義占位符嵌入,使引用標記攜帶所指文檔的語義信息;

      2.上下文引用對齊機制Contextual Citation Alignment:引入引用路由器(二進制分類器)區(qū)分默認令牌與引用令牌,分別優(yōu)化兩類令牌的損失函數(shù)—— 默認令牌采用交叉熵損失保證回答流暢性,引用令牌通過語義相似度匹配實現(xiàn)與檢索文檔的精準對齊;

      3.上下文注意力增強機制:通過距離衰減系數(shù)和注意力約束,放大后續(xù)生成令牌對先前引用令牌的關注度,維持引用與內(nèi)容的語義連貫性,避免因引用插入導致回答邏輯斷裂。

      模型最終損失函數(shù)為默認損失、引用對齊損失、路由器損失與注意力增強損失的加權和,確保引用質(zhì)量與回答準確性的協(xié)同優(yōu)化。



      實驗

      研究團隊在ALCE基準測試的三個數(shù)據(jù)集(ASQA、ELI5、QAMPARI)上進行了全面評估,對比了多種主流歸因方法

      3.1 主實驗結果



      實驗結果令人振奮:

      • 引用質(zhì)量大幅提升:C2-Cite++在引用F1分數(shù)上平均提升5.8%
      • 回答準確性顯著增強:在回答正確性指標上平均提升17.4%
      • 泛化能力強:在不同質(zhì)量的訓練數(shù)據(jù)(SynSciQA 系列)上均表現(xiàn)穩(wěn)定,即使使用普通訓練數(shù)據(jù)也能超越依賴高質(zhì)量數(shù)據(jù)的傳統(tǒng)微調(diào)模型。

      3.2 效率分析

      在保證效果的同時,C2-Cite++還展現(xiàn)出卓越的計算效率。吞吐量(每秒處理樣本數(shù))測試顯示,相比需要多輪迭代的方法(如Blueprint),C2-Cite++實現(xiàn)了最高的處理速度,在實際應用中具有明顯優(yōu)勢。



      3.3溯源生成模型中注意力模式的轉(zhuǎn)變

      注意力熱力圖可視化,直觀展示了C2-Cite的工作機制。在原生LLM中,引用符號前后的句子幾乎沒有交互;而在C2-Cite中,后續(xù)句子對前文的注意力顯著增強,形成了緊密的語義連接。這種"跨引用的語義橋梁"正是模型生成高質(zhì)量溯源內(nèi)容的關鍵。



      總結

      C2-Cite框架通過"上下文感知"這一核心理念,成功解決了現(xiàn)有歸因大語言模型的關鍵痛點:

      • 從符號到語義:將引用標記從被動占位符轉(zhuǎn)化為主動知識指針
      • 精準對齊:通過路由機制確保引用編號與文檔內(nèi)容的準確匹配
      • 語義連貫:利用注意力增強保持引用前后內(nèi)容的流暢性
      • 雙重優(yōu)化:同時提升引用質(zhì)量和回答準確性,而非顧此失彼

      最后,僅僅優(yōu)化訓練數(shù)據(jù)是不夠的,大模型的溯源能力需設計有效的學習機制。相比于復雜的數(shù)據(jù)合成流程,C2-Cite通過其"上下文感知"的設計思想,在內(nèi)容生成的過程依賴可靠的引用知識庫,為構建更加可靠、透明的AI溯源系統(tǒng)提供了重要的技術路徑。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      勇士隊老板迅速回應球迷憤怒的郵件,暗示庫明加與勇士之間存矛盾

      勇士隊老板迅速回應球迷憤怒的郵件,暗示庫明加與勇士之間存矛盾

      好火子
      2025-12-17 07:13:56
      撒貝寧夫妻開300萬大G接娃!加拿大岳父罕見露面,一家三代超溫馨

      撒貝寧夫妻開300萬大G接娃!加拿大岳父罕見露面,一家三代超溫馨

      愛下廚的阿釃
      2025-12-17 06:42:05
      郭碧婷一家4口團聚,向佐陪岳父遛彎盡孝心,3歲兒子騎爸爸脖子上

      郭碧婷一家4口團聚,向佐陪岳父遛彎盡孝心,3歲兒子騎爸爸脖子上

      心靜物娛
      2025-12-17 09:51:52
      北約給中國戰(zhàn)機取代號:殲20代號“Fagin”,音譯過來很惡毒

      北約給中國戰(zhàn)機取代號:殲20代號“Fagin”,音譯過來很惡毒

      云上烏托邦
      2025-12-16 13:18:23
      物業(yè)不催費了?不是良心發(fā)現(xiàn),而是新規(guī)這3條紅線,讓物業(yè)不敢動

      物業(yè)不催費了?不是良心發(fā)現(xiàn),而是新規(guī)這3條紅線,讓物業(yè)不敢動

      我心縱橫天地間
      2025-11-29 22:15:54
      “4斤黃金鳳冠被毀”大反轉(zhuǎn),千萬級網(wǎng)紅天塌了!

      “4斤黃金鳳冠被毀”大反轉(zhuǎn),千萬級網(wǎng)紅天塌了!

      廣告案例精選
      2025-12-16 11:07:45
      淚崩!蔡康永談大S:我以為大S會活得比我們久,結果她提前下車了

      淚崩!蔡康永談大S:我以為大S會活得比我們久,結果她提前下車了

      未小沫
      2025-12-16 23:20:42
      醫(yī)生研究:能抗擊慢性炎癥的事情,不是運動!而是3個生活習慣

      醫(yī)生研究:能抗擊慢性炎癥的事情,不是運動!而是3個生活習慣

      小胡軍事愛好
      2025-12-16 22:05:58
      太猖狂了!張本接受采訪,竟然引用高市早苗話,網(wǎng)友:找死的節(jié)奏

      太猖狂了!張本接受采訪,竟然引用高市早苗話,網(wǎng)友:找死的節(jié)奏

      金山話體育
      2025-12-16 16:04:32
      43歲rain現(xiàn)身沙田馬場,西裝難掩肌肉線條,零距離懟臉歲月無痕

      43歲rain現(xiàn)身沙田馬場,西裝難掩肌肉線條,零距離懟臉歲月無痕

      動物奇奇怪怪
      2025-12-17 01:24:41
      昆明一公園內(nèi)明永歷帝雕塑趴泥中引爭議!有游客稱感到不適要求改變,公園回應:已在著手處理

      昆明一公園內(nèi)明永歷帝雕塑趴泥中引爭議!有游客稱感到不適要求改變,公園回應:已在著手處理

      臺州交通廣播
      2025-12-16 22:38:07
      一醫(yī)生實名舉報醫(yī)院全員吃回扣!舉報信“貼滿”醫(yī)院......

      一醫(yī)生實名舉報醫(yī)院全員吃回扣!舉報信“貼滿”醫(yī)院......

      醫(yī)脈圈
      2025-12-16 20:42:16
      一部電影八個演員title,內(nèi)娛的番位造詞還能更離譜嗎?

      一部電影八個演員title,內(nèi)娛的番位造詞還能更離譜嗎?

      鈦媒體APP
      2025-12-15 18:57:25
      中央定調(diào),2026年養(yǎng)老金調(diào)整有望?工齡對漲幅影響越來越小?

      中央定調(diào),2026年養(yǎng)老金調(diào)整有望?工齡對漲幅影響越來越小?

      王五說說看
      2025-12-17 09:53:40
      朝鮮據(jù)稱拒絕俄羅斯再向俄烏戰(zhàn)場派遣士兵的請求,只因錢沒到位?

      朝鮮據(jù)稱拒絕俄羅斯再向俄烏戰(zhàn)場派遣士兵的請求,只因錢沒到位?

      之乎者也小魚兒
      2025-12-15 15:18:45
      《阿凡達3》避坑指南,頂配版本兩個選擇,IMAX絕非最佳

      《阿凡達3》避坑指南,頂配版本兩個選擇,IMAX絕非最佳

      光影新天地
      2025-12-16 16:35:20
      趙雅芝為了賺錢真是“不要命了”,72歲竟然穿20厘米的高跟鞋!

      趙雅芝為了賺錢真是“不要命了”,72歲竟然穿20厘米的高跟鞋!

      小娛樂悠悠
      2025-12-17 09:27:59
      荷蘭公開宣布制裁中國,各個公司芯片受損,中國反應令人意想不到

      荷蘭公開宣布制裁中國,各個公司芯片受損,中國反應令人意想不到

      歷史求知所
      2025-12-16 09:15:06
      明年1月1日起:每畝補貼3000元?一戶一田定了!土地歸并最新消息? 土地承包整省試點來了!你...

      明年1月1日起:每畝補貼3000元?一戶一田定了!土地歸并最新消息? 土地承包整省試點來了!你...

      新浪財經(jīng)
      2025-12-17 04:48:41
      一球迷向勇士老板發(fā)郵件要求引進第二得分點,后者共情回復并安撫

      一球迷向勇士老板發(fā)郵件要求引進第二得分點,后者共情回復并安撫

      懂球帝
      2025-12-17 08:25:12
      2025-12-17 10:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11935文章數(shù) 142511關注度
      往期回顧 全部

      科技要聞

      無人駕駛邁關鍵一步 特斯拉股價觸歷史新高

      頭條要聞

      牛彈琴:特朗普下狠手BBC面臨生死存亡 英國人急壞了

      頭條要聞

      牛彈琴:特朗普下狠手BBC面臨生死存亡 英國人急壞了

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      鞠婧祎收入曝光,絲芭稱已支付1.3億

      財經(jīng)要聞

      "祥源系"爆雷 有投資者數(shù)百萬元無法提現(xiàn)

      汽車要聞

      一車多動力+雙姿態(tài) 長城歐拉5上市 限時9.18萬元起

      態(tài)度原創(chuàng)

      數(shù)碼
      親子
      旅游
      公開課
      軍事航空

      數(shù)碼要聞

      LG MicroRGB Evo電視將于CES 2026首發(fā) 正面迎戰(zhàn)三星

      親子要聞

      城市長大的女孩更容易早熟,發(fā)育“搶跑”或致大腦結構改變

      旅游要聞

      江西南昌:冬日杉景醉游人

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普稱認定委內(nèi)瑞拉現(xiàn)政府是“外國恐怖組織”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 色婷婷A| 亚洲?欧美?自拍?另类?日韩?人妻| 18无码粉嫩小泬无套在线观看 | 激情内射亚州一区二区三区爱妻| 77777五月色婷婷丁香视频| 日韩a级?a级| 久无码久无码av无码| 肇源县| 91色拍| 日本熟妇色| 久久精品国产亚洲7777| 欧美激情肉欲高潮视频| www.亚洲精品长腿丝袜| 少妇高潮喷水在线观看| 色狠狠色男人| 97资源站人妻| 熟女视频在线看| 久久96热在精品国产高清| 日韩在线视频观看免费网站| 美女Av影院| 精品伊人久久久香线蕉| 国产三级精品三级| 欧美性猛交99久久久久99按摩| 久久夜色撩人精品国产小说| 亚洲一区av无码少妇电影| 亚洲人成网站999久久久综合| 激情综合图区| 亚欧洲乱码视频在线专区| 18禁国产一区二区三区| 人人妻人人插视频| 999白浆| 亚洲天堂男人天堂| 色噜噜狠狠成人综合| 在线日韩一区二区| 国产亚洲精品a在线| 莫力| 五月情婷婷| 成人国产一区二区三区精品| 男女做爰真人视频直播| 长武县| 一本久久a久久精品综合|