清華大學DeepSeek教程第五版由清華大學雙聘教授 @新媒沈陽團隊撰寫,主要圍繞 AI 幻覺展開研究,以 DeepSeek 為例深入探討其現象、成因、評測、應對策略及創造力價值。
![]()
AI 幻覺的定義:AI 幻覺指模型生成與事實不符、邏輯斷裂或脫離上下文的內容,分為事實性幻覺(與現實事實不一致)和忠實性幻覺(與用戶指令或上下文不一致) 。
產生 AI 幻覺的原因:包括數據偏差、泛化困境、知識固化、意圖誤解等。此外,音樂因具有主觀性、抽象性和可感知性差異等特點,雖不存在傳統意義上的幻覺,但也有邏輯斷裂的歌詞等潛在表現。
AI 幻覺評測:通過隨機生成提示語和抽取事實性幻覺測試題進行人工判斷標注與交叉驗證。測試結果顯示,不同模型幻覺率不同,如通用性測試中 DeepSeekV3 幻覺率為 2%、DeepSeekR1 為 3%;事實性測試中 DeepSeekV3 幻覺率達 29.67%、DeepSeekR1 為 22.33% 。推理能力與幻覺率存在雙向作用機制,聯網搜索、雙 AI 驗證、提示詞工程等方法可降低幻覺率。
AI 幻覺的應對策略:普通用戶可采用三角驗證法,警惕 “過度合理” 的回答,理解并利用幻覺帶來的創意靈感。具體方法包括聯網搜索、雙 AI 驗證、提示詞工程(知識邊界限定、對抗性提示)等。技術層面可采用 RAG 框架、結合外部知識庫、精細訓練、開發評估工具等方案。
AI 幻覺的價值:在科學發現、文藝與設計、娛樂與游戲、技術創新等領域具有創造力價值。如助力蛋白質設計獲諾貝爾化學獎,為游戲開發提供靈感,提升自動駕駛系統識別精度等。
需要的小伙伴可進入招文袋的公眾號直接去拿(2月24日零點發布),或加入招文袋的知識星球社群即時下載,一起交流探討學習,1—5版的文檔和知識點都整理在內啦。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.