<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      為什么大模型要騙你?

      0
      分享至

      本文開(kāi)始前,「象先志」先問(wèn)大家三個(gè)問(wèn)題,大家可以一起思考下

      1. 1. AI為什么要騙你?

      2. 2. 幻覺(jué)是大語(yǔ)言模型的bug還是feature?

      3. 3. 為什么AI總是一本正經(jīng)地胡說(shuō)八道?

      OpenAI前段時(shí)間發(fā)了篇論文,題目叫 《Why language models hallucinate》,解釋為什么大語(yǔ)言模型會(huì)產(chǎn)生幻覺(jué)?!赶笙戎尽箷?huì)先介紹下論文內(nèi)容,然后「象先志」再聊聊對(duì)這個(gè)問(wèn)題一些不一樣的看法。



      稍微有點(diǎn)硬核,希望大家耐心看到最后。這篇論文的基本結(jié)論,是大模型產(chǎn)生幻覺(jué),原因是開(kāi)發(fā)人員在訓(xùn)練它的時(shí)候鼓勵(lì)它這么做。就是說(shuō)大模型天性是好的,是跟錯(cuò)了人,后面路才走歪的。

      為什么這么說(shuō)呢?在訓(xùn)練大模型的時(shí)候,廠商內(nèi)部會(huì)跑很多的測(cè)試,來(lái)評(píng)價(jià)和校準(zhǔn)大模型的好壞。這些測(cè)試只看準(zhǔn)確率,不看錯(cuò)誤率,所以哪怕模型不知道答案是什么,它還是會(huì)傾向猜一個(gè)答案。就跟我們考試的時(shí)候,哪怕不會(huì)做,答題卡上也要涂滿(mǎn)是一個(gè)道理。

      要解決這個(gè)問(wèn)題,那就對(duì)癥下藥嘛,論文作者呼吁大家要改變?cè)u(píng)測(cè)基準(zhǔn),不要再搞那套基于準(zhǔn)確率的評(píng)估方法了,要鼓勵(lì)大模型承認(rèn)自己的無(wú)知,而不是一本正經(jīng)的瞎咧咧。

      論文主要說(shuō)的就是這事,「象先志」想邏輯大家應(yīng)該很容易理解。坦白講,雖然說(shuō)論文是OpenAI發(fā)的,但「象先志」覺(jué)得沒(méi)有什么新東西。當(dāng)然OpenAI出來(lái)發(fā)有個(gè)好處,人家行業(yè)地位擺著這,出來(lái)吼兩嗓子,有助于從業(yè)者更快地認(rèn)識(shí)到問(wèn)題,然后去針對(duì)性地解決。

      聊完論文,「象先志」再聊下對(duì)模型幻覺(jué)問(wèn)題的理解。「象先志」認(rèn)為語(yǔ)言模型本質(zhì)上沒(méi)有幻覺(jué)不幻覺(jué)的概念,它們只是基于已有的信息,去預(yù)測(cè)下一個(gè)token。你訓(xùn)練數(shù)據(jù)里是什么樣的概率分布,它就會(huì)盡量去擬合這個(gè)分布,僅此而已。不管你怎樣去調(diào)整模型評(píng)估的方式方法,它其實(shí)仍然是在迎合新的評(píng)價(jià)指標(biāo)。

      比如說(shuō),原來(lái)答錯(cuò)不扣分,現(xiàn)在答錯(cuò)要扣分,那模型肯定更謹(jǐn)慎,不確定的事實(shí),不知道的答案,它就更多承認(rèn)自己不確定或者不知道。

      但這樣還是存在兩個(gè)問(wèn)題。

      第一,模型仍然是沒(méi)有事實(shí)和非事實(shí)的概念區(qū)分,它不是因?yàn)檫@個(gè)東西是幻覺(jué),它才不輸出;它是因?yàn)檫@個(gè)輸出會(huì)扣分,它才不輸出。

      這就引出了第二個(gè)問(wèn)題。按照這個(gè)理解角度,要減少模型的幻覺(jué),就是要合理設(shè)置模型的評(píng)估模式,去盡可能引導(dǎo)模型的輸出跟人類(lèi)認(rèn)知上的事實(shí)陳述重合。

      這顯然是一種治標(biāo)不治本的方式,因?yàn)槟P偷妮敵鼋Y(jié)果跟人類(lèi)認(rèn)為的事實(shí)是兩個(gè)語(yǔ)言集合,我們現(xiàn)在等于沒(méi)辦法,直接瞄準(zhǔn)后面這個(gè)集合做優(yōu)化,所以只能退而求其次,對(duì)前一個(gè)集合做間接的限制。

      但這樣搞有多大效果?上限在哪里?都是不知道的。

      打個(gè)比方吧。人發(fā)燒是因?yàn)樯眢w內(nèi)的免疫系統(tǒng)在劇烈反應(yīng),這個(gè)反應(yīng)是有一個(gè)根本的誘發(fā)因素的,比如說(shuō)病毒感染。那現(xiàn)在要解決發(fā)燒的問(wèn)題,一種辦法是直接對(duì)病毒做處理,上一些抗病毒的藥物,病毒解決了,身體自然就不發(fā)燒了。

      還有一種辦法是什么呢?就是把體溫當(dāng)做優(yōu)化指標(biāo),用藥物把免疫反應(yīng)按下去,或者在頭上敷冰塊,反正要達(dá)到降體溫的目的。

      現(xiàn)在OpenAI提的解決方案就類(lèi)似于后者。這個(gè)方法有沒(méi)有用?當(dāng)然有用,就像人如果一直發(fā)燒發(fā)高燒,腦子就燒壞掉了,先把體溫降下來(lái)、緩解癥狀,是治療步驟中必要的環(huán)節(jié)。

      OpenAI新的GPT-5的確也比之前模型要好很多,幻覺(jué)癥狀有明顯的緩解。但這能不能解決根本問(wèn)題呢?我覺(jué)得很難,你最后還是需要找到發(fā)燒的原因才行。

      只不過(guò)跟生病不一樣,人發(fā)燒是有客觀原因的,可能受限于醫(yī)學(xué)發(fā)展程度醫(yī)生找不到,但我們知道這個(gè)原因是客觀存在的。而語(yǔ)言模型的幻覺(jué)問(wèn)題有可能是與生俱來(lái)的,發(fā)燒就是它身體正常新陳代謝的一部分,你解決不了。沒(méi)那個(gè)能力,知道吧?

      順便說(shuō)一句 ,剛才「象先志」又被AI給騙了?!赶笙戎尽乖?xún)問(wèn)柯潔獲得過(guò)幾個(gè)世界冠軍時(shí),ChatGPT非常篤定地回答,“截止2025年9月,柯潔共獲得9個(gè)世界冠軍,還列出了是哪幾次以及哪一年?!?/strong>



      本來(lái)以為是GPT語(yǔ)料被污染了,因?yàn)槟瓿鮈G杯決賽時(shí)柯潔因不服裁判棄賽,隨后把微博簽名改為“九冠王”。但「象先志」定睛一看,發(fā)現(xiàn)情況并沒(méi)有那么復(fù)雜,因?yàn)镃hatGPT回答里并沒(méi)有列出2025年的LG杯。

      九冠的柯潔,只是它單純的幻覺(jué)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      爆:工信部副部長(zhǎng),“空降”通信央企董事長(zhǎng)!

      爆:工信部副部長(zhǎng),“空降”通信央企董事長(zhǎng)!

      通信頭條
      2026-03-02 21:06:39
      果然不簡(jiǎn)單:中國(guó)摁住日本后,又讓美國(guó)見(jiàn)識(shí)了北京的“陽(yáng)謀”

      果然不簡(jiǎn)單:中國(guó)摁住日本后,又讓美國(guó)見(jiàn)識(shí)了北京的“陽(yáng)謀”

      通文知史
      2026-03-01 23:25:03
      越南專(zhuān)家犀利剖析:中國(guó)真正對(duì)手并不是美國(guó),全球信仰體系崩塌

      越南專(zhuān)家犀利剖析:中國(guó)真正對(duì)手并不是美國(guó),全球信仰體系崩塌

      史行途
      2026-03-03 00:37:02
      從伊朗的情況來(lái)看,中國(guó)有可能存在特務(wù)的人群不只是出國(guó)留學(xué)人員

      從伊朗的情況來(lái)看,中國(guó)有可能存在特務(wù)的人群不只是出國(guó)留學(xué)人員

      忠于法紀(jì)
      2025-12-09 21:28:55
      3月1日俄烏最新:恐怖的場(chǎng)景

      3月1日俄烏最新:恐怖的場(chǎng)景

      西樓飲月
      2026-03-01 20:55:56
      歐盟下禁令,禁止中國(guó)機(jī)構(gòu)參與930億關(guān)鍵科研項(xiàng)目,包含AI與芯片

      歐盟下禁令,禁止中國(guó)機(jī)構(gòu)參與930億關(guān)鍵科研項(xiàng)目,包含AI與芯片

      臨云史策
      2026-03-01 14:32:13
      韓國(guó)網(wǎng)紅博主上海旅游被宰客?一頓火鍋花了177萬(wàn)韓幣!

      韓國(guó)網(wǎng)紅博主上海旅游被宰客?一頓火鍋花了177萬(wàn)韓幣!

      奮斗在韓國(guó)
      2026-03-02 11:00:03
      我見(jiàn)過(guò)最傻的父母,攥著大把的存款和退休金,卻等著給子女當(dāng)遺產(chǎn)

      我見(jiàn)過(guò)最傻的父母,攥著大把的存款和退休金,卻等著給子女當(dāng)遺產(chǎn)

      i書(shū)與房
      2026-02-25 17:22:34
      26年堅(jiān)定持有的十只黑馬股,預(yù)定翻倍增長(zhǎng)!(精選)

      26年堅(jiān)定持有的十只黑馬股,預(yù)定翻倍增長(zhǎng)?。ňx)

      漲多寶
      2026-03-02 14:45:51
      出事了,戰(zhàn)爭(zhēng)形勢(shì)不妙!

      出事了,戰(zhàn)爭(zhēng)形勢(shì)不妙!

      君臨策
      2026-03-02 19:16:06
      男子送相親對(duì)象回家遇其忘帶鑰匙,開(kāi)房遭拒后女子怒斥男子真沒(méi)用

      男子送相親對(duì)象回家遇其忘帶鑰匙,開(kāi)房遭拒后女子怒斥男子真沒(méi)用

      朗威談星座
      2026-03-02 16:54:30
      哈梅內(nèi)伊一死,普京急召全體高層,防空系統(tǒng)全失靈,俄這次背大鍋

      哈梅內(nèi)伊一死,普京急召全體高層,防空系統(tǒng)全失靈,俄這次背大鍋

      夢(mèng)在深巷aqa
      2026-03-02 01:17:46
      小天賜,終為父母當(dāng)年的“沖動(dòng)”買(mǎi)了單,年僅6歲活得不像個(gè)小孩

      小天賜,終為父母當(dāng)年的“沖動(dòng)”買(mǎi)了單,年僅6歲活得不像個(gè)小孩

      奇怪的鯊魚(yú)們
      2026-03-02 13:11:54
      上海著名主持人淚目!中東戰(zhàn)火下,有人平安返航、有人新婚分離、有人只想回家

      上海著名主持人淚目!中東戰(zhàn)火下,有人平安返航、有人新婚分離、有人只想回家

      上觀新聞
      2026-03-02 15:27:27
      美方:伊朗試圖暗殺特朗普

      美方:伊朗試圖暗殺特朗普

      第一財(cái)經(jīng)資訊
      2026-03-02 22:05:26
      最新!油價(jià)調(diào)整通知

      最新!油價(jià)調(diào)整通知

      大象新聞
      2026-03-03 00:50:03
      這個(gè)死磕王楚欽的裁判,決賽就沒(méi)讓她上場(chǎng)

      這個(gè)死磕王楚欽的裁判,決賽就沒(méi)讓她上場(chǎng)

      楊仔述
      2026-03-02 11:13:02
      馬斯切拉諾:球員們下半場(chǎng)踢得像一支冠軍之師,功勞屬于他們

      馬斯切拉諾:球員們下半場(chǎng)踢得像一支冠軍之師,功勞屬于他們

      懂球帝
      2026-03-02 12:16:36
      臺(tái)積電創(chuàng)辦人張忠謀:如果想扼殺中國(guó)大陸,中國(guó)大陸真的無(wú)能為力

      臺(tái)積電創(chuàng)辦人張忠謀:如果想扼殺中國(guó)大陸,中國(guó)大陸真的無(wú)能為力

      混沌錄
      2026-02-27 21:29:05
      日本專(zhuān)家:中國(guó)的7nm不是開(kāi)始,而是終點(diǎn)

      日本專(zhuān)家:中國(guó)的7nm不是開(kāi)始,而是終點(diǎn)

      芯火相承
      2026-03-02 19:55:03
      2026-03-03 03:12:49
      象先志 incentive-icons
      象先志
      專(zhuān)注互聯(lián)網(wǎng)、電商,聚焦產(chǎn)業(yè)、核心,洞察前沿、趨勢(shì)
      111文章數(shù) 8關(guān)注度
      往期回顧 全部

      科技要聞

      蘋(píng)果中國(guó)官網(wǎng)上線(xiàn)iPhone 17e,4499元起

      頭條要聞

      中國(guó)留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

      頭條要聞

      中國(guó)留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

      體育要聞

      “想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

      娛樂(lè)要聞

      李亞鵬與哥哥和解 只有一條真心話(huà)短信

      財(cái)經(jīng)要聞

      油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

      汽車(chē)要聞

      國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

      態(tài)度原創(chuàng)

      旅游
      家居
      教育
      手機(jī)
      時(shí)尚

      旅游要聞

      熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿(mǎn)佳節(jié)!

      家居要聞

      萬(wàn)物互聯(lián) 享科技福祉

      教育要聞

      特別猛,但在留學(xué)生心中存在感很低的英國(guó)大學(xué)!

      手機(jī)要聞

      iPhone 17e外觀與前代幾乎一致 舊款iPhone 16e保護(hù)殼可繼續(xù)用

      今年春天一定要擁有的4件衣服,太好看了!

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版