AI好不好還得靠同行襯托

2026-04-24 15:38:41　來源: 星球商業(yè)評論

北京舉報

分享至

乃悟日常生活中經(jīng)常會用AI，看到輿論說這玩意兒能替代人我就想笑，給大家舉個很簡單的嚴(yán)肅應(yīng)用場景，我讓AI給我分析一下某上市公司的年報，它像模像樣地給我分析半天，我留了個心眼在搜索引擎里查了一下，這家公司當(dāng)時還沒發(fā)年報呢……

是，我指出之后AI認(rèn)錯了，但下次我問同樣問題它還是會錯。

這種問題有時候可以怪那些故意污染AI的人，比如2024年3月，瑞典哥德堡大學(xué)的一名醫(yī)學(xué)研究員閑著沒事兒干，編造了兩篇醫(yī)學(xué)論文，詳細(xì)描述了一種叫做藍(lán)光狂躁癥的病癥。

整個論文看起來像模像樣，什么癥狀、致病原因，甚至還有流行病學(xué)調(diào)查，多少人患病的數(shù)據(jù)等等。

寫完之后，她還把這兩篇論文上傳到了預(yù)印本平臺。這種東西拿給人看，基本都能一眼看出來。因?yàn)樗龑懙淖髡邌挝皇牵?/p>

星際艦隊(duì)學(xué)院。

有意思的是，包括ChatGPT、Gemini等一眾主流AI全部采信了她的論文，并一本正經(jīng)地告訴用戶你得了藍(lán)光狂躁癥，趕緊就醫(yī)。

大語言模型從原理上就是個接收器，你輸入啥，它就輸出啥，無法分辨內(nèi)容是否真實(shí)。

甚至你都不用輸入虛假信息，AI就會亂編，也就是大家說的產(chǎn)生幻覺。比如剛才說的，連上市公司年報都敢自己編，億萬股民肯定盼著它們上崗呢。

為什么AI會自己編呢？因?yàn)锳I在被調(diào)教時，傾向于為用戶帶來幫助。不管對不對，先給個答案再說，這就是幻覺的來源。

這就是Agent誕生的原因，程序員希望Agent幫助AI像人一樣，認(rèn)真去檢索這些資料，甚至交叉對比、核驗(yàn)。

舉個例子，同樣的年報問題，沒有Agent的AI直接搜索發(fā)現(xiàn)沒有媒體報道，然后就胡編亂造一通，而有Agent的AI則不一樣，它會像人一樣去上市公司信息披露網(wǎng)站翻年報，如果沒找到，它會直接告訴你對不起，沒找到。

現(xiàn)在美國那邊Grok、Claude等AI都有Agent模式，國內(nèi)也有如Kimi等AI裝有Agent，但收取會員費(fèi)。

前一段龍蝦爆火后，乃悟觀察到一個很有意思的細(xì)節(jié)。簡單介紹下，龍蝦相當(dāng)于一個有超級權(quán)限的Agent，用戶玩它的時候需要給它裝一些“APP”或者叫Skill（技能）。

在龍蝦市場里，有兩三萬個不同功能的APP，有的可以幫你自動發(fā)朋友圈，有的能幫你監(jiān)控網(wǎng)頁，即時了解新聞熱點(diǎn)，有的還可以自動編程。

剛才說了，搜索是AI最重要的功能起點(diǎn)，相當(dāng)于它的眼睛和大腦，那么大家一起來猜一下，龍蝦用戶安裝最多的Skill是什么？

你們一定想不到，是：

百度搜索 Skill

我當(dāng)時看到這個結(jié)果的時候，怎么說呢，平時又打又罵的孩子你們怎么又抱上了？！

為啥這些游走在AI前沿的用戶都要裝百度搜索Skill呢，愿意很簡單，百度搜索AI的準(zhǔn)確率是國內(nèi)最高的。

今天的百度萬象大會上，百度詳細(xì)介紹了百度AI在引入Agent能力后的變化。首先是有了兩個Agent，可以更深入查找資料，還能交叉驗(yàn)證，相互獨(dú)立搜索，對比，大大降低了AI胡編亂造或者信息的虛假性。

除了這些，還因?yàn)榘俣扔袀€拳頭產(chǎn)品：

百度百科。

對于所有想污染信息的人來說，百度百科絕對是他們的嚴(yán)父。現(xiàn)在的百科，所有詞條必須標(biāo)注權(quán)威引用源，自媒體和UGC內(nèi)容都無法進(jìn)入，而且是先發(fā)后審。

特別是科學(xué)類相關(guān)詞條，百度聯(lián)合國科大等學(xué)術(shù)機(jī)構(gòu)，對20多萬科學(xué)詞條進(jìn)行了審定，覆蓋100%的自然科學(xué)領(lǐng)域詞條。

乃悟前段時間聽人大教授宋瞳講明史。宋教授在講到史料的選擇上時說，如果大家不是專業(yè)研究歷史，只是要了解的話，最好的史料就是：

百度百科。

百度百科里甚至能看到很多壓根沒有出版和刊印的孤本。比如明代許士德的《戎車日記》等等。

果殼網(wǎng)曾經(jīng)做過實(shí)驗(yàn)。他們找來8家主流AI，用2000道測試題的雙盲測試顯示，發(fā)現(xiàn)，在接?百度百科作為參考信源后，AI綜合準(zhǔn)確度平均提升38%以上，關(guān)鍵事實(shí)偏離率從26.4%驟降至4.1%以內(nèi)，專家認(rèn)可度高達(dá)：

91.5%。

交叉驗(yàn)證、深度搜索、權(quán)威信源，除了這些之外，百度還最后加了一道鎖鏈，就是系統(tǒng)的秒級巡查和糾錯，在發(fā)現(xiàn)有問題后，會有人工介入干預(yù)。不再像以前一樣，同一個問題，第一次回答錯誤。一個月后再問，還是錯誤回答。

當(dāng)然，還不只是嚴(yán)謹(jǐn)，因?yàn)閍gent存在，AI能更好理解用戶的需求。比如你問他月球的問題，它會生成可以移動的月球模型給你觀看。你問它黃河的知識，它會生成黃河流經(jīng)過的城市，帶你一個個看過去……

這就超脫了過去AI問啥答啥的呆板，變成開始主動理解用戶需求的小機(jī)靈鬼。

我一點(diǎn)也不懷疑這些用戶數(shù)據(jù)是百度刷的，因?yàn)橛谬埼r的人很可能會讓龍蝦幫自己研究歐洲頂級聯(lián)賽，然后下注，歷史數(shù)據(jù)，球隊(duì)信息那是一點(diǎn)也不能錯的，別說AI給他們瞎編了，那可是真金白銀的游戲，什么好用，什么不好用，大家的錢包門清呢。

（圖片來自機(jī)器之心）

加乃悟微信：yangnw0705 備注公司-職業(yè)

給我一個在看，我能撬動整個星球

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.