![]()
乃悟日常生活中經(jīng)常會用AI,看到輿論說這玩意兒能替代人我就想笑,給大家舉個很簡單的嚴(yán)肅應(yīng)用場景,我讓AI給我分析一下某上市公司的年報,它像模像樣地給我分析半天,我留了個心眼在搜索引擎里查了一下,這家公司當(dāng)時還沒發(fā)年報呢……
![]()
是,我指出之后AI認(rèn)錯了,但下次我問同樣問題它還是會錯。
這種問題有時候可以怪那些故意污染AI的人,比如2024年3月,瑞典哥德堡大學(xué)的一名醫(yī)學(xué)研究員閑著沒事兒干,編造了兩篇醫(yī)學(xué)論文,詳細(xì)描述了一種叫做藍(lán)光狂躁癥的病癥。
整個論文看起來像模像樣,什么癥狀、致病原因,甚至還有流行病學(xué)調(diào)查,多少人患病的數(shù)據(jù)等等。
寫完之后,她還把這兩篇論文上傳到了預(yù)印本平臺。這種東西拿給人看,基本都能一眼看出來。因?yàn)樗龑懙淖髡邌挝皇牵?/p>
星際艦隊(duì)學(xué)院。
有意思的是,包括ChatGPT、Gemini等一眾主流AI全部采信了她的論文,并一本正經(jīng)地告訴用戶你得了藍(lán)光狂躁癥,趕緊就醫(yī)。
大語言模型從原理上就是個接收器,你輸入啥,它就輸出啥,無法分辨內(nèi)容是否真實(shí)。
甚至你都不用輸入虛假信息,AI就會亂編,也就是大家說的產(chǎn)生幻覺。比如剛才說的,連上市公司年報都敢自己編,億萬股民肯定盼著它們上崗呢。
為什么AI會自己編呢?因?yàn)锳I在被調(diào)教時,傾向于為用戶帶來幫助。不管對不對,先給個答案再說,這就是幻覺的來源。
這就是Agent誕生的原因,程序員希望Agent幫助AI像人一樣,認(rèn)真去檢索這些資料,甚至交叉對比、核驗(yàn)。
舉個例子,同樣的年報問題,沒有Agent的AI直接搜索發(fā)現(xiàn)沒有媒體報道,然后就胡編亂造一通,而有Agent的AI則不一樣,它會像人一樣去上市公司信息披露網(wǎng)站翻年報,如果沒找到,它會直接告訴你對不起,沒找到。
現(xiàn)在美國那邊Grok、Claude等AI都有Agent模式,國內(nèi)也有如Kimi等AI裝有Agent,但收取會員費(fèi)。
前一段龍蝦爆火后,乃悟觀察到一個很有意思的細(xì)節(jié)。簡單介紹下,龍蝦相當(dāng)于一個有超級權(quán)限的Agent,用戶玩它的時候需要給它裝一些“APP”或者叫Skill(技能)。
在龍蝦市場里,有兩三萬個不同功能的APP,有的可以幫你自動發(fā)朋友圈,有的能幫你監(jiān)控網(wǎng)頁,即時了解新聞熱點(diǎn),有的還可以自動編程。
剛才說了,搜索是AI最重要的功能起點(diǎn),相當(dāng)于它的眼睛和大腦,那么大家一起來猜一下,龍蝦用戶安裝最多的Skill是什么?
你們一定想不到,是:
百度搜索 Skill
我當(dāng)時看到這個結(jié)果的時候,怎么說呢,平時又打又罵的孩子你們怎么又抱上了?!
為啥這些游走在AI前沿的用戶都要裝百度搜索Skill呢,愿意很簡單,百度搜索AI的準(zhǔn)確率是國內(nèi)最高的。
今天的百度萬象大會上,百度詳細(xì)介紹了百度AI在引入Agent能力后的變化。首先是有了兩個Agent,可以更深入查找資料,還能交叉驗(yàn)證,相互獨(dú)立搜索,對比,大大降低了AI胡編亂造或者信息的虛假性。
除了這些,還因?yàn)榘俣扔袀€拳頭產(chǎn)品:
百度百科。
對于所有想污染信息的人來說,百度百科絕對是他們的嚴(yán)父。現(xiàn)在的百科,所有詞條必須標(biāo)注權(quán)威引用源,自媒體和UGC內(nèi)容都無法進(jìn)入,而且是先發(fā)后審。
特別是科學(xué)類相關(guān)詞條,百度聯(lián)合國科大等學(xué)術(shù)機(jī)構(gòu),對20多萬科學(xué)詞條進(jìn)行了審定,覆蓋100%的自然科學(xué)領(lǐng)域詞條。
乃悟前段時間聽人大教授宋瞳講明史。宋教授在講到史料的選擇上時說,如果大家不是專業(yè)研究歷史,只是要了解的話,最好的史料就是:
百度百科。
百度百科里甚至能看到很多壓根沒有出版和刊印的孤本。比如明代許士德的《戎車日記》等等。
![]()
果殼網(wǎng)曾經(jīng)做過實(shí)驗(yàn)。他們找來8家主流AI,用2000道測試題的雙盲測試顯示,發(fā)現(xiàn),在接?百度百科作為參考信源后,AI綜合準(zhǔn)確度平均提升38%以上,關(guān)鍵事實(shí)偏離率從26.4%驟降至4.1%以內(nèi),專家認(rèn)可度高達(dá):
91.5%。
交叉驗(yàn)證、深度搜索、權(quán)威信源,除了這些之外,百度還最后加了一道鎖鏈,就是系統(tǒng)的秒級巡查和糾錯,在發(fā)現(xiàn)有問題后,會有人工介入干預(yù)。不再像以前一樣,同一個問題,第一次回答錯誤。一個月后再問,還是錯誤回答。
當(dāng)然,還不只是嚴(yán)謹(jǐn),因?yàn)閍gent存在,AI能更好理解用戶的需求。比如你問他月球的問題,它會生成可以移動的月球模型給你觀看。你問它黃河的知識,它會生成黃河流經(jīng)過的城市,帶你一個個看過去……
這就超脫了過去AI問啥答啥的呆板,變成開始主動理解用戶需求的小機(jī)靈鬼。
![]()
我一點(diǎn)也不懷疑這些用戶數(shù)據(jù)是百度刷的,因?yàn)橛谬埼r的人很可能會讓龍蝦幫自己研究歐洲頂級聯(lián)賽,然后下注,歷史數(shù)據(jù),球隊(duì)信息那是一點(diǎn)也不能錯的,別說AI給他們瞎編了,那可是真金白銀的游戲,什么好用,什么不好用,大家的錢包門清呢。
![]()
(圖片來自機(jī)器之心)
加乃悟微信:yangnw0705 備注公司-職業(yè)
給我一個在看,我能撬動整個星球
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.