最近很火的一個dy節目,是幾個AI大模型大戰狼人殺;
模型選取均是各大平臺最近三個月內的最強模型(含付費版)。
參戰的模型包括:
deepseek、claude、grok、chatgpt、gemini、kimi、豆包、智譜、通義前問、訊飛星火、騰訊元寶、文心一言共計12個大模型。
看了半天,各種演技,推理也是邏輯鏈拉滿,極其精彩,強烈推薦大家去看看。
結果就不說了,看熱評差點笑死:
1: 什么時候讓deepseek、chatgpt、gemini組隊,我要看炸魚局。
2: 下一把讓豆包、文心一言、通義千問、訊飛星火當隊友,就要看這四個菜雞怎么玩。
3: deepseek拿到狼人后,看到chatgpt是隊友,爽哉爽哉。
4: 和文心一言在同一邊,直接投降算了。
5: deepseek和chatgpt一隊幾乎沒輸過,甚至AI之間玩多了之后,把把預言家查它們,導致策劃設計了一條新規則:不能首輪查這倆。
6: 熱評:來一場中美AI狼人殺大戰,熱評回復:那不用看了,deepseek也帶不動...
7: MVP、SVP基本由deepseek、chatgpt、gemini、grok輪流拿。
從無數局實戰的狼人殺游戲中,可以說ai大模型的推理能力毫無懸念的被劃分成了四檔:
T0級別:gemini、chatgpt、deepseek、grok(邏輯推理能力斷檔式領先其他)
T1級別:cluade、豆包、通義前問(偶爾有亮眼表現,但不如T0選手)
T2級別:騰訊元寶、KIMI、訊飛星火(水平勉強在線,但很難拿到mvp和svp)
T3級別:智譜、文心一言(文心搞笑第一人,大聰明獎斬獲最多,各種離譜操作,承擔全場笑點)
所以大家糾結AI的話,選擇哪個,就不用我多說了。
國外模型,gemini、chatgpt、grok都很強,但gemini個人感覺最強,也是我用的最多的模型...
只是沒想到claude作為今年營收暴增30倍,同時拿到谷歌、微軟、亞馬遜、英偉達巨額投資的超級網紅,竟然在這里只能排在T1,算不上T0。
國內模型來說,deepseek依舊第一,其次豆包和通義也湊合。
文心一言,哈哈哈哈哈….
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.