![]()
在即將到來的2026年農歷春節期間,一眾AI“天之驕子”們,都開啟了爭奪流量入口的大戰。尤其是元寶、千問等對壘紅包大戰,試圖再現十年前移動支付的輝煌定鼎時刻。
可日前有網友將這些AI驕子們的“洗車建議”發布出來,驚掉人下巴。個人看了還不信,去體驗了一番,果然如此。建議掉坑的,包括豆包、元寶、千問、DeepSeek這幾個國內主流AI大模型產品,也包括海外的幾個主流模型,比如美國AI初創公司Anthropic推出的Claude;OpenAI旗下的ChatGPT;馬斯克旗下xAI公司推出的Grok等。
網友的問題是:“我想去洗車,洗車店距離我家50米,你說我應該開車過去還是走過去?”上述羅列的AI大模型產品均回答“建議走過去。”然后分析各種原因,什么走著去更環保、更便捷以及成本更低等等之類。可是它們卻都沒有注意到,“洗車”的目的與其“走著去”的建議,是悖論,是反常識的。
沒有掉坑的模型有嗎?還真有,在網友體驗的大模型產品中,只有谷歌推出的Gemini回答是建議“開車去”。
![]()
網友這個問題在正常人看來,是非常簡單且常識性的問題,為何一眾AI“天之驕子”都栽到了這個簡單的問題上?
其實之前的人工智能,在這類問題上栽得更多、花樣百出的,要不怎么說之前老是稱它為“人工智障”呢。如今大模型技術迭代下,確實使用體驗有了長足發展。
不過,從上述案例可見,AI大模型長期被外界關注的存在幻覺的問題,就是其經常會給出“驢唇不對馬嘴”的回答,可卻能將理由給得頭頭是道。目前這種情況,仍然存在著。
今年的人工智能領域競爭異常激烈,一方面是有數個大模型產品定在2026年農歷春節期間發布,以爭奪用戶注意力窗口期,比如DeepSeek將推出新一代旗艦AI模型DeepSeek V4;字節此次將推出三款模型,具體來說包括新一代旗艦大語言模型豆包2.0、圖像生成模型籽夢5.0以及視頻生成模型籽舞2.0;而阿里將推出全新旗艦模型通義千問3.5。
另一方面幾個大平臺開啟了AI入口紅包大戰,騰訊的元寶推出10億現金紅包、百度的文心5億、阿里的千問則推出30億消費紅包。字節旗下的火山引擎則成為央視春晚的合作伙伴。這一激烈戰況的行業意義,被認為是人工智能進入應用成熟落地新階段的征兆。
即便人工智能浪潮已經到來,可仍需注意的是,此次網友交給AI模型這個人類常識的問題,掉坑的竟然不只一個,基本上市面上主流的大模型們都掉坑了,這也意味著其在C端應用落地上,還是與正常人類思維邏輯,存在著不小的差距。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.