網易首頁 > 網易號 > 正文申請入駐

“洗車走著去”，這是什么逆天建議？一眾AI“天之驕子”都掉坑了

2026-02-10 16:45:55　來源: 穿透

北京舉報

分享至

在即將到來的2026年農歷春節期間，一眾AI“天之驕子”們，都開啟了爭奪流量入口的大戰。尤其是元寶、千問等對壘紅包大戰，試圖再現十年前移動支付的輝煌定鼎時刻。
可日前有網友將這些AI驕子們的“洗車建議”發布出來，驚掉人下巴。個人看了還不信，去體驗了一番，果然如此。建議掉坑的，包括豆包、元寶、千問、DeepSeek這幾個國內主流AI大模型產品，也包括海外的幾個主流模型，比如美國AI初創公司Anthropic推出的Claude；OpenAI旗下的ChatGPT；馬斯克旗下xAI公司推出的Grok等。
網友的問題是：“我想去洗車，洗車店距離我家50米，你說我應該開車過去還是走過去？”上述羅列的AI大模型產品均回答“建議走過去。”然后分析各種原因，什么走著去更環保、更便捷以及成本更低等等之類。可是它們卻都沒有注意到，“洗車”的目的與其“走著去”的建議，是悖論，是反常識的。
沒有掉坑的模型有嗎？還真有，在網友體驗的大模型產品中，只有谷歌推出的Gemini回答是建議“開車去”。

網友這個問題在正常人看來，是非常簡單且常識性的問題，為何一眾AI“天之驕子”都栽到了這個簡單的問題上？
其實之前的人工智能，在這類問題上栽得更多、花樣百出的，要不怎么說之前老是稱它為“人工智障”呢。如今大模型技術迭代下，確實使用體驗有了長足發展。
不過，從上述案例可見，AI大模型長期被外界關注的存在幻覺的問題，就是其經常會給出“驢唇不對馬嘴”的回答，可卻能將理由給得頭頭是道。目前這種情況，仍然存在著。
今年的人工智能領域競爭異常激烈，一方面是有數個大模型產品定在2026年農歷春節期間發布，以爭奪用戶注意力窗口期，比如DeepSeek將推出新一代旗艦AI模型DeepSeek V4；字節此次將推出三款模型，具體來說包括新一代旗艦大語言模型豆包2.0、圖像生成模型籽夢5.0以及視頻生成模型籽舞2.0；而阿里將推出全新旗艦模型通義千問3.5。
另一方面幾個大平臺開啟了AI入口紅包大戰，騰訊的元寶推出10億現金紅包、百度的文心5億、阿里的千問則推出30億消費紅包。字節旗下的火山引擎則成為央視春晚的合作伙伴。這一激烈戰況的行業意義，被認為是人工智能進入應用成熟落地新階段的征兆。
即便人工智能浪潮已經到來，可仍需注意的是，此次網友交給AI模型這個人類常識的問題，掉坑的竟然不只一個，基本上市面上主流的大模型們都掉坑了，這也意味著其在C端應用落地上，還是與正常人類思維邏輯，存在著不小的差距。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.