“9.11 比 9.9 大?”——當我把這句答案甩到群里,滿屏問號差點把我手機震爛。 幾秒前,我剛拿 GPT-4、Gemini、Claude 3.5 挨個問了一遍,仨學霸異口同聲:9.11 更大。 我小學三年級的侄子當場笑到把奶茶噴鍵盤:小數點白學了?
別急著罵 AI 笨,它其實沒把 9.11 當數字,而是拆成“9”和“11”兩塊token。 在它眼里,這倆就像門牌號,11 號樓當然比 9 號樓靠前,于是秒選 9.11。 順序再調一下,先問 9.9 再問 9.11,有模型立馬改口——典型見風使舵,比我還墻頭草。
![]()
我把同樣的問題丟給國產的元寶和豆包,它倆居然答對了,一秒沒猶豫。 不是它們更聰明,是訓練時喂了更多“小數比大小”的狠活,套路見得多,套路就騙不動。 換句話說,AI 不是不會算,是得有人提前把坑填平,這就是提示工程——問題怎么問,比問題本身更值錢。
![]()
有人覺得小題大做:不就錯一道小數題? 可自動駕駛、金融風控、醫療診斷,全是小數點后面幾位定生死。 今天敢把 9.9 算小,明天就能把 0.19% 的風險算成 1.9%,直接讓一輛車上天,讓一張賬單爆炸。
![]()
更可怕的是,我們正把越來越多的“判斷”外包給黑箱。 黑箱里不是數學,是概率游戲:哪個片段出現得多,哪個就當選。 人類常識在它那里只是訓練語料的頻次,一旦語料偷懶,常識就塌方。
![]()
我試著手動給模型加括號:請把 9.11 和 9.9 當成兩位小數再比較。 答案終于對了,但它補了一句:謝謝提醒,以后我會注意。 ——我后背一涼,這語氣像極了考完試嘴硬的我:不是不會,只是粗心。
![]()
所以,別急著把 AI 當答案制造機,把它當剛入職的實習生: 能干活,但得有人在旁邊把關,尤其在拿不準小數點的時候。 真要把權力交出去,先問問自己:敢不敢讓這位“11 號樓”實習生替你按核按鈕?
![]()
小數點不會騙人,會騙人的是背后那顆盲目信任的心。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.