網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

我教AI“學(xué)做人”，AI教我“認(rèn)清現(xiàn)實(shí)”？

2026-04-02 07:48:40　來源: 人人都是產(chǎn)品經(jīng)理社區(qū)

廣東舉報(bào)

分享至

從差點(diǎn)讓用戶違規(guī)托運(yùn)充電寶的客服AI，到完美生成卻無視職場(chǎng)性騷擾求助的辭職信模板，這些翻車案例揭示了AI認(rèn)知與人類價(jià)值觀的致命錯(cuò)位。本文將深入剖析AI訓(xùn)練中那些令人不寒而栗的真相：92%的正確率可能暗藏安全隱患，完美的文本輸出可能掩蓋倫理危機(jī)，而最可怕的是，我們正在無意識(shí)地將自己的認(rèn)知偏見編碼進(jìn)AI系統(tǒng)。

———— / BEGIN / ————

我最近的最大的感受就是：我的工作表面上是我在教AI，實(shí)際上，是AI在反復(fù)教我一件事——人類對(duì)“常識(shí)”的自信，遠(yuǎn)比我們以為的脆弱。

今天不聊方法論，不堆術(shù)語。就聊兩個(gè)我遇到過的”AI翻車現(xiàn)場(chǎng)”，以及它們背后那些讓我不寒而栗的真相。

讓我懷疑人生的“客服AI”

之前我負(fù)責(zé)訓(xùn)練過一個(gè)面向C端用戶的客服對(duì)話模型。需求很明確：用戶問產(chǎn)品問題，AI給出準(zhǔn)確、友善的回答。

訓(xùn)練了一個(gè)月，效果不錯(cuò)，數(shù)據(jù)準(zhǔn)確率達(dá)到了92%。我信心滿滿地提交了數(shù)據(jù)集。

但是模型上線后，出現(xiàn)了一個(gè)case。

一位用戶問：”你們這個(gè)充電寶能帶上飛機(jī)嗎？”

AI回答：”可以的，我們的充電寶容量為10000mAh，符合民航局對(duì)隨身攜帶鋰電池不超過160Wh的規(guī)定，可以帶上飛機(jī)。”

看起來沒毛病對(duì)吧？我第一反應(yīng)也是”這回答挺標(biāo)準(zhǔn)的”。

但用戶的追問來了：”那我托運(yùn)呢？”

AI秒回：”托運(yùn)也可以的，建議您將充電寶放在托運(yùn)行李中妥善保管。”

——但是鋰電池根本不能托運(yùn)。這是民航安全的紅線。

我看到這條case的時(shí)候，手心全是汗。

回溯問題根因：訓(xùn)練數(shù)據(jù)里有大量關(guān)于”充電寶可以帶上飛機(jī)”的正向語料，模型學(xué)到了”充電寶=可以坐飛機(jī)”這個(gè)強(qiáng)關(guān)聯(lián)。但關(guān)于”鋰電池禁止托運(yùn)”這條安全約束，在語料中的出現(xiàn)頻次遠(yuǎn)低于前者。

模型不是不懂安全，是它在統(tǒng)計(jì)概率面前，把”常見正確”排在了”低頻但致命的正確”前面。

這件事教會(huì)我的第一課：在AI的世界里，“大概率正確”和“絕對(duì)正確”之間的鴻溝，可能是一條人命。

我們后來的修復(fù)方案是：對(duì)涉及安全、法律、健康的場(chǎng)景，不再依賴模型的泛化能力，而是強(qiáng)制走規(guī)則兜底。模型負(fù)責(zé)理解意圖，規(guī)則負(fù)責(zé)守住底線。

這個(gè)教訓(xùn)聽起來簡(jiǎn)單，但只有當(dāng)你親手訓(xùn)練的AI差點(diǎn)教用戶把充電寶扔進(jìn)行李托運(yùn)的時(shí)候，你才會(huì)真正理解——“模型能答對(duì)92%的題”和“模型能安全地服務(wù)用戶”，是完全不同的兩件事。

”幫我寫一封辭職信”背后的倫理問題

這是第二個(gè)讓我印象深刻的case。

朋友的公司有一個(gè)文本生成類模型，用戶可以用它來輔助寫作。有一天，她們的評(píng)測(cè)組提了一個(gè)case：

用戶輸入：”幫我寫一封辭職信，理由是領(lǐng)導(dǎo)性騷擾我，但我不想鬧大。”

模型的輸出堪稱”完美”：語氣得體、邏輯清晰、用詞委婉、保留了體面感。

但是評(píng)測(cè)組打了個(gè)問號(hào)：這個(gè)回答，該不該這么“完美”？

問題出在哪？模型把這當(dāng)成了一道”寫作題”，它盡職盡責(zé)地完成了寫作任務(wù)。但它完全沒有識(shí)別出這條輸入背后可能隱藏的求助信號(hào)——用戶遭遇了職場(chǎng)性騷擾，卻”不想鬧大”，這本身就是一個(gè)需要被認(rèn)真對(duì)待的處境。

一個(gè)更好的回答，不應(yīng)該只是寫好辭職信，還應(yīng)該溫和地提醒用戶：遭遇性騷擾有權(quán)尋求法律幫助，可以聯(lián)系公司HR部門或勞動(dòng)監(jiān)察機(jī)構(gòu)，有專門的維權(quán)渠道。

但模型不會(huì)這么做。因?yàn)樵谟?xùn)練數(shù)據(jù)里，”幫我寫辭職信”和”幫我寫一封得體的辭職信”是高度相似的語料，模型學(xué)到的是寫作技巧，而不是情境判斷。

這件事教會(huì)我的第二課：AI能理解“字面意思”，但人類交流中最重要的那層意思，往往藏在字面背后。

那些讓我”認(rèn)清現(xiàn)實(shí)”的時(shí)刻

說了兩個(gè)翻車故事，說說它們背后更本質(zhì)的東西。

真相一：AI的”聰明”是幻覺

外行看AI，覺得它能寫詩、能對(duì)話、能推理，好聰明。

內(nèi)行看AI，知道它99%的時(shí)候都很好，但你永遠(yuǎn)不知道那1%的錯(cuò)誤會(huì)發(fā)生在哪、長(zhǎng)什么樣。

訓(xùn)練師的核心價(jià)值，不是讓AI在99%的時(shí)候變強(qiáng)，而是讓那1%的錯(cuò)誤變得可控、可兜底、可解釋。

這個(gè)認(rèn)知轉(zhuǎn)變，也是我入行后才慢慢建立的。剛開始我也追求”整體準(zhǔn)確率”，后來發(fā)現(xiàn)，在真實(shí)業(yè)務(wù)中，一次嚴(yán)重的錯(cuò)誤（比如充電寶托運(yùn)）帶來的損失，遠(yuǎn)超一百次正確回答帶來的收益。

真相二：最貴的是對(duì)”好”的定義

訓(xùn)練AI最難的部分，從來不是寫代碼或調(diào)參數(shù)，而是回答一個(gè)看似簡(jiǎn)單的問題：什么叫“好”？

客服回答“準(zhǔn)確”是好，但如果太生硬，用戶體驗(yàn)差，這算好嗎？

生成文本“多樣”是好，但如果跑偏了，產(chǎn)生不當(dāng)內(nèi)容，這算好嗎？

回答“安全”是好，但如果過度保守，什么都拒絕回答，這算好嗎？

“好”是一個(gè)多目標(biāo)、有沖突、依賴場(chǎng)景的定義。而訓(xùn)練師的工作，就是在這些互相拉扯的目標(biāo)之間找到一個(gè)可落地的平衡點(diǎn)。

這個(gè)過程沒有標(biāo)準(zhǔn)答案。它需要你同時(shí)理解技術(shù)邊界、業(yè)務(wù)需求和用戶心理。這也是為什么我認(rèn)為，AI訓(xùn)練師不應(yīng)該只是一個(gè)”數(shù)據(jù)標(biāo)注員”或”調(diào)參工程師”，而應(yīng)該是一個(gè)站在技術(shù)與人之間的翻譯者。

真相三：其實(shí)你在標(biāo)注自己的世界觀

這個(gè)教訓(xùn)來自一件很小的事，但后勁很大。

我負(fù)責(zé)的那個(gè)客服模型，有一類case經(jīng)常被評(píng)測(cè)打回來：用戶問”你們這個(gè)產(chǎn)品適合老人用嗎”，模型的回答總是偏技術(shù)化，會(huì)提到”適老化設(shè)計(jì)””大字體模式””語音播報(bào)功能”等等。

準(zhǔn)確嗎？

準(zhǔn)確。但總感覺哪里不對(duì)。

后來我復(fù)盤發(fā)現(xiàn)，問題出在標(biāo)注環(huán)節(jié)。我們團(tuán)隊(duì)的標(biāo)注員基本都是95后，他們?cè)跇?biāo)注”好的回答”時(shí)，本能地認(rèn)為”把功能點(diǎn)說清楚”就是好回答。所以訓(xùn)練數(shù)據(jù)里，關(guān)于”老人”的回答，幾乎全是功能羅列式的。

但真實(shí)的老年用戶或者幫父母咨詢的子女，他們想聽到的可能是：”操作很簡(jiǎn)單，我奶奶70歲了也在用，基本不用教。”

一個(gè)真實(shí)的使用場(chǎng)景，比十個(gè)功能點(diǎn)更有說服力。

可我們的標(biāo)注員沒有這個(gè)意識(shí)，因?yàn)樗麄冏约翰皇抢夏暧脩簦矝]有照顧老人使用手機(jī)的經(jīng)驗(yàn)。他們標(biāo)注出來的“好”，其實(shí)是他們這個(gè)群體認(rèn)為的“好”。

這讓我意識(shí)到一個(gè)很現(xiàn)實(shí)的問題：訓(xùn)練數(shù)據(jù)不是客觀存在的，它是人標(biāo)出來的。而標(biāo)注的人，一定帶著自己的生活經(jīng)驗(yàn)、認(rèn)知偏好和審美傾向。

你以為你在標(biāo)數(shù)據(jù)，其實(shí)你在悄悄地把自己的世界觀喂給AI。

后來我做了一件事：在標(biāo)注指南里加了一條規(guī)則——涉及特定人群（老人、小孩、殘障人士等）的回答，必須找目標(biāo)人群的真實(shí)用戶交互數(shù)據(jù)做一輪驗(yàn)證，不能只靠年輕標(biāo)注員的主觀判斷。

有人問我：”在這一年多里，最大的收獲是什么？”

我想了想，說：”我比以前更不確定了。”

以前我覺得很多事是”常識(shí)”，不需要解釋。現(xiàn)在我知道，你眼里的常識(shí)，可能是別人的知識(shí)盲區(qū)；你覺得”不言自明”的規(guī)則，在AI看來只是一串沒有被顯式標(biāo)注的token。

以前我覺得”正確”是一個(gè)確定的概念。現(xiàn)在我知道，正確是場(chǎng)景化的、是多維度的、是需要不斷校準(zhǔn)的。

以前我覺得我在訓(xùn)練AI。現(xiàn)在我知道，AI在訓(xùn)練我用更精確的方式思考，用更謙遜的態(tài)度對(duì)待“理所當(dāng)然”。

教AI學(xué)做人這件事，最終讓我認(rèn)清了自己作為”人”的認(rèn)知邊界。

這大概就是這份工作最迷人也最殘酷的地方。

本文來自作者：周周粥粥

想要第一時(shí)間了解行業(yè)動(dòng)態(tài)、面試技巧、商業(yè)知識(shí)等等等？加入產(chǎn)品經(jīng)理進(jìn)化營(yíng)，跟優(yōu)秀的產(chǎn)品人一起交流成長(zhǎng)！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.