網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

ChatGPT文風(fēng)，原產(chǎn)地肯尼亞

2025-12-17 16:04:21　來源: 量子位

北京舉報(bào)

分享至

ChatGPT文風(fēng)奇怪的原因（俗稱AI味兒很濃）找到了！

肯尼亞作家：都是跟我們學(xué)的。

就在最近，一位肯尼亞作家的“控訴貼”登上Hacker News熱榜——

我是肯尼亞人。不是我的寫作風(fēng)格和ChatGPT一樣，而是ChatGPT寫作風(fēng)格和我一樣。

一點(diǎn)進(jìn)去才知道，原來這位朋友連續(xù)精心撰寫的好幾篇文章都被退稿了，而且理由還都是“太像ChatGPT”。

emmm……一想到自己從小接受的教育都是“文章必須像一座完美的大廈”、“你必須展現(xiàn)豐富的詞匯量”，而現(xiàn)在卻被誤認(rèn)為出自AI，這位朋友實(shí)在忍不住發(fā)出怒吼：

對(duì)于那些熱衷于偵查數(shù)字虛假性的偵探們，我想說：朋友，歡迎來到肯尼亞教室、會(huì)議室或公司內(nèi)部Teams聊天室里一個(gè)典型的星期二。你們所認(rèn)為的機(jī)器指紋，實(shí)際上卻是我們教育的化石記錄

而且很早就有消息指出，為了節(jié)省人力成本，很多AI模型廠商會(huì)把RLHF這類工作交給非洲人，所以模型的很多用語習(xí)慣也會(huì)偏向非洲那邊。

所以我們有理由懷疑，難道ChatGPT真是從肯尼亞“偷師”寫作技巧的？

咱這就火速圍觀一下——

“ChatGPT無意中在模仿我們”

事情是這樣的。

來自肯尼亞的Marcus Olang’（以下簡稱小馬）最近發(fā)文控訴，從年初收到第一條回復(fù)開始，他就陷入了需要“自證不是AI”的困境中。當(dāng)時(shí)甲方給的回復(fù)是：

你寫的挺好，邏輯也扎實(shí)，就是……能不能用更“像人”的方式重寫一下？現(xiàn)在這個(gè)感覺，有點(diǎn)太像ChatGPT寫的了。

而且不止是他，他身邊的很多作家朋友也都收到了類似反饋。

而在仔細(xì)對(duì)比了自己和ChatGPT所寫內(nèi)容之后，小馬最終無奈發(fā)現(xiàn)——別說，你還真別說，咱們的文風(fēng)確實(shí)很像ChatGPT。

從某種意義上說，指控者并非完全錯(cuò)誤。我的寫作風(fēng)格確實(shí)與大語言模型的輸出結(jié)果有幾分相似。
我們都傾向于使用結(jié)構(gòu)嚴(yán)謹(jǐn)、平衡的句子。我們都喜歡使用過渡詞，以確保邏輯流暢。我們都會(huì)偶爾使用（如今看來似乎成了罪證）連字符、分號(hào)或破折號(hào)來連接相關(guān)的想法，使其比簡單的句號(hào)更顯優(yōu)雅。

不過在小馬看來：

諷刺之處在于，這種諷刺或許會(huì)讓我們的祖先會(huì)心一笑。

他表示，不是自己寫得像ChatGPT，而是ChatGPT無意中在模仿他們——模仿他們這一代，以及過去幾代在全球南方，尤其是在像肯尼亞這樣的地方，經(jīng)過嚴(yán)苛教育體系“鍛造”出來的人。

從小到大，小馬接受的寫作指導(dǎo)都是講求規(guī)范、講求精心遣詞造句（是誰DNA又動(dòng)了？）。

我們從小被教導(dǎo)，文章必須像一座完美的大廈。引言是地基，主體是承重墻，結(jié)論是封頂，必須堅(jiān)固、對(duì)稱、無懈可擊。我們要用“首先、其次、最后”來構(gòu)建邏輯，要用“此外、然而、因此”來精確轉(zhuǎn)折，要用“光輝燦爛”、“精疲力竭”這樣的“好詞”來展現(xiàn)詞匯量。
這種寫作，是我們的敲門磚，是我們在KCPE（小學(xué)畢業(yè)考試）決定命運(yùn)的四十分鐘里必須掌握的生存技能，是我們向上攀爬的階梯。它嚴(yán)謹(jǐn)、清晰、富有說服力，但也因此，在今天某些人的耳朵里，它聽起來“缺乏人性的溫度”。

而這一套恰巧也被AI學(xué)去了。

諷刺來了，AI大模型（比如ChatGPT）正是從海量的書籍、論文、報(bào)告中學(xué)習(xí)寫作的。而這些文本庫中，充滿了歷史沉淀下來的、經(jīng)典的、正式的書面語——也就是我們被訓(xùn)練去模仿的那種文體。所以，當(dāng)AI為了顯得“權(quán)威”和“可信”而輸出時(shí)，它的文風(fēng)自然就與我所受的教育產(chǎn)生了詭異的“孿生”效應(yīng)。

所以，如今面對(duì)“文風(fēng)像AI”的指責(zé)，小馬憤而吐槽：

這臺(tái)機(jī)器為了顯得權(quán)威，最終聽起來卻像個(gè)英語作文得了“A”的肯尼亞小學(xué)畢業(yè)考試（KCPE）畢業(yè)生。它無意中復(fù)制了大英帝國的語言幽靈。

而且他還提到，現(xiàn)存的一些AI檢測器往往更傾向于將流暢、邏輯嚴(yán)密、句式規(guī)整的文本標(biāo)記為AI生成，而這恰恰是許多非英語母語者（尤其接受過嚴(yán)格正式寫作訓(xùn)練的人）的寫作特點(diǎn)，所以他們也更容易被誤判。

總之，小馬用自己的親身經(jīng)歷告訴大家——

由于歷史原因，一些非英語母語者的寫作，本就是現(xiàn)有AI模型的“教材”，而現(xiàn)在他們卻成了AI普及后的“受害者”。

這一說法也紛紛獲得了網(wǎng)友們的認(rèn)同：

不過，令人啼笑皆非的是，小馬的這篇感情飽滿、“活人感”很強(qiáng)的文章，竟然還是被Pangram網(wǎng)站判定為100%由AI生成。

啊這……小馬不語，小馬只是一味生氣吐血（doge）。

因非洲人做RLHF，ChatGPT還愛用“delve”一詞

而基于類似理由，人們還發(fā)現(xiàn)，ChatGPT似乎對(duì)“delve”（挖掘、深入研究）這個(gè)詞情有獨(dú)鐘。

《衛(wèi)報(bào)》曾有一篇文章指出，Jeremy Nguyen這位來自墨爾本斯威本科技大學(xué)的AI專家發(fā)現(xiàn)——

在PubMed這類專業(yè)學(xué)術(shù)網(wǎng)站上，“delve”的出現(xiàn)頻率在近幾年激增了10到100倍。

（PubMed主要收錄了80余國5200+生物醫(yī)學(xué)期刊，總量超3900萬條文獻(xiàn)。）

這暗示了，有大量研究人員可能在用ChatGPT輔助寫作，并將其偏好的詞匯帶入了正式學(xué)術(shù)文本。

這一現(xiàn)象還引來馬斯克和YC聯(lián)合創(chuàng)始人保羅·格雷厄姆的關(guān)注，后者發(fā)帖表示：

有人給我發(fā)了一封帶“delve”一詞的郵件，而這個(gè)詞表明文本大概率是AI生成的（暗示對(duì)方用AI寫項(xiàng)目書，還要找他投資hhh）。

并且就在格雷厄姆發(fā)帖之后，ChatGPT官號(hào)還用這個(gè)詞公開整活，繼而引來無數(shù)網(wǎng)友跟風(fēng)。

不過，進(jìn)一步的數(shù)據(jù)分析顯示，“delve”遠(yuǎn)非孤例——

像“explore”、“tapestry”、“testament”和“l(fā)everage”等詞匯，在ChatGPT生成的文本中出現(xiàn)頻率也異常地高。

《衛(wèi)報(bào)》在文章中詳細(xì)揭開了這背后的謎底——

為了將大語言模型“馴化”成安全、有用、可控的聊天機(jī)器人，企業(yè)一般會(huì)雇傭大量人類測試員，讓他們與模型互動(dòng)并提供反饋（如點(diǎn)贊/點(diǎn)踩，或撰寫理想的回復(fù)）。

模型從這些海量的人類偏好數(shù)據(jù)中學(xué)習(xí)，從而調(diào)整自己的行為，也即所謂的RLHF（基于人類反饋的強(qiáng)化學(xué)習(xí)）。

而出于人力成本考量，RLHF這項(xiàng)勞動(dòng)密集型工作被大量外包給了肯尼亞、尼日利亞等英語區(qū)的非洲國家。

對(duì)這些國家來說，“delve”這樣的詞正是他們?nèi)粘Ｉ钪凶匀弧⒁?guī)范的商務(wù)或?qū)W術(shù)英語，因此被高頻使用。

所以這些詞也就自然在ChatGPT中高頻出現(xiàn)了。

BTW，你還有哪些小技巧來鑒別某項(xiàng)內(nèi)容是出自AI之手嗎？

有網(wǎng)友先給大家打個(gè)樣了：

“幼獸般的嗚咽”、“瞳孔縮成針尖”……嗯，一般人屬實(shí)想不到了（doge）。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.