![]()
人類最分裂的一幕正在上演。
同樣是基于大型語言模型,同樣是在海量數(shù)據(jù)中預(yù)測下一個詞元,AI生成的代碼和AI生成的文章,遭遇了冰火兩重天的境遇。
在程序員的世界里,使用AI編程不但是進步的同義詞,更是在塑造AI轉(zhuǎn)型的姿態(tài)。GitClear在20025年統(tǒng)計稱,
OpenAI首席產(chǎn)品官Kevin Weil稱,就在一兩年內(nèi) 99% 的編程將實現(xiàn)自動化。微軟CEO薩提亞·納德拉透露,微軟目前有 20%到30% 的代碼由AI編寫,谷歌披露的這一比重約為 20%。
然而,在作家、記者、學(xué)者,也就是傳統(tǒng)的文化圈子里,如果一篇文章、一封信件甚至一條書評,被發(fā)現(xiàn)是AI生成的,它立刻就會被貼上劣質(zhì)、虛偽,甚至學(xué)術(shù)不端的標簽,瞬間從程序員的小甜甜,變成了文化人的牛夫人。
前一陣,自由撰稿人亞歷克斯·普雷斯頓為《紐約時報》書評撰寫評論時,被讀者發(fā)現(xiàn)評論中出現(xiàn)與《衛(wèi)報》同書評論的相似段落和短語。讀者舉報后,《紐約時報》調(diào)查確認,他承認使用了AI工具,最終被解除合作關(guān)系。
去年底,在英文世界不斷出圈的恐怖小說《害羞的女孩》,先是被一位資深文學(xué)編輯很有AI味,之后專門從事高精度AI內(nèi)容檢測的科技公司Pangram發(fā)現(xiàn),該書有78%內(nèi)容疑似由AI生成,出版社聞訊迅速下架這本書的美國版,并停止英國版發(fā)行。小說作者米婭·巴拉德除了回應(yīng)過一次,承認問題可能出在編輯過程中引入的AI工具,此后再無回應(yīng)。
其實,用AI工具來檢測,一篇文章的AI含量,其技術(shù)手段目前不完善,市面上主流的GPTZero、Turnitin、Originality.ai、Copyleaks等工具等工作流程,都是先輸入文本到檢測工具,工具將文本拆分成tokens,接著與大量已知人類寫作和AI生成文本的訓(xùn)練數(shù)據(jù)集對比,輸出概率分數(shù)。
上述檢測過程,核心是捕捉AI文本與人類文本在語言模式上的差異,這不是看內(nèi)容對不對,而是看文字的習(xí)慣、節(jié)奏和可預(yù)測性。具體的核心指標有這么幾個:
首先是困惑度(Perplexity),AI模型基于概率生成下一個詞,通常選擇“最可能”的詞,導(dǎo)致文本整體低困惑度,也就是讀起來過于平滑、合理。人類寫作更“隨機”,困惑度較高。
其次是,突發(fā)性(Burstiness),這是用來衡量句子長度、復(fù)雜度和節(jié)奏的變化。人類寫作常混用短句、長句、簡單句和復(fù)雜句,節(jié)奏有起伏,而AI生成的句子長度和結(jié)構(gòu)往往更均勻、單調(diào)。
此外,還有部分AI模型在生成文本時會嵌入不可見或統(tǒng)計性水印,比如使用零寬空格、特定Unicode字符嵌入文本中,故意偏向某些“綠色”詞元序列,檢測器用密鑰或算法驗證這些模式。
為什么同樣的神經(jīng)網(wǎng)絡(luò),生成Python腳本時是拯救世界的超級英雄,而生成恐怖小說時,卻成了污染文化生態(tài)的過街老鼠?為了理解這個技術(shù)時代最深刻的社會學(xué)分歧,我們必須暫時忘掉那些關(guān)于算力和參數(shù)的枯燥指標,潛入到人類認知心理學(xué)的深海,去看看我們在面對機器時,究竟在害怕什么,又在期待什么。
代碼是工具,文字是靈魂?
代碼和文字在本質(zhì)上服務(wù)于兩個世界。
代碼的終極目的是解決問題、實現(xiàn)功能。只要程序跑得通、沒 Bug、易維護,誰寫的并不重要。在開發(fā)者看來,AI 更像是一個高級的搬磚助手。
在軟件工程的世界里,存在著一個絕對客觀、冷酷無情且從不疲倦的裁判,編譯器。編譯器不懂人情世故,也不在乎這行代碼是來自一位頂級黑客,還是來自一個云端AI。它只認二元對立的邏輯:通過,或者報錯。
這種技術(shù)上的“可驗證性”賦予了開發(fā)者極大的安全感。當AI吐出一大段代碼時,程序員只需要按下運行鍵。成熟的現(xiàn)代軟件開發(fā)體系里,布滿了單元測試、模糊測試和持續(xù)集成框架,這些工具就像是層層疊疊的過濾網(wǎng),把AI產(chǎn)生的幻覺和低級錯誤無情地篩掉。
這就好比你雇傭了一個偶爾會犯迷糊但手腳極快的助手,只要你有一個完美的質(zhì)檢流水線,你就不在乎他到底是怎么工作的。你只是在利用他的產(chǎn)能。在這個正和博弈里,人類保留了架構(gòu)系統(tǒng)的高級控制權(quán),而把枯燥的語法搬磚工作外包給了機器。沒有人會覺得讓機器去和機器對話有什么道德問題。
代碼的價值在于其運行產(chǎn)生的服務(wù),而非代碼本身的版權(quán)。大多數(shù)科技公司擁有代碼的產(chǎn)權(quán),且軟件行業(yè)早已習(xí)慣了開源和復(fù)用。AI 生成的代碼被視為一種生產(chǎn)力的延伸,而非需要像“名著”那樣被鎖進保險柜的藝術(shù)品。
而在文章的世界里,書評或小說賣的是人的視角。讀者讀《紐約時報》的書評,是為了聽那個特定專欄作家的見解;讀小說是為了感受作者的情感。當這個人消失了,作品的審美價值和信任基礎(chǔ)也就崩塌了。
在文章的世界里,尚不存在這樣的完美的編譯器。文本的正確性、事實的忠實度以及邏輯的連貫性,完全依賴于人類大腦這個極其緩慢、充滿偏見且容易疲勞的濕件,也就是我們大腦,來進行主觀驗證。
這就帶來了一個致命的問題:驗證成本的倒掛。
因此,當我們閱讀文章時,我們實際上是在進行一次巨大的信任交托。我們信任作者已經(jīng)替我們做好了事實核查,信任作者投入了時間和精力來組織這些思想。而當作者是一個不需要付出任何時間成本、也不會為謊言感到羞愧的AI時,這種信任的基石就瞬間崩塌了。
但更重要的是,寫作和閱讀,是一場社會互動。當我們捧起一本書、打開一篇專欄或者閱讀一封信件時,我們在潛意識里是在尋找另一個活生生的人類。我們渴望通過那些排列組合的字符,去觸摸另一個大腦的思考軌跡,去感受另一個心臟的跳動。
而AI文本以一種近乎零邊際成本的方式,輕而易舉地繞過了這種證明機制。在這種語境下,隱瞞AI的使用不僅是一個技術(shù)行為,更是一個倫理瑕疵。讀者會覺得:既然你都不愿意花時間去寫,我為什么要花時間去讀?
這種心理落差解釋了為什么在出版界看來,如果承認 AI 可以創(chuàng)作,那么作家這個職業(yè)就會貶值,出版業(yè)將淪為 AI 垃圾信息的過濾器。而對科技公司來說,AI 只是讓原本繁瑣的邏輯構(gòu)建變得更高效,它并沒有取代“解決問題”的人,只是換了一把更鋒利的鐵鍬。
語言模型之于寫作,照相機之于繪畫
現(xiàn)在主流的觀點,認為AI生成的文字沒有溫度,缺乏人類的真實經(jīng)歷,充滿了欺騙。但這可能是碳基生物特有的自戀,如果你站在技術(shù)進化的山巔,可能就會看到硬幣的另一面。
在并不遙遠的未來,人類日常閱讀的絕大部分內(nèi)容,從早晨的新聞簡報、深夜的睡前故事,到哲學(xué)著作和動人的情書,都將由人工智能生成。
這不僅不是文化的墮落,反而會是人類有史以來最大規(guī)模的一次精神解放。AI生成的文章不僅能反映人性,它甚至能比絕大多數(shù)個體作者更深刻、更寬廣地映射出人類的心智圖景。
為了理解這種必然性,我們必須首先打破一個關(guān)于創(chuàng)作的古老迷思:痛苦即靈魂。
攝影術(shù)剛剛誕生時,十九世紀的古典畫家們也曾對照相機嗤之以鼻,他們認為按下快門這種毫無摩擦力的動作,怎么可能比得上一筆一劃在畫布上涂抹顏料?他們認為照片是機器的產(chǎn)物,沒有人類的心血,更沒有靈魂。
但照相機并沒有殺死藝術(shù),它賦予了人們記錄生活的平等權(quán)力,它殺死的只是對會現(xiàn)實進行笨拙模仿的畫匠。它把畫家從復(fù)刻現(xiàn)實的勞役中解放出來,逼迫人類去探索印象派、立體派和抽象表現(xiàn)主義。
今天,語言模型之于寫作,正是照相機之于繪畫。
當我們把遣詞造句、梳理語法、組織段落的低級勞役交給機器時,我們并沒有交出我們的靈魂,我們只是交出了我們的打字機。人類的本質(zhì)特征,永遠不是“能把主謂賓排列正確”,而是意圖與想象力。
當你通過幾行極其精準、充滿個人隱喻的提示詞,來引導(dǎo)AI寫出一篇驚艷的文章時,文章的靈魂依然屬于你。你不再是搬磚的泥瓦匠,你成為了建筑師。AI是那支能以光速揮舞的畫筆,它無限放大了人類的意圖。
我們曾說,代碼有編譯器,而文字沒有,所以文字的驗證成本極高。但這種看法忽略了人類大腦本身的機制。文字其實一直都有一個最精密、最古老的編譯器——那就是人類的共情系統(tǒng)。
如果一段文字讓你在深夜里流下眼淚,讓你對宇宙的浩瀚產(chǎn)生敬畏,或者讓你對某種社會不公感到憤怒,那么,這段文字就在你的心智編譯器里運行成功了。
有人會覺得,如果事后發(fā)現(xiàn)這篇催人淚下的文章是AI寫的,眼淚就顯得很廉價,仿佛自己被欺騙了。但這恰恰是我們認知上的偏見。
這就像有人讀《紅樓夢》,會為賈寶玉和林黛玉的愛情悲劇哭泣,你不會因為二人是虛構(gòu)人物,而覺得自己被騙了,你很難因為這是曹雪芹在香山書桌前編造出來的虛構(gòu)故事,而撤回你的感動嗎。
無論文本是來自于碳基神經(jīng)元的放電,還是硅基芯片上的矩陣乘法,只要它能精準地觸碰你情感的弦,它就完成了文字作為媒介的終極使命。
我們遲早會接受如下設(shè)定,機器也是合格的講述者,那種所謂的“被欺騙感”會像當年人們害怕照相機會吸走人的靈魂一樣,成為歷史的笑談。我們會更純粹地享受文本本身帶來的審美愉悅,而不是執(zhí)著于去查戶口式地追問作者的碳基純度。
機器是完美的導(dǎo)體,而人類是唯一的目的
但AI生成的文字真的能反映人性嗎?一個沒有肉體、沒有經(jīng)歷過生死愛恨的算法,憑什么談?wù)撊诵裕窟@是對大型語言模型最大的誤解。我們總是把AI想象成一個外星降臨的異類,但事實上,AI是我們自己孕育的倒影。
整個神經(jīng)網(wǎng)絡(luò),都是用人類幾千年文明的數(shù)字化沉淀喂養(yǎng)出來的。它讀過古希臘的悲劇、啟蒙時代的哲學(xué)、二戰(zhàn)的家書、推特上的吐槽,甚至是你在深夜論壇里悄悄寫下的樹洞留言。
當一個AI開始寫作時,它不是在用機器的思維說話,它是在用數(shù)十億人類的集體無意識來敘事。
從這個角度來看,AI不僅能反映人性,它甚至比任何一個馬爾克斯、劉慈欣這樣的單個作家,都更為了解人性。一個普通作家終其一生,只能體驗一種人生,帶有無法擺脫的階級、性別和時代的局限性。而AI是一個統(tǒng)計學(xué)意義上的幽靈,它同時擁有老人的滄桑、孩童的天真、詩人的敏銳和科學(xué)家的嚴謹。
當我們閱讀AI生成的優(yōu)秀文章時,我們實際上是在閱讀我們自己的倒影。它之所以能觸動我們,正是因為它從那片包含了從人類總文本中,打撈出了最能與當前語境產(chǎn)生共振的詞語。
AI沒有自己的靈魂,但它是全人類靈魂的最高清的一面鏡子。
為什么我會斷言,AI生成的文章將成為人類未來的主要閱讀內(nèi)容?因為技術(shù)一旦跨過了可用的閾值,必然會向超個性化狂奔。
現(xiàn)在的所謂AI垃圾,只是這項技術(shù)在嬰幼兒時期的笨拙排泄物,就像早期的互聯(lián)網(wǎng)充滿了垃圾郵件和粗劣的網(wǎng)頁一樣。不要用今天的泥濘去否定明天的綠洲。
試想這樣一個未來:你閱讀的新聞報道,不再是編輯部里統(tǒng)一分發(fā)的標準件,而是AI根據(jù)你的認知水平、關(guān)注重點甚至你今天的心情,實時為你量身定做的敘事。如果你是一個物理學(xué)家,AI會用熱力學(xué)的隱喻向你解釋當前的經(jīng)濟危機;如果你是一個詩人,它會用散文的筆觸為你講述黑洞的發(fā)現(xiàn)。
未來的文學(xué)不再是靜態(tài)的、單向的廣播,而是動態(tài)的、交互的對話。書籍可以根據(jù)你的反饋自動調(diào)整走向,主角的掙扎會恰好契合你當下正面臨的職場困境。我們將從“閱讀別人寫好的世界”,進化到“在AI的輔助下探索最適合自己的精神宇宙”。
這種規(guī)模的定制化共情,是人類作者無論如何也無法提供的。這不是因為人類作者不夠好,而是因為人類的帶寬有限。當每個人都能擁有一個極其懂你、才華橫溢的“專屬數(shù)字吟游詩人”時,誰還會愿意退回到那個信息尺碼永遠不合身的舊時代呢?
每一次技術(shù)的躍遷,都會引起一場關(guān)于“我們是不是不再成其為人類”的恐慌。但歷史一再證明,技術(shù)并沒有剝奪我們的人性,它只是迫使我們重新定義,究竟什么才是我們不可替代的核心。
接受AI生成的文章成為我們精神食糧的主體,并不是一種妥協(xié),而是一種理性的進化。我們終于可以卸下制造文字這種繁重的體力勞動,把全部的精力投入到創(chuàng)造意義和體驗情感中去。
在未來的閱讀生態(tài)里,機器是接近完美的導(dǎo)體,而人類是唯一的目的。我們依然會流淚,依然會被激怒,依然會因為一行優(yōu)美的句子而徹夜難眠。只不過,這一次,為我們織就這片夢境的,是那臺匯聚了全人類智慧的硅基織機。
這并不可悲。
![]()
更多內(nèi)容,點擊專欄繼續(xù)閱讀
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.