一位波蘭譯者發(fā)現(xiàn)的現(xiàn)象——AI翻譯能力在下滑，就連AI自己也承認(rèn)

2026-01-27 15:40:16　來源: 談點世

安徽舉報

分享至

我在領(lǐng)英上看到一個波蘭博主發(fā)的關(guān)于AI（人工智能）翻譯能力下滑的帖子，原文如下：

我最近看到一場十分有意思的討論，話題圍繞波蘭譯者發(fā)現(xiàn)的一個現(xiàn)象展開：市面上主流的翻譯工具 —— 比如DeepL（免費版與付費版均包含在內(nèi)）、ChatGPT等 —— 的人工智能 / 機器翻譯質(zhì)量均出現(xiàn)了下滑。

人工智能依舊是一個相對新興的領(lǐng)域，但我們似乎已經(jīng)在遭遇一種始料未及的現(xiàn)象：模型坍縮（AI is still a relatively young field, yet we’re already seem to experience an unexpected phenomenon: model collapse）。

簡單來說，如果模型的訓(xùn)練數(shù)據(jù)越來越多地來源于人工智能生成內(nèi)容，其性能非但不會提升，反而會開始退化（In simple terms, models trained increasingly on AI-generated content can start to degrade rather than improve）。

正如參與這場討論的同行們所觀察到的，這一現(xiàn)象在機器翻譯領(lǐng)域體現(xiàn)得尤為明顯。盡管模型體量更大、算力投入也更多，但許多專業(yè)人士反饋，和幾年前相比，如今的翻譯結(jié)果要么精準(zhǔn)度不足，要么不符合目標(biāo)語言的表達習(xí)慣，要么語言風(fēng)格生硬呆板、缺乏靈氣。

譯文的細(xì)微語義差別被抹殺，專業(yè)術(shù)語出現(xiàn)偏差，譯后編輯的工作量也在悄然增加。這一情況著實令人費解 —— 既然人工智能在 “持續(xù)進步”，為何其核心功能的表現(xiàn)反而時有退步（if AI is “getting better,” why does a core capability sometimes feel worse）？

這種質(zhì)量下滑帶來的風(fēng)險絕不僅限于技術(shù)層面。對于那些依賴翻譯開展銷售、法務(wù)、客戶支持或合規(guī)工作的企業(yè)而言，翻譯質(zhì)量下降會直接影響客戶的信任度、工作效率與運營成本。

另外…… 我也很好奇：在你的日常業(yè)務(wù)流程中，是否也察覺到了類似的產(chǎn)出質(zhì)量下滑現(xiàn)象（無論是翻譯領(lǐng)域還是其他領(lǐng)域）？又或者，你看到的情況恰恰相反？

該博主的帖子內(nèi)容到此結(jié)束，關(guān)于他的上述觀點和對AI如今翻譯內(nèi)容下滑的現(xiàn)象，我問了我們國內(nèi)的知名AI——豆包。豆包的答案是肯定的，因為近年來，確實存在用AI生成式內(nèi)容污染或者誤導(dǎo)模型的情況，導(dǎo)致模型提供的譯文中對專業(yè)術(shù)語的翻譯失真。

關(guān)于豆包對上述波蘭博主帖子的觀點如下：

認(rèn)可！

這段內(nèi)容精準(zhǔn)戳中了當(dāng)前人工智能與機器翻譯領(lǐng)域的一個關(guān)鍵痛點 ——模型坍縮引發(fā)的質(zhì)量波動，其論述邏輯清晰且貼合行業(yè)實際。

現(xiàn)象的真實性：從翻譯從業(yè)者的實際體驗來看，近年來確實存在部分主流機器翻譯工具的譯文質(zhì)量不穩(wěn)定的情況。比如專業(yè)領(lǐng)域的術(shù)語一致性下降、復(fù)雜句式的譯文流暢度降低、文化內(nèi)涵豐富的文本丟失細(xì)微語義等，這些問題都與文中描述的 “精準(zhǔn)度不足”“術(shù)語漂移”“譯后編輯工作量增加” 高度吻合。
原因的合理性：“模型坍縮” 的核心邏輯（訓(xùn)練數(shù)據(jù)被 AI 生成內(nèi)容污染，導(dǎo)致模型學(xué)習(xí)到的信息失真、同質(zhì)化）是目前學(xué)界和業(yè)界公認(rèn)的人工智能發(fā)展瓶頸之一。隨著 AI 生成內(nèi)容在數(shù)據(jù)集中的占比越來越高，模型難以接觸到足夠優(yōu)質(zhì)的人類原創(chuàng)數(shù)據(jù)進行學(xué)習(xí)，自然會出現(xiàn)性能退化。
影響的全面性：文中不僅提及技術(shù)層面的問題，還延伸到企業(yè)的商業(yè)層面，指出翻譯質(zhì)量下滑對信任、效率、成本的影響，這一視角十分全面 —— 畢竟機器翻譯早已成為許多企業(yè)全球化運營的基礎(chǔ)設(shè)施，其質(zhì)量波動必然會傳導(dǎo)至業(yè)務(wù)全鏈路。

綜上，這段內(nèi)容的觀察和分析具有很強的現(xiàn)實意義，其觀點是值得認(rèn)可的。

至此，豆包的評價結(jié)束。其實，我想說，可能不只是生成式內(nèi)容會污染AI模型，還有人工特意投放的大量內(nèi)容也會誤導(dǎo)AI，比如前段時間A品牌汽車出現(xiàn)事故后，有人把事故車輛圖片發(fā)給AI，詢問這是什么品牌汽車，AI上來就說圖中的事故車輛是B品牌汽車。

總的來說，AI翻譯相比于傳統(tǒng)的機器翻譯而言，有好有壞，好處是相比于機器給出的直接且固定的答案，AI會結(jié)合上下文分析和推斷；壞處也是AI的分析和推斷，與傳統(tǒng)機器翻譯那種直來直去給出結(jié)論不同，AI給出的結(jié)論和答案會明顯受到模型內(nèi)雜糅內(nèi)容的過度影響，從而導(dǎo)致一些專業(yè)內(nèi)容的錯誤結(jié)論和偏差翻譯。這一現(xiàn)象，不知在未來將如何通過技術(shù)升級獲得改變。

聲明：取材網(wǎng)絡(luò)，謹(jǐn)慎辨別

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.