我在領(lǐng)英上看到一個波蘭博主發(fā)的關(guān)于AI(人工智能)翻譯能力下滑的帖子,原文如下:
我最近看到一場十分有意思的討論,話題圍繞波蘭譯者發(fā)現(xiàn)的一個現(xiàn)象展開:市面上主流的翻譯工具 —— 比如DeepL(免費版與付費版均包含在內(nèi))、ChatGPT等 —— 的人工智能 / 機器翻譯質(zhì)量均出現(xiàn)了下滑。
人工智能依舊是一個相對新興的領(lǐng)域,但我們似乎已經(jīng)在遭遇一種始料未及的現(xiàn)象:模型坍縮(AI is still a relatively young field, yet we’re already seem to experience an unexpected phenomenon: model collapse)。
![]()
簡單來說,如果模型的訓(xùn)練數(shù)據(jù)越來越多地來源于人工智能生成內(nèi)容,其性能非但不會提升,反而會開始退化(In simple terms, models trained increasingly on AI-generated content can start to degrade rather than improve)。
正如參與這場討論的同行們所觀察到的,這一現(xiàn)象在機器翻譯領(lǐng)域體現(xiàn)得尤為明顯。盡管模型體量更大、算力投入也更多,但許多專業(yè)人士反饋,和幾年前相比,如今的翻譯結(jié)果要么精準(zhǔn)度不足,要么不符合目標(biāo)語言的表達習(xí)慣,要么語言風(fēng)格生硬呆板、缺乏靈氣。
譯文的細(xì)微語義差別被抹殺,專業(yè)術(shù)語出現(xiàn)偏差,譯后編輯的工作量也在悄然增加。這一情況著實令人費解 —— 既然人工智能在 “持續(xù)進步”,為何其核心功能的表現(xiàn)反而時有退步(if AI is “getting better,” why does a core capability sometimes feel worse)?
![]()
這種質(zhì)量下滑帶來的風(fēng)險絕不僅限于技術(shù)層面。對于那些依賴翻譯開展銷售、法務(wù)、客戶支持或合規(guī)工作的企業(yè)而言,翻譯質(zhì)量下降會直接影響客戶的信任度、工作效率與運營成本。
另外…… 我也很好奇:在你的日常業(yè)務(wù)流程中,是否也察覺到了類似的產(chǎn)出質(zhì)量下滑現(xiàn)象(無論是翻譯領(lǐng)域還是其他領(lǐng)域)?又或者,你看到的情況恰恰相反?
該博主的帖子內(nèi)容到此結(jié)束,關(guān)于他的上述觀點和對AI如今翻譯內(nèi)容下滑的現(xiàn)象,我問了我們國內(nèi)的知名AI——豆包。豆包的答案是肯定的,因為近年來,確實存在用AI生成式內(nèi)容污染或者誤導(dǎo)模型的情況,導(dǎo)致模型提供的譯文中對專業(yè)術(shù)語的翻譯失真。
![]()
關(guān)于豆包對上述波蘭博主帖子的觀點如下:
認(rèn)可!
這段內(nèi)容精準(zhǔn)戳中了當(dāng)前人工智能與機器翻譯領(lǐng)域的一個關(guān)鍵痛點 ——模型坍縮引發(fā)的質(zhì)量波動,其論述邏輯清晰且貼合行業(yè)實際。
- 現(xiàn)象的真實性:從翻譯從業(yè)者的實際體驗來看,近年來確實存在部分主流機器翻譯工具的譯文質(zhì)量不穩(wěn)定的情況。比如專業(yè)領(lǐng)域的術(shù)語一致性下降、復(fù)雜句式的譯文流暢度降低、文化內(nèi)涵豐富的文本丟失細(xì)微語義等,這些問題都與文中描述的 “精準(zhǔn)度不足”“術(shù)語漂移”“譯后編輯工作量增加” 高度吻合。
- 原因的合理性:“模型坍縮” 的核心邏輯(訓(xùn)練數(shù)據(jù)被 AI 生成內(nèi)容污染,導(dǎo)致模型學(xué)習(xí)到的信息失真、同質(zhì)化)是目前學(xué)界和業(yè)界公認(rèn)的人工智能發(fā)展瓶頸之一。隨著 AI 生成內(nèi)容在數(shù)據(jù)集中的占比越來越高,模型難以接觸到足夠優(yōu)質(zhì)的人類原創(chuàng)數(shù)據(jù)進行學(xué)習(xí),自然會出現(xiàn)性能退化。
- 影響的全面性:文中不僅提及技術(shù)層面的問題,還延伸到企業(yè)的商業(yè)層面,指出翻譯質(zhì)量下滑對信任、效率、成本的影響,這一視角十分全面 —— 畢竟機器翻譯早已成為許多企業(yè)全球化運營的基礎(chǔ)設(shè)施,其質(zhì)量波動必然會傳導(dǎo)至業(yè)務(wù)全鏈路。
綜上,這段內(nèi)容的觀察和分析具有很強的現(xiàn)實意義,其觀點是值得認(rèn)可的。
![]()
至此,豆包的評價結(jié)束。其實,我想說,可能不只是生成式內(nèi)容會污染AI模型,還有人工特意投放的大量內(nèi)容也會誤導(dǎo)AI, 比如前段時間A品牌汽車出現(xiàn)事故后,有人把事故車輛圖片發(fā)給AI,詢問這是什么品牌汽車,AI上來就說圖中的事故車輛是B品牌汽車。
總的來說,AI翻譯相比于傳統(tǒng)的機器翻譯而言,有好有壞,好處是相比于機器給出的直接且固定的答案,AI會結(jié)合上下文分析和推斷;壞處也是AI的分析和推斷,與傳統(tǒng)機器翻譯那種直來直去給出結(jié)論不同,AI給出的結(jié)論和答案會明顯受到模型內(nèi)雜糅內(nèi)容的過度影響,從而導(dǎo)致一些專業(yè)內(nèi)容的錯誤結(jié)論和偏差翻譯。這一現(xiàn)象,不知在未來將如何通過技術(shù)升級獲得改變。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.