![]()
新智元報道
編輯:艾倫
【新智元導讀】在巴布亞新幾內亞的一個原始部落,情感的中心是肝臟而非心臟;在納米比亞,有一個專門的詞形容「光腳踩在熱沙上」。這些人類經驗的細微差別,正成為AI翻譯難以逾越的「最后且最遠的一英里」。
在巴布亞新幾內亞的叢林深處,阿瓦人(Awa)并不相信心臟是情感的中心。
如果你想對他們表達真誠,你不能說「敞開心扉」,而應該說「敞開你的肝臟」。
而在同一個島嶼的另一端,拉瓦人(Rawa)則堅信,人類的靈魂與情感棲息在胃里。
![]()
這些細微且致命的文化差異,曾是翻譯者數百年來無法逾越的天塹。
但現在,硅谷最前沿的AI正在試圖填平這個天塹。
被遺忘的語料荒漠
對于ChatGPT或Gemini這樣的通用大模型來說,英語是「富人區」,中文和法語是「中產階級」,而像阿瓦語這樣的語言,則是徹底的「貧民窟」。
在AI的訓練集中,英語占據了90%以上的份額。
這種數據的極度不平衡創造了一種「算法霸權」:模型傾向于用英語的邏輯去理解世界。
當你輸入一個復雜的中文成語,AI往往會先將其「腦補」成英文語境下的對應概念,再翻譯回來,導致原意的流失。
而在那些僅有數千人使用的「低資源語言」中,情況更為糟糕。
互聯網上幾乎不存在這些語言的文本數據,AI無書可讀。
威克理夫圣經翻譯會(Wycliffe)手中的《圣經》,往往是這些邊緣語言中唯一存在的長文本。
他們要在2033年前實現「讓所有語言都有譯本」,實現他們愿景中的「基督再臨」。
2022年,Meta開源了名為「不讓任何語言掉隊」的AI模型NLLB-200 (No Language Left Behind)。
相關新文章(非上述舊模型):
扎克伯格的本意或許更多是為了讓他在非洲和亞洲的用戶能更順暢地刷Instagram,從而提升廣告效率,但這個模型意外地成為了語言學家的新寵。
翻譯機構迅速采用了這個本為商業互聯設計的模型,將其微調用于處理那些最晦澀難懂的古老方言。
但有了這個模型,并不是直接萬事大吉了。
AI的幻覺
數據科學家丹尼爾·惠特納克(Daniel Whitenack)發出警告:你不能把經文直接扔進ChatGPT然后坐等結果。
![]()
因為當AI遇到它不懂的領域時,它不會沉默,它會撒謊,也就是AI幻覺。
以《圣經》翻譯為例,這簡直是AI的噩夢。
新約由一種并不規范的古希臘語寫成,充滿了歧義。
比如主禱文中「賜給我們今日的epiousion飲食」,至今無人確切知曉這個詞的含義,學者們只能妥協地譯為「日常」。
當AI面對這種模糊性時,它傾向于根據概率「猜」一個最通順的詞,而不是最準確的詞,而這可能導致嚴重的語義偏離。
如今,一個算法權重的微小波動,可能就會在毫秒間改寫這個定義。
更荒謬的例子發生在日常翻譯中。
有研究發現,當處理極低資源語言時,AI有時會陷入「振蕩性幻覺」,開始像念經一樣無限重復某個單詞;或者產生「分離性幻覺」,即翻譯出的句子通順優美,但內容與原文毫無關系,仿佛是機器自己在編故事。
在商業文檔中,這種錯誤或許只是把「環保的」(Eco-friendly)錯譯為「經濟的」(Econ-friendly),但在文化傳承或法律文本中,這種「一本正經的胡說八道」是致命的。
沒有身體的翻譯官
AI最大的強項和軟肋,在于它沒有肉身。
它從未感受過饑餓、寒冷或疼痛,因此它無法真正理解那些基于生理體驗的隱喻。
在納米比亞的魯匡阿里語(Rukwangali)中,有一個詞叫「Hanyauku」,特指「腳尖踩在滾燙沙子上走路」的動作。
對于生活在沙漠邊緣的人來說,這是一個極具畫面感的日常詞匯。
但對于生活在服務器機房里的AI來說,這是一串無法解碼的亂碼。
同樣,「攻城錘」(battering-ram)這個詞,在許多和平的原始部落語言中根本不存在。
人類譯者會創造性地將其意譯為「撞擊城門的巨大木桿」或「戰爭機器」,而AI可能會直接卡死,或者生硬地音譯一個沒人聽得懂的新詞。
![]()
這就是為什么「人」依然是翻譯閉環中不可或缺的一環。
IllumiNations聯盟雖然利用AI將新約的翻譯周期從十幾年縮短到了兩年,但他們強調,AI只是完成了初稿。
原本需要在叢林中耗費數十年學習語言的傳教士,現在變成了「高級編輯」。
他們的工作重心從「從零翻譯」轉變為「糾正機器的文化盲區」。
在巴布亞新幾內亞,只有深諳當地文化的人類,才懂得把「接受耶穌進入心臟」改為「進入肝臟」。
這種對「痛點」和「笑點」的精準捕捉,是目前硅谷最昂貴的算力也無法模擬的。
翻譯的最后一公里
這不僅是關于《圣經》的故事,更是關于人類溝通終極困境的寓言。
我們在試圖構建一種通用的理解工具,但語言本身卻是極其私人和部落化的。
每一個「不可翻譯」的詞匯背后,都是一種獨特的生活方式。
蘇格蘭語里的Tartle(介紹人時突然忘了對方名字的尷尬),日語里的きょういくママ(虎媽,熱衷于雞娃的母親),意大利語里的abbioccio(飽餐后的困倦與滿足),這些詞匯構成了人類經驗的拼圖。
AI正在幫我們以此前難以想象的速度拼湊這幅拼圖。
它像一架推土機,推平了語言學習的門檻,讓知識的流動不再受限于國界。
但推土機無法完成最后的精調。
2033年的目標或許能夠達成,但那將是人機協作的勝利。
在技術的盡頭,依然站著一個需要被理解的人。
參考資料:
https://www.economist.com/culture/2025/12/11/the-race-to-translate-the-bible-into-every-language-by-2033
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.