<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI模型首次實現與人類專家等同的語言分析能力

      0
      分享至


      摘要

      當 OpenAI 的 o1 模型在無訓練語料的虛構語言中,表現出精準繪制句法樹、破解中心遞歸、厘清單句歧義并自主發現音系規則的能力后,語言學家不得不重新回答那個古老問題:如果語言曾被視為人類最后的“專屬領地”,人類再次追問語言的獨特性究竟還剩多少?

      關鍵詞:LLMs;語言能力;遞歸;句法樹;音系推理

      來源:集智俱樂部

      作者:Steve Nadis

      譯者:任筱芃

      審校:趙思怡

      如果語言是人之所以為人的特性,那么當大語言模型獲得了“元語言”能力,這又意味著什么?

      在人類擁有的無窮多量的能力中,哪些是人類獨有的?至少從亞里士多德開始,語言就一直是首要的備選答案。他曾寫道,人類是“擁有語言的動物”。盡管像 ChatGPT 這樣的大語言模型在表面上復制了日常言談,但研究人員想知道,人類語言的某些特定方面是否獨特到在其他動物或人工智能設備的通信系統中根本不存在對應物。


      Noam Chomsky,語言學家

      研究人員尤其一直在探索語言模型在多大程度上能夠對語言本身進行推理。對于語言學界的一些人來說,語言模型不僅沒有推理能力,而且也沒有對應的潛力。著名語言學家諾姆·喬姆斯基(Noam Chomsky)與伊恩·羅伯茨(Ian Roberts)、杰弗里·瓦圖穆爾(Jeffrey Watmull)在 2023 年聲明了這一觀點,他們當時在《紐約時報》上寫道:“對語言的正確解釋是復雜的,不能僅僅通過沉浸在大數據中就學會?!边@些研究人員認為,人工智能模型或許擅長使用語言,但它們沒有能力以復雜的方式分析語言。


      Ga?per Begu?, 加州大學伯克利分校語言學家

      這一觀點在最近的一篇論文——《Large linguistic models: Investigating LLMs’ metalinguistic abilities》——中受到了挑戰,該論文由加州大學伯克利分校的語言學家 Ga?per Begu?、最近在伯克利獲得語言學博士學位的 Maksymilian D?bkowski 以及羅格斯大學的 Ryan Rhodes 共同撰寫。研究人員讓多個大語言模型接受了一系列語言學測試——其中一項測試是讓大語言模型歸納一種虛構語言的規則。雖然大多數大語言模型未能像人類那樣解析語言規則,但其中一個模型展現出了令人印象深刻的能力,遠遠超出了預期。它能夠像語言學專業的研究生一樣分析語言——繪制句子結構圖、解析多種歧義,并利用像遞歸recursion)這樣的復雜語言特性。Begu? 說,這一發現“挑戰了我們對人工智能潛力的理解”。


      Tom McCoy, 耶魯大學計算語言學家

      “這項新工作既及時又‘非常重要’,”耶魯大學計算語言學家 Tom McCoy 說道(他并未參與這項研究)“隨著社會對這項技術的依賴程度越來越高,了解它在哪些方面可能成功以及在哪些方面可能失敗變得日益重要。”他補充說,語言分析是評估這些語言模型在多大程度上能像人類一樣推理的理想試驗臺。

      無限的復雜性

      對語言模型進行嚴格的語言學測試,挑戰的一部分是確保它們事先并不知道答案。這些系統通常在海量的書面信息上進行訓練——不僅包括互聯網上的大量內容(涵蓋幾十甚至上百種語言),還包括語言學教科書。理論上,模型可能只是死記硬背了訓練時見過的內容,然后在測試中原樣輸出。

      為了避免這種情況,Begu? 和他的同事設計了一個分為四個部分的語言學測試。其中三個部分要求模型使用樹狀圖來分析特制的句子,這種圖表最早由喬姆斯基在其 1957 年的里程碑式著作《句法結構》(Syntactic Structures)中引入。這些圖表將句子分解為名詞短語和動詞短語,然后再進一步細分為名詞、動詞、形容詞、副詞、介詞、連詞等。

      測試的另一部分則聚焦于遞歸——也就是把短語嵌套進其他短語的能力。比如,“The sky is blue”(天空是藍色的)是一個簡單的英語句子。“Jane said that the sky is blue”(簡說天空是藍色的)則把原句嵌套進了一個更復雜的結構中。重要的是,這種遞歸過程可以無限進行。“Maria wondered if Sam knew that Omar heard that Jane said that the sky is blue”(瑪麗亞想知道薩姆是否知道奧馬爾聽說簡說天空是藍色的)雖然聽起來有點拗口,但在語法上仍然是正確的遞歸句。

      遞歸不僅是語言的關鍵要素,也是自然界的一個特征。例如,在加拿大北部的維多利亞島上,人們可以找到一個位于島上湖泊中的小島。但那個小島本身又位于一個更大的島上的湖泊中。這個最里面的無名島是已知最大的“三階”島嶼,它有時被開玩笑地稱為“盜夢島”(Inception Island),源于 2010 年克里斯托弗·諾蘭執導的電影《盜夢空間》(Inception),影片中角色們會進入夢中夢的夢中世界。

      遞歸一直被喬姆斯基等人稱為人類語言的決定性特征之一。實際上,它或許也是人類思維的決定性特征。語言學家認為,正是遞歸的無限潛力,使得人類語言能夠用有限的詞匯和有限的規則,生成無限多的可能句子。到目前為止,還沒有令人信服的證據表明其他動物能夠以復雜的方式使用遞歸。

      遞歸可以發生在句首或句尾,但最難掌握的形式是發生在句中的中心嵌入center embedding)。例如,從“the cat died(貓死了)”變成“the cat the dog bit died(狗咬了的那只貓死了)”。

      Begu? 的測試向語言模型輸入了 30 個包含復雜遞歸例子的原創句子。例如:“The astronomy the ancients we revere studied was not separate from astrology?!保ㄎ覀兂缇吹墓湃怂芯康奶煳膶W與占星術并非涇渭分明。)使用句法樹,其中一個語言模型——OpenAI 的 o1——能夠確定該句子的結構如下:

      The astronomy [the ancients [we revere] studied] was not separate from astrology. 我們崇敬的古人所研究的天文學與占星術并非涇渭分明。

      該模型隨后更進一步,為該句子添加了另一層遞歸:

      The astronomy [the ancients [we revere [who lived in lands we cherish]] studied] was not separate from astrology. 我們所尊敬的那些生活在我們珍視的土地上的古人所研究的天文學與占星術并非涇渭分明。

      Begu? 和其他一些人沒有預料到,這項研究會發現一個具有更高層次“元語言”(metalinguistic)能力的 AI 模型——正如他所說,這“不僅是使用語言的能力,更是思考語言的能力”。


      David Mortensen, 卡內基梅隆大學計算語言學家

      “這是他們論文中‘引人注目’的方面之一,”卡內基梅隆大學的計算語言學家 David Mortensen 說道。關于語言模型是否只是在預測句子中的下一個詞或語言學上的標記 (token)一直存在爭議。這種能力與人類對語言的深刻理解有著本質區別?!罢Z言學界的一些人曾說,大語言模型并不是真的在‘處理’語言,”他說?!斑@項研究看起來像是否定了那些說法?!?/p>

      你什么意思?

      McCoy 對 o1 模型的整體表現感到驚訝,尤其是它識別歧義的能力,他說,這是眾所周知的計算語言模型難以捕捉的東西。人類“擁有大量的常識知識,使我們能夠排除歧義。但計算機很難擁有那種程度的常識知識。”

      例如“Rowan fed his pet chicken”這樣的句子,既可以描述羅文(Rowan)喂了他當寵物養的雞,也可以描述他喂了他的(大概是更傳統的意義上的)動物伴侶一頓雞肉。o1 模型正確地生成了兩棵不同的句法樹,一棵對應句子的第一種解釋,另一棵對應第二種解釋。

      研究人員還進行了一些與音系學(phonology)相關的實驗。該學科研究聲音的模式以及最小聲音單位——稱為音位 (phonemes) ——的組織方式。為了像母語者一樣流利地說話,人們會遵循一些音系規則,這些規則可能是通過練習習得的,而從未被明確教授過。例如,在英語中,在以“g”結尾的單詞后添加“s”會產生“z”音,如“dogs”。但是,在以“t”結尾的單詞后添加“s”,發音則更接近標準的“s”,如“cats”。

      在音系學任務中,研究小組創造了 30 種新的“迷你語言”(Begu? 稱之為),以測試大語言模型是否能在沒有任何先驗知識的情況下正確推斷出音系規則。每種語言包含 40 個虛構詞。以下是其中一種語言的示例詞:

      θalp ?ebre ei?z? ga?rbo?nda? ?i?z?ee?jo

      然后,他們要求語言模型分析每種語言的音系過程。對于上面這種語言,o1模型正確地寫出:“當一個元音緊接在一個既是濁音又是阻礙音(obstruent)的輔音之后時,它就會變成一個氣聲元音(breathy vowel)”—— 阻礙音是一種通過限制氣流形成的音,比如“top”中的“t”。

      這些語言是新發明的,所以 o1 不可能在訓練期間接觸過它們?!拔覜]想到結果會如此出色,如此令人印象深刻,”Mortensen 說。

      非得是人類嗎?

      這些語言模型能走多遠?它們會僅僅通過變得更大——疊加更多的計算能力、更復雜的結構和更多的訓練數據——就無限地變得更好嗎?還是說,人類語言的某些特征是我們物種獨有的進化過程的結果?

      最近的研究結果表明,這些模型原則上可以進行復雜的語言學分析。但是,目前還沒有一個模型能提出任何原創性的東西,也沒有教會我們任何關于語言的、我們以前不知道的知識。

      如果模型的改進真的只是增加計算能力和訓練數據的問題,那么 Begu? 認為語言模型最終將在語言技能上超越我們。Mortensen 則表示,當前的模型有一定局限性?!八鼈儽挥柧殎碜鲆患浅>唧w的事情:給定一個標記(tokens)或單詞的歷史,預測下一個標記,”他說。“由于它們被訓練的方式,它們在概括方面存在一些困難。”

      但考慮到最近的進展,Mortensen 表示,他看不出任何理由語言模型最終不會表現出超越人類的語言理解能力?!坝貌涣硕嗑?,我們就能打造出用更少數據做出更好泛化、且更具創造力的模型?!?/p>

      Begu? 指出,新結果正一步步“削平”那些曾被視為人類語言專屬領地的特性。“看起來,我們并沒有我們以為的那么獨一無二?!?/p>

      參考文獻

      https://www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html

      閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

      https://wx.zsxq.com/group/454854145828


      未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      當美國海軍突襲中國貨船時,外界普遍認為北京只能默默承受損失。

      當美國海軍突襲中國貨船時,外界普遍認為北京只能默默承受損失。

      安安說
      2025-12-21 14:41:07
      印度外長:中方不能跨過印度所劃紅線,否則印度會支持臺灣。

      印度外長:中方不能跨過印度所劃紅線,否則印度會支持臺灣。

      百態人間
      2025-12-25 16:44:21
      保護心臟,朝左睡還是朝右睡好?醫生:若想心臟健康,做好...

      保護心臟,朝左睡還是朝右睡好?醫生:若想心臟健康,做好...

      袁醫生課堂
      2025-12-25 07:34:23
      曝37歲福原愛近況!即將誕下3胎,二婚老公公開,自稱現在很幸福

      曝37歲福原愛近況!即將誕下3胎,二婚老公公開,自稱現在很幸福

      建康啊你可以的
      2025-12-26 02:57:12
      高市早苗支持率居高不下!高達75.9%,年輕人支持率突破92%

      高市早苗支持率居高不下!高達75.9%,年輕人支持率突破92%

      環球熱點快評
      2025-12-24 14:13:34
      國防部:解放軍全時待戰、隨時能戰、戰之必勝

      國防部:解放軍全時待戰、隨時能戰、戰之必勝

      界面新聞
      2025-12-25 15:58:25
      朱孝天致歉

      朱孝天致歉

      觀察者網
      2025-12-25 23:22:13
      光刻機大消息!國產設備龍頭1.1億元中標,660億概念股直線拉升

      光刻機大消息!國產設備龍頭1.1億元中標,660億概念股直線拉升

      21世紀經濟報道
      2025-12-25 23:10:48
      魯比奧再次回應高市涉臺言論,不怕中國打日本,就怕中國不打日本

      魯比奧再次回應高市涉臺言論,不怕中國打日本,就怕中國不打日本

      安珈使者啊
      2025-12-24 14:43:46
      上海環衛工手搓熱門IP爆火 落葉限定版“星星人”上新

      上海環衛工手搓熱門IP爆火 落葉限定版“星星人”上新

      上觀新聞
      2025-12-25 11:28:04
      鄭柵潔作報告:我委認真分析研判,2026年春節放假9天并減少調休,回應了社會期待

      鄭柵潔作報告:我委認真分析研判,2026年春節放假9天并減少調休,回應了社會期待

      大風新聞
      2025-12-25 12:21:03
      中組部:公職人員退休后未經批準經商(包括當律師)的,不再保留黨政機關退休金等待遇

      中組部:公職人員退休后未經批準經商(包括當律師)的,不再保留黨政機關退休金等待遇

      新浪財經
      2025-11-18 12:46:38
      大量網友相信強力磁鐵可讓燃氣表變慢,專家:竊氣嚴重可刑事處罰

      大量網友相信強力磁鐵可讓燃氣表變慢,專家:竊氣嚴重可刑事處罰

      映射生活的身影
      2025-12-20 03:39:27
      A股:大盤精準漲到3959.62點,不出意外的話,周五行情這么走!

      A股:大盤精準漲到3959.62點,不出意外的話,周五行情這么走!

      風風順
      2025-12-26 00:00:03
      退休5年后發現:曾經讓我難以啟齒的2000元退休金,還有這7大好處

      退休5年后發現:曾經讓我難以啟齒的2000元退休金,還有這7大好處

      小馬達情感故事
      2025-12-24 11:45:03
      外交部:中方愿同洪方一道在一個中國原則基礎上共同推動中洪關系不斷向前發展

      外交部:中方愿同洪方一道在一個中國原則基礎上共同推動中洪關系不斷向前發展

      環球網資訊
      2025-12-25 15:27:05
      43歲日本名模富永愛宣布懷孕!九頭身比例+硬朗的骨相,又美又颯

      43歲日本名模富永愛宣布懷孕!九頭身比例+硬朗的骨相,又美又颯

      明星私服穿搭daily
      2025-12-22 15:57:48
      獨生子女父母退休金加5%?社保局排起長隊,真相到底如何?

      獨生子女父母退休金加5%?社保局排起長隊,真相到底如何?

      甜檸聊史
      2025-12-25 10:20:48
      首例!呼和浩特危樓要原址重建22層新居!預計2027年完工交付!

      首例!呼和浩特危樓要原址重建22層新居!預計2027年完工交付!

      荷蘭豆愛健康
      2025-12-25 16:27:39
      上海人不會驚訝也不會好奇的,最多再多送你一句上海話:“巴子”

      上海人不會驚訝也不會好奇的,最多再多送你一句上海話:“巴子”

      上海云河
      2025-12-24 22:38:31
      2025-12-26 04:00:49
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4420文章數 37357關注度
      往期回顧 全部

      科技要聞

      小米17Ultra發布,徠卡2億像素 ,6999元起

      頭條要聞

      俄軍中將在汽車炸彈爆炸中身亡 俄軍報復

      頭條要聞

      俄軍中將在汽車炸彈爆炸中身亡 俄軍報復

      體育要聞

      約基奇有多喜歡馬?

      娛樂要聞

      朱孝天把阿信好意當球踢!

      財經要聞

      新規來了,年化超24%的小貸被即刻叫停

      汽車要聞

      速來!智界在上海西岸準備了年末潮流盛典

      態度原創

      家居
      游戲
      教育
      親子
      藝術

      家居要聞

      經典彌新 品味浪漫居所

      逆水寒頂流主播沉迷倩女!三界的魅力藏不住了

      教育要聞

      突發!外語類保送政策巨變,南外還有優勢嗎?

      親子要聞

      三歲打娘娘會笑,三十打娘娘上調,教子有方家興旺教子無方家敗光

      藝術要聞

      你絕對沒見過的美麗風景,快來看看!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲va在线∨a天堂va欧美va| 丁香色婷婷国产精品视频| 浴室人妻的情欲hd三级国产| 国产日产欧产系列| 久久国产成人高清精品亚洲| 欧美日韩一级视频| 99国精产品自偷自偷综合| 亚洲精品成人AV无码| 亚洲综合av在线在线播放| 99热国产成人最新精品| 中文字幕av久久爽Av| 黑山县| 精品 日韩 国产 欧美 视频| 婷婷四房色播| 夜爽8888视频在线观看| 黑丝足交在线| 插入中文字幕在线一区二区三区| 午夜福利精品国产二区| 国产综合久久久久久鬼色| 色亚洲无码| 91精品国产综合久久久蜜臀酒店| 国产精品xxxxx| 爆乳女仆高潮在线观看| 开心五月色婷婷综合开心网| 人妻少妇精品无码专区动漫| 亚洲精品在线成人| yy111111少妇无码影院| 亚洲精品无码专区在线| 国产精品天干天干综合网| 国产视频99| 国产乱码一区二区三区| 国产一区二区三区不卡av| 成人精品区| 新干县| 99噜噜噜在线播放| 性荡视频播放在线视频| 黑人变态另类videos| 衡阳县| 国产日韩成人内射视频| 中文字幕三四区男人| 天堂一区在线观看|