![]()
生成式人工智能系統能夠實現真正的創造力嗎?由蒙特利爾大學心理學系的卡里姆·杰爾比教授領導的一項大型新研究,旨在解答這個問題。研究團隊還包括蒙特利爾大學的人工智能先驅、教授約書亞·本吉奧。他們共同進行了迄今為止最廣泛的人類創造力與大型語言模型創造能力的比較。
這些發表在《科學報告》上的發現,顯示出一個重大轉變。生成式人工智能系統現在已經達到了某些創造力指標上能夠超越普通人類的水平。與此同時,研究明確指出,最具創造力的人仍能超越最強AI模型的性能。
人工智能達到了人類平均創造力水平
研究人員評估了多個主要大型語言模型,包括ChatGPT、Claude、Gemini等,并將結果與10萬名人類參與者的數據進行了比較。這一結果標志著一個明確的轉折點。包括GPT-4在內的一些人工智能系統在測量發散性語言創造力的任務中得分高于普通人類。
團隊的研究表明,基于大型語言模型的一些人工智能系統現在可以在明確定義的任務中表現優于普通人類的創造力。這一結果可能令人驚訝——甚至令人不安。但他們的研究也凸顯了一個同樣重要的觀點:即使是最好的人工智能系統,也未能達到最有創造力的人類水平。雖然一些AI模型現在表現優于普通人,但最高層次的創造力人類依然是獨一無二。
研究人員更仔細地觀察時發現,最具創造力的一半人類參與者的平均得分高于所有測試過的人工智能系統。在最有創造力的前10%人群中,這種差異更為明顯。
人類與人工智能如何衡量創造力
為了公平地比較人與機器,研究團隊采用了多種方法。主要工具是發散聯想任務(DAT),這是一項心理測試,旨在測量發散性創造力,即從單一提示中產生多原創且多樣想法的能力。
該DAT由研究合著者Jay Olson創建,要求參與者(無論是人類還是人工智能)生成十個詞,這些詞語的含義盡可能不同。一個高度創意的回應可能會包括諸如“銀河系、叉形、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風、光合作用”這樣的詞匯。
人類在該任務中的表現與其他用于創意生成、寫作和創造性問題解決的成熟創造力測試結果非常相似。雖然該任務基于語言,但不僅僅是測試詞匯量。相反,它觸及了創造性思維中涉及的更廣泛認知過程,跨越多個領域。DAT的另一個優勢是速度快且易于獲取,完成只需兩到四分鐘,且面向公眾在線訪問。
從簡單的文字測試到創意寫作
基于這些結果,研究人員考察了人工智能在這一基本詞聯想任務上的表現是否能轉化為更復雜的創造性活動。為了測試這一點,他們直接比較了人工智能系統與人類參與者在創意寫作任務中的表現。
這些包括寫俳句(一種三行短詩體)、制作電影劇情摘要以及創作短篇故事。同樣,這種模式顯而易見。雖然人工智能有時表現優于普通人類參與者,但最有技能的人類創作者依然展現出明顯優勢。
人工智能的創造力可以被調整嗎?
這些發現引發了一個重要的后續問題。人工智能的創造力可以被塑造或控制嗎?根據研究,確實可以。一個關鍵因素是模型的溫度,這是一種技術設置,影響了AI反應的可預測性和冒險性。
在較低溫度設置下,AI系統往往能產生更安全、更可預測的輸出。在較高溫度下,反應變得更加多樣且不受限制,鼓勵冒險和更具原創性的聯想。
研究人員還發現,提示的寫作方式起著重要作用。例如,鼓勵AI模型利用詞源學考慮詞源和結構的指令,會帶來更多意想不到的想法和更高的創造力分數。這些結果共同表明,人工智能創造力高度依賴人類輸入和指導,使人與機器的互動成為創造過程的核心部分。
人工智能會取代人類創造者嗎?
該研究為人們對人工智能可能取代創意專業人士的擔憂提供了平衡的視角。雖然一些人工智能系統現在可以在特定任務上與人類的創造力媲美,但研究也凸顯了其明顯局限性以及人類創造力持續的重要性。
盡管人工智能現在可以在某些測試中達到人類水平的創造力,但我們需要超越這種誤導性的競爭感。生成式人工智能首先已成為服務于人類創造力的極其強大的工具:它不會取代創作者,而是深刻改變他們想象、探索和創作的方式——為那些選擇使用它的人服務。
這些發現并沒有預測創意職業的終結,而是鼓勵人們以新的方式思考人工智能。這項技術可以作為創意助手,拓展探索和靈感的可能性。創造力的未來可能不再依賴于人類對抗機器,而更多依賴于新型協作形式,其中人工智能支持并增強人類的想象力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.