![]()
2025年10月1日,微軟發布《GenAI對課堂學習成效的影響:實證研究述評》(Learning outcomes with GenAI in the classroom: A review of empirical evidence)報告。
該報告綜述了GenAI對正規教育學習成效影響的最新實證證據,旨在為教育工作者提供關于使用基于大語言模型(LLM)學習工具時確保學生獲得學習成效的核心關切概覽,并以研究為依據給出課堂應用決策指南。
該報告分為四部分,首先,厘清教育界與產業界在采納AI目標上的根本不同;接著,深入剖析生成式AI如何影響學習條件中的關鍵變量;進而,系統評估其使用如何關聯并影響布魯姆分類法中的各層學習目標;最終,指向未來,探討生成式AI工具為何及如何增加教學復雜性以實現更優的學習成效。
各部分主要觀點如下:
1.教育范式與產業需求的差異
報告指出,"為就業做準備"常被視為當前教育的目的。然而,盡管正規教育對健康的產業發展至關重要,但這兩者的直接目標并不相同。
在產業界,生產力是核心目標——這是一個可量化的標準,而新型自動化技術能夠提升這一指標。
正規教育的目標則在于"讓學習者掌握兼具持久性與適應性的知識與技能"。
因此,任務完成的速度、數量和便捷性在工作場所中比在課堂中更為重要,在教學場景中,學習本身需要經歷某種必要的磨礪過程。
這意味著,如何在課堂上部署GenAI以支持學習目標,與產業如何利用該技術實現自動化效益截然不同。產業界主要著眼于提升生產效率。而教育工作者的優先考量截然不同:教學層面的關切包括教育公平性問題、培養學生批判性思維能力的必要性,以及GenAI可能對社會性發展造成的抑制作用。這些考量超越了技術專家關注的范疇(后者主要聚焦于緩解技術性危害,如系統輸出中的有害內容、偏見或準確性等問題)。
2.影響學習的關鍵變量
報告指出,GenAI有望大規模促進教育,這是一個充滿希望的愿望。然而,其實際效果受到多種因素的制約。從實證證據來看,存在幾個關鍵變量。
一是AI素養。理解AI系統的能力與局限已成為學生運用GenAI取得成功的關鍵新變量。
二是教育公平性。GenAI為邊緣化群體帶來矛盾體驗。研究表明,GenAI可成為殘障學生的有效學習資源;但在其他情境中,它會固化學業表現最弱學生的既有模式,并可能加劇經濟弱勢學生的教育不平等。
三是GenAI會影響長期公認促進學習的心理與社會條件:自我效能感、個體學習節奏及人際交往。關于自我效能感,有研究顯示學生使用GenAI時可能對自身技能掌握過度自信,需要幫助調整其學習成效的認知模型。就自主節奏學習而言,GenAI既帶來效率提升也存在潛在陷阱,具體取決于學習領域、使用場景(AI工具是通用聊天機器人還是結構化輔導系統)。有研究還強調GenAI對人際交往的影響——這種交往正是培養批判性思維與創造力等高階技能的基礎。
GenAI的按需可用特性,但缺乏社交臨場感,既可能帶來機遇,也可能帶來不利影響,例如,它提供了一個不帶評判性的話題探索環境,也減少了小組項目中同伴之間的合作。然而,有研究表明,人類導師仍然是學生獲取可靠信息的更受青睞來源。
3.學習目標如何受影響
報告指出,實證證據顯示,GenAI可能損害學生的思維能力——從基礎的記憶與理解能力,到高階的分析與創造技能皆會受到影響。
記憶與理解能力是學術領域取得成功的基礎,它們位于布魯姆分類學中最基礎的學習目標層級——識記與領會。有證據表明,使用大語言模型聊天機器人時,過度依賴和缺乏參與可能會導致記憶形成受損。如果GenAI的使用方式繞過了獲得技能所必需的努力,那么高階思維(分析、推理和創造力)的發展也可能會受到影響。
還有研究表明,在沒有支架式輔導或其他教學護欄的情況下使用ChatGPT等通用GenAI工具可能會對批判性思維產生不利影響。GenAI還會影響創造力。使用GenAI進行創造性解決問題的學生可以從快速的原型迭代和更高的項目完整性或細節中受益,但也可能傾向于固守于AI生成的想法,作品的原創性和復雜性降低。
4.教學復雜性的必要回歸
報告指出,將通用聊天機器人改造為AI導師可能過于簡單化,無法滿足教學成功所需的多樣化教育考量。迄今為止,最先進的工具通常仍是ChatGPT或類似系統,通過提示工程讓模型扮演教師角色,并用其他基礎指令約束生成內容——例如限定討論主題與教學策略、禁止直接提供答案,或要求生成測驗題目來檢測知識掌握情況。
新型實驗性AI導師展現出發展前景——這類系統內置了經過驗證的教學策略(例如能夠檢測并有效應對學生多種認知狀態)。在系統設計過程中咨詢教育工作者,對于此類即將問世系統的成功至關重要。
5.結論
通過對實證證據的綜合分析,報告最后提出四項在教育環境中整合GenAI的指導原則:
一是使用GenAI要確保學生做好充分準備。
報告認為,學生準備度是提升GenAI工具學習成效的關鍵考量因素,能減少因依賴GenAI而產生盲目自信的風險。這種準備度還包括學生批判性評估GenAI輸出結果的能力,這是學生AI素養中的核心能力。
不要過早引入GenAI。過早引入會損害理解力和基礎記憶能力,對初學者不利,并造成虛假的學習成效。研究表明,在學習初期階段暫緩使用GenAI有助于記憶形成,并建議保留傳統學習策略以鞏固理解與記憶。"必要難度"的價值——這種學習過程中不可或缺的認知掙扎——不應被AI工具削弱。
領域新手首先需要掌握新領域的基礎知識,否則可能面臨淺層參與和理解不足的風險,甚至對自身技能產生虛假信心。例如,若未扎實掌握領域基礎,編程新手往往誤解初始指導并急于推進步驟,錯誤地將GenAI的使用視為技能提升。
二是培養AI素養是受益于GenAI的基石。
AI素養是實現教育培養高階思維能力目標的關鍵要素。AI素養包含多重維度和學生必須掌握的核心能力。
建立對GenAI能力與局限性的認知,是培養學生批判性評估AI輸出的基礎。學生需要理解GenAI可能存在的虛構傾向與偏見,把握其在摘要生成方面的優勢與不足,并認識到驗證輸出結果、與其他信息來源交叉比對的重要性。
掌握特定領域的實踐操作技巧以獲得最優結果,是AI素養的核心能力之一。當學生具備有效提示設計和與大語言模型(LLM)迭代交互的策略時,其表現顯著提升。針對特定領域的操作示范能夠有效優化學生與LLM的互動效果。
在設計AI素養教育時需了解受眾群體。有效的學習材料應當反映學生群體的實際體驗,而非單純"灌輸知識"。當學生通過親手構建自己的AI模型等活動來探索技術能力、局限性、錯誤和偏見時,與目標學生群體共同設計AI教育材料能取得顯著成效。
三是作為補充用途:通過解釋和示例學習。
GenAI應作為傳統學習方式的補充而非替代。通用工具如ChatGPT可能干擾從知識記憶到批判性思維的學習過程。然而,盡管存在缺陷,GenAI能夠清晰有效地解釋復雜概念,這一能力受到學生重視。研究顯示,編程學習者將大語言模型(LLMs)作為解釋工具而非答案提供者時,能夠深化理解;當以記憶和保持為目標時,推薦采用以下學習順序:學生應先自主閱讀并做筆記,再通過LLMs拓展相關知識。
AI的解釋需要教師指導保駕護航。有研究針對高中生的實驗中發現,生成簡單的類比——如用“多米諾骨牌”解釋鏈式反應,或將身體想象成一座城市、將免疫系統比作城市警察以解釋免疫反應——能有效提升學生對于領域術語的理解。然而,關鍵在于,教師必須對這些類比的準確性與完整性進行調整,才能達到最佳教學效果,同時還需引導學生避免過度依賴這類解釋。
四是設計促進參與的干預措施。
學生如何運用GenAI——無論是用于獲取解釋還是直接獲得答案——將對學習效果產生決定性影響。細微的工具設計調整可能帶來顯著改變。
應限制復制粘貼功能。提高操作成本有助于記憶形成并創造批判性評估的機會。
需支持元認知校準。學生高估自身學習進度是GenAI應用中的常見問題,通過定期干預措施(如間歇性測驗)可幫助學生清晰掌握知識領域及需加強環節。
推動批判性思維。應當促使學習者停下來思考,考慮不同觀點,評估對GenAI輸出的理解程度。在GenAI交互關鍵節點設置元認知提示,有望培養學生對自身思維過程的覺察能力。
評估GenAI工具的教學是否成熟。需認識到,僅通過提示詞改造通用聊天機器人(如ChatGPT)無法適應學習過程中的復雜因素,例如學生動機與參與度。部分研究者建議在早期領域學習階段避免使用此類AI導師,同時主張精心設計符合教學最佳實踐的AI系統。關鍵是要讓教育工作者參與系統設計,而現實中少有系統供應商這樣做。與教育工作者協同開發的精密系統能整合多元教學策略,更真實反映學生學習現狀。例如,一個能根據學生參與狀態和理解水平自動匹配教學響應策略的AI導師,其效果顯著優于僅依賴提示詞工程的生成式AI系統。
報告最后指出,盡管許多設計精良的AI導師即將問世,但將GenAI融入課堂仍需要權衡多重因素。教育工作者必須綜合考慮GenAI對思維能力的影響、其在自主學習中的效率與缺陷,以及領域新手或學習困難學生面臨的風險。隨著GenAI在課堂中的應用不斷推進,兩項條件對成功至關重要:AI素養與人際交往。正如學生所言,在評估信息和培養高階思維方面,沒有什么比師生關系更值得信賴——而這恰恰是課外世界的終極技能。
資料來源:
Kathy Walker, Mihaela Vorvoreanu. Learning outcomes with GenAI in the classroom: A review of empirical evidence. https://www.microsoft.com/en-us/research/wp-content/uploads/2025/10/GenAILearningOutcomes-Report-published-10-07-2025.pdf
[本文為教育部國別和區域研究基地中國教育科學研究院國際教育研究中心成果]

本文由中國教育科學研究院“教育國際前沿”課題組整理,課題組負責人張永軍,編輯劉強。點擊左下角閱讀原文可下載該文獻。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.