大語言模型智能體的創(chuàng)新 應(yīng)用:數(shù)字化身教研
李海東 蔣萬強 劉軍民 許世紅
【摘 要】新時代基礎(chǔ)教育教研的數(shù)字化轉(zhuǎn)型正面臨多重挑戰(zhàn),尤其是如何使教研交流數(shù)字化更 加困難重重。 多智能體模擬技術(shù)與現(xiàn)實的教研交流需求具有很高的匹配性,可為基礎(chǔ)教育教 研交流提供新的解決方案。 本文在研究了相關(guān)人工智能技術(shù)的發(fā)展以及教研交流獨特特點 和需求的基礎(chǔ)上,提出了“數(shù)字化身教研”的概念。 數(shù)字化身教研是指利用具有教師或?qū)<?獨特特征的多智能體來模擬教研交流,并輸出交流過程的數(shù)字化功能。 本文選擇大語言模 型,設(shè)計了能夠促進多智能體高效開展互動的架構(gòu),完成了數(shù)字化身教研實驗系統(tǒng),開展了真 實環(huán)境下的實驗,利用課堂觀察自動化技術(shù)自動采集數(shù)字化身教研所需的數(shù)據(jù),自動啟動多 智能體之間的模擬教研交流,并輸出模擬教研交流的過程和結(jié)果。 實驗表明,數(shù)字化身教研 能夠模擬執(zhí)教教師與資深專家、優(yōu)秀同行等專業(yè)群體間的互動交流,能夠產(chǎn)生較好的思維交 流碰撞,可以為現(xiàn)實世界的教研交流提供有效參考。
【關(guān)鍵詞】數(shù)字化身教研; 大語言模型; 智能體模擬; 教研交流; 基礎(chǔ)教育
【作者簡介】李海東 / 廣東省教育研究院教授 (廣州 510035) 蔣萬強 / 莫納什大學(xué)馬來西亞校區(qū)碩士研究生 (雪蘭莪州 47500);努比技術(shù) (廣州)有限公司技術(shù)副總監(jiān) (廣州 510000) 劉軍民 / 努比技術(shù)(廣州)有限公司高級工程師 (廣州 510000) 許世紅 / 廣東省教育研究院研究員 (廣州 510035)
基礎(chǔ)教育高質(zhì)量發(fā)展帶來對高水平教研的現(xiàn)實需求。 教育部于2019年底發(fā)布《關(guān)于加強和改進新時代基礎(chǔ)教育教研工作的意見》,從服務(wù)學(xué)校教育教學(xué)、服務(wù)教師專業(yè)成長、服務(wù)學(xué)生全面發(fā)展、服務(wù)教育管理決策等方面,對數(shù)字時代基礎(chǔ)教育教研進行了明確定位,要求創(chuàng)新教研工作方式,積極探索信息技術(shù)背景下的教研模式改革。[1]
教學(xué)研究,簡稱“教研”,作為基礎(chǔ)教育領(lǐng)域耳熟能詳?shù)膶S忻~,在不同語境下有著不同的含義與指向,如教研機構(gòu)、教研隊伍、教研制度、教研體系、校本教研等。通常情況下,一線教師所處的現(xiàn)實情境多為教學(xué)的真實場景,教師所理解的“教研”,指的是與教學(xué)伴隨的研究,也是他們最樂意參加的專業(yè)發(fā)展活動[2]。由于課堂是教師教學(xué)實踐的最主要場所,因此本文所探討的“教研”,特指基于一定教育理論,針對一線教師的課堂教學(xué)過程、現(xiàn)象和問題進行探究、解釋與解決的專項研究活動。
一、 新時代基礎(chǔ)教育教研交流數(shù)字化轉(zhuǎn)型面臨的主要挑戰(zhàn)
隨著基礎(chǔ)教育新課標(biāo)、新教材的實施,以及中考、高考改革的深化,基礎(chǔ)教育教學(xué)改革逐漸進入深水區(qū)。改革對學(xué)生核心素養(yǎng)、解決問題能力、高階思維的培養(yǎng)均提出更高要求,迫切需要以高質(zhì)量的教研提升教師的教學(xué)能力和人才培養(yǎng)質(zhì)量。實踐表明,開展基礎(chǔ)教育的教研,需要教師對個人課堂教學(xué)進行觀察分析、總結(jié)反思,不斷發(fā)現(xiàn)問題并嘗試解決問題(即課堂觀察)。這也要求教師之間需要圍繞課堂教學(xué)開展觀摩學(xué)習(xí)、交流探討、彼此借鑒(即教研交流)。教師在教中研、研中教的過程中,能夠積累觀察真實課堂的技術(shù)和經(jīng)驗,獲得基于真實教學(xué)案例改進教學(xué)的基本方法和策略,有效提升課堂教學(xué)能力、教研能力、評價能力,最終實現(xiàn)個人專業(yè)成長和課堂教學(xué)質(zhì)量的提升。
(一) 課堂觀察自動化可為教研提供專業(yè)數(shù)據(jù)支持,但難以完全替代人類觀察者的專業(yè)直覺和經(jīng)驗判斷
課堂觀察是教研的基礎(chǔ),隨著人工智能技術(shù)的發(fā)展,課堂觀察自動化逐漸成為可能。課堂觀察自動化系統(tǒng)能夠?qū)崟r、全面、精準(zhǔn)地采集各種數(shù)據(jù),如師生互動頻率、學(xué)生參與度、教師提問類型等,極大減輕了教師收集教研證據(jù)的負擔(dān)。通過自動分類、統(tǒng)計和分析采集的數(shù)據(jù),可以為教研提供直觀清晰的結(jié)果,解決了數(shù)據(jù)處理的復(fù)雜性;通過對伴隨式采集數(shù)據(jù)的實時分析,打破觀察的時空限制,使得教師可以遠程觀察課堂,實現(xiàn)更廣泛的比較和研究,促進優(yōu)質(zhì)教學(xué)經(jīng)驗的傳播和共享。
課堂觀察自動化雖然為教研數(shù)字化轉(zhuǎn)型提供了強有力的專業(yè)支持,但難以精準(zhǔn)感知和解讀師生情感交流等更細膩復(fù)雜的層面,難以評估學(xué)科知識傳授的透徹性、邏輯的嚴(yán)密性,也無法有效應(yīng)對獨特、非標(biāo)準(zhǔn)化的教學(xué)創(chuàng)新舉措,而這些方面正是人類的課堂觀察者憑借專業(yè)直覺和經(jīng)驗判斷可以有效解決的部分。
(二) 教研數(shù)字化轉(zhuǎn)型落地的關(guān)鍵在于技術(shù)能否推動教研思想層面的自動交流與碰撞
教研旨在探索優(yōu)化課堂的有效方法、策略和理念,而這些都源于教師與專業(yè)群體之間的思想交流、觀點碰撞、相互啟發(fā)。不同思想的交鋒,有助于教師發(fā)現(xiàn)研究新視角,開拓教學(xué)新思路,探討教學(xué)新策略,形成積極有效的改進措施。因此,教研的靈魂在于教師和專業(yè)群體之間的教研交流,其社會屬性才是把課堂觀察結(jié)果真正轉(zhuǎn)化為課堂實踐能力的關(guān)鍵。近幾年數(shù)字化教研活動開展得紅紅火火[3-5],顯示了極佳的效果和強大的生命力。實踐表明,課堂觀察自動化雖然解決了長久以來困擾教研工作的課堂“黑箱”問題,但作為教研靈魂的教研交流,依然只能采用傳統(tǒng)交流模式,受制于經(jīng)濟成本、人情面子、教師心理抗拒等現(xiàn)實問題,往往導(dǎo)致教研交流效果欠佳。
在解決課堂觀察自動化的基礎(chǔ)上,運用信息科技進一步解決教研交流中存在的問題,已成為教研工作數(shù)字化轉(zhuǎn)型能否真正落地的關(guān)鍵。人工智能技術(shù)的發(fā)展,特別是基于大語言模型(Large Language Model,簡稱“LLM”)的多智能體(Agent)技術(shù)的顯著進展,為以上問題的解決提供了可行思路和切實路徑。本文創(chuàng)新地提出“數(shù)字化身教研”的設(shè)想,并完成了技術(shù)框架設(shè)計和原型實驗,以探索解決目前教研交流面臨的現(xiàn)實問題。
二、 智能體模擬與深化基礎(chǔ)教育教研中互動交流的技術(shù)契合
(一) 智能體模擬及其最新發(fā)展
20世紀(jì)50年代,阿蘭·圖靈(Alan Turing)把“高度智能有機體”概念擴展到了人工實體,并提出了著名的圖靈測試,旨在探索機器是否可以顯示與人類相當(dāng)?shù)闹悄苄袨椤_@些人工智能實體通常被稱為“Agent”,是人工智能系統(tǒng)的基本構(gòu)建模塊,指能夠感知周圍環(huán)境、作出決策,然后使用致動器采取響應(yīng)行動的人工實體。1995年, 伍爾德里奇(M. Wooldridge)和詹寧斯(N.R.Jennings)針對智能體給出了一個獲得廣泛認(rèn)可的定義框架。在該框架中,智能體被描述為一種計算機系統(tǒng),它處于某個特定環(huán)境中,能在此環(huán)境中自主行動以實現(xiàn)其設(shè)計目標(biāo)。據(jù)此定義,能在各種棋類游戲中與人類對弈的程序均屬于智能體。比如,IBM公司開發(fā)的“深藍”(Deep Blue)在 1997年5月?lián)魯‘?dāng)時國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov),是第一個在標(biāo)準(zhǔn)比賽時限內(nèi)擊敗國際象棋冠軍的智能體;谷歌深度思考(Deep Mind)公司開發(fā)的“阿爾法圍棋”(AlphaGO)在2016年3月?lián)魯‘?dāng)時的世界圍棋冠軍李世石(Lee Sedol),是第一個在圍棋比賽中戰(zhàn)勝職業(yè)九段棋手的智能體;“ 阿爾法元” (AlphaGo Zero)則是阿爾法圍棋的后續(xù)版本,于2017年10月宣布,僅通過自我對弈強化學(xué)習(xí)就超越了前者。這些都是智能體成功應(yīng)用的具體案例。
智能體模擬則是一種計算機模擬的建模方法,通過集中關(guān)注稱為智能體的個體實體,來模擬個體與復(fù)雜環(huán)境的相互作用。智能體模擬通常包括三個基本組件:一是智能體,其代表被建模系統(tǒng)中的個體、實體或元素;每個智能體都有自己的一組屬性、行為和決策過程。二是環(huán)境,這是智能體運作和互動的空間,包括虛擬空間、物理空間和影響智能體行為的任何外部因素,如天氣條件、經(jīng)濟變化、政治變動和自然災(zāi)害等;智能體可能受環(huán)境約束或影響,它們的互動也可以對環(huán)境本身產(chǎn)生影響。三是交互,智能體通過預(yù)定義的機制,彼此之間直接互動,或與環(huán)境進行間接互動[6] 。在智能體模擬中,每個智能體都具有獨特的個性特征,包含感知、大腦(決策和記憶)、行動三個部分,能根據(jù)上下文和環(huán)境進行自主決策和采取行動。智能體所處的環(huán)境是用來引入條件、激發(fā)競爭、定義邊界,并提供影響智能體行為的相應(yīng)資源;交互的目標(biāo)則是基于預(yù)定義或自適應(yīng)規(guī)則,在模擬中反映現(xiàn)實中的行為。
智能體具有自主性、反應(yīng)性、社會能力與主動性等四個基本屬性。智能體的社會能力屬性使得多個智能體之間交互的場景得到了更多關(guān)注,幫助研究者更好地理解社會運動、經(jīng)濟轉(zhuǎn)變、文化趨勢中互動交流的復(fù)雜性,以探索設(shè)計更有效的交流策略和系統(tǒng)。自2018年Open AI發(fā)布 GPT-1以來,以GPT技術(shù)為代表的大語言模型在理解、生成和處理自然語言方面展現(xiàn)出巨大的能力和潛力,在解決文本生成、語言翻譯、問答系統(tǒng)、文本摘要、情感分析、軟件開發(fā)、文檔寫作、商業(yè)協(xié)作 等各種任務(wù)中均取得顯著成效[7]。由于大語言模型具有出色的規(guī)劃和推理能力,因此非常適合作為文本環(huán)境內(nèi)的智能體的控制端(Brain),負責(zé)處理信息、存儲知識、進行推理和決策。最近,基于大語言模型的多智能體系統(tǒng),在解決復(fù)雜問題和模擬現(xiàn)實世界方面取得了顯著進展[8]。智能體模擬在教育領(lǐng)域的應(yīng)用不多,主要集中在單智能體方面,比如與大模型客戶端的對話等。翟雪松等從學(xué)習(xí)者的角度開展了多智能體的實證研究,發(fā)現(xiàn)在多智能體環(huán)境中,學(xué)習(xí)者能夠自發(fā)運用多維提問策略,高效解決復(fù)雜學(xué)習(xí)問題[9]。文獻檢索顯示,在教育教研領(lǐng)域,多智能體的應(yīng)用還是空白。從智能體當(dāng)前的技術(shù)特點和發(fā)展來看,本研究認(rèn)為用多智能體模擬教研交流 來解決現(xiàn)實問題已具備可能性。
(二) 智能體模擬對基礎(chǔ)教育教研中互動交流優(yōu)化的主要支撐點
中小學(xué)校教師開展教研活動時,最希望獲得的稀缺資源體現(xiàn)在兩點:一是得到資深專家的指導(dǎo);二是與優(yōu)秀同行深度切磋。智能體模擬可以用來創(chuàng)建虛擬教研環(huán)境,模擬教師和專業(yè)群體之間交流互動、思維碰撞的過程,為現(xiàn)實 世界中的教研交流提供有益參考和借鑒。
數(shù)字化身教研,是指利用具有教師或?qū)<要毺靥卣骱托枨蟮亩嘀悄荏w,來模擬教研交流,并輸出交流過程的數(shù)字化功能。采用智能體模擬技術(shù),先為希望參加教研的每個教師或?qū)<叶寂鋫湟粋€專屬的智能體,稱之為“數(shù)字化身”。例如教師A的專屬智能體是數(shù)字化身A,專家B、C的專屬智能體分別是數(shù)字化身B、C;然后,這些不同的數(shù)字化身A、B、C圍繞某一設(shè)定話題(即環(huán)境,例如課堂實 錄、課堂教學(xué)特征大數(shù)據(jù)分析報告等)所開展的互動交流過程,就稱為“數(shù)字化身 教研”。這一智能體模擬過程能基本上概括人類教研活動的所有關(guān)鍵要素。
目前,基于大語言模型的智能體在有效模擬人類社會的互動中,可以表現(xiàn)出如互動交流、情感理解、角色扮演等社會屬性。這些社會屬性能夠讓教師及時聽取更開放多元的針對性意見建議,在安全環(huán)境中自主練習(xí)和提高教學(xué)技能,并得到更多尊重與理解。這恰好滿足中小學(xué)教研活動最稀缺資源的供給。
基于大語言模型的智能體可以提供教研需要的多種角色。例如,激勵型智能體可以通過積極鼓勵、提供正面反饋,來增強教師的自信心,適合新教師或需要額外支持的教師,以提高他們的教學(xué)動力和自我效能感;技術(shù)型智能體 精通數(shù)據(jù)分析與解讀,適合畏懼大數(shù)據(jù)分析的文科教師,可以提高他們的數(shù)字教研能力;學(xué)科型智能體在特定學(xué)科領(lǐng)域具有深厚知識和經(jīng)驗,適合需要深化學(xué)科知識或?qū)で髮W(xué)科教學(xué)策略的教師;研究型智能體專注于教育研究,能夠提供基于證據(jù)的教學(xué)建議,適合希望基于研究結(jié)果來指導(dǎo)教學(xué)實踐的教師;創(chuàng)新型智能體則擅長推動創(chuàng)新思維和教學(xué)實踐,鼓勵教師嘗試新的教學(xué)方法,適合尋求教學(xué)創(chuàng)新和改進的教師。還有文化型智能體、情緒型智能體、評估型智能體等,都能適合不同的教師群體,滿足他們個性化教研的現(xiàn)實需求。
數(shù)字化身教研體系在不斷開展數(shù)字化教研的過程中,可以積累豐富多樣的資深教研專家、優(yōu)秀學(xué)科教師,并伴隨式采集包括學(xué)科、年級、思維傾向、語音特征、專業(yè)身份等個人獨特屬性,生成相應(yīng)的數(shù)字化身資源庫。中小學(xué)校可以根據(jù)自身需要,組合定制相關(guān)類型的智能體。各具特點的數(shù)字化身教研系統(tǒng)可深度參與一線教師的課堂教研活動,將帶給中小學(xué)教師實實在在的收獲和歡欣愉悅的情感。實際場景教研與模擬場景教研共存互促,可以提供更加豐富多元的課堂視角,激發(fā)教師不斷思考和創(chuàng)新。由此可見,智能體模擬,特別是基于大語言模型的多智能體模擬技術(shù),已成為實現(xiàn)數(shù)字化教研交流的理想模型。能否推動數(shù)字化身教研系統(tǒng)實現(xiàn)使用便利、成本可控,并能模仿出教研所需的思維碰撞,則是教研交流數(shù)字化轉(zhuǎn)型的關(guān)鍵所在。
三、 數(shù)字化身教研系統(tǒng)的整體設(shè)計與技術(shù)實現(xiàn)
(一) 教育領(lǐng)域教研交流的獨特性
教師參與的教研交流與一般社會交流存在巨大差異,主要體現(xiàn)為三個方面:一是交流角色的復(fù)雜度不同。與一般社會交流相比,教研交流不僅存在交流主體“執(zhí)教教師”,而且交流主體兼具主導(dǎo)方、被指導(dǎo)方的雙重角色。這種雙重角色要求教研交流兼顧教師作為交流主體可能產(chǎn)生的心理沖突,以及教研的不同需求。二是思維碰撞的需求度不同。一般社會交流通常具有更多的共同話題和一致的價值觀;相比之下,教研交流則希望出現(xiàn)更多的思維碰撞,需要豐富的多樣性。這種多樣性常常使得教研交流更易產(chǎn)生沖突,但也往往能帶來更大的思維靈感和獲得感。三是交流方式的專業(yè)度不同。與一般社會交流不同,教師希望通過教研交流獲得解釋教學(xué)現(xiàn)象、分析教學(xué)過程、解決教學(xué)問題的有效策略與方法,因此教研交流對參與者有明確的期待。參與者需要運用明確證據(jù)、嚴(yán)密邏輯和相關(guān)理論等專業(yè)方式來支持相應(yīng)的教研觀點;若是單純說教,則只會帶來負面效果。因此,若想運用數(shù)字技術(shù)來模擬教研交流,即實現(xiàn)“數(shù)字化身教研”,則必須充分考慮上述教研交流的獨特性。只有這樣,才能讓教研交流的主體——教師自覺擁抱新技術(shù),自愿運用數(shù)字化身教研優(yōu)化課堂教學(xué)。
(二) 數(shù)字化身教研系統(tǒng)設(shè)計的總體構(gòu)思與原則
數(shù)字化身教研設(shè)計的總體思路如下:采用多個智能體(必須包括教研交流 主體)來模擬教研交流過程,并對整個模擬過程進行文本和音頻記錄,再將相關(guān)記錄反饋給教師。教師通過閱讀和聆聽教研交流過程記錄,獲得啟發(fā)并深 入思考,從而提高課堂實踐能力。此外,教師還可以通過實時加入模擬教研交流,從而改變模擬教研交流的進程和發(fā)展方向,以獲得更大的收獲。
考慮到教研交流的獨特性,數(shù)字化身教研的設(shè)計須遵循以下原則:一是作 為教研交流主體的智能體,應(yīng)該是教研交流的主持者,掌握整個教研交流的程序和議程;二是參與教研交流的智能體,必須具備多樣性,并與教研交流主體有盡可能大的差異性;三是所有的教研交流都必須依托課堂實錄和課堂大數(shù)據(jù)分析報告,以確保教研交流的有理有據(jù)和有的放矢;四是參與教研交流所有智能體的發(fā)言,都應(yīng)盡可能配上對應(yīng)的語音模仿和數(shù)字人物畫像模仿,這是為了提升教師參與度和接受度,增加教研交流記錄反饋的沉浸感,使得教師對模擬教研交流產(chǎn)生身臨其境的感覺。
設(shè)計數(shù)字化身教研系統(tǒng),旨在通過多智能體模擬教研交流過程,解決教研活動中成本最高、最耗時間的關(guān)鍵環(huán)節(jié),以緩解教師參加傳統(tǒng)教研面臨的焦慮和過大心理壓力,使得教師可以更冷靜、更客觀,從多角度、多方位去研究自己的課堂。借助數(shù)字化身教研,教師個人即可組織參與教研活動,這極大降低了教研門檻,為常態(tài)化、日常化開展教研活動,構(gòu)建出一個更加便捷、高效的教學(xué)研究和交流平臺。
(三) 數(shù)字化身教研系統(tǒng)的整體設(shè)計
數(shù)字化身教研系統(tǒng)主要包括課堂自動觀察、數(shù)字化身交流、本體化身互、教研社群搭建四大環(huán)節(jié)。下面以教師G為案例來說明,其技術(shù)框架如圖1所示。
![]()
圖 1 數(shù)字化身教研的技術(shù)框架(虛像代表數(shù)字化身)
一是課堂自動觀察。相對于其構(gòu)建的智能體,執(zhí)教教師G被稱為“本體”。首先,本體采集課堂教學(xué)音頻或視頻數(shù)據(jù);系統(tǒng)對課堂采集數(shù)據(jù)進行自動分析,獲取課堂觀察數(shù)據(jù),同時提取出制作執(zhí)教教師G數(shù)字化身的人物特征。
二是數(shù)字化身交流。通過數(shù)字化工具(如 CSMS 等)完成課堂自動化分析后,觸發(fā)創(chuàng)建交互環(huán)境,包括設(shè)置該堂課的教學(xué)記錄數(shù)據(jù)和課堂觀察數(shù)據(jù)。系統(tǒng)按規(guī)則自動邀請與執(zhí)教教師G同學(xué)科、同年級、不同思維風(fēng)格的教師或?qū)<?的數(shù)字化身來開展類似教研類型的對話。言語交流結(jié)果匯總成一份音頻文件 (含相應(yīng)的文字),反饋給執(zhí)教教師G。
三是本體化身互動。執(zhí)教教師G如有需要,可以直接與自己或他人的數(shù)字化身就該節(jié)課的課堂教學(xué)展開觀點的交流、思維的碰撞,進一步拓展教研交流的深度和廣度。
四是教研社群搭建。以上述大數(shù)據(jù)分析來驅(qū)動,建立各類本體或化身的教研社群,如學(xué)科組、年級組、教學(xué)方法研究組等,也建立教師本體之間的交流通道和社群,促進教師提升教學(xué)質(zhì)量和專業(yè)發(fā)展水平。
(四) 數(shù)字化身教研的技術(shù)實現(xiàn)
若要實現(xiàn)圖1的數(shù)字化身教研的技術(shù)框架,需重點解決以下三個關(guān)鍵技術(shù)問題:一是課堂自動觀察分析技術(shù)。在之前的研究工作中,我們提出了一種使用人工智能技術(shù)常態(tài)化、規(guī)模化分析課堂教學(xué)的指標(biāo)體系和評價系統(tǒng)——CSMS課堂自動化觀察系統(tǒng)[10-11]。大量實踐表明,它可以解決課堂觀察問題。CSMS對課堂教學(xué)策略的分析數(shù)據(jù),以及課堂文字實錄,可以構(gòu)成智能體交流的環(huán)境因素。
二是智能體特征歸納提取技術(shù)。參與教研的智能體人物特征對于對話有著重要的影響,可以包括學(xué)科、年級、專業(yè)身份、思維傾向、語音特征等。學(xué)科、年級、專業(yè)身份等身份類信息可以通過系統(tǒng)搜集教師的信息或課堂類型等方式獲取,語音特征等則通過分析聲紋、語言運用特點等途徑獲取。最困難的是教師思維傾向特征的分析,難點在于該思維特征的表征,需有教育學(xué)意義上的價值。解決此問題的一個方法是知行模型[12],它將思維特征分為能動型、現(xiàn)實型、哲理型、感悟型,并提供了一種可定量和可計算的思維特征分析工具。
三是基于大語言模型的多智能體技術(shù)。基于大語言模型的多智能體技術(shù)是一個正在迅速發(fā)展的領(lǐng)域,已經(jīng)產(chǎn)生了很多技術(shù)框架[13]。根據(jù)以上教研交流需求,基于大語言模型的多智能體技術(shù)特別需要關(guān)注三個方面。首先,需要建立統(tǒng)一的多智能體文本環(huán)境下的對話框架,并具有較強的對話管理能力。因為教研主要關(guān)注的是交流對話,并且對交流的有序性比較敏感。其次,需要智能體具備對話能力,環(huán)境內(nèi)任何智能體都可以發(fā)送和接收其他智能體的消息,以啟動或繼續(xù)對話。這是由教研活動的自由性決定的。再次,智能體角色的自動轉(zhuǎn)換。教師和其化身之間的關(guān)系,既可以是平等的對話伙伴,也可以是命令者—執(zhí)行者的關(guān)系,特別是教師和其化身同在一個對話環(huán)境時,需要處理復(fù)雜的本體—化身關(guān)系。以上需求,都增加了基于大語言模型的多智能體技術(shù)的難度,其解決更是一個逐步優(yōu)化的過程。
四、數(shù)字化身教研的實驗研究
根據(jù)圖1所示的數(shù)字化身教研的技術(shù)框架,團隊開發(fā)了數(shù)字化身教研實驗原型系統(tǒng),并開展了初步應(yīng)用實驗。實驗過程如下:教研交流主體上傳一堂課之后,系統(tǒng)首先進行課堂教學(xué)大數(shù)據(jù)分析,然后自動組織一次多智能體參與的教研交流,自動生成教研交流反饋,并以文字和對應(yīng)的本體語音模仿完成輸出。該系統(tǒng)經(jīng)過大量實驗,取得了較為穩(wěn)定的類似結(jié)果。圖2呈現(xiàn)的是一次典型實驗結(jié)果。唐老師將其執(zhí)教的《不等式》課堂錄像上傳系統(tǒng)。系統(tǒng)首先對課堂教學(xué)大數(shù)據(jù)展開分析,待分析完成后,觸發(fā)數(shù)字化身教研,其分析數(shù)據(jù)和課堂實錄會自動置入環(huán)境。系統(tǒng)以唐老師的數(shù)字化身為主體,自動邀請教育理論專家李博士、技術(shù)分析專家劉博士,以及學(xué)科教研專家許博士這三位專家的數(shù)字化身共同開展教研交流。最終,系統(tǒng)輸出教研交流反饋的音頻和文字。
![]()
圖 2 數(shù)字化身教研的輸出界面(人名代表其相應(yīng)的數(shù)字化身)
輸出的文字結(jié)果(節(jié)選精簡)如下:
唐老師化身:各位專家好,我是唐老師,非常榮幸能與各位專家一起探討我在初中數(shù)學(xué)教學(xué)中的體驗和心得。這節(jié)課呢,我主要講述了這些內(nèi)容:1.不等式的定義。介紹了不等式的定義,即用不等號連接表示大小關(guān)系的式子。2.不等式的列法。講解了如何根據(jù)情境中的關(guān)鍵詞來列出不等式,包括明確的不等關(guān)系和隱含的不等關(guān)系。3.不等式的解。解釋了不等式的解是指使不等式成立的未知數(shù)的值,并區(qū)分了不等式的解和解集的概念。4.不等式解集的表示。介紹了用數(shù)軸來表示不等式的解集,包括畫數(shù)軸、找關(guān)鍵點、描點、畫方向等步驟。5.總結(jié)。最后對整節(jié)課的內(nèi)容進行了總結(jié),強調(diào)了不等式的定義、列法、解和解集的概念,以及解集的表示方法。期望能夠得到大家的寶貴意見,特別是如何更好地兼顧不同學(xué)生的學(xué)習(xí)風(fēng)格,讓我的課堂能夠激發(fā)每一位學(xué)生的潛能。
李博士化身:唐老師,您好。從您的分析報告來看,您在課堂上表現(xiàn)出了哲理型的教學(xué)風(fēng)格,注重抽象概念和邏輯推理,這有助于學(xué)生系統(tǒng)掌握知識。您通過生活實例引入新知識,讓學(xué)生更好地理解抽象的數(shù)學(xué)概念,并注重知識遷移和應(yīng)用,這有助于培養(yǎng)學(xué)生的知識遷移和創(chuàng)新能力。綜上所述,您在教學(xué)過程中展現(xiàn)了較高的教學(xué)水平和教學(xué)藝術(shù),值得學(xué)習(xí)和借鑒。
唐老師化身:感謝李博士給予的評價和總結(jié)。我認(rèn)為這些想法確實能夠幫助學(xué)生在掌握抽象概念的同時,增強實踐能力和創(chuàng)造性思維。接下來,我想請各位專家能否就我在授課中可能存在的不足或需要改進的地方,提出寶貴 的意見和建議?
劉博士化身:唐老師您好。根據(jù)您的教學(xué)分析報告,我總結(jié)出以下可能存在的不足之處:首先,“四何”運用不均衡。報告顯示教師過于注重“是何”和“為何”,而較少運用“如何”和“若何”,這可能限制了學(xué)生的實踐能力和創(chuàng)新思維。其次,學(xué)生發(fā)言時間不足。學(xué)生發(fā)言總時長僅4分13秒,平均每次發(fā)言僅4.77秒,這可能限制了學(xué)生的主動思考和表達能力。以上是我對唐老師教學(xué)中可能存在的不足之處的總結(jié),希望對您有所幫助。
唐老師化身:感謝劉博士中肯的總結(jié)。我同意課堂互動的重要性,我會嘗試在課堂上創(chuàng)造更多機會讓學(xué)生參與進來,我會更多地引導(dǎo)學(xué)生思考“如何” 和“若何”,將理論知識與實際應(yīng)用結(jié)合起來。許博士對我的授課有什么建議?
許博士化身:你好,唐老師。在提問類型上,教師可以增加開放性問題,以進一步激發(fā)學(xué)生的思考。從課堂互動來看,教師可以通過增加學(xué)生討論、合作學(xué)習(xí)等方式,進一步提高學(xué)生的主體地位。以上希望對教師進一步提高教學(xué) 水平有所幫助。
唐老師化身:感謝大家的參與,我們今天的教研活動就到這里吧。
以上實驗結(jié)果顯示了數(shù)字化身教研的理性思維和實用價值。與實際教研交流活動相比,數(shù)字化身教研已經(jīng)具備了相當(dāng)?shù)念愃菩浴T谙嚓P(guān)話題的呈現(xiàn)方面,其真實性、邏輯性均達到了預(yù)期目的,這得益于系統(tǒng)能準(zhǔn)確模仿參與者 的語音和思維特征,營造良好的沉浸體驗。這證明數(shù)字化身教研的設(shè)計具備科學(xué)性和可行性。
五、進一步反思討論和前景展望
(一) 數(shù)字化身教研在核心技術(shù)層面存在的主要困難
數(shù)字化身教研目前還處于初期應(yīng)用、不斷完善的階段。每個數(shù)字化身(智能體)的“大腦”主要依賴大模型的能力,但大模型的能力離人們的期望值還有明顯差距。現(xiàn)階段的大模型還存在明顯的局限性。一是可靠性不足。大模型經(jīng)常犯事實性錯誤,這可能是因為訓(xùn)練數(shù)據(jù)中包含錯誤信息或者模型在生成文本時出現(xiàn)的“幻覺”現(xiàn)象。此外,由于大模型的訓(xùn)練數(shù)據(jù)是固定的,它們無法實時更新知識,可能會提供過時的信息。二是邏輯推理挑戰(zhàn)。大模型在復(fù)雜邏輯和分析能力的測試中表現(xiàn)不甚理想,尤其是在進行多步驟的邏輯推理時,其準(zhǔn)確性迅速下降。這是因為即使每一步的預(yù)測準(zhǔn)確率都很高,但累積誤差也會逐漸增加。三是語義理解局限。大模型在語義理解方面仍有待提升,尤其是在對語言背后的意義和形式的完全理解方面存在短板,在特定領(lǐng)域(如醫(yī)學(xué)或法律)的知識掌握上也存在缺陷。四是可解釋性較弱。大模型通常被視為“黑箱”,其內(nèi)部工作原理不透明,導(dǎo)致可解釋性和可調(diào)試性較弱;當(dāng)輸出出現(xiàn)錯誤時,由于結(jié)構(gòu)復(fù)雜,很難準(zhǔn)確找到問題所在并進行修復(fù)。
上述大模型的不足雖然會影響數(shù)字化身教研的質(zhì)量和效果,但瑕不掩瑜,數(shù)字化身教研仍然代表著未來數(shù)字化教研發(fā)展的方向。隨著智能體技術(shù)不斷發(fā)展,其技術(shù)成熟度也會逐步提升,可以解決目前存在的交互有效性、數(shù)據(jù)隱私與安全性等問題。數(shù)字化身教研中,如何保障數(shù)據(jù)的隱私和安全等更須特別關(guān)注,因為這會涉及資深專家、優(yōu)秀教師、學(xué)校執(zhí)教教師等群體大量的個人數(shù)據(jù)。而對于教研這個特殊的應(yīng)用領(lǐng)域,如何確保數(shù)字化身所提供的教學(xué)策略建議適切,有思想性,符合角色定位,符合教育標(biāo)準(zhǔn),仍具有相當(dāng)?shù)碾y度。數(shù)字化身教研雖然處于初步發(fā)展階段,但數(shù)字化身優(yōu)質(zhì)資源庫的建設(shè)指日可待。隨著相關(guān)關(guān)鍵技術(shù)的成熟,以及大量的資金與資源投入和時間積累,我們必將迎來由傳統(tǒng)教研向數(shù)字化身教研轉(zhuǎn)型的歷史性時刻。
(二) 數(shù)字化身教研的應(yīng)用場景拓展
新華社2024年8月26日發(fā)布了《中共中央國務(wù)院關(guān)于弘揚教育家精神加強新時代高素質(zhì)專業(yè)化教師隊伍建設(shè)的意見》,其中提出要讓“數(shù)字化賦能教師發(fā)展成為常態(tài)”、[14]教師發(fā)展的關(guān)鍵就體現(xiàn)在課堂教學(xué)能力的提升上,其中最有效的手段就是教研。運用人工智能技術(shù)解決教研交流中存在的問題,是教研工作數(shù)字化轉(zhuǎn)型真正落地的關(guān)鍵,也是數(shù)字化賦能教師發(fā)展成為常態(tài)的重要抓手。借助人工智能技術(shù)的發(fā)展,特別是基于大語言模型的多智能體 技術(shù)賦能教研,是一個可行的思路。本文通過數(shù)字化身教研技術(shù)框架設(shè)計和原型實驗,來探索解決目前教研交流面臨的現(xiàn)實問題,其理論研究和實驗結(jié)果均顯示了數(shù)字化身教研的應(yīng)用價值,證明了數(shù)字化身教研的可行性。隨著技術(shù)的不斷成熟和成本的降低,數(shù)字化身教研技術(shù)有望逐漸普及,并應(yīng)用到更多的學(xué)校和機構(gòu)中,成為常態(tài)化的教學(xué)輔助工具,與在線教育合式學(xué)習(xí)等模式深度融合,創(chuàng)造更加豐富多樣的教育數(shù)字化新生態(tài)。數(shù)字化身教研技術(shù)將通過推動教學(xué)研模式的創(chuàng)新,為教育數(shù)字化帶來更多的可能性和發(fā)展空間。通過數(shù)字化身技術(shù),讓優(yōu)質(zhì)教育資源能夠更廣泛地覆蓋偏遠地區(qū)和教育資源匱乏的地區(qū),促進教育公平,這更是基礎(chǔ)教育高質(zhì)量發(fā)展的應(yīng)有之義。
參考文獻:
[1] 中華人民共和國教育部.教育部關(guān)于加強和改進新時代基礎(chǔ)教育教研工作的意見[EB/OL].
http://www.moe.gov.cn/srcsite/A06/s3321/201911/t20191128_409950.html,2019-11-25/2024-07-01.
[2] 劉月霞.追根溯源:“教研”源于中國本土實踐[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),2021(5):85-98.
[3] 李海東,許世紅,劉軍民.數(shù)字化賦能課堂教學(xué)評價與改進:打造教育教學(xué)研究新生態(tài)—廣東省中小學(xué)課堂大數(shù)據(jù)報告暨數(shù)據(jù)開源發(fā)布會綜述[J].課程教學(xué)研究,2023(10):72-79.
[4] 姜曉丹.數(shù)字化教研,讓課堂教學(xué)更智能(在一線)[N]. 人民日報,2023-12-3(05).
[5] 李海東,許世紅. 借助大數(shù)據(jù)對課堂教學(xué)畫像[N]. 中國教師報,2023-08-16(15).
[6] Xi,Z.,Chen W.,Guo,X.,et al.The Rise and Potential of Large Language Model Based Agents:A Survey [J]. Science China Information Sciences, 2025(2),121101.
[7] Bellemare-Pepin A.,Lespinasse F.,Th?lke P.,et al. Divergent Creativity in Humans and Large Language Models[J/OL]. ArXiv,
https://arxiv.org/abs/2405.13012,2024-05-13/2024-09-09.
[8] Wang L., Ma C., Feng X., et al. A Survey on Large Language Model based Autonomous Agents[J]. Frontiers of Computer Science 2024(6):186345.
[9] 翟雪松,季爽,焦麗珍,等. 基于多智能體的人機協(xié)同解決復(fù)雜學(xué)習(xí)問題實證研究[J].開放教育研究, 2024(3):63 73.
[10] 許世紅,劉軍民,王時舟,等. 人工智能視域下課堂教學(xué)智慧評價:理論建構(gòu)、模型支撐與技術(shù)實現(xiàn) [J].教育測量與評價,2022(2): 56 65.
[11] 鐘守權(quán),耿丹青. CSMS 在課堂教學(xué)評價領(lǐng)域的理論探索與實踐價值剖析[J].課程教學(xué)研究,2023(10):80-90.
[12] 許世紅,劉軍民,王時舟. 人工智能視域下課堂教學(xué)智慧評價:學(xué)習(xí)發(fā)生知行模型[J].教育測量與評價,2022(1):80-90.
[13] Wu Q., Bansal G., Zhang J., et al. AutoGen: Enabling Next-Gen LLM Applications via Multi-agent Conversations[C]. Philadelphia PA:First Conference on Language Modeling,2024.
[14] 中華人民共和國教育部.中共中央國務(wù)院關(guān)于弘揚教育家精神加強新時代高素質(zhì)專業(yè)化教師隊伍建設(shè)的意見[EB/ OL].http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202408/t20240826_1147269.html,2024-08-06/2024-09-26.
來源:《全國教育展望》2025年第10期
編輯:廣東君
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.