![]()
教育 Agent 的第一場(chǎng)考試:讓大模型學(xué)會(huì) “主動(dòng)教學(xué)”。
文丨陳然
2011 年,喬布斯最后一次與比爾·蓋茨會(huì)面,兩人的閑聊中有一部分話題關(guān)于教育。喬布斯認(rèn)為,無論是蘋果還是微軟,都沒有真正通過技術(shù)提高教育的水平,蓋茨同意這個(gè)判斷:技術(shù)已經(jīng)重塑了法律和醫(yī)學(xué)的學(xué)習(xí)方式,但在教育領(lǐng)域卻沒有從技術(shù)的巨大進(jìn)步中獲益。
蓋茨對(duì)這個(gè)問題的解釋是, 技術(shù)需要更多致力于提供個(gè)性化的課程和帶有啟發(fā)性的反饋,由此才能從根本上重塑教育。
這恰恰也是教育復(fù)雜與難以改造的地方,它非常依賴人與人之間的互動(dòng)反饋,教育的過程不僅在傳遞知識(shí),還涉及情感與價(jià)值觀的多層次交流,僅僅是把教學(xué)材料數(shù)字化,從傳統(tǒng)紙筆換成平板電腦,從面對(duì)面教學(xué)切換到網(wǎng)絡(luò)遠(yuǎn)程教學(xué),雖然可以讓教學(xué)資源更充分地被分配運(yùn)用,但并不能本質(zhì)上提升教育的水平。
語(yǔ)言學(xué)習(xí)尤其如此。著名語(yǔ)言學(xué)家史蒂芬·克拉申在 1980 年代提出的語(yǔ)言習(xí)得五種假說中,首先區(qū)分了 “習(xí)得(Acquisition)” 和 “學(xué)習(xí)(Learning)” 兩個(gè)概念。克拉申認(rèn)為,語(yǔ)言學(xué)習(xí)更應(yīng)該是一個(gè) “習(xí)得” 的過程,自然、直覺乃至近乎于潛意識(shí)的學(xué)習(xí)方式才更接近語(yǔ)言的本質(zhì)——我們每個(gè)人在嬰兒時(shí)期都是如此學(xué)習(xí)母語(yǔ)的。
但當(dāng)前的現(xiàn)實(shí)是,幾乎所有人都在 “學(xué)習(xí)” 而不是 “習(xí)得” 語(yǔ)言。這讓學(xué)習(xí)者雖然能夠掌握語(yǔ)法規(guī)則和詞匯,卻缺乏實(shí)際運(yùn)用語(yǔ)言的能力。
聽、讀和寫的能力,尚能依賴反復(fù)練習(xí)、強(qiáng)化記憶以及單項(xiàng)針對(duì)訓(xùn)練來提高,但口語(yǔ)的提升幾乎必須采用 “習(xí)得” 方式:唯有真切地不厭其煩地高頻即時(shí)互動(dòng),學(xué)習(xí)者才有可能逐步提升口語(yǔ)的水平,脫離了語(yǔ)言環(huán)境和互動(dòng),這一切很難成立。這也讓口語(yǔ)教育成為語(yǔ)言學(xué)習(xí)聽說讀寫四個(gè)方面中最薄弱的環(huán)節(jié),“啞巴英語(yǔ)” 由此而來。
在技術(shù)改造語(yǔ)言學(xué)習(xí)方面,至少在 2011 年,喬布斯和比爾·蓋茨都沒有看到什么清晰路徑,讓它變得更加個(gè)性化,更具互動(dòng)性。
直到新一輪人工智能浪潮的來臨,大模型的出現(xiàn)帶來了語(yǔ)言教育方式根本變革的可能性。
供需嚴(yán)重不匹配的口語(yǔ)市場(chǎng),大模型的緩緩落地
在大模型出現(xiàn)之前,找外教是人們提高口語(yǔ)水平的主要方式。
2020 年教育部公布的中國(guó)教育機(jī)構(gòu)共有外籍教師 6.71 萬(wàn)人,賣方市場(chǎng)主導(dǎo)下,即使通過在線平臺(tái)遠(yuǎn)程教學(xué)的方式,單次外教的費(fèi)用也在 100 元 / 次以上,按一周兩次課計(jì)算,一個(gè)月花費(fèi)在口語(yǔ)上的費(fèi)用超過 800 元——這超出了大部分中國(guó)家庭的消費(fèi)能力:根據(jù)博研咨詢的統(tǒng)計(jì),全國(guó)只有 12% 的家庭能夠負(fù)擔(dān)長(zhǎng)期一對(duì)一外教的費(fèi)用。
如果不選擇一對(duì)一外教,而是班級(jí)制授課,那么開口次數(shù)這樣的關(guān)鍵指標(biāo)會(huì)立刻下滑,雙向互動(dòng)頻率的降低會(huì)直接影響口語(yǔ)教學(xué)效果。
龐大的口語(yǔ)學(xué)習(xí)需求和無法規(guī)模化的口語(yǔ)教學(xué)方式之間產(chǎn)生了嚴(yán)重的供求不匹配,斑馬首席產(chǎn)品官修佳明認(rèn)為,這正是造成大部分人口語(yǔ)水平長(zhǎng)期停滯無法突破的原因。既沒有那么多的老師來提供一對(duì)一口語(yǔ)教學(xué),也沒有那么多的家庭支付得起高昂的一對(duì)一費(fèi)用。
大模型技術(shù)被認(rèn)為可以針對(duì)性地解決這種供需錯(cuò)配的痛點(diǎn),它提供了過往技術(shù)一直難以提供的口語(yǔ)交互的個(gè)性化表達(dá)和及時(shí)反饋,同時(shí)又很容易實(shí)現(xiàn)規(guī)模化部署,市場(chǎng)最初對(duì) AI 的樂觀也在于此,口語(yǔ)教學(xué)第一次可以不再依賴真人。
很多 AI 口語(yǔ)產(chǎn)品陸續(xù)出現(xiàn)。在這些產(chǎn)品中,大模型被當(dāng)做是一個(gè)可以完成流暢對(duì)話的萬(wàn)能語(yǔ)伴,人們可以沒有負(fù)擔(dān)的和它展開自由討論,大模型更是能夠自如地說出一般人難以掌握的長(zhǎng)難句式,從語(yǔ)言教育的角度講,這更接近語(yǔ)言 “習(xí)得” 的本質(zhì)。
但這些仍然稱不上是理想的口語(yǔ)教育。在克拉申的語(yǔ)言習(xí)得五種假說中,第五種被稱為語(yǔ)言輸入假說,在這位語(yǔ)言學(xué)大師看來,輸入(聽和讀)比輸出(讀和寫)重要,只有累積了足夠的輸入語(yǔ)料,輸出才能夠有的放矢。克拉申特別強(qiáng)調(diào),輸入的材料必須略微超過學(xué)習(xí)者本身的水平,但又不至于難到讓人徹底無法理解。正是這種帶有適當(dāng)挑戰(zhàn)性的漸進(jìn)式輸入決定了輸出的水平。
大模型盡管具有廣博的通用知識(shí),精準(zhǔn)無誤的語(yǔ)言發(fā)音和智能互動(dòng)體驗(yàn),但每一次對(duì)話背后并沒有對(duì)難度的考量,也就是說,學(xué)習(xí)者面對(duì)的只是一個(gè)全能對(duì)話問答機(jī)器,它既不懂得設(shè)定教學(xué)目標(biāo),也無意構(gòu)建教學(xué)效果閉環(huán),它只是盡己所能地回答用戶的問題,這并不是一種基于 AI 原生驅(qū)動(dòng)的教學(xué)產(chǎn)品,反而更像是一個(gè)添加了 AI 功能的傳統(tǒng)教學(xué)工具。
可以說,工具都是被動(dòng)響應(yīng)用戶的問題,而不是主動(dòng)帶領(lǐng)用戶學(xué)習(xí)。
用戶到底需要什么樣的口語(yǔ)學(xué)習(xí) AI 產(chǎn)品?
AI 已經(jīng)成為助推教育產(chǎn)業(yè)發(fā)展的重要因子,Grand View Research 報(bào)告估計(jì),從 2024 到 2030 年,全球 AI 教育市場(chǎng)規(guī)模的復(fù)合年增長(zhǎng)率將超過 30%,但迄今為止,在教育賽道里,還沒有出現(xiàn)一款基于大模型 Agent 技術(shù)構(gòu)建的原生 AI 教育產(chǎn)品。
較為典型的是拍照搜題類產(chǎn)品,大模型使其答案更加清晰準(zhǔn)確和高效。然而,這類工具產(chǎn)品盡管使用頻率高,卻因功能單一,難以形成完整的學(xué)習(xí)閉環(huán),大模型優(yōu)化了它們的工具屬性,但并未將其轉(zhuǎn)化為一種全新的學(xué)習(xí)產(chǎn)品。
實(shí)際上這揭示了大模型 Agent 技術(shù)落地中的一個(gè)核心問題:用戶已經(jīng)見過太多相似的 AI 工具,它們?nèi)狈Σ豢商娲裕鴺酚^的商業(yè)前景有賴于提供與眾不同的體驗(yàn)。因此,在修佳明看來,僅僅只是在現(xiàn)有的教學(xué)工具上添加一些 AI 功能,對(duì)斑馬來說還遠(yuǎn)遠(yuǎn)不夠。它不應(yīng)該是某些單點(diǎn)能力上的 AI 化,而應(yīng)該是全棧式基于 AI 本身的特點(diǎn),從 0 構(gòu)建的新形態(tài)產(chǎn)品。
剛剛推出的斑馬口語(yǔ),就是修佳明心目中對(duì)于全棧式 AI 學(xué)習(xí)產(chǎn)品理解的產(chǎn)物。他說,斑馬口語(yǔ)是 “首個(gè)落地教育場(chǎng)景的 ‘教育 Agent’”,相比較于其它 AI 口語(yǔ)產(chǎn)品更多圍繞于簡(jiǎn)單的工具屬性,教育 Agent 則是 “能自主完成教學(xué)閉環(huán)的智能體”。
![]()
斑馬口語(yǔ)技術(shù)架構(gòu)圖
“自主完成” 和 “教學(xué)閉環(huán)” 這兩個(gè)關(guān)鍵詞,恰巧對(duì)應(yīng)了前文提到的大模型主動(dòng)交互能力和 “教學(xué)-練習(xí)-測(cè)試-反饋” 全鏈條。
打開斑馬口語(yǔ),會(huì)看到一個(gè)三分屏,其中一個(gè)分給 AI 外教,她是一個(gè)名叫 Jessica 虛擬 2D 老師形象,另一個(gè)留給播放孩子實(shí)時(shí)直播畫面,最后的大屏則是交互式動(dòng)畫課件。
在大模型 Agent 技術(shù)的加持下,用戶使用這款針對(duì) 6-12 歲兒童設(shè)計(jì)的口語(yǔ)學(xué)習(xí)的全程(一節(jié)課時(shí)長(zhǎng)大約 25 分鐘),都是在跟 AI 外教一對(duì)一練習(xí)。
AI 外教不僅圍繞每節(jié)內(nèi)容的教學(xué)目標(biāo)回答小朋友天馬行空的各種問題,更會(huì)靈活運(yùn)用兒童心理學(xué)知識(shí)和有親和力的人格特征主動(dòng)引導(dǎo)用戶開口完整表達(dá),為了進(jìn)一步加強(qiáng)口語(yǔ)教學(xué)的互動(dòng)性,交互式動(dòng)畫課件中甚至還預(yù)埋了不少彩蛋動(dòng)效,舉例來說,當(dāng)小朋友興奮談?wù)撟约旱纳諘r(shí),這些彩蛋會(huì)隨機(jī)觸發(fā),像煙花一樣綻放在整個(gè)屏幕。
再比如,當(dāng) Jessica 引導(dǎo)孩子用英語(yǔ)形容某個(gè)人的長(zhǎng)相時(shí),交互式課件上會(huì)根據(jù)孩子的回答。
這樣的強(qiáng)互動(dòng)設(shè)計(jì)貫穿課程始終,確保用戶在 25 分鐘的時(shí)間內(nèi)緊密圍繞教學(xué)目標(biāo)深度參與,根據(jù)斑馬內(nèi)測(cè)期間的數(shù)據(jù)統(tǒng)計(jì),用戶一堂課累積開口說話的次數(shù)超過 100 次。
斑馬口語(yǔ)針對(duì)用戶的英語(yǔ)水平,將難度劃分為了六個(gè)梯度,每個(gè)梯度分為 24 個(gè)單元,每個(gè)單元 4 節(jié)課,所有 96 節(jié)課全部上完需要一年。這樣的內(nèi)容設(shè)計(jì)同在線一對(duì)一真人外教類似,而隨著教學(xué)的深入推進(jìn)(每周兩次),斑馬口語(yǔ)不僅逐漸記住用戶的個(gè)人學(xué)習(xí)情況、興趣愛好,還會(huì)在之后的課程中基于這些個(gè)人化信息同用戶進(jìn)行主動(dòng)互動(dòng)——這也同用戶面對(duì)真人老師時(shí)的情況一樣。
斑馬口語(yǔ)從設(shè)計(jì)伊始就遵循 “AI 原生” 原則。其核心在于實(shí)現(xiàn)大模型主動(dòng)交互、教學(xué)目標(biāo)體系化設(shè)計(jì)與產(chǎn)品界面機(jī)制三者的全面協(xié)同,修佳明說,這在國(guó)內(nèi)尚屬首次。
與模型 “搏斗”
作為一個(gè)具備自主教學(xué)能力的教育 Agent,斑馬口語(yǔ)的基座來自猿力大模型,同時(shí)對(duì)兒童語(yǔ)言教育場(chǎng)景進(jìn)行了特訓(xùn)微調(diào),其中許多數(shù)據(jù)來自斑馬多年以來的英語(yǔ)教學(xué)積累:斑馬過去的口語(yǔ)強(qiáng)化系列產(chǎn)品已經(jīng)積累了近 60 萬(wàn)節(jié)、1500 萬(wàn)分鐘的真實(shí)數(shù)據(jù)。
當(dāng)然,僅僅依賴專有數(shù)據(jù)和大模型能力本身并不足以將斑馬口語(yǔ)與市面上現(xiàn)有的 AI 口語(yǔ)產(chǎn)品區(qū)別開來,為了踐行主導(dǎo)型 Agnet 教育產(chǎn)品的理念,做一款市面上沒有的產(chǎn)品,斑馬在兩年多的時(shí)間里投入 200 人規(guī)模的團(tuán)隊(duì),這里面不僅包括負(fù)責(zé)教學(xué)體系動(dòng)畫交互設(shè)計(jì)的內(nèi)容團(tuán)隊(duì),產(chǎn)品團(tuán)隊(duì)和研發(fā)團(tuán)隊(duì),還有音視頻中臺(tái)以及跨部門的數(shù)據(jù)標(biāo)注與質(zhì)檢調(diào)優(yōu)團(tuán)隊(duì)。
自 2023 年 8 月立項(xiàng)以來,斑馬口語(yǔ)的上線日期多次推遲——用修佳明的話說,團(tuán)隊(duì)一直在 “與模型搏斗”。
搏斗分為兩個(gè)層面,首先是模型層。
已有的自研大模型只是基礎(chǔ),想要產(chǎn)品化,還必須針對(duì) AI 原生做特訓(xùn),這種特訓(xùn)大致包括兩部分。首先是讓模型融合多種口語(yǔ)教學(xué)法、心理學(xué)與語(yǔ)言學(xué)技巧,以便在實(shí)踐中更好地應(yīng)對(duì)多種突發(fā)場(chǎng)景(比如所謂熊孩子的搗亂)。另一部分則是將課件信息、學(xué)習(xí)目標(biāo)、評(píng)價(jià)標(biāo)準(zhǔn)等納入模型中,讓它對(duì)自己的教學(xué)目標(biāo)有著清晰認(rèn)知。
如何在引導(dǎo)糾正用戶把復(fù)雜的句子說好的同時(shí)不打擊他的信心?如何記住用戶的理解程度同時(shí)適當(dāng)拔高口語(yǔ)訓(xùn)練的難度?大模型極大的靈活性和口語(yǔ)教學(xué)的特點(diǎn)注定了這是個(gè)繁雜的過程,模型需要時(shí)刻圍繞用戶的具體場(chǎng)景和能力水平來做響應(yīng)。
搏斗的第二層則是工程化實(shí)踐。
大模型天然具有開放,靈活的特點(diǎn)。然而,當(dāng)斑馬的技術(shù)團(tuán)隊(duì)決定開發(fā)一個(gè)原生主導(dǎo)型教育 Agent,而非市面上常見的 AI 口語(yǔ)工具時(shí),他們面臨的核心挑戰(zhàn)是如何平衡控制與靈活:既要確保大模型嚴(yán)格遵循教學(xué)流程,又要避免限制過死,保留其應(yīng)答的靈活性。
不僅只是排除一般意義上的不安全內(nèi)容,模型訓(xùn)練階段的數(shù)據(jù)篩選還特別注意數(shù)據(jù)與兒童心理年齡發(fā)育的匹配性。在策略層,斑馬口語(yǔ)通過規(guī)則設(shè)定了一道彈性但明確的邊界,允許大模型在邊界內(nèi)自由發(fā)揮。
這套規(guī)則設(shè)計(jì)進(jìn)一步延宕了斑馬口語(yǔ)的開發(fā)速度,因?yàn)檫@種策略 “邊界” 設(shè)定,不是加幾個(gè)關(guān)鍵詞攔截那么簡(jiǎn)單,它不但是模型能力的一道護(hù)欄,同時(shí)還肩負(fù)著教學(xué)功能:斑馬的產(chǎn)研團(tuán)隊(duì)將每堂課都拆分成十幾個(gè)環(huán)節(jié),通過精確到 2-3 分鐘的環(huán)節(jié)目標(biāo)設(shè)定,引導(dǎo)大模型 Agent 能力沿著教學(xué)體系設(shè)計(jì)的方向前進(jìn)。
這種精細(xì)顆粒度讓開發(fā)一年的內(nèi)容花費(fèi)的時(shí)間差不多也需要一年,但帶來的好處在斑馬看來是值得的:清晰的、根據(jù)教學(xué)內(nèi)容設(shè)計(jì)的規(guī)則促使大模型 Agent 擁有極強(qiáng)的主導(dǎo)能力,但又不會(huì)漫無邊際地神游天外,同時(shí)在許多人類意想不到的時(shí)刻,會(huì)產(chǎn)生奇妙的火花。
修佳明舉了個(gè)例子,在內(nèi)測(cè)階段,同 AI 外教一同出場(chǎng)輔助執(zhí)行教學(xué)任務(wù)的 AI 學(xué)伴,在看到用戶對(duì)話中提及自己收到禮物時(shí),會(huì)脫口而出:I’m jealous.(我很嫉妒)“小朋友非常開心。” 修佳明說,因?yàn)檫@是一個(gè)有針對(duì)性的、情緒化的、意料之外的反應(yīng)。在大模型 Agent 出現(xiàn)之前,沒有哪種技術(shù)能做到這一點(diǎn)。
這種獨(dú)特性引發(fā)了另一個(gè)問題。如同從小接觸平板電腦與智能手機(jī)的小朋友會(huì)下意識(shí)觸摸每一塊看得到的玻璃一樣,作為實(shí)現(xiàn)完全自主的教育 Agent,斑馬口語(yǔ)中的 AI 外教 Jessica 對(duì)孩子來說意味著什么?
作為兒童教育領(lǐng)域的資深從業(yè)者,修佳明認(rèn)為,不需向用戶諱言 Jessica 的 AI 屬性,實(shí)際上,Jessica 確實(shí)就是個(gè)有人格的 AI 外教,她知識(shí)面廣博,囊括了大量的通識(shí)知識(shí),這在開放式問題互動(dòng)過程中非常好用。溫暖熱忱,擁有超越普通外教水平的教學(xué)能力和超強(qiáng)的記憶力。
斑馬口語(yǔ)從設(shè)計(jì)之初就致力于為 AI 外教建立穩(wěn)定的人格特質(zhì),通過大模型 Agent 實(shí)現(xiàn)的高質(zhì)量互動(dòng),使得 AI 外教能夠模擬真實(shí)教學(xué)中的多維交流,不限于知識(shí),也包含情感與價(jià)值觀。
主導(dǎo)型 Agent 與教育市場(chǎng)的重構(gòu)
口語(yǔ)教學(xué)是一個(gè)供需不匹配,一直以來需求都沒有被滿足的巨大市場(chǎng)。主導(dǎo)型 Agent 教育產(chǎn)品的出現(xiàn),第一次有望根本解決這種關(guān)系失衡。
根據(jù)修佳明的介紹,在經(jīng)過技術(shù)論證和反復(fù)測(cè)試后,斑馬口語(yǔ)最終定位是首個(gè) AI 外教一對(duì)一產(chǎn)品,這意味著它的最終價(jià)格會(huì)參考同級(jí)別的真人口語(yǔ)課程。
在教育領(lǐng)域,消費(fèi)者的決策邏輯非常樸素理性,就是看這個(gè)產(chǎn)品是否有用,從早期內(nèi)測(cè)的情況來看,反響頗為正面,斑馬內(nèi)部甚至圍繞這個(gè)產(chǎn)品構(gòu)建了一個(gè)名為口語(yǔ)力的指標(biāo),以便清晰量化衡量口語(yǔ)的提高過程。口語(yǔ)力共分為準(zhǔn)確度、流利度和豐富度三個(gè)大的維度,通過客觀數(shù)據(jù)指標(biāo)來量化分析,這些數(shù)據(jù)匯總起來得出的分?jǐn)?shù)就是口語(yǔ)力,它會(huì)在斑馬口語(yǔ)稍晚上線,屆時(shí)每個(gè)用戶都能通過這個(gè)指標(biāo)便捷衡量口語(yǔ)能力的提升幅度。
教育和醫(yī)療領(lǐng)域的 AI 應(yīng)用和其它所有賽道都不同,在修佳明看來,教育真正 “涉及人命關(guān)天的事情”,讓大模型領(lǐng)悟教育實(shí)踐過程中的微妙和精密,是一個(gè)注定無法一蹴而就的事。
兩年多的開發(fā)過程中,斑馬的產(chǎn)研團(tuán)隊(duì)真正掌握了許多一手實(shí)踐經(jīng)驗(yàn),正是這些經(jīng)驗(yàn),填補(bǔ)了大模型與成熟可商業(yè)化落地產(chǎn)品之間的空白。“經(jīng)驗(yàn)和人力的比重是特別大的,尤其是兒童英語(yǔ)。” 修佳明說,在模型不能自由發(fā)揮的地方,精密的教學(xué)內(nèi)容銜接、難度設(shè)計(jì)都需要人的經(jīng)驗(yàn)來完成。
從另一個(gè)角度說,這也是一份真正的苦活。對(duì)教育 Agent 產(chǎn)品來說, 97% 的可靠性都是不可接受的,這意味著 100 個(gè)用戶中有 3 個(gè)人的教育會(huì)出錯(cuò)。然而提升到 99.9% 所付出的邊際成本是巨大的,僅僅在研發(fā)上,斑馬為了這一款產(chǎn)品就投入超兩個(gè)億。
斑馬口語(yǔ)目前的形態(tài),是不是具有泛用性?斑馬口語(yǔ)這種主導(dǎo)型 Agent 形式適合所有人群和所有口語(yǔ)教學(xué)場(chǎng)景嗎?修佳明的心中并沒有確定的答案。關(guān)于 AI 教育產(chǎn)品的未來,還有許多問題有待于發(fā)現(xiàn)。
AI 推動(dòng)教育行業(yè)實(shí)現(xiàn)增長(zhǎng)已經(jīng)是確定的事實(shí),但隨著主導(dǎo)型 Agent 產(chǎn)品的出現(xiàn),教育行業(yè)整個(gè)市場(chǎng)規(guī)模、增長(zhǎng)前景乃至商業(yè)模式都面臨著重大重構(gòu),至少在口語(yǔ)教學(xué)領(lǐng)域,AI 外教已經(jīng)能夠做到真人教師的水平,甚至許多時(shí)候還更出色,而這距離 ChatGPT 發(fā)布才過去僅僅三年。在喬布斯所提出問題的道路上,技術(shù)已經(jīng)進(jìn)入一個(gè)新階段。
題圖來源:《模仿游戲》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.