![]()
11月17日至18日,芥末堆在北京舉辦以“教育有AI,學習無界”為主題的GET2025教育科技大會。阿里云智能集團公共云事業部華北大區教育行業解決方案總監張博就《全棧AI助力教育全場景創新》進行了主題分享。
以下為演講實錄,經編輯:
今天我帶來”全棧AI如何助力教育全場景創新”的分享。
為什么提“全棧AI”呢?首先要從教育最難的難題——“不可能三角”講起,即很難同時做到個性化、高質量和大規模。個性化的輔導怎么去規模化、怎么去提高質量?AI時代的到來,為解決這個難題提供了重要的思路。
為什么說在線教育是大模型賦能最快的行業?首先,在線教育擁有廣泛的需求及清晰的目標,這能讓大模型更好地做到因材施教。其次是高質量數據沉淀。教學過程中沉淀了大量的高質量數據,這些數據往往優于基礎模型的訓練數據。
基于此,阿里云全棧AI之所以能提供強勁賦能,主要是因為以下四點。
首先是通義千問的模型能力。阿里云堅持模型的開放開源,整個模型智能程度始終保持高水平,在國內外都受到廣泛歡迎。
其次,AI基礎設施的投入非常高。
另外,阿里云是全球領先的全棧人工智能服務商,所以在PaaS平臺和模型的配套方案,阿里也是有所長。舉個例子,現在開發智能體,往往需要歷史對話,用戶畫像,以及向量檢索,甚至是一些知識圖譜。阿里云PolarDB等數據庫產品能一站式地解決上述問題,這就是整個PaaS能力的體現。
最后一點就是,服務和生態賦能。現在幫助客戶做模型或迭代時,我們可以提供高水平的模型交付團隊。
![]()
接下來,我會介紹阿里云針對教育行業的全棧AI解決方案。包括這四個方面:教育增長運營、教學內容生產、教學互動和評估,以及課后的知識鞏固。
首先是增長運營。教育公司的核心是業務的增長。教培的運營,包括體驗課,轉正價課,續報等;如果是做在線教育App,需要進行拉新、留存等運營動作,這兩者的本質邏輯都是一樣的。基于通義千問大模型強大的分析、生成能力,在公域、私域的運營數據上,可以實現文、圖、視頻等種草內容的生產,對用戶原聲進行分析和歸納,設計智能體與潛在用戶對話,引導轉化。
場景一:教育增長運營
第一個場景,VOC(用戶原聲)。很多時候,我們在處理運營相關數據的時候,會做打標分析,用來提高轉化率。我們在實踐中發現,標簽可能需要分多個層級,最底層的標簽數量可能會達到100多個。這樣就會導致基礎模型打標簽準確率較低,這時我們可以在Qwen3小尺寸開源模型進行后訓練,訓后的模型打標,準確率大幅度提升。這就是Qwen3模型后訓練的一個最佳的實踐落地場景。
打標后訓練還有個“意圖識別”場景,例如,在對話智能體中,我們要教學生知識。首先要判斷問題是閑聊還是哪個學科。這時候就需要我們做前置的意圖分類。我們可以使用Qwen3的基礎模型做微調,會獲得比基礎模型更好的效果。
發文、發圖、發視頻的場景同樣適用。發文簡單,用大模型和提示詞就差不多了;發圖有三個方式:生圖、選圖和編輯圖。如果是發視頻的場景,很多客戶已經使用Wan2.2和2.5生成視頻,包括Wan2.5已經支持最大長度10秒的視頻,且視頻自帶聲音。用戶可以拼接拼成一個更長的視頻。還有就是AI剪輯視頻,包括剪輯視頻時,用工作流加模型的方式串聯起來。比如,先拿模型去生成講解腳本,然后再把講解腳本做一個語音合成,最終結合數字人的技術,加上云剪輯的能力,拼成一個完整的視頻。這些都可以實現的。
客服Agent是我們在大模型落地很重要的場景,這里面包括了意圖識別、查詢改寫以及公域、私域的各類回答。像客戶在小紅書上發文章后,下面可能有用戶來咨詢。這時候需要有一個機器人接洽這些咨詢,把他們轉化為用戶。
場景二:內容生產
![]()
內容生產是最近幾年越來越多教育公司在做的事情。主要包括以下內容的生產:題目教案、解題視頻、繪本動畫和課堂素材剪輯。題目的生產,用文本模型去產題,客戶采納率越來越高,也包括用教育領域OCR模型將線下的試卷或者講義數字化。那解題視頻和繪本動畫方面,前文也有所涉及。上課視頻的生產,和銷售場景類似,都是用模型的生成能力或工作流的拼接能力,去生成相關嚴肅的講課視頻、動畫的繪本;如果做低幼賽道,很多APP都用動畫繪本去講知識,動畫繪本的知識里用模型生成的量和占比以后會越來越多。
課堂素材的剪輯指的是將老師和學生的高光時刻剪輯出來。比如說老師的高光時刻,我們可以發到小紅書上去種草,學生的高光時刻我們可以發給家長,表示學習的成果。這些其實都能用qwen3的多模態模型能很好的處理。
場景三:教學互動和評估
第三個方向是用全棧AI提效教學互動和評估。主要分為兩類方案,一類是借助阿里云AI實時互動的編排能力+Qwen全面的模型能力,快速搭建AI老師實時對話智能體。第二類是借助Qwen3多模態模型,對老師教學質量和學生學情進行評估。
![]()
具體包括以下這些場景。首先是字幕上屏,可以使用最新的Qwen3-ASR模型識別上課語音,可以實現自動上屏、錄播課的切片,以及課程質量評估。
其次是AI課堂的互動。這里有兩套解決方案。一是基于AI實時互動RTC搭建任務的編排,可以快速幫客戶搭建智能體。另一套是直接用模型能力。Qwen3-Omni直接搭建智能體,還可以基于這個開源的模型進行后訓練智能體的強化。
AIGC的實訓課:現在教小孩學AI也是很重要的賽道,學AI一般都要體驗生文、生圖、生視頻,真實上課場景很多時候就是幾千甚至上萬個學生同時操作,這個時候對模型的并發能力有非常高的要求。百煉平臺的彈性算力單元(PTU),可秒級應對萬級并發,輕松應對這一場景。
還有一個就是多元模態的學情評估。很多時候學情評估質量,或是用視覺模型評估專注力,或是用文本模型評估講課質量。這時候就可以基于Qwen3多模態模型,對學情和教學質量進行評估,保障教學質量。
場景四:課后鞏固與自學
這個場景我總結為解題、批改、改題、推題、對練這幾個細分方向。我們在大量落地實踐中總結出一個規律,這個場景是非常適合去做Qwen模型的后訓練。
首先基礎模型肯定涵蓋不了所有客戶自己的高質量題目數據;其次剛需高頻高DAU場景;還有一點,它是實時在線業務,對于推理成本非常敏感,對于延遲要求很高。打個比方,本來需要萬億參數才能解決的問題,現在把它訓練到可能只有8B的小模型上,最多32B,就能達到比基礎模型還要高的準確率,同時獲得極低的推理成本和延時,這就是這個場景Qwen模型后訓練的價值。
還有一個點,我們面臨著客戶們很現實的需求,基礎模型解題能力不錯,但不是期望的講課風格,我們想要AI像真人老師一樣講題。如何實現?
現在所有的模型都越來越會說人話,其實就是強化學習在里面注入了人類偏好。通過偏好選擇的方式,來強化這個模型的風格,所以我們可以在后訓練階段加入Qwen模型的強化學習來解決這個風格問題。
![]()
剛才介紹了全棧AI場景,場景具體是怎么交付?今年9月云棲大會我們發布了大量的新模型,Qwen3-Max,可以對標海外最優秀模型的文本模型,Qwen-Flash,如果你想追求推理速度,就用Flash。還有Qwen-Image和Wan2.5等優秀的生圖生視頻的模型,以及Qwen3-ASR和Qwen3-TTS的語音交互模型也都獲得了客戶的高度認可。百煉平臺除了能夠體驗、調用模型以外,還有一點比較重要,如果客戶自己想做模型后訓練,我們可以提供訓練和推理的托管。相當于訓練過程中,你既可以用到Qwen3非開源的模型訓練,還能結合Qwen3原始的數據,自己的模型還可以低成本的托管在百煉上做推理,這是很多客戶非常喜歡的一點。
剛才在教學鞏固場景提到了后訓練的價值,如果是后訓練這個場景,千問模型具備很大的價值。大家知道為什么一提“后訓練”必談千問嗎?因為Qwen的開源涵蓋參數從大到小、各個模態的模型,模型的能力在開源榜單也很靠前,同時大量的后訓練衍生模型構筑了完整的生態,目前Qwen的全球衍生模型數量已經達到17萬。為了獲得更低的推理成本和延遲,用小參數模型的模型結合優質的場景數據,Qwen系列模型是大概率的選擇對象。整個訓練過程也逐步從Dense+SFT簡單的微調逐步走向了MoE+SFT。后訓練模型在阿里云有好多種不同的部署方式,可以在百練上提供后訓練模型的托管,也可以用PaaS平臺去做GPU形式的托管。
最后,AI在教育領域的價值并非取代教師,而是通過承擔批改作業、內容生成等重復性、事務性工作,將教師從繁重的機械勞動中解放出來,讓教師回歸教育的本質——成為學生情感的陪伴者、思維的引導者和人格的塑造者。這些高階育人職責,是任何技術都無法替代的。
阿里云全棧AI所追求的,正是以技術之力賦能教育,讓人與人之間的溫度、智慧與創造力,在課堂中重新閃耀。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.