原文來源:多鯨
作者:曹培杰 黃寶忠
圖片來源:由無界 AI生成
回望2023年,ChatGPT橫空出世,國內(nèi)外公司紛紛推出自家大模型,加入混戰(zhàn),各種智能化教育產(chǎn)品也隨之落地,AI+教育概念熱度飆升。由于教育所獨有的個性化、互動性需求,教育行業(yè)成大模型落地最通暢的場景之一。從通用大模型到教育專用大模型,從AI概念到實際產(chǎn)品,如何推動市場生態(tài)走向成熟?
近日,中國教育科學(xué)研究院數(shù)字教育研究所副所長曹培杰、之江實驗室智能教育研究中心主任黃寶忠共同發(fā)布了《重構(gòu)教育圖景:教育專用大模型研究報告》(下簡稱《報告》)。《報告》聚焦教育專用大模型,從技術(shù)基礎(chǔ)、應(yīng)用現(xiàn)狀、潛在挑戰(zhàn)、創(chuàng)新構(gòu)思、落地場景等方面開展研究。
「大模型」(largemodels)是指具有數(shù)十億到數(shù)百億甚至更多可訓(xùn)練參數(shù)的人工智能模型,它是深度學(xué)習(xí)、GPU硬件、大規(guī)模數(shù)據(jù)集等多種技術(shù)共同發(fā)展的產(chǎn)物。大模型所展現(xiàn)的強大能力實質(zhì)上是深度學(xué)習(xí)中「量變引起質(zhì)變」的結(jié)果。當(dāng)模型參數(shù)量達到一定規(guī)模時,模型準確率會經(jīng)歷質(zhì)的飛躍,這一過程被稱之為「涌現(xiàn)能力」,即從原始訓(xùn)練數(shù)據(jù)中自動學(xué)習(xí)并發(fā)現(xiàn)新的、更高層次的特征和模式的能力。這些能力突出表現(xiàn)為通用的用戶意圖理解能力、強大的大范圍上下文連續(xù)對話能力、智能的交互修正能力、內(nèi)容的潤色分類和總結(jié)能力、新內(nèi)容的生成能力、多模態(tài)能力。
《報告》指出,教育專用大模型是指以通用大模型為基礎(chǔ)的多層次開放技術(shù)架構(gòu),以多樣的教育數(shù)字化應(yīng)用為驅(qū)動,通過統(tǒng)一交互對話界面向師生和社會學(xué)習(xí)者提供專業(yè)能力,具備豐富多樣的教育專業(yè)知識,并在應(yīng)用中持續(xù)升級。作為重點研發(fā)領(lǐng)域之一,教育專用大模型是大模型技術(shù)、知識庫技術(shù)以及各類智能教育技術(shù)的集成應(yīng)用,將在教育過程中訓(xùn)練形成教育新場景,實現(xiàn)人類學(xué)習(xí)和機器學(xué)習(xí)的雙向建構(gòu)。
教育專用大模型應(yīng)用包括學(xué)習(xí)空間互動生成、學(xué)習(xí)資源按需供給、教師角色轉(zhuǎn)型升級、探究性學(xué)習(xí)、對話式教學(xué)、嵌入式評價、服務(wù)式治理等關(guān)鍵要素。
當(dāng)前,教育專用大模型主要采取兩種技術(shù)路線:一是直接調(diào)用通用大模型,通過微調(diào)或提示學(xué)習(xí)的方式使之具備一定專業(yè)能力;二是利用教育領(lǐng)域?qū)I(yè)數(shù)據(jù),專門訓(xùn)練用于解決教育任務(wù)的大模型。
綜合當(dāng)前業(yè)內(nèi)情況看來,這兩種技術(shù)路線都取得了一定進展,但實現(xiàn)效果仍有待提升。由于缺乏足夠的專業(yè)數(shù)據(jù)訓(xùn)練,教育深度知識不夠,智能性不強,難以靈活處理復(fù)雜多變的教育任務(wù)。
《報告》指出,研發(fā)教育專用大模型,破解之道在于兩條技術(shù)路線整合起來。
這并非簡單相加,而是通過建立一種全新的開放技術(shù)架構(gòu),系統(tǒng)整合通用問題解決能力和教育專用問題解決能力,實現(xiàn)技術(shù)突破。具體來說,要結(jié)合通用大模型與教育領(lǐng)域?qū)I(yè)數(shù)據(jù),打破數(shù)據(jù)孤島,通過開放數(shù)據(jù)接口源源不斷地獲得來自常態(tài)化教育應(yīng)用中的數(shù)據(jù);要以專家知識庫作為大模型的補充,將學(xué)科知識和教育教學(xué)中的各種規(guī)則有意識地「教」給大模型;要整合應(yīng)用各類智能教育技術(shù),將已經(jīng)發(fā)展起來的各類智能教育技術(shù)集成于教育專用大模型之中。
大模型在口語練習(xí)、數(shù)學(xué)學(xué)習(xí)、情感分析和個性化推薦等方面為教育帶來巨大潛力和可能性?!秷蟾妗肥崂砹宋宸N典型的教育專業(yè)大模型應(yīng)用案例,對其發(fā)展背景、應(yīng)用場景、設(shè)計特色等進行了深度分析。
教育專用大模型典型應(yīng)用案例
從應(yīng)用場景看,星火語伴主要用于語言學(xué)習(xí),支持多語言文本、語音和圖片的實時翻譯,并能糾正語法錯誤,提供口語陪練等。EmoGPT用于提供心理健康服務(wù),能識別和響應(yīng)用戶情緒,提供持續(xù)的心理支持。MathGPT面向全球數(shù)學(xué)愛好者和科研機構(gòu),提供解題和講題算法,支持用戶進行數(shù)學(xué)解題和練習(xí)。智海-三樂用于AI專業(yè)教育,提供搜索引擎、計算引擎和本地知識庫等功能,支持智能問答和試題生成。Khanmigo通過對話式AI聊天機器人為學(xué)習(xí)者提供個性化學(xué)習(xí)方案,同時也支持生涯規(guī)劃服務(wù)、教學(xué)方法輔導(dǎo)優(yōu)化等。
從技術(shù)進展看,教育專用大模型在模型性能、應(yīng)用場景、技術(shù)特點方面展現(xiàn)出優(yōu)勢,涵蓋了大部分學(xué)科內(nèi)容,主要聚焦于自主學(xué)習(xí)場景,包括知識問答、語言學(xué)習(xí)、學(xué)習(xí)引導(dǎo)和教學(xué)輔助等。在技術(shù)路線上,「通用+微調(diào)」的路徑已證明其有效性,許多技術(shù)方案以通用大模型為基礎(chǔ),通過指令微調(diào)等方式實現(xiàn)針對特定學(xué)科知識的有效回答。
從現(xiàn)有不足看,現(xiàn)有教育專用大模型在準確性、教學(xué)內(nèi)容多樣性、支持核心教育場景、包容學(xué)習(xí)者多樣性方面還有所局限,存在錯誤率較高、缺乏共情理解能力等問題,主要側(cè)重于學(xué)科知識教學(xué)和應(yīng)試教育情境,在跨學(xué)科學(xué)習(xí)、學(xué)生綜合能力與高階思維培養(yǎng)等方面仍有不足;主要聚焦于支持自主學(xué)習(xí),在真實課堂、同伴協(xié)作、混合教學(xué)等場景下如何充分發(fā)揮大模型的作用尚未得到有效探索。
總之,大模型在教育領(lǐng)域的應(yīng)用取得了明顯進展,但仍面臨著現(xiàn)實問題,需要進一步提升訓(xùn)練數(shù)據(jù)的質(zhì)量和規(guī)模,尤其是將先進教育理念、教育深度知識和教育核心場景的真實需求深度嵌入技術(shù)設(shè)計,結(jié)合用戶反饋進行多輪迭代,形成更智慧、更靈活的教育專用大模型。
《報告》指出,教育自動化和智能化的實現(xiàn)相較于其他領(lǐng)域往往面臨著更高的要求。因為教育任務(wù)大部分是「非程式化」的,可自動化程度相對較低。隨著大模型在模仿、生成、創(chuàng)作等能力上的不斷突破,大模型有望在教育過程中得到深入應(yīng)用。作為一項新興的人工智能技術(shù),有必要對教育專用大模型可能面臨的挑戰(zhàn)進行系統(tǒng)性評估。
一方面,智能機器與人類教師之間存在模糊分野。教育任務(wù)往往需要人類智慧,這使得具備生成、創(chuàng)造能力的大模型技術(shù)在承擔(dān)復(fù)雜認知任務(wù)(如藝術(shù)創(chuàng)作、決策制定)時,逐漸模糊了機器與教師之間的界限,從而容易導(dǎo)致師生對大模型的過度依賴,造成知識體系的斷裂和碎片化、偏見等問題。具體來說,大模型的強大生成能力簡化了師生獲取信息的流程,但也放大了其對知識探究的惰性。大模型往往會為復(fù)雜問題提供簡潔、直接的答案,但這些答案缺乏連貫性和完整性,可能導(dǎo)致學(xué)生所獲取的知識處于不斷被切割的狀態(tài)。
同時,數(shù)據(jù)集本身或算法等原因?qū)е履P蛯δ承┨囟ㄈ后w或主題存在偏好或歧視,可能會導(dǎo)致模型輸出的答案或結(jié)論存在偏差。
另一方面,通用與專用大模型在人類價值上可能存在沖突。通用大模型在教育領(lǐng)域的應(yīng)用受限主要源于其缺乏教育領(lǐng)域特定的深度知識和個性化定制能力。這種模型通常是通過廣泛而通用的文本數(shù)據(jù)訓(xùn)練而成,未必能準確理解教育領(lǐng)域特定術(shù)語、學(xué)科需求及學(xué)習(xí)模式,由此引發(fā)通用與專用大模型之間的過程與結(jié)果的沖突、生成與探究的沖突、自動與協(xié)作的沖突、透明和可靠的沖突。因此,需要定制基于領(lǐng)域知識深度理解的教育專用大模型來提供更有效、精準和深度的智能化支持。
《報告》秉持「應(yīng)用驅(qū)動、共建共享」的理念,提出了開放創(chuàng)新的教育專用大模型架構(gòu),通過集成通用大模型、教育場景模型(小模型)和知識庫三條技術(shù)路線,讓教育專用大模型賦能各級各類教育數(shù)字化應(yīng)用,讓智能算力像「水電」一樣,接入每一所學(xué)校、每一個課堂、每一臺終端,讓生成式人工智能成為廣大師生的親密助手。
教育專用大模型的開放創(chuàng)新架構(gòu)分為三層,分別是基礎(chǔ)能力層(L0)、專業(yè)能力層(L1)、應(yīng)用服務(wù)層(L2)?;A(chǔ)能力層(L0)基于通用大模型的基礎(chǔ)能力,根據(jù)多元教育數(shù)據(jù)類型和多元任務(wù)需求,調(diào)用不同類型的大模型。專業(yè)能力層(L1)包括教育場景模型庫和專家知識庫。應(yīng)用服務(wù)層(L2)將各類教育數(shù)字化應(yīng)用接入大模型,在大模型為應(yīng)用賦能的同時,將應(yīng)用數(shù)據(jù)源源不斷傳入大模型,持續(xù)提高大模型的教育專業(yè)能力。
教育專用大模型開放創(chuàng)新架構(gòu)
教育專用大模型并非單一、封閉的模型,而是一個開發(fā)者和用戶共同參與持續(xù)完善的過程。廣大師生和各類教育數(shù)字化產(chǎn)品的研發(fā)者既是模型的使用者,也是模型的貢獻者、建設(shè)者,由此形成共建共享的教育專用大模型創(chuàng)新生態(tài)。教育專用大模型的技術(shù)路線包括大規(guī)模多元教育數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、特征工程、模型設(shè)計、模型預(yù)訓(xùn)練、微調(diào)與遷移學(xué)習(xí)、模型評估與調(diào)優(yōu)七個關(guān)鍵步驟。
教育專用大模型的技術(shù)路線
教育專用大模型將把「以學(xué)習(xí)者為中心」理念變成普遍現(xiàn)實。其中,在學(xué)前教育階段,主要表現(xiàn)為尊重兒童、放手兒童,強調(diào)培養(yǎng)兒童的自主性、創(chuàng)造性;在基礎(chǔ)教育階段,主要表現(xiàn)為從講授灌輸式教學(xué)走向深度理解和研究性學(xué)習(xí),強調(diào)建立學(xué)習(xí)者的主體性;在高等教育和職業(yè)教育階段,主要表現(xiàn)為以學(xué)生發(fā)展為中心,強調(diào)科教融合、產(chǎn)教融合;在終身教育階段,主要表現(xiàn)為以學(xué)習(xí)需求為導(dǎo)向,重點解決優(yōu)質(zhì)教育資源供給與需求匹配的問題。
未來,人工智能大模型將深度融入各領(lǐng)域各環(huán)節(jié),賦能千行百業(yè)智能升級,助力社會生產(chǎn)力躍升。從通用大模型到教育專用大模型,是人工智能大模型技術(shù)深化發(fā)展的重要趨勢。這不只是在通用大模型基礎(chǔ)上進行微調(diào)和優(yōu)化,而是一種基于教育場景、開放模型架構(gòu)的重大創(chuàng)新。同時,也是推動教育數(shù)字化改革、推進教育公平惠普化的重要推力。