當前位置：區(qū)塊鏈 >區(qū)塊鏈 > 聚焦教育場景的大模型，離真正的「教育專用大模型」還差多遠？

聚焦教育場景的大模型，離真正的「教育專用大模型」還差多遠？

更新時間：2023-12-19 10:38:00 | 作者：佚名

原文來源：多鯨作者：曹培杰黃寶忠圖片來源：由無界AI生成回望2023年，ChatGPT橫空出世，國內外公司紛紛推出自家大模型，加入混戰(zhàn)，各種智能化教育產品也隨之落地，AI+教育概念熱度飆升。由于教育所獨有的個性化、互動性需求，教育行業(yè)成大模型落地最通暢的場景之一。從通用大模型到教育專用大模型，從AI概念到實際產品，如何推動市場生態(tài)走向成熟？近日，中...

原文來源：多鯨

作者：曹培杰黃寶忠

圖片來源：由無界 AI生成

回望2023年，ChatGPT橫空出世，國內外公司紛紛推出自家大模型，加入混戰(zhàn)，各種智能化教育產品也隨之落地，AI+教育概念熱度飆升。由于教育所獨有的個性化、互動性需求，教育行業(yè)成大模型落地最通暢的場景之一。從通用大模型到教育專用大模型，從AI概念到實際產品，如何推動市場生態(tài)走向成熟？

近日，中國教育科學研究院數(shù)字教育研究所副所長曹培杰、之江實驗室智能教育研究中心主任黃寶忠共同發(fā)布了《重構教育圖景：教育專用大模型研究報告》（下簡稱《報告》）?！秷蟾妗肪劢菇逃龑Ｓ么竽Ｐ?，從技術基礎、應用現(xiàn)狀、潛在挑戰(zhàn)、創(chuàng)新構思、落地場景等方面開展研究。

「大模型」（largemodels）是指具有數(shù)十億到數(shù)百億甚至更多可訓練參數(shù)的人工智能模型，它是深度學習、GPU硬件、大規(guī)模數(shù)據(jù)集等多種技術共同發(fā)展的產物。大模型所展現(xiàn)的強大能力實質上是深度學習中「量變引起質變」的結果。當模型參數(shù)量達到一定規(guī)模時，模型準確率會經(jīng)歷質的飛躍，這一過程被稱之為「涌現(xiàn)能力」，即從原始訓練數(shù)據(jù)中自動學習并發(fā)現(xiàn)新的、更高層次的特征和模式的能力。這些能力突出表現(xiàn)為通用的用戶意圖理解能力、強大的大范圍上下文連續(xù)對話能力、智能的交互修正能力、內容的潤色分類和總結能力、新內容的生成能力、多模態(tài)能力。

《報告》指出，教育專用大模型是指以通用大模型為基礎的多層次開放技術架構，以多樣的教育數(shù)字化應用為驅動，通過統(tǒng)一交互對話界面向師生和社會學習者提供專業(yè)能力，具備豐富多樣的教育專業(yè)知識，并在應用中持續(xù)升級。作為重點研發(fā)領域之一，教育專用大模型是大模型技術、知識庫技術以及各類智能教育技術的集成應用，將在教育過程中訓練形成教育新場景，實現(xiàn)人類學習和機器學習的雙向建構。

教育專用大模型應用包括學習空間互動生成、學習資源按需供給、教師角色轉型升級、探究性學習、對話式教學、嵌入式評價、服務式治理等關鍵要素。

當前，教育專用大模型主要采取兩種技術路線：一是直接調用通用大模型，通過微調或提示學習的方式使之具備一定專業(yè)能力；二是利用教育領域專業(yè)數(shù)據(jù)，專門訓練用于解決教育任務的大模型。

綜合當前業(yè)內情況看來，這兩種技術路線都取得了一定進展，但實現(xiàn)效果仍有待提升。由于缺乏足夠的專業(yè)數(shù)據(jù)訓練，教育深度知識不夠，智能性不強，難以靈活處理復雜多變的教育任務。

《報告》指出，研發(fā)教育專用大模型，破解之道在于兩條技術路線整合起來。

這并非簡單相加，而是通過建立一種全新的開放技術架構，系統(tǒng)整合通用問題解決能力和教育專用問題解決能力，實現(xiàn)技術突破。具體來說，要結合通用大模型與教育領域專業(yè)數(shù)據(jù)，打破數(shù)據(jù)孤島，通過開放數(shù)據(jù)接口源源不斷地獲得來自常態(tài)化教育應用中的數(shù)據(jù)；要以專家知識庫作為大模型的補充，將學科知識和教育教學中的各種規(guī)則有意識地「教」給大模型；要整合應用各類智能教育技術，將已經(jīng)發(fā)展起來的各類智能教育技術集成于教育專用大模型之中。

大模型在口語練習、數(shù)學學習、情感分析和個性化推薦等方面為教育帶來巨大潛力和可能性?！秷蟾妗肥崂砹宋宸N典型的教育專業(yè)大模型應用案例，對其發(fā)展背景、應用場景、設計特色等進行了深度分析。

教育專用大模型典型應用案例

從應用場景看，星火語伴主要用于語言學習，支持多語言文本、語音和圖片的實時翻譯，并能糾正語法錯誤，提供口語陪練等。EmoGPT用于提供心理健康服務，能識別和響應用戶情緒，提供持續(xù)的心理支持。MathGPT面向全球數(shù)學愛好者和科研機構，提供解題和講題算法，支持用戶進行數(shù)學解題和練習。智海-三樂用于AI專業(yè)教育，提供搜索引擎、計算引擎和本地知識庫等功能，支持智能問答和試題生成。Khanmigo通過對話式AI聊天機器人為學習者提供個性化學習方案，同時也支持生涯規(guī)劃服務、教學方法輔導優(yōu)化等。

從技術進展看，教育專用大模型在模型性能、應用場景、技術特點方面展現(xiàn)出優(yōu)勢，涵蓋了大部分學科內容，主要聚焦于自主學習場景，包括知識問答、語言學習、學習引導和教學輔助等。在技術路線上，「通用+微調」的路徑已證明其有效性，許多技術方案以通用大模型為基礎，通過指令微調等方式實現(xiàn)針對特定學科知識的有效回答。

從現(xiàn)有不足看，現(xiàn)有教育專用大模型在準確性、教學內容多樣性、支持核心教育場景、包容學習者多樣性方面還有所局限，存在錯誤率較高、缺乏共情理解能力等問題，主要側重于學科知識教學和應試教育情境，在跨學科學習、學生綜合能力與高階思維培養(yǎng)等方面仍有不足；主要聚焦于支持自主學習，在真實課堂、同伴協(xié)作、混合教學等場景下如何充分發(fā)揮大模型的作用尚未得到有效探索。

總之，大模型在教育領域的應用取得了明顯進展，但仍面臨著現(xiàn)實問題，需要進一步提升訓練數(shù)據(jù)的質量和規(guī)模，尤其是將先進教育理念、教育深度知識和教育核心場景的真實需求深度嵌入技術設計，結合用戶反饋進行多輪迭代，形成更智慧、更靈活的教育專用大模型。

《報告》指出，教育自動化和智能化的實現(xiàn)相較于其他領域往往面臨著更高的要求。因為教育任務大部分是「非程式化」的，可自動化程度相對較低。隨著大模型在模仿、生成、創(chuàng)作等能力上的不斷突破，大模型有望在教育過程中得到深入應用。作為一項新興的人工智能技術，有必要對教育專用大模型可能面臨的挑戰(zhàn)進行系統(tǒng)性評估。

一方面，智能機器與人類教師之間存在模糊分野。教育任務往往需要人類智慧，這使得具備生成、創(chuàng)造能力的大模型技術在承擔復雜認知任務（如藝術創(chuàng)作、決策制定）時，逐漸模糊了機器與教師之間的界限，從而容易導致師生對大模型的過度依賴，造成知識體系的斷裂和碎片化、偏見等問題。具體來說，大模型的強大生成能力簡化了師生獲取信息的流程，但也放大了其對知識探究的惰性。大模型往往會為復雜問題提供簡潔、直接的答案，但這些答案缺乏連貫性和完整性，可能導致學生所獲取的知識處于不斷被切割的狀態(tài)。

同時，數(shù)據(jù)集本身或算法等原因導致模型對某些特定群體或主題存在偏好或歧視，可能會導致模型輸出的答案或結論存在偏差。

另一方面，通用與專用大模型在人類價值上可能存在沖突。通用大模型在教育領域的應用受限主要源于其缺乏教育領域特定的深度知識和個性化定制能力。這種模型通常是通過廣泛而通用的文本數(shù)據(jù)訓練而成，未必能準確理解教育領域特定術語、學科需求及學習模式，由此引發(fā)通用與專用大模型之間的過程與結果的沖突、生成與探究的沖突、自動與協(xié)作的沖突、透明和可靠的沖突。因此，需要定制基于領域知識深度理解的教育專用大模型來提供更有效、精準和深度的智能化支持。

《報告》秉持「應用驅動、共建共享」的理念，提出了開放創(chuàng)新的教育專用大模型架構，通過集成通用大模型、教育場景模型（小模型）和知識庫三條技術路線，讓教育專用大模型賦能各級各類教育數(shù)字化應用，讓智能算力像「水電」一樣，接入每一所學校、每一個課堂、每一臺終端，讓生成式人工智能成為廣大師生的親密助手。

教育專用大模型的開放創(chuàng)新架構分為三層，分別是基礎能力層（L0）、專業(yè)能力層（L1）、應用服務層（L2）?；A能力層（L0）基于通用大模型的基礎能力，根據(jù)多元教育數(shù)據(jù)類型和多元任務需求，調用不同類型的大模型。專業(yè)能力層（L1）包括教育場景模型庫和專家知識庫。應用服務層（L2）將各類教育數(shù)字化應用接入大模型，在大模型為應用賦能的同時，將應用數(shù)據(jù)源源不斷傳入大模型，持續(xù)提高大模型的教育專業(yè)能力。

教育專用大模型開放創(chuàng)新架構

教育專用大模型并非單一、封閉的模型，而是一個開發(fā)者和用戶共同參與持續(xù)完善的過程。廣大師生和各類教育數(shù)字化產品的研發(fā)者既是模型的使用者，也是模型的貢獻者、建設者，由此形成共建共享的教育專用大模型創(chuàng)新生態(tài)。教育專用大模型的技術路線包括大規(guī)模多元教育數(shù)據(jù)采集、數(shù)據(jù)預處理、特征工程、模型設計、模型預訓練、微調與遷移學習、模型評估與調優(yōu)七個關鍵步驟。

教育專用大模型的技術路線

教育專用大模型將把「以學習者為中心」理念變成普遍現(xiàn)實。其中，在學前教育階段，主要表現(xiàn)為尊重兒童、放手兒童，強調培養(yǎng)兒童的自主性、創(chuàng)造性；在基礎教育階段，主要表現(xiàn)為從講授灌輸式教學走向深度理解和研究性學習，強調建立學習者的主體性；在高等教育和職業(yè)教育階段，主要表現(xiàn)為以學生發(fā)展為中心，強調科教融合、產教融合；在終身教育階段，主要表現(xiàn)為以學習需求為導向，重點解決優(yōu)質教育資源供給與需求匹配的問題。

未來，人工智能大模型將深度融入各領域各環(huán)節(jié)，賦能千行百業(yè)智能升級，助力社會生產力躍升。從通用大模型到教育專用大模型，是人工智能大模型技術深化發(fā)展的重要趨勢。這不只是在通用大模型基礎上進行微調和優(yōu)化，而是一種基于教育場景、開放模型架構的重大創(chuàng)新。同時，也是推動教育數(shù)字化改革、推進教育公平惠普化的重要推力。

本站提醒：投資有風險，入市須謹慎，本內容不作為投資理財建議。

聚焦教育場景的大模型，離真正的「教育專用大模型」還差多遠？

聚焦教育場景的大模型，離真正的「教育專用大模型」還差多遠？