hao86下載站:值得大家信賴的游戲下載站!

首頁 > 區(qū)塊鏈 > 聚焦教育場景的大模型,離真正的「教育專用大模型」還差多遠?

聚焦教育場景的大模型,離真正的「教育專用大模型」還差多遠?

時間:2023-12-19 10:38:00
來源:hao86下載
區(qū)塊鏈

【#區(qū)塊鏈# #聚焦教育場景的大模型,離真正的「教育專用大模型」還差多遠?#】

原文來源:多鯨

作者:曹培杰 黃寶忠

圖片來源:由無界 AI生成

回望2023年,ChatGPT橫空出世,國內(nèi)外公司紛紛推出自家大模型,加入混戰(zhàn),各種智能化教育產(chǎn)品也隨之落地,AI+教育概念熱度飆升。由于教育所獨有的個性化、互動性需求,教育行業(yè)成大模型落地最通暢的場景之一。從通用大模型到教育專用大模型,從AI概念到實際產(chǎn)品,如何推動市場生態(tài)走向成熟?

近日,中國教育科學研究院數(shù)字教育研究所副所長曹培杰、之江實驗室智能教育研究中心主任黃寶忠共同發(fā)布了《重構(gòu)教育圖景:教育專用大模型研究報告》(下簡稱《報告》)。《報告》聚焦教育專用大模型,從技術(shù)基礎、應用現(xiàn)狀、潛在挑戰(zhàn)、創(chuàng)新構(gòu)思、落地場景等方面開展研究。

「大模型」(largemodels)是指具有數(shù)十億到數(shù)百億甚至更多可訓練參數(shù)的人工智能模型,它是深度學習、GPU硬件、大規(guī)模數(shù)據(jù)集等多種技術(shù)共同發(fā)展的產(chǎn)物。大模型所展現(xiàn)的強大能力實質(zhì)上是深度學習中「量變引起質(zhì)變」的結(jié)果。當模型參數(shù)量達到一定規(guī)模時,模型準確率會經(jīng)歷質(zhì)的飛躍,這一過程被稱之為「涌現(xiàn)能力」,即從原始訓練數(shù)據(jù)中自動學習并發(fā)現(xiàn)新的、更高層次的特征和模式的能力。這些能力突出表現(xiàn)為通用的用戶意圖理解能力、強大的大范圍上下文連續(xù)對話能力、智能的交互修正能力、內(nèi)容的潤色分類和總結(jié)能力、新內(nèi)容的生成能力、多模態(tài)能力。

《報告》指出,教育專用大模型是指以通用大模型為基礎的多層次開放技術(shù)架構(gòu),以多樣的教育數(shù)字化應用為驅(qū)動,通過統(tǒng)一交互對話界面向師生和社會學習者提供專業(yè)能力,具備豐富多樣的教育專業(yè)知識,并在應用中持續(xù)升級。作為重點研發(fā)領(lǐng)域之一,教育專用大模型是大模型技術(shù)、知識庫技術(shù)以及各類智能教育技術(shù)的集成應用,將在教育過程中訓練形成教育新場景,實現(xiàn)人類學習和機器學習的雙向建構(gòu)。

教育專用大模型應用包括學習空間互動生成、學習資源按需供給、教師角色轉(zhuǎn)型升級、探究性學習、對話式教學、嵌入式評價、服務式治理等關(guān)鍵要素。

當前,教育專用大模型主要采取兩種技術(shù)路線:一是直接調(diào)用通用大模型,通過微調(diào)或提示學習的方式使之具備一定專業(yè)能力;二是利用教育領(lǐng)域?qū)I(yè)數(shù)據(jù),專門訓練用于解決教育任務的大模型。

綜合當前業(yè)內(nèi)情況看來,這兩種技術(shù)路線都取得了一定進展,但實現(xiàn)效果仍有待提升。由于缺乏足夠的專業(yè)數(shù)據(jù)訓練,教育深度知識不夠,智能性不強,難以靈活處理復雜多變的教育任務。

《報告》指出,研發(fā)教育專用大模型,破解之道在于兩條技術(shù)路線整合起來。

這并非簡單相加,而是通過建立一種全新的開放技術(shù)架構(gòu),系統(tǒng)整合通用問題解決能力和教育專用問題解決能力,實現(xiàn)技術(shù)突破。具體來說,要結(jié)合通用大模型與教育領(lǐng)域?qū)I(yè)數(shù)據(jù),打破數(shù)據(jù)孤島,通過開放數(shù)據(jù)接口源源不斷地獲得來自常態(tài)化教育應用中的數(shù)據(jù);要以專家知識庫作為大模型的補充,將學科知識和教育教學中的各種規(guī)則有意識地「教」給大模型;要整合應用各類智能教育技術(shù),將已經(jīng)發(fā)展起來的各類智能教育技術(shù)集成于教育專用大模型之中。

大模型在口語練習、數(shù)學學習、情感分析和個性化推薦等方面為教育帶來巨大潛力和可能性?!秷蟾妗肥崂砹宋宸N典型的教育專業(yè)大模型應用案例,對其發(fā)展背景、應用場景、設計特色等進行了深度分析。

教育專用大模型典型應用案例

從應用場景看,星火語伴主要用于語言學習,支持多語言文本、語音和圖片的實時翻譯,并能糾正語法錯誤,提供口語陪練等。EmoGPT用于提供心理健康服務,能識別和響應用戶情緒,提供持續(xù)的心理支持。MathGPT面向全球數(shù)學愛好者和科研機構(gòu),提供解題和講題算法,支持用戶進行數(shù)學解題和練習。智海-三樂用于AI專業(yè)教育,提供搜索引擎、計算引擎和本地知識庫等功能,支持智能問答和試題生成。Khanmigo通過對話式AI聊天機器人為學習者提供個性化學習方案,同時也支持生涯規(guī)劃服務、教學方法輔導優(yōu)化等。

從技術(shù)進展看,教育專用大模型在模型性能、應用場景、技術(shù)特點方面展現(xiàn)出優(yōu)勢,涵蓋了大部分學科內(nèi)容,主要聚焦于自主學習場景,包括知識問答、語言學習、學習引導和教學輔助等。在技術(shù)路線上,「通用+微調(diào)」的路徑已證明其有效性,許多技術(shù)方案以通用大模型為基礎,通過指令微調(diào)等方式實現(xiàn)針對特定學科知識的有效回答。

從現(xiàn)有不足看,現(xiàn)有教育專用大模型在準確性、教學內(nèi)容多樣性、支持核心教育場景、包容學習者多樣性方面還有所局限,存在錯誤率較高、缺乏共情理解能力等問題,主要側(cè)重于學科知識教學和應試教育情境,在跨學科學習、學生綜合能力與高階思維培養(yǎng)等方面仍有不足;主要聚焦于支持自主學習,在真實課堂、同伴協(xié)作、混合教學等場景下如何充分發(fā)揮大模型的作用尚未得到有效探索。

總之,大模型在教育領(lǐng)域的應用取得了明顯進展,但仍面臨著現(xiàn)實問題,需要進一步提升訓練數(shù)據(jù)的質(zhì)量和規(guī)模,尤其是將先進教育理念、教育深度知識和教育核心場景的真實需求深度嵌入技術(shù)設計,結(jié)合用戶反饋進行多輪迭代,形成更智慧、更靈活的教育專用大模型。

《報告》指出,教育自動化和智能化的實現(xiàn)相較于其他領(lǐng)域往往面臨著更高的要求。因為教育任務大部分是「非程式化」的,可自動化程度相對較低。隨著大模型在模仿、生成、創(chuàng)作等能力上的不斷突破,大模型有望在教育過程中得到深入應用。作為一項新興的人工智能技術(shù),有必要對教育專用大模型可能面臨的挑戰(zhàn)進行系統(tǒng)性評估。

一方面,智能機器與人類教師之間存在模糊分野。教育任務往往需要人類智慧,這使得具備生成、創(chuàng)造能力的大模型技術(shù)在承擔復雜認知任務(如藝術(shù)創(chuàng)作、決策制定)時,逐漸模糊了機器與教師之間的界限,從而容易導致師生對大模型的過度依賴,造成知識體系的斷裂和碎片化、偏見等問題。具體來說,大模型的強大生成能力簡化了師生獲取信息的流程,但也放大了其對知識探究的惰性。大模型往往會為復雜問題提供簡潔、直接的答案,但這些答案缺乏連貫性和完整性,可能導致學生所獲取的知識處于不斷被切割的狀態(tài)。

同時,數(shù)據(jù)集本身或算法等原因?qū)е履P蛯δ承┨囟ㄈ后w或主題存在偏好或歧視,可能會導致模型輸出的答案或結(jié)論存在偏差。

另一方面,通用與專用大模型在人類價值上可能存在沖突。通用大模型在教育領(lǐng)域的應用受限主要源于其缺乏教育領(lǐng)域特定的深度知識和個性化定制能力。這種模型通常是通過廣泛而通用的文本數(shù)據(jù)訓練而成,未必能準確理解教育領(lǐng)域特定術(shù)語、學科需求及學習模式,由此引發(fā)通用與專用大模型之間的過程與結(jié)果的沖突、生成與探究的沖突、自動與協(xié)作的沖突、透明和可靠的沖突。因此,需要定制基于領(lǐng)域知識深度理解的教育專用大模型來提供更有效、精準和深度的智能化支持。

《報告》秉持「應用驅(qū)動、共建共享」的理念,提出了開放創(chuàng)新的教育專用大模型架構(gòu),通過集成通用大模型、教育場景模型(小模型)和知識庫三條技術(shù)路線,讓教育專用大模型賦能各級各類教育數(shù)字化應用,讓智能算力像「水電」一樣,接入每一所學校、每一個課堂、每一臺終端,讓生成式人工智能成為廣大師生的親密助手。

教育專用大模型的開放創(chuàng)新架構(gòu)分為三層,分別是基礎能力層(L0)、專業(yè)能力層(L1)、應用服務層(L2)?;A能力層(L0)基于通用大模型的基礎能力,根據(jù)多元教育數(shù)據(jù)類型和多元任務需求,調(diào)用不同類型的大模型。專業(yè)能力層(L1)包括教育場景模型庫和專家知識庫。應用服務層(L2)將各類教育數(shù)字化應用接入大模型,在大模型為應用賦能的同時,將應用數(shù)據(jù)源源不斷傳入大模型,持續(xù)提高大模型的教育專業(yè)能力。

教育專用大模型開放創(chuàng)新架構(gòu)

教育專用大模型并非單一、封閉的模型,而是一個開發(fā)者和用戶共同參與持續(xù)完善的過程。廣大師生和各類教育數(shù)字化產(chǎn)品的研發(fā)者既是模型的使用者,也是模型的貢獻者、建設者,由此形成共建共享的教育專用大模型創(chuàng)新生態(tài)。教育專用大模型的技術(shù)路線包括大規(guī)模多元教育數(shù)據(jù)采集、數(shù)據(jù)預處理、特征工程、模型設計、模型預訓練、微調(diào)與遷移學習、模型評估與調(diào)優(yōu)七個關(guān)鍵步驟。

教育專用大模型的技術(shù)路線

教育專用大模型將把「以學習者為中心」理念變成普遍現(xiàn)實。其中,在學前教育階段,主要表現(xiàn)為尊重兒童、放手兒童,強調(diào)培養(yǎng)兒童的自主性、創(chuàng)造性;在基礎教育階段,主要表現(xiàn)為從講授灌輸式教學走向深度理解和研究性學習,強調(diào)建立學習者的主體性;在高等教育和職業(yè)教育階段,主要表現(xiàn)為以學生發(fā)展為中心,強調(diào)科教融合、產(chǎn)教融合;在終身教育階段,主要表現(xiàn)為以學習需求為導向,重點解決優(yōu)質(zhì)教育資源供給與需求匹配的問題。

未來,人工智能大模型將深度融入各領(lǐng)域各環(huán)節(jié),賦能千行百業(yè)智能升級,助力社會生產(chǎn)力躍升。從通用大模型到教育專用大模型,是人工智能大模型技術(shù)深化發(fā)展的重要趨勢。這不只是在通用大模型基礎上進行微調(diào)和優(yōu)化,而是一種基于教育場景、開放模型架構(gòu)的重大創(chuàng)新。同時,也是推動教育數(shù)字化改革、推進教育公平惠普化的重要推力。

小編推薦下載

相關(guān)文章

更多>>

同類軟件下載