前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數據挖掘學習計劃范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞:遠程教育;數據挖掘;個性化學習系統
中圖分類號:G434 文獻標識碼:A 文章編號:1007-9599 (2012) 12-0000-02
目前網絡遠程教育的普及使得優質教學資源突破了時間和空間的局限性,使得終身學習成為可能。而當前網絡教育的開展,也出現了種種弊端:技術方面,多以教學資料呈現形式的轉換為主,只是書本搬家而缺少一定的交互模式;而其不同學習進度、不同興趣、個性化的學習需要基本不能得到一定的滿足,無法因材施教。因此,網絡教育需要強大的技術力量幫助學生迅速高效地搜尋到滿足其個性要求的教學資源,并對其學習整個進程進行正確指引與科學評價。本文試圖設計一種系統模型,利用數據挖掘技術來改進當前的網絡教育模式,對每一個學生都提供個性化的學習進程,達到一下學習要求:
學習系統可依照與當前登錄學生相似的學生的學習步驟自動的對其后續目標知識進行預測和推薦
針對學生的學習過程進行過程性考核,并依據成績動態改變學生的學習與練習進程,對此學生的掌握不好的地方進行再次督學
本文依據以上目標,構建了基于Web的個性化學習系統模塊(Web-based Personalized Learning Core System 下文簡稱WPLCS)來滿足遠程教育中學習者個性化學習的迫切需要。
在該系統核心算法的選型上鎖定了數據挖掘技術來構建WPLCS。下面圖1便是基于網絡的個性化學習系統核心模塊(Web-based Personalized Learning Core System)數據挖掘引擎的基本架構:
數據挖掘技術是從多樣的、無序的數據中,抽取提煉出有用的信息的過程。因此數據挖掘技術被廣泛商用。但在教育領域中應用此技術,就不能簡單的套用一些商用模式,因為電子商務中的服務器端在進行數據挖掘時只需知道大量的用戶在訪問了A頁面后又去訪問了B或者C頁面,證明他們對B、C頁面有潛在的興趣,從而向訪問過A頁面的用戶的客戶端動態的推薦B、C頁面,以此來達到個性化引導客戶訪問的目的。
而在網絡教育中,若系統鎖定學生感興趣的知識和關注知識頁面的時長等信息,不但可以依據此信息靈活地改變練習和考核進程,還可重構網站結構減少網絡響應時長。與此同時,在設計網絡課程的頁面時,力圖使嵌有某些特定知識頁面和網絡課程中的知識點形成映射關系,也就使得系統能夠清楚標記出學生對于知識的掌握情況。從而在數據挖掘過程中能夠做到以知識點為導向。
WPLCS利用數據處理模塊將系統的用戶訪問日志文件和數據庫構建出一個學生基本特征數據倉庫,再在此數據倉庫的基礎上,利用多種數據挖掘算法進行挖掘從而形成學生個性化數據挖掘庫。
數據預處理
本階段首要找準挖掘數據源,本文遴選出系統服務器中的日志文件和系統數據庫數據作為數據源。抽取數據源數據形成挖掘庫,即學生特征數據倉庫。
服務器訪問日志的預處理
學生從登錄到系統服務器開始,便在此服務器上留下相應的日志文件。它包括登錄學生的IP、URL、Cookie等信息。首先抽取網絡日志中的信息,再清洗數據缺值等臟數據,最后識別學生的IP及登錄Cookie值,合并同一個學生的訪問路徑請求,將時間跨度大的URL進行相應的區分和記錄。
構建數據挖掘庫
匹配系統數據庫預處理后的數據和服務器訪問日志預處理得到的數據,構建出數據挖掘庫,即學生特征數據倉庫(學習者標識、個人信息、學業信息、偏好信息等)。
數據挖掘
綜合考慮不同數據挖掘算法有不同的特點和弊端以及前文所述的個性化學習的要求,在選擇數據挖掘算法時,本文選取了序列模式、聚類、關聯規則發現等不同算法,并將其有機結合。為了精確匹配當前學生特征模式與規則前項,力爭較高的推薦準確率,采取了基于關聯規則的挖掘方式進行學習頁面推薦;為了得到更高的推薦覆蓋率,采用基于聚類分析進行推薦。綜合了兩種數據挖掘算法的優勢,從而改善了推薦的測度。本文將學生特征數據倉庫中的數據傳送到數據挖掘核心模塊來進行數據挖掘,得到的數據再存放到學生個性化數據倉庫來完成整個數據挖掘的全過程。
關聯規則發現
關聯規則發現,即尋找數據項之間的聯系規則。在服務器訪問日志數據的預處理過程中,將學生訪問的頁面路徑組成了學生訪問session集,我們可以利用關聯規則挖掘得到學生訪問請求間的關聯規則。其中比較簡單的一種規則為:訪問了A頁面的學習者中,有60%又訪問過B頁面。得到這種初始化關聯規則后,再通過用戶訪問頁面與知識點的一一映射關系,我們就可以推理出更加實用的規則模式,即確定在學習過A知識點的學習者中有60%的人對B知識點表現出一定興趣。得到這種有用規則后我們即可對所有訪問A頁面的學習者的頁面上加上B頁面的推薦鏈接,方便學習者導航。
聚類
聚類,即將數據劃分到不同的類中,類間的差別盡可能的大,類內的差別盡可能的小,聚類分析實現并不知曉將要劃分成幾個類,而是利用系統服務器自動化、智能化的計算而得。產生出不同的類后,某學生的特征模式一旦符合某個類后,系統推薦引擎會自動將此學生未來可能訪問的頁面鏈接推薦給學生。由此就可以智能化地將處在不同學習階段的學生匹配到此類本該獲得的學習和考核進程。
序列模式
與關聯規則發現相仿,序列模式是將數據間的關聯性與時間相聯系。在實際挖掘過程中,我們可以得到下列序列模式:在學習過B和C兩個知識點的學生中有81%的學生在若干天后進行A知識的學習,并且在此過程中大量地頻繁訪問A2、A5、A7、B2等知識,而且對這些知識點的掌握情況開始下滑。因此我們可以及時干預在此時間段所有學習過C、B知識點的學生,將一定量的練習和測試推薦給他們,幫其熟練掌握上述知識,從而達到因時施教的目的。
作為一種新的教學手段——基于Web的網絡教育,當前正方興未艾。本文旨在通過計算機數據挖掘技術構建出一個智能化的基于網絡的個性化學系統,以此來輔助完成對不同學生的個性化教學。從而充分發揮網絡教育的優勢。
參考文獻:
[1]W.H.Inmon 《Building the Data Warehouse》 John Wiley & Sons,Inc. 1996
關鍵詞:數據挖掘;教師培訓;教師專業發展
中圖分類號:TP391文獻標識碼:A文章編號:16727800(2012)007011302
作者簡介:徐海霞(1980-),女,寧夏銀川人,西北師范大學教育技術與傳播學院碩士研究生,研究方向教學設計;寇藝儒(1966-),男,寧夏銀川人,寧夏銀川一中高級教師,研究方向為物理學教育理論。
隨著教育的不斷發展,教師培訓已成為促進教師專業發展的一種有效途徑。而培訓過程中會積聚各種資源,培訓結束后也會有大量的數據需要處理。本文利用數據挖掘技術發現、捕獲和挖掘有效的信息資源,使分布、異構信息的智能聚合問題得到有效解決,使網絡平臺上豐富的信息資源得到有效利用與深度共享,以幫助培訓者更有效地制定培訓規劃與培訓策略,從而提高培訓效果。
1數據挖掘的概念
數據挖掘(Data Mining,簡稱DM)被稱為數據庫中的知識發現(Knowledge Discovery in Databases,簡稱KDD)。有一種比較公認的定義是:數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。簡單地說,就是從大量數據中提取或“挖掘”知識。
這些知識是隱含的、事先未知的潛在的有用信息,提取的知識表示為概念、規則、規律、模式等形式。數據挖掘要處理的問題,就是從龐大的數據庫中尋找出有價值的隱藏事件,并加以分析,將這些有意義的信息歸納成結構模式,供有關部門決策時參考。此外,數據挖掘看重的是數據庫的再分析,包括模式的構建或是資料特征的判定,其主要目的是要從數據庫中發現先前未曾獲悉的有價值的信息。
2數據挖掘技術的選取
為進一步加強教師培訓,全面提高教師隊伍素質,在聯合國兒童基金會(UNICEF)的資助下,中央電教館組織實施了基于交互式電視培訓課程的“災區教師培訓”項目,加快了教師繼續教育學習與終身學習的步伐,基本上每位教師都參與了不同程度、不同學科的培訓學習。應用數據挖掘技術將培訓對象、學習內容、模塊設計、作業、發帖量、培訓反思等數據生成數據庫,通過對這些網絡平臺上的數據信息進行分析,可以得到關于培訓現狀與效果的一些數據信息,用以改進培訓過程中存在的不足。更重要的是,通過對這些數據特征的理解與分析,可以開展有針對性的培訓預測。本文利用數據挖掘技術來挖掘網絡平臺上的數據資源,以此來達到資源深度共享,也為提高教師培訓網絡平臺系統的完整性、協調性和高效性。
3數據挖掘在教師培訓系統中的應用
在聯合國兒童基金會(UNICEF)的資助下,中央電教館組織實施了基于交互式電視培訓課程的“災區教師培訓”項目。該項目是為提高四川、甘肅地震受災地區的小學教育質量,使四川省北川縣、青川縣、什邡市、綿竹市及甘肅省西和縣這5個縣級地區的200所學校的5 000名教師和100 000 名8~12歲的小學生從高質量的教育中受益。并在教育部國家教師培訓網站(省略.cn)上建立網絡學習模塊,實施網絡學習遠程指導。本文就數據挖掘技術應用于教師培訓系統中的培訓對象、培訓內容設置、培訓效果評價等幾個方面進行具體分析。
3.1培訓對象方面
該項目的培訓對象被分成兩部分:一部分為資源教師,另一部分為學科教師。資源教師在災區教師培訓中也被稱為骨干教師,由各學校的校長、語文、數學、科學等主要學科帶頭人組成。資源教師在接受培訓后,將負責組織和實施各自學校的校本培訓,因而在本校的校本培訓過程中是核心人物,他們所擔任的角色較多,主要是為學科教師集中授課,提供網絡指導,并組織、管理校本培訓,與網絡遠程指導團隊溝通協調。所以在“災區教師培訓”項目中,我們將資源教師作為一種寶貴的資源納入教師培訓發展的關鍵環節。利用數據挖掘技術,整理數據信息庫,充分利用資源教師和學科教師在項目培訓過程中的所有信息(包括姓名、性別、年齡、職務、教齡、學科、職稱等)和過程性資料(在項目培訓過程中資源教師的作業提交情況、網絡平臺注冊情況、發帖情況、回帖情況、學習成績等),在分析資源教師和學科教師特征的基礎上進行信息處理和數據分析,從中挖掘出有價值的資源信息和培訓信息。我們在數據庫的屬性中羅列出培訓對象的所有基本信息,并利用數據挖掘得到了一些意想不到的數據信息,如資源教師的教齡與發帖情況有著正向聯系,資源教師與學科教師的職務與網絡課程學習有著密不可分的關聯。通過數據挖掘,利用足夠的信息迭代,修正種種問題,尤其是對資源教師和學科教師的行為、需求及其在校本培訓過程中的指導研究,可為教師培訓提供科學的決策依據,以此提升教師培訓的效果。
3.2培訓內容設置方面
決定經濟增長的因素很多,人力資本是其中之一。鑒于人力資本系統構成的復雜性,通過對自組織數據挖掘理論與方法的分析,闡述它對人力資本指標體系功能和模型預測功能,并強調,自組織數據挖掘理論為有效而準確的人力資本系統復雜性研究提供了有力的理論依據,為人力資本研究提供了新的思路。
關鍵詞:
人力資本系統;自組織數據挖掘;復雜性
舒爾茨認為,人力資本是指勞動者的勞動能力(通過五個方面投資而獲取)。在《人力資本投資》一書中,舒爾茨將人力資本投資的范圍分為五個方面,即⑴正規教育;⑵在職培訓;⑶衛生保健;⑷校外學習計劃;⑸流動遷移。我國部分學者對人力資本投資估算范圍主要有:侯鳳云對教育、科研、文化、健康、干中學和就業遷移六種類別分別進行了測算,是根據中國的實際情況而確定的測算范圍;錢雪亞對人力資本測算范圍,包括教育、在職培訓等類的投資。測算范圍的確定與測算的結果有決定性的關系。對人力資本的測算與衡量,國內外學者未考慮到人力資本是復雜系統(人力資本的測算范圍與經濟增長之間存在著某種“黑箱”,即對人力資本投資所確定的人力資本存量,并將人力資本存量通過勞動(腦力勞動或者體力勞動)物化在商品當中,這個過程能夠直接推動經濟增長,他們(人力資本存量與經濟增長)之間存在非線性映射關系。)所以,本文提出一個新的觀點:“自組織數據挖掘理論是人力資本系統復雜性研究提供了有力的理論依據,為人力資本研究提供了新的思路”。
一、自組織數據挖掘理論與方法的發展過程
選擇學說是自組織數據挖掘理論基礎。是建立在“遺傳-變異-選擇-進化”的進化論原理基礎上的。自組織數據挖掘算法是從一個簡單的數學模型(根據面板數據或者截面數據、統計數據樣本來建模)集合出發,按一定的法則(根據自己研究的目的來確定)進行組合,產生了新的中間待選模型(篩選條件),再經過中間模型進行篩選(根據數據情況而定),不斷重復“遺傳-變異-選擇-進化”這個過程,使其“中間待選模型”復雜度不斷增加(從簡單到復雜逐步改進,特別是循環過程的次數),最后得到最優的復雜模型,這個最優模型就是與自己研究目的相關的模型。對于人力資本系統,其特征是勞動者(衛生保健投資維持生命的延續)、自我不斷提高(教育、在職培訓投資)、不斷適應環境變化(遷移投資),所以人力資本系統屬于自組織系統,把人力資本歸于自組織系統是一個創新。所以,利自組織數據挖掘理論可以建立人力資本系統最優復雜模型。
二、人力資本形成與指標體系建立
本文采用侯鳳云六種類別。所以,本文將人力資本投資內容(范圍)定為教育培訓、醫療保健、勞動力遷移、經驗技能和科研,建立人力資本指標體系:如表1。
三、揭示人力資本指標體系功能
“競爭而產生的優勝劣汰”是生物進化過程,自組織數據挖掘建立模型過程就是從簡單系統到復雜系統演化過程,本文用賀昌政自組織數據挖掘方法,揭示了人力資本存量測算因素的功能,它能夠影響的因素(19個因素)中篩選出對人力資本存量測算重要影響因素,其中外準則起著關鍵作用,外準則就是對人力資本存量測算因素進行篩選條件,篩選條件不能對存量的結果有大的偏差,最后對偏差進行檢驗。偏差越小,評價模型質量較優。
在模型構造過程中,消除建模者參與而給計算機選擇自由是自組織數據挖掘算法的目的。建模者僅僅要做的是提供樣本數據(截面數據或者縱貫數據),外準則算法類型,只能通過選擇準則的形式來影響建模的結果(選擇最重要的影響因素來確定人力資本存量的結果),然而,建模者對研究對象模型的主觀想象(主觀性)與建模結果無關,從而保證了模型選擇的客觀性。例如人力資本指標體系中勞動力遷移研究。建模者要完成的工作:樣本區間(1990-2014年)數據采集;算法類型:用最小偏差準則;系統輸出Y:勞動力遷移指數;系統輸入(可能的影響因素):x,i=1−5i,共5個變量。
用自組織數據挖掘算法,計算機自由選擇篩選出的模型含3個變量:農村居民人均純收入,鄉鎮企業就業人數,從業人員占總人口比重。自組織數挖掘算法通過最優復雜度原理能夠對人力資本存量進行預測,是人力資本系統的復雜性研究的另一個重要內容,為人力資本存量的測算提供新思路。
參考文獻:
[1]舒爾茨.人力資本投資[M].北京:北京經濟學院出版社,1991:9-10.
[2]侯鳳云.中國人力資本投資與城鄉就業相關性研究[M].上海:上海人民出版社,2007.
[3]錢雪亞,王秋實,劉輝.中國人力資本水平再估算:1995—2005[J].統計研究,2008,(2).
關鍵詞:大數據;教育領域
大數據(big data),又名巨量資料、海量資料。麥肯錫全球研究院報告《大數據:創新、競爭和生產力的下一個前沿》對大數據所做定義如下:大數據是指數據量大小超出了傳統數據庫軟件工具的抓取、存儲、管理和分析能力的數據群。大數據必定具備四個特征:容量大(Volume),指數據的存儲容量單位已經由GB、TB上升到EB、ZB、YB,甚至更高的級別;速度快(Velocity),指海量數據的創建、傳輸和分析速度快,一般要求響應時間要控制在秒級單位內;類型多(Variety),指數據類型多樣,除了結構化的事務數據,還包括半結構化的網頁數據、非結構化的視頻和音頻數據;價值高(Value),指數據價值密度低,但海量數據綜合價值總量很高。
大數據時代的來臨對各行業都產生了深刻的影響,教育領域也不例外。學員的學習行為、思維方式,教員的授課理念、教學方法,學校的教育管理、教學評價無一例外都受到大數據的影響。教育領域必定會在大數據技術的推動下發生深層次的、多元化的創新與變革。
一、大數據對教育領域的影響
1.教育理念與教學評價被迫革新。教育作為社會子系統的重要組成部分深受社會形態影響,現代的教育體系幾乎是伴隨著工業社會發展同步發展的。市場的擴大與提高,對勞動者勞動技術與經驗的要求遠遠高于個體層面的文化修養,合格勞動力的衡量標志是能不能解決問題。這一實用主義特點對教育領域的影響是巨大的。傳統的教學評價不論對學員還是對教員,總是依賴能力測試,通過考試分數的數理統計分析來評價學員與教員。在大數據時代,則是跟蹤記錄教員與學員教與學的長期行為并對之進行分析,采用過程性、歸納式、多元化的方式進行評價。
2.個性化教學得以真正實現。運用大數據技術,在線平臺能實時記錄每一位學員的學習行為,教員獲得全面豐富的數據內容后利用數據挖掘技術加以整合分析,不但能掌握學員個體的學習狀態、知識接受水平,還能了解哪種教學方法對該學員最有效,以及該學員具體的薄弱點。教員根據這些數據就可以針對學員個體因材施教,制定個性化的教學方案、教學活動和學習計劃,教學工作真正從共性化的群體教學轉向了個性化的個體教學。個性化教學的實現能大幅提高教員的教學質量和學員的學習效果。
二、大數據在教育領域的應用模式
大數據在教育領域的應用模式本質上就是數據的生命周期,即數據獲取(學員使用在線教育系統)、數據存儲(系統將學員的在線學習行為記錄下來存入數據庫)、查找與分析(進行數據挖掘,預測學員的各項表現)、可視化(對數據挖掘和預測結果進行可視化處理)、決策(教員與教學管理人員給予學員指導與支持)。
1.教育者角度的應用,即教學領域知識模型構建。大數據教育系統對現有的教學內容建模后通過數據挖掘、學習分析和在線決策各子系統,研究各專業學員所必須掌握的教學知識點、教學單元與教學課程之間的邏輯關系,最終重新構建領域知識結構,對現有的教學內容與方法進行改革,達到提高學員學習效果和教員教學效率的目的。
2.學習者角度的應用。(1)個性化課程分析。大數據教育系統首先獲取某個學員以前的學習表現,從已畢業學員的成績庫中匹配與之相似的學員,分析已獲得的成績和待選課程表現之間的相關性;然后通過學習滿意度調查問卷分析評估學員個人情況;再結合專業課程的重要性,為學生列舉課程清單。并向其推薦有可能取得優秀成績的課程。(2)輟學行為預警。大數據教育系統可以記錄所有學員的課程學習信息,進行教學情況實時監測。當曠課、違紀、課堂表現等與輟學行為相關的關鍵因素發生變化時,系統會及時對學員行為做出評估,并在風險達到一定閾值時向教育管理方發出預警,使教育管理方有足夠的時間在輟學行為發生前進行提前干涉。(3)助學需求預測。大數據教育系統可以通過收集校園卡的生活與消費記錄,以一日三餐為主要權重指標對生活必要開銷進行計算評估,當發現某學員的消費明顯低于預警線時,會主動通知學校相關管理方,由相關部門與學員進一步溝通,并進行相應調查,判斷該學員是否需要助學幫助。
3.其他應用。當大數據教育系統與其他領域的大數據系統互聯互通后能發揮的作用不可估量。比如,與社保、醫療、金融、公安、政府等大數據實現安全共享后,教育系統內所有學校與學區內的情況可以從各個角度可視化地展現在出來。大數據系統既能幫助學員從選擇學習合作小組到職業規劃的制定等各個方面進行輔助指導,也能幫助國家層面的教育管理者制定宏觀教育政策、調整教育改革方向、分配教育資源。
總而言之,大數據在教育領域的應用惠及該系統內學員、教員、教育管理者、教育研究者等所有人員,它是未來教育發展的必然趨勢。但作為新生事物,大數據具體的應用還不成熟,需要在實踐探索中不斷改進完善。
參考文獻:
【關鍵詞】 在線學習;學習過程管理;大數據思維;學習分析
【中圖分類號】 G434 【文獻標識碼】 B 【文章編號】 1009―458x(2016)11―0017―05
現代信息技術對教育領域產生著越來越深遠的影響。以大數據、云計算、移動互聯網等為特征的信息化手段,催生出各種新的學習模式、教學模式和管理模式。教育部在《關于“十三五”期間全面深入推進教育信息化工作的指導意見(征求意見稿)》中指出:黨的十以來,“互聯網+”行動計劃、促進大數據發展行動綱要等有關政策密集出臺,信息化已成為國家戰略,教育信息化正迎來重大歷史發展機遇,我們要堅持融合創新,拓展教育信息化應用廣度與深度,依托網絡學習空間逐步實現對學生日常學習情況的大數據采集和分析,優化教學模式。(教育部,2015)因此,利用互聯網和信息技術促進教育大數據建設與應用,有效開展在線學習并實現過程管理,不僅是開放大學、各高校網絡學院、各類培訓機構的主要教育目標,也是我國教育信息化發展的重要任務,是構建繼續教育公共服務平臺,擴大教育供給,促進教育公平,完善終身教育體系的主要途徑。
在當前互聯網+環境下,大數據思維被越來越廣泛而深入地應用到教育領域,數據分析結果越來越多地影響管理和決策。在教育實踐中,我們如何對海量信息進行有效而充分的采集和挖掘,同時又要避免對數據和技術產生過度依賴,陷入技術決定教育和數據決定管理的誤區(鄭爭文,2016)?本文通過分析國內當前在線學習過程管理現狀和學習者學習過程中產生的相關數據,探討如何應用大數據思維來提升在線學習者的學習效果、在線教育的教學效果與管理水平,并以在線學習過程管理大數據應用為例,探討互聯網+環境下教育大數據管理的新思維和新模式。
一、在線學習過程管理現狀
在線學習是隨著網絡技術發展出現的新的學習模式,是遠程教育發展的新階段,是利用計算機互聯網和移動互聯網,通過依托于網絡的學習平臺和管理平臺建立虛擬的學習環境實施教學、開展學習的過程。
我國在線教育于2000年前后緩慢起步。1999年,中央廣播電視大學在電大系統啟動“開放教育”試點;2000年,教育部批準68所高校建立網絡教育學院,同一時間,新東方網校上線運行;2010年,在線教育開始蓬勃發展;2012年美國三大MOOC平臺催生了國內千百計企業加盟教育培訓,進軍在線教育特別是高等教育市場;2014年,隨著國務院“取消和下放利用網絡實施遠程高等學歷教育的網校審批”,我國在線教育市場走向開放和多元化;2015年,“互聯網+”時代到來,為我國基于信息技術的在線教育帶來新的機遇與挑戰。
我國在線教育學習過程管理存在幾個普遍性現象:一是教、學、管分離,使得信息碎片和數據孤島問題凸顯(顧小清,等,2014);二是各高校或培訓機構信息技術與教育教學的深度融合不夠,對整個學習周期的管理缺乏頂層設計,導致諸多平臺運行不力,管理模式固化,數據標準不統一;三是在教學和資源建設方面,教學設計和課程資源面向所有學習者,沒有考慮對不同學習者的適用性,無法滿足其個性化需求,也就無法實現真正意義上的個性化人才培養;四是在學習支持服務方面,大眾化的學習支持多,個性化的學習支持少(吳南中,2015);五是缺乏對學習效果、教學效果的有效評價和激勵機制,在線學習活動的參與度低,學習任務的完成率差。此外,在線課程學習的課程完成率低,在線學歷教育的畢業率明顯低于傳統教育的問題一直是困擾遠程教育可持續發展的難題之一,特別是在缺乏有效的教學約束管理和學習支持服務的情況下這一現象尤為明顯。
二、大數據思維對在線學習過程管理的啟示
與傳統數據相比,互聯網和信息時代產生的大數據呈現出在線、實時、全貌的顯著特征。如果說傳統數據產生出自然價值,大數據則衍生出智慧價值,它深刻改變了人們對待數據的思維方式,這主要體現在:一是總體思維,從原本只能采集樣本數據到獲取全面、系統的所有相關數據;二是容錯思維,從微觀和精準性向宏觀和包容性轉變;三是相關思維,不再執著于對數據進行因果關系的分析,而是聚焦到相關關系和對未來的洞見與預測分析;四是智能思維,使線性、簡單的機器思維變得像人腦一樣呈現出主動性、邏輯性和前瞻性。
針對在線教育領域,我們可以把大數據思維應用到在線學習過程管理中,以數據為核心梳理架構管理流程,利用全樣本數據搜集協助管理判斷,通過對過程數據的快速獲取實現管理高效,通過過程相關性數據分析預測管理風險,把數據處理結果轉化為管理決策支持,探索實現管理主動性和智能化的渠道。例如通過對多維度、多元化、分散異構的海量在線學習相關數據進行采集、分析和挖掘,研究學習者需求,推薦適用不同個體的學習資源,避免其面對海量信息卻無法提取有效資源而產生空茫狀態(楊現民,等,2016);研究學習者特點,協助其制定個性化的學習計劃;研究學習者學習過程,通過及時有效的技術支持與信息推送服務,緩解在線學習者由于時空分離、師生分離產生的孤獨感;研究學習者學習生命周期中的動態影響因素,進行評估預測與風險預警等。
在在線學習過程管理中應用大數據思維和技術,跟蹤學習者學習過程和學習行為,跟蹤教學活動與學習者參與狀況,進行教學質量監控,對學習效果、教學效果、資源適用度等進行評估預測,具有積極的現實意義:① 挖掘有效學習模式,助力在線學習者學習能力和自我管理能力的提升,實現深度學習; ② 掌握學習者學習動因與需求,為在線學習者提供真正意義上的個性化教學與支持服務;③ 促進在線教學模式的改進和教學效果提升,提高教學活動參與度,降低輟學率(謝洵,2016);④ 為教學管理和科學決策提供智慧支撐;⑤ 促進數據標準統一,實現信息共建共享,促進教育的透明與公平。
三、在線學習過程管理大數據建設關鍵問題探討
在線學習者的學習過程概括講包括學習內容選擇(課程資源或專業)、就讀學校或機構選擇、注冊繳費、參加教學活動、自主學習、學習效果考核與評價、成果獲取(如獲得畢業或課程證書)。在線學習者的學習過程,由于處在虛擬網絡和課堂中,又受到諸如學習者特征、環境、工作與生活狀態、對教師與資源適應度等多種因素影響與制約,因此在線學習過程管理大數據建設與應用,要關注以下幾個關鍵問題:
1. 化零為整與化整為零的思維
大數據是一種新的思維方式,一種解決問題的新方法(趙靖巖,等,2016)。化零為整就是要收集與學生學習過程相關的各類碎片化信息,進行分類統計,通過大數據建模,形成結構化的數據表或可視化的分析結果,據此對學習、教學和管理進行評估和預測。化整為零是對大數據所呈現結果的反饋與落實,關注到每一位學習者個體分析結果,對教學與管理從每一個細節進行調整與改進。例如依據在線學習特點對資源進行分解制作微課,依據風險預警為每一位學習者提供有針對性的信息推送服務,教師依據學習效果評估實時改進教學設計,在教學過程中為學習者提供個性化支持等。
2. 關鍵數據庫的建立
數據采集是大數據應用的首要和基礎工作。圍繞在線學習者的學習過程,要建立一系列關鍵信息數據庫:① 學生信息庫,包括個人基本信息、學習者特征、環境、學習動因與目標等;② 師資信息庫,包括學習過程涉及的專業負責人、課程責任教師、課程輔導教師、導學教師、技術支持教師、教務管理教師等各類師資;③ 課程資源庫,包括圍繞課程學科建設的系統資源、針對課程模塊提供的支撐素材、各類專題研究與討論等;④ 學分與成績庫,記錄學習者圍繞課程或專業學習的階段性和終結性學習效果與獲得成果及相關信息;⑤ 教學過程信息庫,采集教學實施過程中的教學策略、教學行為、教學活動、技術運用、教學效果等信息;⑥ 質量評價保障信息庫實現多元化質量因子采集與質量標準的確立。
3. 數據的互通性
互聯網極大地促進了數據的開放,但基于在線學習的各類高校和教育機構都建有獨立的諸多教學、教務、考核等管理平臺,這些平臺使用不同的開發工具和數據庫技術,必然造成數據管理上的獨占性、封閉性和數據范式的不一致。因此,大數據應用需要更高層面的統籌規劃和頂層設計,建立開放的、采用相同范式和標準的數據接口,實現數據管理的標準化和數據互通共享。2015年9月正式啟動的國際開放數據就提出了開放數據必須保證互通性的倡議,提出將努力“制定并實現統一、開放的數據標準,從而確保數據的格式、結構和通用標識符都具備互通性”(高豐,2016)。
4. 數據的有效性
信息技術的飛速發展使海量的數據采集變得越來越高效,但并非收集的基礎數據量越龐大,分析預測的結果準確性就越高,大量無效的信息不但會造成冗余,影響數據處理的效率,更重要的是會干擾數據加工過程與風險導向,使預測結果偏離最接近真實的方向。因此,有效數據的遴選是在線學習過程數據采集的首要任務。
5. 數據的時效性
大數據應用中,反應速度極為關鍵。我們知道,大數據獲取的不僅是歷史數據,更重要的是即時數據。數據從產生的一刻起,就是有不同生命周期的,這就決定了數據價值會隨時間發生動態變化。因此,在線學習過程管理大數據應用中要重視數據采集、數據挖掘與結果呈現的時效性。要確保預測結果的有效性和價值實現,建立對在線學習過程相關數據的快速反應機制就顯得尤為重要。
6. 分析結果的準確性與質量
數據分析結果的準確性和質量直接影響管理決策方向。對于在線學習過程管理中關鍵環節的教學評價,在數據建設中要聚焦于實現教育質量保障的理性、透明性、可測量性和專業性,建立一種相互信任、權利與責任相平衡的質量文化(張應強,等,2014)。要重視對在線學習參與水平而不僅僅是參與度的數據研究,通過大數據應用探索有效的測量標準、方法與機制。對此,美國雪域大學DI Sun提出了測量學習者參與水平的三要素,即情感參與、認知參與和行為參與,并構建了包含21項條目的量表(梁林梅,等,2016)。這些研究成果可作為我們探索在線學習過程管理大數據挖掘和分析的參考。
7. 人的因素
對大數據進行加工處理,依托的不僅僅是數據分析軟件和信息技術,更重要的是人的參與。數據挖掘的靈魂是智能算法,通過對數據的分析、整合與設計實現信息向價值的轉換,體現的是人的智慧與思維。因此,在線教育的教師和管理者要具備一定的大數據思維和數據挖掘基礎知識,做既懂得數據分析技術又諳熟各項具體業務的復合型人才;大數據建模與應用的技術實施者,同時要了解并熟悉在線教育的特征和發展現狀,要跟蹤在線教育的新變化和新理念,才能挖掘教育大數據所潛藏的更高價值。
四、在線學習過程管理大數據
應用模式設計
大數據應用遵循數據采集、數據加工、結果呈現的基本模型。其中,數據收集是大數據應用的最基礎最底層任務,通過數據采集將數量龐大、結構復雜的信息匯聚起來建立關鍵信息數據庫。依據不同模型對收集到的各類數據通過挖掘和分析等技術手段和設計進行預處理和再加工,最終轉化為可視化結果輸出并落地應用,是大數據管理要實現的核心目標。依據不同的研究領域,大數據管理衍生出諸多不同的更具體的應用模式,這里圍繞在線學習過程,從學習分析、教學分析以及二者相結合的維度對大數據管理模式進行探討。
1. 學習分析模式
學習分析是大數據在教育領域的典型應用(王良周,等,2016)。新媒體聯盟(New Media Consortium)將學習分析定義為:利用松散耦合的數據收集工具和分析技術,研究分析學習者學習參與、學習表現和學習過程的相關數據,進而對課程、教學和評價進行實時修正(徐鵬,等,2013)。以在線學習者及其學習過程為主體,對在線學習過程進行分析的過程同樣如此。它通過收集學習者特征、學習背景、學習動因與需求等數據,跟蹤學習過程中的狀態、行為、影響因子、資源利用、作業與考核情況等信息,利用預設的模型對數據加以分析,并呈現出可視化數據分析結果。在線學習分析的大數據應用主要體現在:在保護學生個人隱私的基礎上,盡可能全面并有效地反映客觀真實;能預測學生的學習行為與需求,實現有針對性地為學習者提供支持和服務;依據正確的判斷進行風險預警,并體現關鍵性和前瞻性;能夠挖掘有效的個性化學習模式,提升學習者的學習能力、自我調適能力和管理能力。
2. 教學分析模式
在線學習教學分析圍繞教師的教學周期進行,聚焦于教師特征提取、課程資源建設、教學活動設計、線上互動學習設計、線下任務部署、學生資源訪問情況、活動參與情況、考核與學習效果評價、教學評價等環節,在數據采集和分析的基礎上,力爭針對每一位學習者實現真正意義上的“因材施教”。對在線學習教學分析應用大數據思維的重點聚焦在三方面:一是從互聯網海量的公開資源中遴選優質、適用的資源應用于課程教學;二是通過跟蹤教學活動參與效果與學生行為,及時調整、改進教學設計手段與策略方法,激發學習者學習動力,提升其學習效果;三是通過對整個教學過程的跟蹤反饋與評價,找到提高課程整體設計水平和資源質量的切入點,同時提升在線課程責任教師、在線輔導教師的教學能力和教學效果(鄭燕林,等,2015)。
3. 學教管相結合的分析模式
學習、教學和管理在在線學習中是交叉進行并互相影響的。隨著教育領域中大數據應用逐漸引起關注,功能相對單一的“學習分析系統”已經不能滿足互聯網+環境下教育發展的需要。學習者希望能利用碎片化的時間學習到豐富有用的知識或技能,實現高效能又不枯燥的學習;教師希望設計出受歡迎的優質課程或資源,開發學習者感興趣又能保持高參與度和持久度的學習活動,展現教師的價值與成就感;管理者希望能建立一個通暢的管理流程和渠道,并實時捕捉過程中發生的問題和需求,實現高品質服務和高效率管理。上述三者目標的共同實現,將促成學校或機構的品牌建立與影響力提升。于是,學教管相結合的大數據分析模式應此而生。這種分析模式如圖一所示,它具備統籌規劃與頂層設計,圍繞學習者整個學習周期,從更全面的多元化的角度收集數據,在有專業技術人員進行大數據平臺搭建的基礎上,結合實際需求與發展趨勢對數據進行算法設計研究,再將處理結果在學習、教學與管理中落地應用,并在實踐中不斷調整和改進。
結束語
終身學習已經從教育觀念發展成為全球性的共同行動,成為人們不可或缺的生存和生活方式,在線學習作為實現終身學習的必要途徑,以其豐富多樣的資源、多元化的教學方式、自由靈活的學習方式、開放包容的入學條件等優勢,受到越來越多學習者青睞。2015年在青島舉行的國際教育信息化大會上通過的《青島宣言》中指出,“在線學習,包含大規模開放在線學習課程(MOOCS),具有建立邁向高等教育和終身學習新路徑的潛力。我們鼓勵那些為改進在線學習而探索大數據潛力的努力,這使我們深入了解學生行為和學習活動,并且改進在線課程的設計和組織形式。”以信息技術為手段,對在線學習者學習過程產生的大數據進行研究,是一項復雜的系統工程,探討更適應學習者個性化的學習模式,不斷改進教學模式,建立先進的管理體系,是在線教育工作者不懈努力的目標。在此,筆者結合多年在開放教育一線教育教學管理經驗,謹以此文與從事在線教育的同行們就在線學數據思維與應用進行探討,以期引發對在線教育大數據更深入的研究。
[參考文獻]
徐鵬,王以寧,劉艷華,張海. 2013. 大數據視角分析學習變革[N]. 遠程教育雜志(6):11-17.
顧小清,鄭隆威,簡菁. 2014. 獲取教育大數據:基于xAPI規范對學習經歷數據的獲取與共享[J]. 現代遠程教育研究(5):13-22.
吳南中. 2015. 基于教育大數據的MOOC支持服務特質與形成研究[J]. 中國遠程教育(12):49-55.
張應強,蘇永建. 2014. 高等教育質量保障:反思、批判與變革[J]. 教育研究(5):19-26.
鄭燕林,柳海民. 2015. 大數據在美國教育評價中的應用路徑分析[J].中國電化教育(7):25-31.
王良周,于衛紅. 2015. 大數據視角下的學習分析綜述[J]. 中國遠程教育(3):31-37.
教育部. 2015. 關于“十三五”期間全面深入推進教育信息化工作的指導意見(征求意見稿)[EB/OL].
謝洵. 2016. 聚焦遠程學習的多元化實踐與研究[J]. 中國遠程教育(1):73-76.
趙靖巖,胡振波. 2016. 大數據環境下高校信息化教學模式研究[J]. 情報科學(1):92-95.
高豐. 2016. 共治共創視角下的開放數據發展:趨勢、挑戰和反思[J].大數據(2):38-45.
梁林梅,夏穎越. 2016. 美國高校在線教育:現狀、阻礙、動因與啟示[J]. 開放教育研究(1):27-34.