前言:本站為你精心整理了教育學(xué)中的數(shù)據(jù)挖掘技術(shù)研究范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
1數(shù)據(jù)挖掘在教育學(xué)領(lǐng)域的應(yīng)用
1.1數(shù)據(jù)電子化
要讓數(shù)據(jù)電子化,首先要搭建適用的網(wǎng)絡(luò)平臺(tái),網(wǎng)絡(luò)平臺(tái)的搭建分為2個(gè)過程。如果需要收集數(shù)據(jù),則需要搭建一個(gè)面向?qū)ο蟮木W(wǎng)絡(luò)平臺(tái)。在對(duì)大學(xué)生社會(huì)體系和人際關(guān)系的研究中,采用的是在WEB上自動(dòng)收集量表數(shù)據(jù),首先將量表轉(zhuǎn)換為匯編語言編寫的網(wǎng)頁,再采用將量表轉(zhuǎn)換后的電子版網(wǎng)頁與數(shù)據(jù)庫中的表相連接,這樣,只要被試登錄指定網(wǎng)站,就可以在網(wǎng)上完成量表的填寫,數(shù)據(jù)則直接存入數(shù)據(jù)庫中。數(shù)據(jù)庫管理系統(tǒng)使用的是SQLServer2000,在網(wǎng)絡(luò)成癮和注意關(guān)系偏向的研究中,也采用了同樣的方法。如果對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行分析,則可以略過數(shù)據(jù)收集這個(gè)步驟,直接將數(shù)據(jù)輸入數(shù)據(jù)處理軟件中。在對(duì)于青少年同伴關(guān)系的研究中,創(chuàng)建了一個(gè)數(shù)據(jù)倉庫來存放現(xiàn)有數(shù)據(jù),選用SQLServer2000作為數(shù)據(jù)倉庫的構(gòu)建平臺(tái)。由于青少年同伴關(guān)系的研究中的維度不是太多,維度層次也不復(fù)雜,出于對(duì)查詢效率和使用者是否容易理解的角度考慮,決定使用星型結(jié)構(gòu)來創(chuàng)建數(shù)據(jù)倉庫,青少年同伴關(guān)系研究的星型結(jié)構(gòu)。最后一種方法是直接將數(shù)據(jù)輸入SPSS中,這種方法這樣需要大量人力物力,而且效率難以提高,存在誤錄的可能。
1.2數(shù)據(jù)挖掘分析
將數(shù)據(jù)轉(zhuǎn)換為需要的電子文本格式以后,進(jìn)行簡(jiǎn)單的數(shù)據(jù)處理。在剔除了部分缺失或者明顯錯(cuò)誤的數(shù)據(jù)后,就可以進(jìn)行數(shù)據(jù)挖掘工作了。數(shù)據(jù)挖掘的常用算法為關(guān)聯(lián)規(guī)則挖掘、決策樹算法和聚類挖掘算法。在此選用關(guān)聯(lián)規(guī)則挖掘算法做詳細(xì)說明,在大學(xué)生社會(huì)網(wǎng)絡(luò)和人際關(guān)系研究中,選取被試人際關(guān)系滿意度為例進(jìn)行關(guān)聯(lián)規(guī)則挖掘。表1被試人際關(guān)系滿意度關(guān)聯(lián)規(guī)則挖掘關(guān)聯(lián)規(guī)則挖掘的步驟如下:
①選擇數(shù)據(jù)根據(jù)關(guān)聯(lián)規(guī)則挖掘的目標(biāo),選擇如上表所示的屬性,通過下面的sql語句選擇數(shù)據(jù),并將jibenxinxi表和zongjie表通過學(xué)號(hào)連接起來。select性別,是否獨(dú)生子女,你對(duì)自己的人際關(guān)系滿意嗎,你對(duì)自己與父母的關(guān)系滿意嗎,你對(duì)自己與同伴的關(guān)系滿意嗎,你對(duì)自己與老師的關(guān)系滿意嗎,你認(rèn)為比較了解你的人會(huì)對(duì)你的人際關(guān)系給出一個(gè)怎樣的評(píng)價(jià),你對(duì)自己人際關(guān)系的關(guān)注程度fromjibenxinxia,zongjiebwherea.學(xué)號(hào)=b.學(xué)號(hào);
②保存選擇的數(shù)據(jù):首先將第一步選擇的數(shù)據(jù)插入到一張表中,sql語句如下:insertintoguanlianguize1select性別,是否獨(dú)生子女,你對(duì)自己的人際關(guān)系滿意嗎,你對(duì)自己與父母的關(guān)系滿意嗎,你對(duì)自己與同伴的關(guān)系滿意嗎,你對(duì)自己與老師的關(guān)系滿意嗎,你認(rèn)為比較了解你的人會(huì)對(duì)你的人際關(guān)系給出一個(gè)怎樣的評(píng)價(jià),你對(duì)自己人際關(guān)系的關(guān)注程度fromjibenxinxia,zongjiebwherea.學(xué)號(hào)=b.學(xué)號(hào);
③構(gòu)造滿足關(guān)聯(lián)規(guī)則挖掘的事務(wù)數(shù)據(jù)庫在guanlianguize1表中增加一個(gè)屬性item,通過下面的sql語句給item賦值。注意各屬性的數(shù)據(jù)挖掘映射代碼如上表所示。新建表social_guanlian_1作為數(shù)據(jù)挖掘的事務(wù)數(shù)據(jù)庫,導(dǎo)入item。Insertintosocial_guanlian_1(item)selectitemfromguanlianguize1以上關(guān)聯(lián)規(guī)則挖掘的結(jié)果,結(jié)果表明:對(duì)自己圖人際關(guān)系評(píng)價(jià)較高的大學(xué)生,同時(shí)對(duì)自己人際關(guān)系的滿意度也較高。對(duì)自己人際關(guān)系評(píng)價(jià)較低的大學(xué)生,同時(shí)對(duì)自己人際關(guān)系的滿意度也較低。對(duì)人際關(guān)系關(guān)注程度較低的同學(xué),人際關(guān)系滿意度也較低。這些數(shù)據(jù)之間是互相有關(guān)聯(lián)的,因此呼吁大學(xué)生多關(guān)注人際關(guān)系和人際交往的法則,有利于他們及早的認(rèn)識(shí)到自己在人際交往方面的不足,為以后步入社會(huì),創(chuàng)造更大的社會(huì)價(jià)值打好基礎(chǔ)。除此以外,對(duì)于教育學(xué)中的很多課題,例如青少年同伴關(guān)系的研究,網(wǎng)絡(luò)成癮與注意偏向關(guān)系的研究,學(xué)生成績(jī)的分析等等都可以用數(shù)據(jù)挖掘來進(jìn)行科學(xué)的數(shù)據(jù)分析,數(shù)據(jù)挖掘技術(shù)在教育學(xué)領(lǐng)域正發(fā)揮著越來越大的作用。
2結(jié)束語
隨著信息化時(shí)代的不斷發(fā)展,很多研究人員圍繞教育學(xué)從不同側(cè)面不同領(lǐng)域進(jìn)行研究,在這個(gè)過程中必然會(huì)積累大量的科學(xué)數(shù)據(jù),這就急切需要應(yīng)用計(jì)算機(jī)手段進(jìn)行系統(tǒng)的數(shù)據(jù)整合,有利于更深層次的分析所得數(shù)據(jù)。數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育學(xué)領(lǐng)域內(nèi)的分析必將有廣闊的前景,可以作為未來的教育學(xué)的研究方向進(jìn)行進(jìn)一步的推廣。
作者:張曄柏毅單位:東南大學(xué)學(xué)習(xí)科學(xué)研究中心