摘 要: 數(shù)據(jù)挖掘是適應(yīng)信息社會(huì)從海量的數(shù)據(jù)庫中提取信息的需要而產(chǎn)生的新學(xué)科,。它是統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí),、數(shù)據(jù)庫,、模式識(shí)別、人工智能等學(xué)科的交叉。以往的數(shù)據(jù)挖掘技術(shù)的應(yīng)用大多是在金融領(lǐng)域,,而在其他領(lǐng)域里面應(yīng)用不是很多,,如在高校招生中的應(yīng)用更是如此。數(shù)據(jù)挖掘技術(shù)對(duì)招生工作的深層研究與挖掘?qū)?huì)得到各高校的更多重視,。以某高校招生數(shù)據(jù)作為招生信息為依據(jù),,對(duì)高校招生的關(guān)聯(lián)規(guī)則進(jìn)行分析。從而對(duì)關(guān)聯(lián)性規(guī)則的應(yīng)用作進(jìn)一步的研究,。
關(guān)鍵詞: 關(guān)聯(lián)規(guī)則,;Apriori算法;置信度,;支持度,;建模
1 民辦高校招生的現(xiàn)狀分析
招生工作一直是民辦學(xué)校最重要的工作,民辦學(xué)校在招生上的投入占一年總支出的很大部份,,采用的招生方式也在不斷的更新,,使用新方法,新模式,。但同時(shí)也會(huì)發(fā)現(xiàn),,有些方式方法并不能解決招生問題,浪費(fèi)了有限的資源,,得不償失,,主要表現(xiàn)在招生成本高、沒有嚴(yán)格的招生機(jī)制,,宣傳模式單一等,。歸根原因是沒有找到適合本校的招生方法與模式,而要能做到這一點(diǎn),,必須要對(duì)招生工作做一個(gè)詳細(xì)的研究,,根據(jù)以住招生的情況,總結(jié)分析,,找出問題所在點(diǎn)和發(fā)光點(diǎn),,為招生工作更好的方式提供有力的依據(jù)。
2 Apriori算法分析
2.1 挖掘關(guān)聯(lián)規(guī)則的主要步驟
步驟1:發(fā)現(xiàn)所有的頻繁集,。項(xiàng)集的頻度至少應(yīng)等于(預(yù)先設(shè)置的)最小支持度,。關(guān)聯(lián)規(guī)則的整個(gè)性能主要取決于這一步。
步驟2:根據(jù)所獲得的頻繁項(xiàng)集,,產(chǎn)生相應(yīng)的強(qiáng)關(guān)聯(lián)規(guī)則,。這些規(guī)則必須滿足最小置信度閾值。
2.2 Apriori算法
Apriori算法是挖掘產(chǎn)生關(guān)聯(lián)規(guī)則所需要的頻繁項(xiàng)集的基本算法,,是數(shù)據(jù)挖掘領(lǐng)域里面常用的一種關(guān)聯(lián)規(guī)則挖掘算法,。該算法利用一個(gè)層次順序搜索的循環(huán)方法來完成頻繁集的挖掘工作,。這一循環(huán)方法就是利用(k-1)-項(xiàng)集來產(chǎn)生k-項(xiàng)集,具體的做法是首先找出頻繁集I-項(xiàng)集,,記為L(zhǎng)1,;然后利用L1來挖掘產(chǎn)生L2,即頻繁2-項(xiàng)集,,如此循環(huán)往返,直到無法發(fā)現(xiàn)更多的頻繁k-項(xiàng)集為止,。在每一層挖掘產(chǎn)生Lk時(shí),,都需要對(duì)整個(gè)數(shù)據(jù)庫掃描一遍。Apriori算法利用Lk-1來生成Lk,。
3.2 利用spss Clemention建模
利用spss Clemention工具建立模型,,本例用2012年入學(xué)數(shù)據(jù)與2013年入學(xué)數(shù)據(jù)進(jìn)行比較,得出兩年的地區(qū)與是否報(bào)到的關(guān)聯(lián)性分析,,建模如圖3所示,。
3.3 設(shè)置最低條件支持度,最小規(guī)則置信度,,最大前項(xiàng)數(shù)
在2012年的數(shù)據(jù)中,,設(shè)置最低條件支持度為8.0,最小規(guī)則置信度60.0%,,最大前項(xiàng)數(shù)為5,,得到的數(shù)據(jù)分析結(jié)果如圖4所示。
如果把2013的規(guī)則支持度和置信度設(shè)置和2012相同,,結(jié)果如圖5所示,。
3.4 地區(qū)與是否報(bào)到關(guān)聯(lián)規(guī)則結(jié)果分析
根據(jù)圖4和圖5進(jìn)行比較,B(云南大理)和D(云南昭通)地區(qū)的學(xué)生報(bào)到是趨于正常的發(fā)展,,在2013年招生中,,A(云南昆明)、C(云南曲靖)和E(云南麗江)加大了招生宣傳,,取得了非常明顯的效果,,那么在2014年的招生宣傳中,還需要在A,、C,、E地區(qū)保持一定的宣傳投入,在B和D地區(qū)可以適當(dāng)減少招生投入,。
一個(gè)學(xué)校生源的多少?zèng)Q定了它規(guī)模及發(fā)展,。特別是在民辦高校,“招生就是一切”,,招生中不僅要數(shù)量,、質(zhì)量也是發(fā)展的關(guān)鍵,。民辦院校在不同的發(fā)展時(shí)期會(huì)有不同的發(fā)展策略,在不同的歷史時(shí)期院校也就有不同的招生策略及隊(duì)伍建設(shè)適應(yīng)發(fā)展的需求,。因此,,只有在清楚制定了院校發(fā)展戰(zhàn)略規(guī)劃后,才能順理成章地制定出院校人力資源需求,、發(fā)展,、策略、培訓(xùn),、擴(kuò)建和儲(chǔ)備計(jì)劃,。充分把數(shù)據(jù)挖掘技術(shù)利用在招生工作中,將對(duì)個(gè)高校的招生工作提供決策支持,,對(duì)高校的招生成本的整合具有深遠(yuǎn)的意義,。
參考文獻(xiàn)
[1] 趙祖應(yīng),丁勇.基于Apriori算法的購物籃關(guān)聯(lián)規(guī)則分析[J].江西科學(xué),,2012(1).
[2] 王嵩巖.基于數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則研究[J].吉林省經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào),,2008,22(1):80-82.
[3] 朱建平,,謝邦昌.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的提升及其應(yīng)用[J].統(tǒng)計(jì)研究,,2004(12):34-39.
[4] 姚俊.淺談關(guān)聯(lián)規(guī)則挖掘[J].信息技術(shù),2005(6).
[5] 劉柱文,,李麗琳.關(guān)聯(lián)規(guī)則技術(shù)在數(shù)據(jù)挖掘中的應(yīng)用[J].科學(xué)技術(shù)與工程,,2008(6).
[6] 譚建豪,章兢.數(shù)據(jù)挖掘技術(shù)[M].北京:中國水利水電出版社,,2009.
[7] 劉世平.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:高等教育出版社,,2010.