《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于Apriori算法的高校招生的關聯(lián)規(guī)則分析
基于Apriori算法的高校招生的關聯(lián)規(guī)則分析
來源:微型機與應用2014年第5期
趙祖應,,丁 勇,潘明波
(云南工商學院,,云南 昆明 651701)
摘要: 數(shù)據(jù)挖掘是適應信息社會從海量的數(shù)據(jù)庫中提取信息的需要而產生的新學科,。它是統(tǒng)計學、機器學習,、數(shù)據(jù)庫、模式識別,、人工智能等學科的交叉。以往的數(shù)據(jù)挖掘技術的應用大多是在金融領域,,而在其他領域里面應用不是很多,如在高校招生中的應用更是如此,。數(shù)據(jù)挖掘技術對招生工作的深層研究與挖掘將會得到各高校的更多重視。以某高校招生數(shù)據(jù)作為招生信息為依據(jù),,對高校招生的關聯(lián)規(guī)則進行分析。從而對關聯(lián)性規(guī)則的應用作進一步的研究,。
Abstract:
Key words :

摘  要: 數(shù)據(jù)挖掘是適應信息社會從海量的數(shù)據(jù)庫中提取信息的需要而產生的新學科。它是統(tǒng)計學,、機器學習、數(shù)據(jù)庫,、模式識別、人工智能等學科的交叉,。以往的數(shù)據(jù)挖掘技術的應用大多是在金融領域,,而在其他領域里面應用不是很多,如在高校招生中的應用更是如此,。數(shù)據(jù)挖掘技術對招生工作的深層研究與挖掘將會得到各高校的更多重視,。以某高校招生數(shù)據(jù)作為招生信息為依據(jù),,對高校招生的關聯(lián)規(guī)則進行分析。從而對關聯(lián)性規(guī)則的應用作進一步的研究,。
關鍵詞: 關聯(lián)規(guī)則;Apriori算法,;置信度支持度,;建模

1 民辦高校招生的現(xiàn)狀分析
 招生工作一直是民辦學校最重要的工作,民辦學校在招生上的投入占一年總支出的很大部份,,采用的招生方式也在不斷的更新,,使用新方法,新模式,。但同時也會發(fā)現(xiàn),有些方式方法并不能解決招生問題,,浪費了有限的資源,得不償失,,主要表現(xiàn)在招生成本高、沒有嚴格的招生機制,,宣傳模式單一等。歸根原因是沒有找到適合本校的招生方法與模式,,而要能做到這一點,必須要對招生工作做一個詳細的研究,,根據(jù)以住招生的情況,總結分析,,找出問題所在點和發(fā)光點,,為招生工作更好的方式提供有力的依據(jù),。
2 Apriori算法分析
2.1 挖掘關聯(lián)規(guī)則的主要步驟

 步驟1:發(fā)現(xiàn)所有的頻繁集。項集的頻度至少應等于(預先設置的)最小支持度,。關聯(lián)規(guī)則的整個性能主要取決于這一步。
 步驟2:根據(jù)所獲得的頻繁項集,,產生相應的強關聯(lián)規(guī)則。這些規(guī)則必須滿足最小置信度閾值,。
2.2 Apriori算法
 Apriori算法是挖掘產生關聯(lián)規(guī)則所需要的頻繁項集的基本算法,,是數(shù)據(jù)挖掘領域里面常用的一種關聯(lián)規(guī)則挖掘算法,。該算法利用一個層次順序搜索的循環(huán)方法來完成頻繁集的挖掘工作。這一循環(huán)方法就是利用(k-1)-項集來產生k-項集,,具體的做法是首先找出頻繁集I-項集,記為L1,;然后利用L1來挖掘產生L2,,即頻繁2-項集,,如此循環(huán)往返,直到無法發(fā)現(xiàn)更多的頻繁k-項集為止,。在每一層挖掘產生Lk時,都需要對整個數(shù)據(jù)庫掃描一遍,。Apriori算法利用Lk-1來生成Lk,。

 

3.2 利用spss Clemention建模
 利用spss Clemention工具建立模型,,本例用2012年入學數(shù)據(jù)與2013年入學數(shù)據(jù)進行比較,得出兩年的地區(qū)與是否報到的關聯(lián)性分析,,建模如圖3所示。

 

 

3.3 設置最低條件支持度,,最小規(guī)則置信度,,最大前項數(shù)
    在2012年的數(shù)據(jù)中,,設置最低條件支持度為8.0,,最小規(guī)則置信度60.0%,最大前項數(shù)為5,,得到的數(shù)據(jù)分析結果如圖4所示。

 如果把2013的規(guī)則支持度和置信度設置和2012相同,,結果如圖5所示,。
3.4 地區(qū)與是否報到關聯(lián)規(guī)則結果分析
 根據(jù)圖4和圖5進行比較,,B(云南大理)和D(云南昭通)地區(qū)的學生報到是趨于正常的發(fā)展,在2013年招生中,,A(云南昆明),、C(云南曲靖)和E(云南麗江)加大了招生宣傳,,取得了非常明顯的效果,,那么在2014年的招生宣傳中,還需要在A,、C、E地區(qū)保持一定的宣傳投入,,在B和D地區(qū)可以適當減少招生投入。
 一個學校生源的多少決定了它規(guī)模及發(fā)展,。特別是在民辦高校,,“招生就是一切”,招生中不僅要數(shù)量,、質量也是發(fā)展的關鍵,。民辦院校在不同的發(fā)展時期會有不同的發(fā)展策略,在不同的歷史時期院校也就有不同的招生策略及隊伍建設適應發(fā)展的需求,。因此,,只有在清楚制定了院校發(fā)展戰(zhàn)略規(guī)劃后,才能順理成章地制定出院校人力資源需求,、發(fā)展、策略,、培訓,、擴建和儲備計劃。充分把數(shù)據(jù)挖掘技術利用在招生工作中,,將對個高校的招生工作提供決策支持,,對高校的招生成本的整合具有深遠的意義,。
參考文獻
[1] 趙祖應,丁勇.基于Apriori算法的購物籃關聯(lián)規(guī)則分析[J].江西科學,,2012(1).
[2] 王嵩巖.基于數(shù)據(jù)挖掘的關聯(lián)規(guī)則研究[J].吉林省經(jīng)濟管理干部學院學報,,2008,22(1):80-82.
[3] 朱建平,,謝邦昌.數(shù)據(jù)挖掘中關聯(lián)規(guī)則的提升及其應用[J].統(tǒng)計研究,,2004(12):34-39.
[4] 姚俊.淺談關聯(lián)規(guī)則挖掘[J].信息技術,2005(6).
[5] 劉柱文,,李麗琳.關聯(lián)規(guī)則技術在數(shù)據(jù)挖掘中的應用[J].科學技術與工程,,2008(6).
[6] 譚建豪,章兢.數(shù)據(jù)挖掘技術[M].北京:中國水利水電出版社,,2009.
[7] 劉世平.數(shù)據(jù)挖掘技術與應用[M].北京:高等教育出版社,,2010.

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載,。