《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 關(guān)聯(lián)規(guī)則在藝術(shù)品股票預(yù)測(cè)方面的應(yīng)用
關(guān)聯(lián)規(guī)則在藝術(shù)品股票預(yù)測(cè)方面的應(yīng)用
2016年微型機(jī)與應(yīng)用第23期
趙艷琪,,茍剛
貴州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,,貴州 貴陽(yáng) 550025
摘要: 股票市場(chǎng)瞬息萬(wàn)變,每天產(chǎn)生大量的交易數(shù)據(jù),。隨著藝術(shù)品股票市場(chǎng)的興起,,越來(lái)越多的人投資于藝術(shù)品股票。由于藝術(shù)品股票價(jià)格受多方面的影響,,需要尋求更為有效的方法來(lái)對(duì)藝術(shù)品交易市場(chǎng)進(jìn)行預(yù)測(cè),。利用Apriori算法的改進(jìn)算法對(duì)藝術(shù)品股票進(jìn)行關(guān)聯(lián)規(guī)則挖掘,得到藝術(shù)品股票之間的關(guān)聯(lián)關(guān)系,進(jìn)而對(duì)投資者做出正確決策有一定的輔助作用,,防止投資者盲目投資,,降低藝術(shù)品股票市場(chǎng)交易風(fēng)險(xiǎn)。
Abstract:
Key words :

  趙艷琪,,茍剛

 ?。ㄙF州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,貴州 貴陽(yáng) 550025)

  摘要:股票市場(chǎng)瞬息萬(wàn)變,,每天產(chǎn)生大量的交易數(shù)據(jù),。隨著藝術(shù)品股票市場(chǎng)的興起,越來(lái)越多的人投資于藝術(shù)品股票,。由于藝術(shù)品股票價(jià)格受多方面的影響,,需要尋求更為有效的方法來(lái)對(duì)藝術(shù)品交易市場(chǎng)進(jìn)行預(yù)測(cè)。利用Apriori算法的改進(jìn)算法對(duì)藝術(shù)品股票進(jìn)行關(guān)聯(lián)規(guī)則挖掘,,得到藝術(shù)品股票之間的關(guān)聯(lián)關(guān)系,,進(jìn)而對(duì)投資者做出正確決策有一定的輔助作用,防止投資者盲目投資,,降低藝術(shù)品股票市場(chǎng)交易風(fēng)險(xiǎn),。

  關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;藝術(shù)品股票

  中圖分類(lèi)號(hào):TP399文獻(xiàn)標(biāo)識(shí)碼:ADOI: 10.19358/j.issn.16747720.2016.23.026

  引用格式:趙艷琪,,茍剛. 關(guān)聯(lián)規(guī)則在藝術(shù)品股票預(yù)測(cè)方面的應(yīng)用[J].微型機(jī)與應(yīng)用,,2016,35(23):90-92.

0引言

  近年來(lái),隨著中國(guó)藏品熱和我國(guó)政府關(guān)于藝術(shù)品交易政策的改變,,中國(guó)已經(jīng)取代美國(guó)成為世界第一大藝術(shù)品交易市場(chǎng),。2010年7月,深圳文化產(chǎn)權(quán)交易所推出了“深圳文化產(chǎn)權(quán)交易所1號(hào)藝術(shù)品資產(chǎn)包”,,這是國(guó)內(nèi)外首次出現(xiàn)的“權(quán)益拆分”投資模式,,即藝術(shù)品股票。自此藝術(shù)品股票作為一種新型的金融產(chǎn)品越來(lái)越受到人們的關(guān)注[1],。

  由于藝術(shù)品股票價(jià)格受多方面的影響,,尤其是藝術(shù)品交易市場(chǎng)相對(duì)于股票市場(chǎng)來(lái)說(shuō)莊家的影響更大,所以需要尋求更為有效的方法來(lái)對(duì)藝術(shù)品交易市場(chǎng)進(jìn)行預(yù)測(cè),。在藝術(shù)品股票市場(chǎng),,每天都會(huì)產(chǎn)生海量的交易數(shù)據(jù),這些數(shù)據(jù)雖然存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,,但是并沒(méi)有得到有效的利用,。通過(guò)數(shù)據(jù)挖掘技術(shù)分析股票市場(chǎng)數(shù)據(jù),投資者可以從中得出有效的投資信息,,并綜合分析利弊以后做出投資決策,,提高投資收益率。

  一般來(lái)說(shuō),,數(shù)據(jù)挖掘是指從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中發(fā)現(xiàn)隱藏的,、預(yù)先未知的、有趣的信息的過(guò)程[2],。在國(guó)內(nèi),臺(tái)灣義守大學(xué)陳慶翰開(kāi)發(fā)了MIAT仿生物智慧股票預(yù)測(cè)系統(tǒng),,該系統(tǒng)是一個(gè)可以建立自我學(xué)習(xí)、自我組織,、自我調(diào)節(jié),、自我改善的高度自主性智慧型系統(tǒng)[3]。國(guó)內(nèi)還有許多著名的學(xué)者在股票預(yù)測(cè)方面做過(guò)大量的工作,。國(guó)際方面,,Morgan、Stannlog等人已經(jīng)開(kāi)發(fā)了AI(Automated Investor)系統(tǒng),,該系統(tǒng)通過(guò)采用聚類(lèi),、可視化和預(yù)測(cè)技術(shù)來(lái)尋求最佳投資時(shí)機(jī)[4]。

  本文致力于通過(guò)關(guān)聯(lián)規(guī)則算法獲得藝術(shù)品股票之間的關(guān)聯(lián)關(guān)系,,如“在某個(gè)時(shí)間段X范圍內(nèi),,藝術(shù)品股票A和B價(jià)格上漲時(shí),有80%的情況下,,股票C的價(jià)格也會(huì)隨之上漲”,。這樣,就可以對(duì)投資者有一定的借鑒意義,,防止被套牢,。

1關(guān)聯(lián)規(guī)則介紹

  1.1算法思想

  假設(shè)有多個(gè)購(gòu)物籃,每個(gè)購(gòu)物籃是由多個(gè)項(xiàng)組成的集合(即為項(xiàng)集itemset),,那么一個(gè)在多個(gè)購(gòu)物籃中出現(xiàn)的項(xiàng)集稱為“頻繁”項(xiàng)集,。

  定義1支持度:如果I是一個(gè)項(xiàng)集,I的支持度(support)指包含I的購(gòu)物籃的數(shù)目,,此時(shí)定義一個(gè)支持度閾值(support threshold)s,,如果I的支持度不小于s,則I為頻繁項(xiàng)集,。

  定義2置信度:I→j的置信度即為集合I∪{j}的支持度與I的支持度的比值,。顧名思義,置信度即為得到的規(guī)則的可信任程度,。

  AGRAWAL R和SRIKANT R于1994年提出了Apriori算法,,該算法是關(guān)聯(lián)規(guī)則挖掘的最有影響的迭代算法[5]。設(shè)Cm為大小為m的候選項(xiàng)集集合,,Ln為大小為n的真正頻繁項(xiàng)集集合,。Apriori算法是將候選項(xiàng)集不斷過(guò)濾,,得到頻繁項(xiàng)集,再將頻繁項(xiàng)集進(jìn)一步過(guò)濾,,得到新的頻繁項(xiàng)集,,如:首先找到“1項(xiàng)集”的集合,再將其支持度與支持度閾值相比較,,過(guò)濾得到頻繁“1項(xiàng)集”,,記作L1,再將其進(jìn)行組合,,得到“2項(xiàng)集”,,再將其支持度與支持度閾值相比較,過(guò)濾得到頻繁“2項(xiàng)集”,,記作L2,,以此類(lèi)推,直到找到最終的頻繁項(xiàng)集,。具體步驟如圖1,。

圖像 001.png

  1.2算法實(shí)例

  

圖像 004.png

表1為某商場(chǎng)9天內(nèi)的商品交易情況,設(shè)定支持度為2,,置信度為80%,。利用Apriori算法尋找所有滿足條件的關(guān)聯(lián)規(guī)則的過(guò)程如圖2所示。

圖像 002.png

  接下來(lái)四項(xiàng)集只有{I1,,I2,,I3,I4},,且其支持度為1,,小于支持度閾值,故{I1,,I2,,I3,I4}不是頻繁項(xiàng)集,。由以上步驟可得:最大的頻繁項(xiàng)集為{I1,,I2,I3},、{I1,,I2,I4},。關(guān)聯(lián)規(guī)則產(chǎn)生步驟如下:

  (1) 對(duì)于每個(gè)頻繁項(xiàng)集l,,產(chǎn)生其所有非空真子集;

  (2) 對(duì)于每個(gè)非空真子集s,如果其置信度不小于最小置信度閾值,,則為強(qiáng)關(guān)聯(lián)規(guī)則,。

  經(jīng)計(jì)算,,強(qiáng)關(guān)聯(lián)規(guī)則為I4I2和I1&&I4I2,置信度均為100%,。

2改進(jìn)的關(guān)聯(lián)規(guī)則挖掘算法

  在關(guān)聯(lián)規(guī)則挖掘算法中,,經(jīng)典的Apriori挖掘算法是通過(guò)項(xiàng)目集數(shù)目不斷增長(zhǎng)來(lái)得到所有的頻繁項(xiàng)目集的,即先產(chǎn)生頻繁“1項(xiàng)集”,,再產(chǎn)生頻繁“2項(xiàng)集”,直到頻繁項(xiàng)目集中的元素不能擴(kuò)增為止,。傳統(tǒng)的Apriori算法有兩個(gè)瓶頸:(1)需要多次掃描數(shù)據(jù)庫(kù),,對(duì)于候選項(xiàng)集Ck,需要掃描k次數(shù)據(jù)庫(kù)來(lái)確定其是否為頻繁項(xiàng)集,是否可加入Lk,;(2)由于頻繁“k-1項(xiàng)集”產(chǎn)生候選“k-1項(xiàng)集”是將頻繁項(xiàng)集中的元素進(jìn)行組合得到,,呈指數(shù)增長(zhǎng),這將產(chǎn)生大量的頻繁項(xiàng)集,,從而產(chǎn)生大量的關(guān)聯(lián)規(guī)則[6],。這兩個(gè)瓶頸明顯降低了算法的效率。

  因此,,在傳統(tǒng)關(guān)聯(lián)規(guī)則算法的基礎(chǔ)上,,本文提出Apriori算法的改進(jìn)算法,即Partition算法,。由于Apriori算法需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行多次掃描,,這個(gè)過(guò)程非常繁瑣,可以將數(shù)據(jù)庫(kù)邏輯性地分成幾個(gè)互不相交的塊,,即分而治之,。Partition算法步驟如下:(1)每次都只針對(duì)單獨(dú)一個(gè)分塊,其中分塊的大小要保證可以放入主存,,每個(gè)階段秩序被掃描一次,,而算法的正確性是由每一個(gè)可能的頻集至少在該分塊中是頻集保證的。利用Apriori算法產(chǎn)生它的頻繁項(xiàng)集,。(2)把所有分區(qū)產(chǎn)生的頻繁項(xiàng)集合并,,生成候選項(xiàng)集,掃描整個(gè)數(shù)據(jù)庫(kù),,計(jì)算這些項(xiàng)集的支持度,,最終得到全局的支持度不小于支持度閾值的頻繁項(xiàng)集。該算法流程如圖3,。

圖像 003.png

  Partition算法共掃描數(shù)據(jù)庫(kù)兩次,。第一次掃描是對(duì)數(shù)據(jù)庫(kù)進(jìn)行分塊,找出各塊的頻繁項(xiàng)集,,即局部頻繁項(xiàng)集,;第二次掃描數(shù)據(jù)庫(kù)是求候選集的支持度,,用以計(jì)算全局頻繁項(xiàng)集。相對(duì)于傳統(tǒng)Apriori算法,,Partition算法全程只掃描兩次數(shù)據(jù)庫(kù),,大大減少了I/O操作。由于Partition算法是并行計(jì)算,,同時(shí)對(duì)各個(gè)分區(qū)進(jìn)行求頻繁項(xiàng)集的操作,,大大提高了算法的效率。

  Partition算法是高度并行的,,即把各個(gè)分塊的處理分配給不同的處理器來(lái)產(chǎn)生頻繁項(xiàng)集,,在每一個(gè)循環(huán)結(jié)束之后,各個(gè)處理器之間會(huì)進(jìn)行通信,,以產(chǎn)生全局候選項(xiàng)集,。

3關(guān)聯(lián)規(guī)則在股票方面的應(yīng)用

  在文化藝術(shù)品交易市場(chǎng),每天都會(huì)產(chǎn)生大量的交易數(shù)據(jù),,利用數(shù)據(jù)挖據(jù)技術(shù)對(duì)股票市場(chǎng)的股票價(jià)格以及股票的走勢(shì)進(jìn)行預(yù)測(cè),,通過(guò)運(yùn)用關(guān)聯(lián)規(guī)則技術(shù)對(duì)藝術(shù)品股票市場(chǎng)進(jìn)行分析,為投資人提供較為準(zhǔn)確的預(yù)測(cè)結(jié)果,,防止投資者盲目投資[7],。

  本文選擇了某藝術(shù)品股票交易市場(chǎng)2016年1月~5月幾個(gè)月的交易數(shù)據(jù),以此為依據(jù)進(jìn)行股票關(guān)聯(lián)規(guī)則挖掘,。選取其中6只股票并分別記為A,、B、C,、D,、E、F,。然后對(duì)股票進(jìn)行預(yù)處理,,如果某天A股票上漲,則記為A0,,若下跌則記為A1,,其他股票同理。部分股票數(shù)據(jù)如表2所示,。

圖像 005.png

  運(yùn)用Apriori算法的改進(jìn)算法——Partition算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘,,在實(shí)驗(yàn)中,設(shè)定支持度為60,,置信度為70%,,得到如表3所示挖掘結(jié)果。

圖像 006.png

  由規(guī)則1可知,,當(dāng)A和D藝術(shù)品股票價(jià)格均上漲時(shí),,C藝術(shù)品股票價(jià)格上漲的概率為85%,。投資者根據(jù)這一信息,在藝術(shù)品股票A和D均上漲時(shí),,可以考慮購(gòu)買(mǎi)一定的C藝術(shù)品股票,,因?yàn)楹苡锌赡苓^(guò)段時(shí)間C藝術(shù)品股票價(jià)格就上漲了。

  由規(guī)則2可知,,當(dāng)D藝術(shù)品股票價(jià)格下跌,,同時(shí)F藝術(shù)品股票價(jià)格上漲時(shí),C藝術(shù)品股票價(jià)格下跌的概率為88%,。因此,,在D藝術(shù)品股票價(jià)格下跌,同時(shí)F藝術(shù)品股票價(jià)格上漲時(shí),,投資者如果手中持有C藝術(shù)品股票,,可以趁C藝術(shù)品股票價(jià)格未下跌時(shí)及早拋售,,如果手中未持有C藝術(shù)品股票,,可等過(guò)段時(shí)間C藝術(shù)品股票價(jià)格下跌時(shí)低價(jià)購(gòu)買(mǎi)。其他幾個(gè)藝術(shù)品股票關(guān)聯(lián)規(guī)則同理,。

4結(jié)束語(yǔ)

  本文將關(guān)聯(lián)規(guī)則的Apriori算法的改進(jìn)算法應(yīng)用到藝術(shù)品股票交易市場(chǎng)的預(yù)測(cè)上,,得出如“當(dāng)A和D藝術(shù)品股票價(jià)格均上漲時(shí),C藝術(shù)品股票價(jià)格上漲的概率為85%”這樣的關(guān)聯(lián)規(guī)則,,投資機(jī)構(gòu)和普通股民可以根據(jù)挖掘出的關(guān)聯(lián)規(guī)則快速得到各個(gè)藝術(shù)品股票之間的關(guān)聯(lián)關(guān)系,,進(jìn)而決定買(mǎi)入或者賣(mài)出哪只股票,以使自己的投資收益最大化,。對(duì)藝術(shù)品股票進(jìn)行關(guān)聯(lián)規(guī)則挖掘可為投資者提供較為準(zhǔn)確和有效的投資信息,,對(duì)藝術(shù)品股票投資有一定的指導(dǎo)意義,可促進(jìn)中國(guó)文化藝術(shù)品交易市場(chǎng)更好的發(fā)展,。

  參考文獻(xiàn)

 ?。?] 王洋.藝術(shù)品的股票交易[N].中華工商時(shí)報(bào),2011-3-11(21).

 ?。?] 朱明. 數(shù)據(jù)挖掘[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,,2002.

  [3] HAND D, MANNILA H, SMYTH P.Principles of data mining[M].MA: The MIT press,2001.

 ?。?] RAMASUBBAREDDY B. Mining positive and negative association rules[C]. International Conference on Computer Science and Education,2010:1403-1406.

 ?。?] 鄭朝霞,劉廷建.關(guān)聯(lián)規(guī)則在股票分析中的應(yīng)用[J].成都大學(xué)學(xué)報(bào),2002,11(4):46-50.

 ?。?] 周濤,,陸惠玲.數(shù)據(jù)挖掘中聚類(lèi)算法研究進(jìn)展[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(12):100-111.

 ?。?] 孫媌. 基于數(shù)據(jù)挖掘的股票分析和預(yù)測(cè)模型的設(shè)計(jì)與應(yīng)用[D].北京:北京郵電大學(xué),,2011.


此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。