摘 要: 三支決策,、粗糙集、集對分析以及模式識別理論都是處理模糊和不確定性知識的有效理論,。分析三支決策與粗糙集,、集對分析、模式識別的相似和想通之處,,并將它們相互滲透,為今后三支決策理論的進(jìn)一步發(fā)展和完善奠定理論基礎(chǔ),。
關(guān)鍵詞: 三支決策;粗糙集,;集對分析,;模式識別;不確定性
三支決策理論是姚一豫等人在粗糙集[1]和決策粗糙集[2]基礎(chǔ)上提出的新的決策理論,。2012年10月召開的中國粗糙集與軟計算會議上,,姚一豫教授系統(tǒng)地介紹了三支決策理論的背景、框架,、模型及應(yīng)用,。“三支決策理論與應(yīng)用”[3]標(biāo)志著三支決策由粗糙集的三個區(qū)間的語義解釋逐步發(fā)展為在一種不確定或不完整信息條件下的決策理論,。許多學(xué)者研究和拓展了三支決策理論,,并將其應(yīng)用于多個學(xué)科領(lǐng)域。2013年在漳州舉辦的中國rough集與軟計算學(xué)術(shù)會議上還專門開設(shè)了三支決策討論班,,來自各地的專家學(xué)者討論了三支決策的研究新進(jìn)展及其未來的發(fā)展方向,。三支決策用接受、拒絕和不承諾表示決策的三種類型,。與此理論研究的不確定信息的處理相關(guān)的理論還有誕生于20世紀(jì)20年代,、在60年代初迅速發(fā)展成一門學(xué)科的模式識別理論[4]和1989年我國學(xué)者趙克勤首次提出的集對分析理論[5],。模式識別過程是從樣本空間到類別空間的一個映射過程,也就是將觀察目標(biāo)與已有模式相比較,、配準(zhǔn),,判斷其類屬的過程。集對分析是以集對及其聯(lián)系度的基本概念,,刻畫和研究系統(tǒng)中廣泛存在著的確定性與不確定性及其轉(zhuǎn)化規(guī)律的一種系統(tǒng)分析技術(shù),。本文針對三支決策、粗糙集,、集對分析,、模式識別4種理論的基本思想、對確定性和不確定性的處理,、已有的研究方向,、應(yīng)用領(lǐng)域幾個方面進(jìn)行綜述,總結(jié)和展望三支決策理論與其他理論可以相互借鑒,、相互滲透的地方,。
1 基本思想
1.1 粗糙集
三支決策最初的提出是為了對粗糙集的3個區(qū)間給出一個合理的語義解釋。因此首先介紹粗糙集的基本思想,。
給定一個知識庫K=(U,R),,其中R為U上的一個等價關(guān)系。如果某個實體X可以用一些R基本范疇的并表示,,則X是R可定義的,;如果實體X不能用一些R基本范疇的并表示,則X是R不可定義的,。R不可定義集又稱作粗糙集,。對于無法用一個精確集定義的粗糙集,可以用兩個精確集來進(jìn)行近似定義,。同時把這兩個精確集稱為粗糙集的上近似集和下近似集[2]:
下近似:RX=∪{Y∈U/R|Y?哿X}
上近似:RX=∪{Y∈U/R|Y∩X≠?椎}
其中posR(X)=RX稱為X的R正域,,negR(X)=U-RX稱為X的R負(fù)域,bnR(X)=RX-RX稱為X的R邊界域,。根據(jù)定義,在知識R劃分下,posR(X)中的元素一定屬于X,;negR(X)中的元素一定不屬于X;bnR(X)中的元素不能準(zhǔn)確判斷是否屬于X,。
定理1:(1)X是R可定義集當(dāng)且僅當(dāng)RX=RX;
(2)X是R粗糙集當(dāng)且僅當(dāng)RX≠RX,。
1.2 三支決策
三支決策理論的基本思想是在實體評價函數(shù)上引入兩個閾值,并構(gòu)造所需要的3個域,。設(shè)U是有限,、非空實體集或者決策方案集;C是有限條件集,,條件集可能包含指標(biāo),、目標(biāo)或約束。決策任務(wù)是基于給定條件對每一個實體x∈U作出相應(yīng)決策,。條件集C給出了決策的依據(jù),,通過構(gòu)造評價函數(shù)給出決策。當(dāng)信息不確定或者不完整時,,可能無法確定實體是否屬于滿足條件,,也就是評價函數(shù)是對實體滿足條件的一種估計而非精確值。由于這種估計的不確定性,,采用二值決策可能比較困難,,在評價函數(shù)值既不很高也不很低時,不論是接受或拒絕都不合理,。此時引入三支決策,,給定閾值?琢和?茁:
(1)當(dāng)評價函數(shù)值大于或等于?琢?xí)r,接受該實體,;
(2)當(dāng)評價函數(shù)值小于或等于?茁時,,拒絕該實體;
(3)當(dāng)評價函數(shù)值在?琢和?茁之間時,,既不拒絕也不接受,,選擇不承諾決策。
在決策中,,信息不足或獲取信息需要一定代價時,,可以給出接受、拒絕和不承諾的三支決策-粗糙集是典型的三支決策模型,,粗糙集模型的正域,、負(fù)域和邊界域可以解釋為接受、拒絕和不承諾三種決策的結(jié)果,。
1.3 集對分析
集對是具有一定聯(lián)系的兩個集合組成的對子,。集對分析的核心思想是把確定不確定視作一個確定-不確定系統(tǒng),在這個系統(tǒng)中確定性與不確定性相互聯(lián)系,、相互影響,、相互制約,并在一定條件下相互轉(zhuǎn)換,,確定與不確定性關(guān)系用同異反聯(lián)系度來描述,。
給定兩個集合A和B,并設(shè)這兩個集合組成集對,,表示為H=(A,B),在某個具體的問題(記為W)背景下,,對集對H的特性展開分析,共得到N個特性,,其中有S個為集對H中兩個集合A和B共同具有,;在P個特性上集合A和B相對立,;在其余的F=N-S-P個特性上既不相互對立,又不為這兩個集合所共同具有,, 則稱比值:S/N為這兩個集合在問題W下的同一度,;F/N為這兩個集合在問題W下的差異度;P/N為這兩個集合在問題W下的對立度,;并用下式加以統(tǒng)一表示,。
模式是指通過觀察可以區(qū)別其相同與否的事物。將所要觀察的目標(biāo)與已經(jīng)存在的模式進(jìn)行比較,、配準(zhǔn)并判斷其類屬的過程是模式識別的過程,。模式識別的過程是人類認(rèn)知、判別的過程,,在人類活動中占有非常重要的地位,。隨著計算機(jī)科學(xué)的發(fā)展,人們逐漸可以借助計算機(jī)來實現(xiàn)模擬人的模式識別過程[6-7],。雖然使用模式識別的主體不同,,但原理基本相同,都是將要觀察的目標(biāo)與已經(jīng)存在的模式進(jìn)行配比分析,。
模式識別使用的方法因源數(shù)據(jù)類型不同而相應(yīng)不同,,但最終目標(biāo)都是將樣本歸類到相似程度最大的標(biāo)本類里。模式識別的基本步驟有:信息預(yù)處理,、特征提取和選擇,、分類決策。常見的模式識別方法[8]如表1所示,。
三支決策是決策粗糙集的語義擴(kuò)展[1],,粗糙集中的正域、負(fù)域,、邊界域與集對分析的同異反聯(lián)系度可以互相轉(zhuǎn)換[5],,而模式識別理論涉及的識別和判別決策可以使用粗糙集和三支決策的原理進(jìn)行分析決策。
2 確定性和不確定性
從哲學(xué)的觀點看,,不確定是相對于確定而言的,,沒有了確定也就沒有了不確定,反之亦然,。
粗糙集的不確定性體現(xiàn)在:當(dāng)X不能用R基本范疇的并表示時,,則X是R不可定義的。但卻可以使用兩個精確集將不可定義集進(jìn)行近似定義,。由這兩個精確集作差得到的邊界域是粗糙集粗糙程度的體現(xiàn),。等價關(guān)系R的劃分越細(xì),邊界域中能被劃分到正域或負(fù)域的部分越多,邊界越清晰,,集合的粗糙程度越?。坏葍r關(guān)系R的劃分越粗糙,,邊界越粗糙,,集合的粗糙程度也越大。
三支決策的不確定性與粗糙集類似,。粗糙集的正域、負(fù)域和邊界域可以解釋為接受,、拒絕和不承諾的三種決策的結(jié)果,。當(dāng)無法使用接受或拒絕規(guī)則時,采取不承諾決策,。已知的信息越充分,,接受和拒絕決策的可能性越大,不承諾決策的可能性就越??;已知信息越少,接受和拒絕決策的可能性越小,不承諾決策的可能性就越大,。
而集對分析對不確定的態(tài)度是客觀承認(rèn),、系統(tǒng)描述、定量刻畫,、具體分析,。具體體現(xiàn)在首先集對分析對不確定性采取“客觀承認(rèn)”的態(tài)度;其次把事物的確定性和不確定性作為一個系統(tǒng)來加以處理, u=a+bi+cj, i∈[-1,1],a+b+c=1,;再次對確定不確定系統(tǒng)作同異反定量描述,;最后對不確定系數(shù)i根據(jù)不同情況作不同的取值。對集合的特征提取越多,,能確定的相同或相反的屬性越多,,相異屬性越少,聯(lián)系度的量化更精確,;特征提取越少,,能確定的相同或相反的屬性越少,相異屬性越多,,聯(lián)系度的量化更粗糙,。
而模式識別過程中重要的一點是特征選擇和提取。特征選擇越多,,對事物的了解越清晰,,歸類正確的可能性越大;特征選擇越少,對事物的了解越模糊,,歸類正確的可能性越小,。
4種理論中不確定性的程度都依賴于所掌握的“知識”的程度。
3 研究方向
對粗糙集,、三支決策,、集對分析、模式識別現(xiàn)有研究方向的探析便于找出它們相互交融的地方,,同時避免科研工作的重復(fù),。
粗糙集模型擴(kuò)展是粗糙集理論研究的一個重要方向。經(jīng)典粗糙集是基于等價關(guān)系劃分?jǐn)?shù)據(jù)的,,進(jìn)一步研究非等價關(guān)系,,得到了“基于非等價關(guān)系的鄰域粗糙集模型”;同時擴(kuò)展劃分概念得到“基于粒的擴(kuò)展粗糙集模型”,;對粗糙集中近似算子擴(kuò)展得到基于子系統(tǒng)的擴(kuò)展模型,;進(jìn)一步研究基于統(tǒng)計信息的概率粗糙集模型,如0.5-概率粗糙集模型,、可變精度粗糙集模型,、參數(shù)化粗糙集模型和貝葉斯粗糙集模型。這些方面常常不是單獨出現(xiàn),,還可以進(jìn)行交叉,、綜合。
三支決策理論已經(jīng)進(jìn)行了的工作是對理論的完善,,如用博弈粗糙集模型給出了決策閾值的選取方法,;將三支決策應(yīng)用于代價敏感問題分類、半監(jiān)督學(xué)習(xí),、政策分析等具體問題中,;同時還研究了決策粗糙集下的三支決策理論和應(yīng)用以及雙論域決策粗糙集的理論和應(yīng)用。
集對分析是非常年輕的學(xué)科,,目前的研究著重于對其數(shù)學(xué)性質(zhì)探析,、對聯(lián)系度有效性的改進(jìn)、與其他不確定性方法的關(guān)系和互補(bǔ),。最終目的是使集對分析表示的確定和不確定性的聯(lián)系更客觀,、更有效。
模式識別理論和方法的研究主要集中在研究生物體如何感知對象以及研究如何用計算機(jī)實現(xiàn)模式識別這兩個方面,。在數(shù)學(xué)上,,選擇合適的判別函數(shù)和分類器是值得長期思考的問題。常見的模式識別方法如:模板匹配,、統(tǒng)計模式識別,、句法(結(jié)構(gòu))模式識別、模糊模式識別、人工神經(jīng)元網(wǎng)絡(luò)模式識別,。
將論域進(jìn)行擴(kuò)展,,將確定與不確定進(jìn)行對比分析,使決策更具客觀有效性是研究的熱點,。
4 應(yīng)用領(lǐng)域
粗糙集在知識獲取(如數(shù)據(jù)預(yù)處理,、屬性約簡、規(guī)則生成,、數(shù)據(jù)依賴關(guān)系獲取)上有成功的應(yīng)用,;知識的不確定性度量也是其應(yīng)用的重要方面;還有面向領(lǐng)域的數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘,、海量數(shù)據(jù)挖掘,;而在計算機(jī)領(lǐng)域常見的應(yīng)用是基于數(shù)據(jù)的決策與分析、機(jī)器學(xué)習(xí),、模式識別等。
三支決策理論的提出是基于決策粗糙集模型,,但也可用于傳統(tǒng)粗糙集模型,、博弈粗糙集模型和構(gòu)造性神經(jīng)網(wǎng)絡(luò),還可用于分類,、聚類,、規(guī)則學(xué)習(xí)等數(shù)據(jù)分析模型。
集對分析主要用于決策,、預(yù)測,、數(shù)據(jù)融合、不確定性推理,、產(chǎn)品設(shè)計,、網(wǎng)絡(luò)計劃、綜合評價等,。
模式識別主要應(yīng)用在數(shù)據(jù)挖掘,、文獻(xiàn)分類、財政預(yù)測,、多媒體數(shù)據(jù)庫的組織和檢索,、生物(人臉、指紋識別),、醫(yī)學(xué)(醫(yī)學(xué)圖像分析),、地質(zhì)、能源,、氣象(天氣預(yù)報),、化工、冶金、航空,、工業(yè)產(chǎn)品檢測中,。
在不確定信息下有分類和決策的地方正是這4種理論大展身手的地方。
研究后發(fā)現(xiàn)了一個有趣的現(xiàn)象——將粗糙集,、三支決策,、集對分析、模式識別進(jìn)行對比分析的過程恰恰是這4種理論都存在的經(jīng)典的對比分析的過程,。這些研究和應(yīng)用各具特色,,又互有交叉。正所謂站在巨人的肩膀上才能望得更遠(yuǎn),,對已有知識對比分析的需求無處不在,,也正是這種需求才推動了它們之間相互借鑒、相互促進(jìn),,科學(xué)理論才能發(fā)展得更快更完善,。
參考文獻(xiàn)
[1] 張文修, 吳偉志, 梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社, 2001.
[2] YAO Y Y, WONG S K M, LINGRAS P. A decision-theoretic rough set model[C]. The 5th International Sympo-sium on Methodologies for Intelligent Systems,1990.
[3] 賈修一,商林等.三支決策理論與應(yīng)用[M].南京:南京大學(xué)出版社,2012.
[4] 孫亮,禹晶.模式識別原理[M].北京:北京工業(yè)大學(xué)出版社,2009.
[5] 趙克勤.集對分析及其初步應(yīng)用[M].杭州:浙江科學(xué)技術(shù)出版社,2000.
[6] 王敏妲.語音識別技術(shù)的研究與發(fā)展[J].微型機(jī)與應(yīng)用,2009,28(23):1-6.
[7] 童剛,朱鴻博.圖像處理在紅綠燈判別中的應(yīng)用[J].微型機(jī)與應(yīng)用,2013,32(4):88-90.
[8] 蔣云良,徐從富.集對分析理論及其應(yīng)用研究進(jìn)展[J].計算機(jī)科學(xué),2006,33(1):205-209.