1,周基賢1,,馮俊羲2,,滕奇志2
(1.新疆油田分公司實驗檢測研究院,,新疆 克拉瑪依 834000,;2.四川大學 電子信息學院 圖像信息研究所,四川 成都 610065)
摘要:在巖石薄片圖像處理中,,針對巖屑礦物個數(shù)未知,、成像多為聚集的點狀的特點,提出了一種基于DBSCAN(DensityBased Spatial Clustering of Applications with Noise)算法與數(shù)學形態(tài)學的礦物分割方法,。首先,,標記出每個顆粒目標,求得其中心坐標;其次,,利用DBSCAN算法對巖屑顆粒目標中心進行聚類,,將不同區(qū)域的巖屑目標分離出來;最后,,利用數(shù)學形態(tài)學方法對聚類結(jié)果做膨脹,、填孔、腐蝕等處理,,得到顆粒的邊界,。實驗分析表明:該方法聚類效果良好,參數(shù)容易控制并有一定的抗噪性能,,對巖屑顆粒目標的提取有較好的效果,。
關(guān)鍵詞:DBSCAN聚類;圖像分割;巖石薄片圖像;數(shù)學形態(tài)學
0引言
利用巖石薄片圖像進行巖石顆粒的粒度分析是地質(zhì)實驗室的一種常用方法,而巖石顆粒的分割是粒度分析和礦物識別的前提,。根據(jù)顆粒的光學性質(zhì)和礦物成分,,可以分為以下兩類:
(1)碎屑顆粒,。該類顆粒成分較為單一,,在正交偏光下,明暗變化比較一致,,通常呈現(xiàn)整體地變亮變暗,。其特點是顆粒目標面積較大,邊界清晰,,容易確定,。隨著圖像處理技術(shù)的發(fā)展,目前已經(jīng)有一些典型顆粒分割方法應(yīng)用在碎屑顆粒分割上,,取得了較好的效果,,已經(jīng)在一定程度上解決了分割的問題。
?。?)巖屑顆粒,。該類顆粒成分較為復雜,在正交偏光下明暗變化不一致,,通常呈現(xiàn)出點狀,。特點是目標面積較小,邊界模糊,,難以確定,。目前有一些學者提出了超像素分割方法[1],該方法應(yīng)用到巖石薄片圖像的分割上,,能夠大致地擬合出顆粒的邊界,,但是存在目標過分割及區(qū)域合并易出錯的問題,。
針對巖屑礦物的光學特性和成像特點,本文提出一種基于算法密度的聚類算法(DensityBased Spatial Clustering of Applications with Noise,DBSCAN)與數(shù)學形態(tài)學的巖屑顆粒分割方法,。該方法首先利用顆粒中心代表本身來簡化模型,,然后利用DBSCAN算法對目標中心進行聚類,標記出不同的顆粒目標,;最后再結(jié)合改進的數(shù)學形態(tài)學方法,,近似地得到顆粒邊界。實驗結(jié)果表明,,本文方法對顆粒的分割和邊界提取有較好的效果,,為顆粒邊界的刻畫提供了一種有效的途徑。
1問題描述與分析
圖1是一幅巖石薄片樣本的單偏光圖像,,其中既包含碎屑顆粒,,又包含巖屑顆粒。對顆粒進行分割的目的就是確定其邊界,,但是僅通過這一張單片光圖片是很難對兩種顆粒進行分割的,。
碎屑顆粒目標成分單一,在正交偏光下成像簡單,,通常為一整個顆粒,,邊界比較容易確定,利用礦物在正交偏光下的這一消光特性[2],,目前已有學者提出了一些分割算法[3],,在工程應(yīng)用中取得了較好的效果;而對于巖屑顆粒而言,,在正交偏光下成像復雜,,通常呈現(xiàn)若干聚集的點狀,邊界模糊難以確定,,常用的顆粒分割方法沒有明顯的效果。針對巖屑顆粒的光學特性和成像的特點,,考慮利用聚類的方法來進行分割,,再結(jié)合數(shù)學形態(tài)學做后期處理,就可以擬合出目標邊界,。
1.1聚類算法分類
目前的聚類算法大致可以分為以下4種:(1)基于分割的算法,,如k均值[4]、k中心等,。這類算法是將數(shù)據(jù)集分成若干的子集,。特點是需要設(shè)定簇的數(shù)量,根據(jù)對象間的相似程度將每個對象劃歸最近的簇,。(2)層次聚類算法,。層次聚類是把數(shù)據(jù)按層次進行分解,最終的結(jié)果形成了一顆類別樹,每個子集是樹的節(jié)點,。算法有最近鄰,、最遠鄰和CURE等。(3)基于模型的算法,。這類算法基于統(tǒng)計理論,,假定給定的數(shù)據(jù)集是按照一個確定的模型產(chǎn)生的,找出數(shù)據(jù)集的最佳擬合模型,。如期望最大化(EM)[5]算法,。(4)基于密度的算法。主要思路是在數(shù)據(jù)集中,,根據(jù)密度的高低,,分隔出低密度區(qū)域,尋找到高密度區(qū)域,,并將每個獨立的高密度區(qū)域作為一個簇,。比較典型的算法有DBSCAN[6] 、OPTICS[7]等,。
1.2基于密度的聚類算法特點
基于密度的聚類方法,,是根據(jù)數(shù)據(jù)集在空間分布上的密集程度來進行聚類,不需要人為設(shè)定簇的數(shù)量,,非常適用于數(shù)據(jù)集的簇數(shù)量未知的場合,。本文所使用的DBSCAN算法是一種經(jīng)典的基于密度聚類算法,它以單位超球狀區(qū)域內(nèi)所包含數(shù)據(jù)對象的數(shù)量作為依據(jù),,來衡量此區(qū)域密度的高低[8],,它的特點是可以自動確定簇的數(shù)量,能夠在帶有噪聲的數(shù)據(jù)空間中發(fā)現(xiàn)任意形狀的簇,,并且可以標記出離群點,。
2基于DBSCAN算法與數(shù)學形態(tài)學的分割方法
2.1DBSCAN算法基本理論
DBSCAN算法最早由ESTER M[6]等人提出,是一種經(jīng)典的基于密度聚類算法,,已經(jīng)在交通監(jiān)控[9],、數(shù)據(jù)挖掘等方面有著廣泛的應(yīng)用。DBSCAN算法的主要定義[6,,8]如下:
定義1(Eps鄰域):給定一個數(shù)據(jù)對象p,,p的Eps鄰域NEps定義為以p為核心,以Eps為半徑的d維超球體區(qū)域,,即:
NEps(p)={q∈D|dist(p,q)≤Eps}
定義2(核心點與邊界點):對于某個數(shù)據(jù)對象p∈D,,給定一個整數(shù)minPts,若p的Eps鄰域內(nèi)對象的數(shù)量滿足|NEps(p)|≥minPts條件,,則稱p為(Eps,minPts)條件下的核心點,;若p不滿足此條件,,則它不是核心點,又若p落在某個核心點的Eps鄰域內(nèi),,則稱它為邊界點,。
定義3(直接密度可達):給定(Eps,minPts),如果對象p和q滿足以下兩個條件:p∈NEps(q);|NEps(q)|≥minPts,(即q是核心點),,則稱對象p是從對象q出發(fā),,直接密度可達的。
定義4(直接密度可達):給定一個數(shù)據(jù)集D,,當存在一個對象鏈p1,p2,p3,...,pn,,其中p1=q,pn=p對于pi∈D,如果在條件(Eps,minPts)下pi+1從pi直接密度可達,,則稱對象p從對象q在條件(Eps,minPts)下密度可達,。
定義5(密度相連):如果數(shù)據(jù)集D中存在一個對象o,使得對象p和q是從o在(Eps,minPts)條件下密度可達的,,那么就稱對象p和q密度相連,,密度相連是對稱的。
定義6(簇和噪聲):由任意一個核心點對象開始,,從該對象密度可達的所有對象構(gòu)成一個簇,。不屬于任何簇的對象為噪聲。
在巖石薄片圖像中,,巖屑顆粒目標就是呈現(xiàn)的聚集的點狀,。而噪聲分布是雜亂無章的,聚集程度較低,,與巖屑顆粒目標的分布有著差別,。在工程中,無法獲得顆粒數(shù)量等先驗知識,,而DBSCAN算法在目標簇的數(shù)量未知的情況下,,可以尋找到任意形狀的簇。因此,,DBSCAN算法很適合這種場景下的應(yīng)用,。
2.2巖屑顆粒分割及邊界提取步驟
實際中本文得到的是一幅復雜多樣的圖片,首先要進行面積預處理,,然后為了簡化模型,利用目標中心來代表本身,,進一步需要聚類,、去噪、數(shù)學形態(tài)學處理等過程,,最終才能得到分割的結(jié)果,。
在本文中,,分割的結(jié)果是多值的,傳統(tǒng)二值圖像的形態(tài)學處理是不適用的,,需要做一些改進,,如對目標進行膨脹,邊界的顏色需要與當前處理的目標顏色一致,。
在實際中,,巖石薄片圖像里既有大面積的碎屑顆粒目標,也有小面積,、呈現(xiàn)出聚集點狀的巖屑顆粒目標,,如圖2所示。提取巖屑顆粒目標需要以下幾個步驟:
?。?)利用兩種顆粒面積大小不同的特點,,通過設(shè)定面積閾值,提取出巖屑顆粒目標,,對其進行單獨處理;
?。?)標記出每個連通區(qū)域,并求出其中心坐標;
?。?)運用DBSCAN算法對各區(qū)域進行聚類,,標記出不同的巖屑顆粒和噪聲點;
(4)去除噪聲點并進行膨脹,、填孔等數(shù)學形態(tài)學的處理,,得到巖屑顆粒的邊界。
3實驗結(jié)果與分析
對于實際中的一幅圖片,,如圖2所示,,先進行面積的預處理,去除大面積的碎屑顆粒目標,,便得到了含有噪聲的巖屑顆粒目標,,如圖3所示。首先標記出每個連通區(qū)域并求得其中心坐標,;其次運用DBSCAN算法對顆粒中心進行聚類,,提取出巖屑顆粒目標,并標識出噪聲點,,其中灰色的為巖屑顆粒目標,,純白色的為噪聲點,結(jié)果如圖4所示,。去除噪聲并對巖屑顆粒進行膨脹,,得到的結(jié)果如圖5所示。對膨脹結(jié)果進行填孔,、腐蝕處理得到最終的結(jié)果,,如圖6所示,。
對比圖3和圖4可以看出,,DBSCAN算法可以有效地去除噪聲點,,能夠提取出巖屑顆粒,具有較好的抗噪性能,。得到了巖屑顆粒目標后,,由于它們是呈散點狀的,還需要通過膨脹和后期的填孔處理,。從圖5可以看出,,膨脹后在顆粒邊界周圍,存在著一些小面積目標,,這些目標是孤立的,,并不影響顆粒的總體輪廓,所以可以去除它們,。從總體上看,,經(jīng)過多次膨脹,目標面積增大了,,需要進行適當?shù)母g或開操作的處理,,
4結(jié)論
基于DBSCAN算法和數(shù)學形態(tài)學的巖石薄片圖像分割方法,首先經(jīng)過面積預處理,,去除碎屑顆粒目標,,保留巖屑顆粒目標;然后利用DBSCAN算法對含有噪聲的巖屑顆粒中心坐標進行聚類,,從而去除大部分的噪聲點,;再對結(jié)果進行改進的膨脹、填孔,、腐蝕等形態(tài)學處理,,最終得到分割結(jié)果和顆粒目標的邊界。
實驗結(jié)果表明,,本文方法對巖屑顆粒的分割與邊界提取有一定的效果,,為顆粒目標提取和粒度分析提供了一種途徑。但該方法也存在著一些不足,,如經(jīng)過數(shù)學形態(tài)學處理的結(jié)果邊緣不夠平滑,;DBSCAN算法需要人為設(shè)定經(jīng)驗性的參數(shù),目前還不能很好地自適應(yīng),。如何根據(jù)實際中復雜多樣的情況做出相應(yīng)的改進,,將是需要進一步解決的問題。
參考文獻
[1] ACHANTA R, SHAJI A, SMITH K, et al. SLIC superpixels compared to stateoftheart superpixel methods[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274 2282.
?。?] 常麗華,陳曼云,,金巍,,等. 透明礦物薄片鑒定手冊[M]. 北京:地質(zhì)出版社, 2006.
[3] 吳擁, 蘇桂芬, 滕奇志, 等. 巖石薄片正交偏光圖像的顆粒分割方法[J]. 科學技術(shù)與工程, 2013,,13(31): 92019206.
?。?] MACQUEEN J. Some methods for classification and analysis of multivariate observations[C].Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1967, 1(14): 281297.
?。?] MOON T K. The expectationmaximization algorithm[J]. Signal Processing Magazine, IEEE, 1996, 13(6): 47 60.
?。?] ESTER M, KRIEGEL H P, SANDER J, et al. A densitybased algorithm for discovering clusters in large spatial databases with noise[C]. Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD′96).AAAI Press,1996: 226231.
[7] ANKERST M, BREUNIG M M, KRIEGEL H P, et al. OPTICS: ordering points to identify the clustering structure[C]. In: Proceedings of the 1999 ACM SIGMOD International Conference on Management of Data, SIGMOD 1999:4960.
?。?] 夏魯寧, 荊繼武. SADBSCAN: 一種自適應(yīng)基于密度聚類算法[J]. 中國科學院研究生院學報, 2009, 26(4): 530 538.
?。?] 劉衛(wèi)寧,曾嬋娟,孫棣華. 基于DBSCAN算法的營運車輛超速點聚類分析[J]. 計算機工程,2009,35(5):268 270.