文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.12.013
中文引用格式: 楊茹,秦振濤,,楊武年. 基于字典學習的古建筑圖像修復研究[J].電子技術應用,,2016,42(12):51-53,,57.
英文引用格式: Yang Ru,,Qin Zhentao,,Yang Wunian. Study on inpainting of drawings of ancient buildings based on dictionary learning[J].Application of Electronic Technique,,2016,42(12):51-53,,57.
0 引言
古代建筑圖紙能夠反映古人對建筑獨特的認識與理解,,不僅具有極高的歷史價值,、文化價值和科學價值,同時也是現(xiàn)代仿古建筑,、園林景觀和旅游景區(qū)的重要借鑒[1],。建筑圖紙的質地、圖形,、字體及涂料具有多樣性,,需要特別的保護。當前,,在實際的工作環(huán)境中,,大部分建筑圖紙以卷宗的形式進行保存,,隨著時間的變遷,建筑圖紙的缺損非常嚴重,,且在掃描,、微縮處理中,圖紙的像素丟失嚴重,。對建筑圖紙進行修復,、評估及再利用,一直作為建筑學科及計算機圖像處理等領域的研究熱點而受到關注[2],。僛文峰等人指出圖紙的破損主要是由于圖紙質地的酸性化而變黃,、發(fā)干, 以及隨之而來的粉碎和撕毀情況比較嚴重;由于時間久遠,,圖紙質地及顏料也會出現(xiàn)不同程度的缺損,、黃色斑點等破損;在對古建筑圖紙進行信息化加工的過程中也會造成像素的丟失,,出現(xiàn)黑色斑點等,。本文針對掃描及微縮以后的古建筑圖像提出一種新的基于字典學習的修復方法,該算法在稀疏域針對污損圖像的特迭代處理,,從而達到古建筑圖紙修復的目的,。通過實驗表明,該算法能較好地修復古建筑圖像,,降低了圖像的均方誤差,,在實際應用中具有良好的前景。
1 古建筑圖像修復模型
1.1 基于稀疏表示的古建筑圖像處理模型
在圖像處理領域[3],,任一理想的古建筑圖像可以表示為y0∈RN,,稀疏表示的目標是找到一個稀疏表示向量x0,且x0的0范數(shù)||x0||0=k0,,滿足:y0=Ax0,。A為字典,B為圖像退化算子,,表示圖像丟失掉的p個采樣,,則:y=By0。B表示單位矩陣(大小為:n×n)根據丟失掉的(缺損)采樣去除p行后的矩陣,,其大小為(n-p)×n,,則古建筑圖像修復問題就轉化為求其稀疏表示向量進而獲得未降質圖像
則可以建模為式(1)[4]:
1.2 對模型的求解
該問題中由于原始古建筑圖像y0未知,且古建筑圖像一般較大,,存在多種類型的缺損,,因此需要對大的圖像進行分塊。根據給定的字典A,,將大的圖像分割成一些小的塊后,,每個塊都有其稀疏表示系數(shù),,降質操作B為一矩陣,根據Elad等人的原理,,該問題屬于M-稀疏域模型,,則可以轉化如下最大后驗概率問題[5]:
下一部分獲得該模型中字典A的求解,通過式(5)能夠獲得輸出圖像,,對丟失掉的像素,,通過塊中已知像素進行平均獲得。
2 字典學習算法
字典學習過程一般分為2個階段,,分別是稀疏編碼及字典更新,。在對式(5)求解時,一般假設字典A∈Rn×k(k>n)為已知,,如DCT,、DWT和FFT等。為了進一步提高修復古建筑圖像的修復能力,,本文分別通過MOD算法和K-SVD算法進行字典學習,,在字典學習過程中需考慮缺損像素,。因此,,一旦獲得字典,就可以完成稀疏編碼,,然后固定系數(shù),,再更新字典,從而轉化為求式(6)錯誤的最小值:
2.1 MOD字典學習算法
MOD算法(Method of Optimal Direction)也稱為最優(yōu)方向法[6],,該算法由K.Engan等人在1999年提出,通過對錯誤求導,,然后令其為0,則可得:
2.2 改進的K-SVD字典學習算法
本文根據缺損的古建筑圖像進行K-SVD字典學習,,利用K-SVD算法[7]每次更新字典A的一列,,對字典的第j列aj,根據式(6),,僅有第k塊用到了這個原子,,將其表示為域Pk,則可將式(6)進行如下轉化:
將圖像塊合并后輸出即可獲得最終修復圖像,,經過字典學習后獲得的MOD字典及K-SVD字典如圖1和圖2所示,。由圖可見,K-SVD字典包含了缺損圖像形變區(qū)的原子,,表明K-SVD字典能夠根據圖像的特點進行自適應調整,,從而保留更多的細節(jié)和邊緣信息,更加有利于后續(xù)的處理,。
2.3 算法分析
該算法的計算復雜度可以分為兩部分:稀疏編碼,、字典更新(迭代J次)與最終的輸出過程構成,。古建筑圖像中的每個像素點的計算復雜度為:O(K×L×J),其中,,K為字典的列向量的個數(shù),,L為每個系數(shù)的非零元素的個數(shù),一般取決于古建筑圖像的噪聲的方差和缺損像素的個數(shù),。
3 模擬實驗
對本文提出算法的性能進行測試,,實驗用古建筑圖像稱為重檐四角亭,來源于成都理工大學,;圖像的大小為256×256,。實驗所使用的PC是CPU 3.0 GHz,內存為2 GB,,算法用GNUOctave進行實現(xiàn),。圖3分別為加噪20 dB后,損失50%像素后的原始古建筑圖像,,以及采用MOD字典學習算法的修復結果和采用K-SVD字典學習算法的修復結果圖,。設置字典原子的個數(shù)為256,圖像塊大小為8×8,。圖4為隨著迭代次數(shù)的增加,,MOD字典學習算法和K-SVD字典學習算法的修復效果對比圖。表1為采用MOD字典學習算法和K-SVD字典學習算法迭代15次后所獲得的RMSE(均方根誤差),。由圖3可見,,采用K-SVD算法修復的效果明顯優(yōu)于采用MOD算法修復的效果,尤其是右上角塔頂處的局部放大圖所示,。
本實驗中運用K-SVD字典學習算法實現(xiàn)了對古建筑圖像的修復,,由圖4可見,K-SVD字典學習算法的修復效果優(yōu)于MOD字典學習算法,,且 K-SVD算法的魯棒性更強,。
4 結論
本文通過對缺損古建筑圖像問題進行建模,然后利用字典學習算法實現(xiàn)對缺損圖像的修復,。通過對重檐四角亭古建筑圖像進行修復試驗,,表明K-SVD字典學習算法具有更優(yōu)的效果。本文利用機器學習及圖像處理技術對解決古建筑圖紙,、古文獻修復等問題提出了新的思路,,對該算法的優(yōu)化和應用的拓展是下一步研究的重點。
參考文獻
[1] 王茹.古建筑數(shù)字化及三維建模關鍵技術研究[D].西安:西北大學,,2010.
[2] 李四明.工程圖紙輸入與自動識別系統(tǒng)的研究[D].北京:中國農業(yè)大學,,2000.
[3] N Metaxas D,AXEL L.Recent novel methods and approaches in sparsity-based compressive sensing and sparse learning have shown promising results. Introduction[J].Med Image Anal,2014,,18(6):819.
[4] ELDAR Y C.Compressed sensing:theory and applications[M].Cambridge University Press,,2012:556.
[5] ELAD M,AHARON M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transactions Image Process,,2006,,15(12):3736-3745.
[6] OLSHAUSEN B A,F(xiàn)IELD D J.Sparse coding with an overcomplete basis set: a strategy employed by V1[J].Vision Research,,1997,,37(23):3311-3325.
[7] RUBINSTEIN R,PELEG T,,ELAD M.Analysis K-SVD:a dictionary-learning algorithm for the analysis sparse model[J].IEEE Transactions on Signal Processing,,2013,61(3):661-677.