文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.181513
中文引用格式: 黃欣,,李倩玉,,駱亦其,等. 一種基于敏感性分析的改進(jìn)參數(shù)篩選方法[J].電子技術(shù)應(yīng)用,,2018,,44(12):106-110.
英文引用格式: Huang Xin,Li Qianyu,,Luo Yiqi,,et al. An effective parameter screening method based on sensitivity analysis[J]. Application of Electronic Technique,,2018,44(12):106-110.
0 引言
氣候變化對(duì)人類的生產(chǎn)生活,、政治經(jīng)濟(jì)、科技等方面影響巨大,。地球系統(tǒng)模式(Earth System Models,,ESMs)是基于動(dòng)力、物理,、化學(xué)、生物過(guò)程及其相互間的能量物質(zhì)交換構(gòu)建的一系列數(shù)學(xué)物理模型,,是預(yù)測(cè)未來(lái)氣候變化的重要工具[1],。模式中含有大量取值不確定的參數(shù),會(huì)極大影響地球系統(tǒng)模式的模擬性能[2],。然而隨著模式發(fā)展,,不確定參數(shù)越來(lái)越多[3],這導(dǎo)致參數(shù)不確定性分析難以實(shí)施,。其原因一方面是參數(shù)空間隨著參數(shù)數(shù)量增加呈指數(shù)增長(zhǎng),,計(jì)算成本不可接受;另一方面是由于地球系統(tǒng)模式強(qiáng)非線性,,參數(shù)間存在復(fù)雜的交互關(guān)系,。因此,,通過(guò)篩選重要參數(shù)來(lái)減少待研究參數(shù)個(gè)數(shù)是參數(shù)不確定性分析的重要步驟,是提高地球系統(tǒng)模式模擬性能的關(guān)鍵,。
參數(shù)敏感性分析方法(Sensitivity Analysis,,SA)是一類傳統(tǒng)的參數(shù)篩選方法[4]。其中基于方差分解的Sobol′方法應(yīng)用普遍,,許多研究表示它是一個(gè)里程碑,,能提供最準(zhǔn)確和魯棒的結(jié)論[5-6]。然而傳統(tǒng)SA并沒(méi)有考慮隨著不敏感參數(shù)的剔除,,參數(shù)敏感性信息不斷改變[7],,這有可能導(dǎo)致參數(shù)篩選結(jié)論不可靠。
本文首先驗(yàn)證了這種篩選偏差的存在,,其次提出了動(dòng)態(tài)敏感性分析方法(Dynamic Sensitivity Analysis Method,,DSAM)。它利用全連接的超圖結(jié)構(gòu)存儲(chǔ)參數(shù)的敏感性信息,,將參數(shù)篩選問(wèn)題轉(zhuǎn)換為最密子圖的識(shí)別問(wèn)題,。最后將DSAM應(yīng)用于兩個(gè)模型:一般非線性數(shù)學(xué)函數(shù)、單柱大氣模式,。通過(guò)對(duì)比,,驗(yàn)證了DSAM比傳統(tǒng)Sobol′方法能更有效地識(shí)別重要參數(shù)。
1 傳統(tǒng)敏感性方法的參數(shù)篩選問(wèn)題
本文利用Ishigami函數(shù)進(jìn)行兩次敏感性分析,,結(jié)果如圖1所示,。第一次擾動(dòng)全參數(shù)集,它的結(jié)果是傳統(tǒng)Sobol′的篩選結(jié)果,。第二次固定不敏感參數(shù)x3不變,,只對(duì)剩余參數(shù)子集進(jìn)行擾動(dòng),使有關(guān)x3的交互敏感性消失,,最敏感的參數(shù)會(huì)變?yōu)閤2,。這說(shuō)明參數(shù)篩選過(guò)程中非敏感參數(shù)的剔除會(huì)通過(guò)交互作用動(dòng)態(tài)影響到其他參數(shù)的敏感性。
2 動(dòng)態(tài)敏感性分析方法
2.1 敏感性超圖構(gòu)建
敏感性超圖是一個(gè)全連接,、權(quán)重全為正實(shí)數(shù)且含超邊的圖,。超邊代表連接兩個(gè)以上節(jié)點(diǎn)的邊。節(jié)點(diǎn)代表參數(shù),,點(diǎn)權(quán)代表主敏感性,,邊權(quán)代表交互敏感性,超邊權(quán)代表二階以上的高階交互敏感性,。實(shí)際高于二階的交互敏感性太小可以忽略[9],,因此本文只計(jì)算二階交互敏感性。
基于方差分解(如式(2)所示)可計(jì)算傳統(tǒng)Sobol′方法的三類敏感性和參數(shù)組合的組合敏感性(如式(6)所示),。顯然全參數(shù)的組合效應(yīng)接近1,。
2.2 最密k階子圖搜索
給定子圖中節(jié)點(diǎn)數(shù)量k,,最密k階子圖就是其中權(quán)重最大的子圖。本文基于深度優(yōu)先搜索算法(Depth-First-Search,,DFS)遞增式搜索最密子圖,,即k從1遞增到n-1過(guò)程中,對(duì)每個(gè)k值進(jìn)行一次k階最密子圖的搜索,。遞增式搜索的停止條件是當(dāng)前k階最密子圖的權(quán)重接近原始圖的總權(quán)重,,如80%。由于敏感性超圖的總權(quán)重為1,,因此停止標(biāo)準(zhǔn)可設(shè)置為0.8,。
3 實(shí)驗(yàn)設(shè)計(jì)與分析
3.1 實(shí)驗(yàn)?zāi)P?/strong>
3.1.1 數(shù)學(xué)函數(shù)
Moon10hd是一個(gè)含有20個(gè)參數(shù)的高維非線性函數(shù)[10],如式(7)所示,。它含有線性項(xiàng),、二次指數(shù)項(xiàng)和二階交互項(xiàng),其中θ(xi)中含有大量的小系數(shù)項(xiàng),。本文利用Moon10hd的100 000個(gè)樣本進(jìn)行分析,。
3.1.2 單柱大氣模式
單柱大氣模型(Single-column Community Atmosphere Model,SCAM)用于模擬一個(gè)網(wǎng)格點(diǎn)的大氣物理過(guò)程[11],。本實(shí)驗(yàn)限制網(wǎng)格點(diǎn)在澳大利亞北部,,模擬時(shí)間是從2006年1月18日至2月13日。觀測(cè)資料來(lái)源于該地區(qū)6個(gè)無(wú)線電探空站每3小時(shí)收集到的觀測(cè)數(shù)據(jù),。參數(shù)和輸出變量見(jiàn)表1,、表2。模式結(jié)果如式(8)所示,,代表N個(gè)輸出變量與觀測(cè)的平均偏差,。本文利用了SCAM模擬的10 000次樣本。
3.2 參數(shù)篩選結(jié)果評(píng)估方法
本文利用傳統(tǒng)Sobol′與DSAM的篩選結(jié)果進(jìn)行對(duì)比,。變量wDiff(Weighted Difference)用于量化評(píng)估參數(shù)篩選結(jié)果的差異,。當(dāng)差異小于0.01 時(shí)可視為敏感性指標(biāo)不變,所以當(dāng)wDiff低于1% 時(shí),,可認(rèn)為兩個(gè)篩選結(jié)果近似相同,。
參數(shù)篩選要為后續(xù)參數(shù)不確定性分析(如參數(shù)取值優(yōu)化)提供待研究參數(shù)。當(dāng)固定待優(yōu)化參數(shù)的數(shù)量時(shí),,對(duì)更敏感參數(shù)調(diào)優(yōu)更有可能達(dá)到更佳的優(yōu)化效果。協(xié)方差矩陣適應(yīng)演化策略(CMA-ES)是一類經(jīng)典的優(yōu)化方法,。本文分別將Sobol′和DSAM的篩選結(jié)果應(yīng)用于CMA-ES調(diào)優(yōu),,若優(yōu)化后模式結(jié)果越低,篩選結(jié)果越有效,。
4 實(shí)驗(yàn)結(jié)果
圖2(a)和圖3(a)顯示了傳統(tǒng)Sobol′方法對(duì)Moon10hd函數(shù),、SCAM模式的參數(shù)敏感性結(jié)論,,總敏感性最高的參數(shù)被篩選出來(lái)。圖2(b)和圖3(b)展示了DSAM的動(dòng)態(tài)篩選結(jié)果,。每列代表一個(gè)參數(shù),,從左到右按Sobol′的結(jié)果遞減地排序,實(shí)心表示參數(shù)被篩選出來(lái),,篩選出的敏感參數(shù)個(gè)數(shù)隨行號(hào)遞增,。最后一列是傳統(tǒng)Sobol′方法和DSAM篩選結(jié)果的量化差異(即式(9))。
即使兩個(gè)篩選結(jié)果的組成成員大部分相似,,加權(quán)差異也可能很大,。對(duì)于Moon10hd的最敏感的兩個(gè)參數(shù)(如圖2(b)所示),Sobol′和DSAM的篩選結(jié)果的量化差異高達(dá)29%,,而對(duì)于前3位敏感參數(shù),,篩選差異也超過(guò)10%。
Sobol′和DSAM的篩選結(jié)論的不一致有助于發(fā)現(xiàn)潛在的關(guān)鍵過(guò)程,。文獻(xiàn)[12]認(rèn)為x12是Moon10hd函數(shù)中的關(guān)鍵參數(shù),,而它甚至沒(méi)有出現(xiàn)在前3的敏感參數(shù)中。對(duì)于SCAM模型,,Sobol′剔除掉的不敏感參數(shù)x13和x15被DSAM識(shí)別為敏感,。從物理意義上分析,x13(聚合冰收集率)影響冰的反射率,,進(jìn)而影響關(guān)鍵的輻射過(guò)程,。x15(濕夾卷加強(qiáng)參數(shù))影響底部湍流,而x19(上升穿透夾卷率)代表更高層的濕氣夾卷,,較低位置的湍流過(guò)程更為重要,。
圖4、圖5分別顯示了對(duì)DSAM和Sobol′的篩選結(jié)果進(jìn)行優(yōu)化后的模型結(jié)果,,其中每個(gè)都分別選擇了大量參數(shù)集合和少量參數(shù)集合,。首先,當(dāng)優(yōu)化更多參數(shù)時(shí),,模式結(jié)果的優(yōu)化程度更好,,而調(diào)優(yōu)過(guò)程越不容易收斂。其次,,相比Sobol′,,DSAM的篩選結(jié)果能使結(jié)果收斂到更優(yōu)解,即相對(duì)于觀測(cè)的偏差更小,。由圖4可知,,DSAM識(shí)別到的Top2敏感參數(shù)的調(diào)優(yōu)效果比Sobol′的結(jié)果提升了38.5%,而所需迭代次數(shù)減少了26.6%,。同樣,,對(duì)于Top5重要參數(shù),,優(yōu)化效果提升了12.5%,迭代次數(shù)減少了36.1%,。
盡管只有少量參數(shù)不同,,但參數(shù)調(diào)優(yōu)中優(yōu)化效果差別卻可能很大。在圖5(b)中,,14個(gè)參數(shù)中只有2個(gè)發(fā)生了替換,,即x4和x19替換為x13和x15,但調(diào)優(yōu)效果提升了65.2%,。
因此,,無(wú)論從量化比較還是基于參數(shù)調(diào)優(yōu)應(yīng)用的評(píng)估,都證明了DSAM比傳統(tǒng)Sobol′更為有效,。
5 結(jié)論
本文基于一個(gè)經(jīng)典數(shù)值函數(shù)說(shuō)明了參數(shù)交互作用對(duì)參數(shù)篩選過(guò)程的影響,,提出了一個(gè)基于動(dòng)態(tài)敏感性的篩選算法(DSAM),并在兩個(gè)測(cè)試案例中,,分析對(duì)比了DSAM和傳統(tǒng)篩選方法的效果,。通過(guò)實(shí)驗(yàn)和分析,可得到如下結(jié)論:
(1)參數(shù)交互作用在模式參數(shù)篩選過(guò)程中動(dòng)態(tài)變化,,對(duì)篩選結(jié)果有很重要的影響作用,。參數(shù)篩選實(shí)際是一個(gè)組合優(yōu)化問(wèn)題。
(2)DSAM算法利用圖結(jié)構(gòu)來(lái)存儲(chǔ)參數(shù)敏感性信息,,將參數(shù)篩選問(wèn)題轉(zhuǎn)換為遞增式搜索最密子圖問(wèn)題,。由于保證了動(dòng)態(tài)性,從理論上DSAM更適合參數(shù)篩選應(yīng)用,。
(3)實(shí)驗(yàn)表示相比傳統(tǒng)方法,,DSAM的篩選結(jié)果量化差異可高達(dá)29%。這表明基于組合最優(yōu)和單一敏感性指標(biāo)的結(jié)論差異很大,。
(4)針對(duì)參數(shù)調(diào)優(yōu)應(yīng)用,,即使篩選結(jié)果的組成差異很小,帶來(lái)的調(diào)優(yōu)效果差異可高達(dá)67%,。
參考文獻(xiàn)
[1] 王斌,,周天軍,俞永強(qiáng),,等.地球系統(tǒng)模式發(fā)展展望[J].氣象學(xué)報(bào),,2008,66(6):857-869.
[2] HUANG M,,HOU Z,,LEUNG L R,et al.Uncertainty analysis of runoff simulations and parameter identifiability in the community land model:evidence from MOPEX basins[J].Journal of Hydrometeorology,2013,,14(6):1754-1772.
[3] GILMORE M S,STRAKA J M,,RASMUSSEN E N.Precipitation uncertainty due to variations in precipitation particle parameters within a simple microphysics scheme[J].Monthly Weather Review,,2004,132(11):2610-2627.
[4] SALTELLI A,,RATTO M,,TARANTOLA S,et al.Sensitivity analysis for chemical models[J].Chemical Reviews,,2005,,105(7):2811-2828.
[5] SONG X,ZHANG J,,ZHAN C,,et al.Global sensitivity analysis in hydrological modeling:review of concepts,methods,,theoretical framework,,and applications[J].Journal of Hydrology,2015,,523:739-757.
[6] LI J,,DUAN Q Y,GONG W,,et al.Assessing parameter importance of the common land model based on qualitative and quantitative sensitivity analysis[J].Hydrology and Earth System Sciences,,2013,17(8):3279.
[7] METZGER C,,NILSSON M B,,PEICHL M,et al.Parameter interactions and sensitivity analysis for modelling carbon heat and water fluxes in a natural peatland, using Coup-Model v5[J].Geoscientific Model Development,,2016,,9(12):4313-4338.
[8] GAN Y,DUAN Q,,GONG W,,et al.A comprehensive evaluation of various sensitivity analysis methods:a case study with a hydrological model[J].Environmental Modelling and Software,2014,,51:269-285.
[9] SAFTA C,,RICCIUTO D,SARGSYAN K,,et al.Global sensitivity analysis,,probabilistic calibration,and predictive assessment for the data assimilation linked ecosystem carbon model[J].Geoscientific Model Development Discussions,2015,,8(7):6893-6948.
[10] MOON H.Design and analysis of computer experiments for screening input variables[D].Columbus, Ohio: The Ohio State University,,2010.
[11] U K M,ARAKAWA A.Semiprognostic tests of the Arakawa-Schubert cumulus parameterization using simulated data[J].Journal of the atmospheric sciences,,1992,,49(24):2421-2436.
[12] ZHANG M H,LIN J L.Constrained variational analysis of sounding data based on column-integrated budgets of mass,,heat,,moisture,and momentum:approach and application to ARM measurements[J].Journal of the Atmospheric Sciences,,1997,,54(11):1503-1524.
資助項(xiàng)目:國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2016YFA0602103)
作者信息:
黃 欣1,李倩玉2,,駱亦其3,,薛 巍1,2
(1.清華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)系,,北京100084,;2.清華大學(xué) 地球系統(tǒng)科學(xué)系,北京100084,;
3.北亞利桑那大學(xué) 生態(tài)系統(tǒng)科學(xué)與社會(huì)中心,,美國(guó) 弗拉格斯塔夫 86011)