摘 要: 為了改善針對一般非線性離散時間系統(tǒng)的控制性能,引入“擬偽偏導數(shù)”概念,,給出了一般非線性離散時間系統(tǒng)沿迭代軸的非參數(shù)動態(tài)線性化形式,,并綜合BP神經(jīng)網(wǎng)絡(luò)以及模糊控制各自的優(yōu)點,提出了基于BP算法無模型自適應迭代學習控制方案。仿真結(jié)果表明,,該控制器對模型有較強的魯棒性和跟蹤性,。
關(guān)鍵詞: BP算法,;無模型自適應控制,;迭代學習;擬偽偏導數(shù)
針對設(shè)計部分依賴,、不完全依賴和不依賴受控系統(tǒng)數(shù)學模型的控制系統(tǒng),,國內(nèi)外控制理論界做了多年的努力,發(fā)展了許多理論和方法,。例如專家系統(tǒng),、模糊控制[1]、神經(jīng)網(wǎng)絡(luò),、多模型方法等,。最近無模型自適應控制理論得到了廣泛的應用,該控制器的設(shè)計和分析不需要已知系統(tǒng)的任何知識,,僅依賴于系統(tǒng)的輸入輸出數(shù)據(jù),,與模型結(jié)構(gòu)、系統(tǒng)階數(shù)均無關(guān),。
迭代學習控制(ILC)可利用以前操作的信息修正當前控制行為,提高控制性能,,可以實現(xiàn)有限時間區(qū)間上的完全跟蹤任務(wù),近十幾年來得到了廣泛的研究[2],。池榮虎將非參數(shù)自適應控制(NP-AC)的基本思想和分析手段引入到學習過程中,,提出了一種新的無模型自適應迭代學習控制方案(MF-AILC)[3,4],??紤]如下一般非線性離散時間SISO系統(tǒng):
這種控制方案只需系統(tǒng)的輸入輸出數(shù)據(jù),與系統(tǒng)的模型結(jié)構(gòu),、系統(tǒng)階數(shù)無關(guān),。
神經(jīng)網(wǎng)絡(luò)是借鑒于生物神經(jīng)網(wǎng)絡(luò)而發(fā)展起來的新型智能信息處理系統(tǒng),可作為一般的函數(shù)估計器,,有較強的自學習,、自組織與自適應性,能夠用數(shù)理方法從信息處理的角度對人腦神經(jīng)網(wǎng)絡(luò)進行抽象,,并建立某種簡化模型,。模糊邏輯則模仿人腦的邏輯思維機理,用于處理模型未知或不精確的控制問題,對非線性系統(tǒng)控制簡單,、有效,。二者各有所長,具有互補性,。模糊神經(jīng)網(wǎng)絡(luò)將神經(jīng)網(wǎng)絡(luò)與模糊邏輯[5]相結(jié)合,,這種結(jié)合給智能系統(tǒng)提供了一個新的研究方向[6],。
根據(jù)系統(tǒng)的運行狀態(tài),調(diào)整控制器的參數(shù)-擬偽偏導數(shù)θ(k,,t),,以達到某種性能指標的最優(yōu)化,使輸出層的輸出對應于擬偽偏導數(shù)θ(k,,t),,通過神經(jīng)網(wǎng)絡(luò)的自身學習、加權(quán)系數(shù)調(diào)整,,使其穩(wěn)定狀態(tài)對應于某種最優(yōu)控制律下的無模型自適應控制器的參數(shù),。引入模塊模糊量化法,系統(tǒng)的狀態(tài)變量進行歸檔模糊量化和歸一化處理,。利用模糊控制的魯棒性和非線性控制作用,,對神經(jīng)網(wǎng)絡(luò)NN的輸入進行預處理,避免了當神經(jīng)網(wǎng)絡(luò)用Sigmoid函數(shù)或雙曲正切函數(shù)時,,由于輸入過大易導致輸出趨于飽和使得對輸入不再敏感,。
2 算法實現(xiàn)
2.1 BP神經(jīng)網(wǎng)絡(luò)
三層BP神經(jīng)網(wǎng)絡(luò),有M個輸入節(jié)點,、Q個隱層節(jié)點,、一個輸出節(jié)點,輸出節(jié)點對應無模型自適應迭代學習控制器的逆為偏導數(shù)θ(k,,t),,輸出層和隱層的神經(jīng)元的激勵函數(shù)可取正負對稱的Sigmoid函數(shù)。
BP網(wǎng)絡(luò)的前向計算和加權(quán)系數(shù)修正迭代算法如下:
輸入節(jié)點對應經(jīng)模糊量化處理后的系統(tǒng)狀態(tài)變量:
本文將BP神經(jīng)網(wǎng)絡(luò),、模糊理論及無模型自適應迭代學習相結(jié)合,,構(gòu)造出了一種基于BP神經(jīng)網(wǎng)絡(luò)的模糊無模型自適應迭代學習控制器。該控制器綜合了三者的優(yōu)點,,利用有著較強的非線性逼近性的BP神經(jīng)網(wǎng)絡(luò)學習逆?zhèn)纹珜?shù),。文章提出的控制方案,不需要已知系統(tǒng)的任何先驗知識,,是一種無模型的方法,,而且迭代學習控制律的學習增益僅依賴于系統(tǒng)的輸入輸出數(shù)據(jù)設(shè)計,并可沿學習軸迭代地更新,。仿真結(jié)果表明了該控制方案的有效性,。
參考文獻
[1] 李友善.Fuzzy控制理論在甜菜制糖過程的應用[J].自動化學報,1994,20(3):334-337.
[2] LIN C J,LIN C T.An ART-based fuzzy adaptive learning control networks[J].IEEE Trans on Fuzzy Systems,1997,5(4):477-496.
[3] 池榮虎.非線性離散時間系統(tǒng)的自適應迭代學習控制及應用[D].北京:北京交通大學博士論文,,2006.
[4] CHI Rong Hu,HOU Zhong Sheng.A model-free adaptive control approach for freeway traffic density via ramp metering[J].IJICIC 2008,,4(11):2823-2832.
[5] 劉有才,劉增良.模糊邏輯與神經(jīng)網(wǎng)絡(luò)[M].北京:北京航空航天大學出版社,1996.
[6] ZHANG Jin, LI Heng Tong.Adaptive neural network control for a class of MIMO nonlinear systems with disturbances in discrete-time[J]. IEEE Trans on Fuzzy Systems,2004,34(4).
[7] 施陽.MATLAB語言精要及動態(tài)仿真工具SIMULINK[M]. 西安:西北工業(yè)大學出版社,1999.
[8] 聞新,周露,李翔,等.MATLAB神經(jīng)網(wǎng)絡(luò)仿真與應用[M]. 北京:北京科學出版社,2003.