摘 要: 基于多片" title="多片">多片TS101S的并行處理" title="并行處理">并行處理自適應(yīng)波束形成" title="自適應(yīng)波束形成">自適應(yīng)波束形成系統(tǒng),給出了系統(tǒng)的算法,、結(jié)構(gòu)及實驗結(jié)果,。
關(guān)鍵詞: TS101S 自適應(yīng)波束形成 IQRD-SMI 多處理器系統(tǒng)
自適應(yīng)波束形成是利用現(xiàn)時的輸入信號和干擾矢量采用自適應(yīng)算法進行處理,以達到通過有用信號或需要方向的信號且抑制干擾的目的,。由于其可以在惡劣的敵方干擾和電磁兼容環(huán)境中提高雷達,、通信等系統(tǒng)的抗干擾能力,所以被廣泛應(yīng)用于雷達,、聲納和通信等多種軍事應(yīng)用和國民經(jīng)濟領(lǐng)域,。當(dāng)前,自適應(yīng)波束形成通常采用數(shù)字方式在基帶實現(xiàn),,即自適應(yīng)數(shù)字波束形成(ADBF),。ADBF與自適應(yīng)波束形成可視為同一技術(shù),。
ADBF技術(shù)要完成相當(dāng)復(fù)雜的運算。為了實時實現(xiàn)該技術(shù),,一方面要從算法本身提高ADBF系統(tǒng)的處理性能,,另一方面需研制處理器結(jié)構(gòu)(特別是以Systolic和Wavefront為代表的高速并行處理機),以滿足高速,、實時的需要,。目前,隨著高性能通用DSP的迅猛發(fā)展并結(jié)合并行性能優(yōu)越的Systolic陣,,采用通用DSP實現(xiàn)自適應(yīng)波束形成已成為一種趨勢,。
本文描述了一種基于多片TS101S的并行處理自適應(yīng)波束形成系統(tǒng),討論了系統(tǒng)的算法,、結(jié)構(gòu),,給出了實驗結(jié)果。
1 IQRD-SMI自適應(yīng)波束形成算法
1.1 算法原理
自適應(yīng)陣處理系統(tǒng)" title="處理系統(tǒng)">處理系統(tǒng)(M陣元的均勻線陣),,結(jié)構(gòu)如圖1所示,。其中中虛線框內(nèi)為自適應(yīng)波束形成系統(tǒng),,也是本文研究的部分,。設(shè)Xn為n次采樣得到的n×M維輸入數(shù)據(jù)矩陣,即Xn=[xT(1),,xT(2),,L,xT(n)]T,。其中:xT(i)=[x1(i) x2(i) ∧ xM(i)],,i=1,2,,……∧ n,,表示在第i次快拍時各陣元上的數(shù)據(jù)。為了提高算法的并行性能,,采用數(shù)據(jù)域ADBF算法,,其典型代表是QR分解SMI(QRD-SMI)算法[1~3]。該算法避免了直接利用協(xié)方差矩陣Rxx求解線性方程,,而是將Rxx分解,,并利用Givens旋轉(zhuǎn)實現(xiàn)數(shù)據(jù)矩陣的QR分解,最終將自適應(yīng)權(quán)矢量w的求解問題轉(zhuǎn)化為如下三角線性方程組的求解問題,。
1.2 Systolic陣結(jié)構(gòu)
圖2為IQRD-SMI算法的Systolic陣結(jié)構(gòu)(以三陣元為例),,所有的并行處理系統(tǒng)可視為以處理器為節(jié)點的網(wǎng)絡(luò)。設(shè)計并行處理系統(tǒng)時必須考慮許多問題,,其中處理器系統(tǒng)的網(wǎng)絡(luò)拓撲結(jié)構(gòu)及節(jié)點處理器的選擇和設(shè)計最為重要,。良好的專用并行處理系統(tǒng)應(yīng)該具有模塊化,、流水處理、局域性等特點,。圖2所示結(jié)構(gòu)可以很好地滿足實時/并行處理的要求,。
該Systolic陣包含四種處理器單元。下三角矩陣B(即===)部分的bij單元儲存并更新====的各元素,;中間向量z(n)中各zi單元用以產(chǎn)生系統(tǒng)進行Givens旋轉(zhuǎn)更新所需的旋轉(zhuǎn)因子,;中間向量v中各vi單元完成對vi的儲存和更新;最后,,wi單元完成權(quán)向量的更新和輸出,。可以看到,,該算法及其Systolic陣避免了QR分解SMI算法需要的前后向回代過程,,整個Systolic陣系統(tǒng)能高效并行地完成權(quán)向量的更新和提取,可以滿足實際雷達自適應(yīng)波束形成系統(tǒng)對實時性的要求,。
為了減少處理器數(shù)目,,通常采用線性陣列結(jié)構(gòu),把實際算法所采用的非線性陣映射為線性陣,。本文所采用的映射方式如圖3所示,。此映射方式有以下優(yōu)點:處理器單元(PE)數(shù)大大減少;數(shù)據(jù)傳遞關(guān)系簡單,,數(shù)據(jù)均從第一個PE節(jié)點流入,,內(nèi)部PE節(jié)點與外界無輸入輸出關(guān)系,單向流動,,在最后一個PE節(jié)點以流水方式輸出,;每一個節(jié)點只與相鄰的節(jié)點有數(shù)據(jù)交換。該種映射方式能方便地安排輸入/輸出接口,、數(shù)據(jù)流和控制流,,也有利于系統(tǒng)的擴展和重構(gòu)。
2 多片TS101S實現(xiàn)方案
ADSP-TS101S是ADI公司于2001年底推出的新一代高性能數(shù)字信號處理器,,主頻300MHz,,片內(nèi)存儲器6Mbit。它是由ADSP-2106x/2116x系列發(fā)展起來的一款極高性能的靜態(tài)超標(biāo)量處理器,,專為大的信號處理任務(wù)和通信結(jié)構(gòu)進行了優(yōu)化,。TS101S靜態(tài)超標(biāo)量結(jié)構(gòu)使DSP每周期能夠執(zhí)行多達4條指令、24個16位定點運算和6個浮點運算,。其優(yōu)越的運算處理性能使得采用通用DSP實時地實現(xiàn)ADBF成為可能,。
筆者研制的含有4片TS101S的多處理器實驗系統(tǒng)如圖4。系統(tǒng)為鏈路口耦合流水線方式多處理器系統(tǒng),,因為TS101S鏈路口傳輸數(shù)據(jù)率與外部總線相當(dāng),,同時鏈路口耦合方式具有片間通信簡單,、能實現(xiàn)無縫連接、各DSP程序可以獨立設(shè)計,、PCB板設(shè)計容易等優(yōu)點,。片間數(shù)據(jù)傳送采用鏈路口鏈?zhǔn)紻MA方式,鏈?zhǔn)紻MA在完成一次DMA傳輸后,,能自動對DMA參數(shù)寄存器載入新值,,實現(xiàn)自動初始化(無需處理器核干預(yù)),開始下一次傳輸,。片間通信采用鏈?zhǔn)紻MA中斷方式,,中斷在整個鏈序列結(jié)束后產(chǎn)生。板上還接一32MB的SDRAM和4Mbit的Flash,,它們都掛接在各DSP的外部總線上,。四片DSP的JTAG口連在一起通過仿真器與計算機通信,ADBF模擬用的數(shù)據(jù),、系數(shù)因子及DSP程序利用仿真器(系統(tǒng)采用ADI公司的ADDS-HPPCI-ICE仿真器)通過JTAG口下載到各DSP上,。處理數(shù)據(jù)的流向依次為:DSPA→DSPB→DSPC→DSPD,最后在DSPD完成波束形成,,在任務(wù)分配上應(yīng)注意各DSP均勻分配,。軟件平臺使用VisualDSP++3.5。
并行處理機的基本性能取決于組成并行處理機的要素:處理單元,、并行處理機網(wǎng)絡(luò)結(jié)構(gòu),、并行算法程序和任務(wù)分配方法,。實驗方案對上述要素均有較好的把握,。
3 實驗結(jié)果
實驗?zāi)P蜑椋?陣元,均勻線陣(ULA),,陣元間距為λ/2,。為了測試算法和DSP實現(xiàn)系統(tǒng)方案的性能,按照采樣數(shù)滿足基本數(shù)2M(16次)的條件分析系統(tǒng)對單干擾和雙干擾的實驗性能,。當(dāng)采樣數(shù)增大時,,使得協(xié)方差矩陣的估計越充分,干擾抑制深度進一步加深,,并且旁瓣性能逐步改善,。為了改善波束旁瓣性能,均采用了對角加載" title="加載">加載技術(shù)(實驗過程未采用操縱矢量加窗),。本文做了大量的實驗,,實驗結(jié)果與計算機仿真一致。
圖5為單干擾源實驗結(jié)果,。自適應(yīng)陣的瞄準(zhǔn)方向為30°,,信號噪聲比(SNR)為20dB,;干擾噪聲比(INR)為40dB,到來角為0°,。30dB加載,。可以看到處理系統(tǒng)在干擾方向產(chǎn)生了相當(dāng)深的零點,,其零深約為-60dB,。
圖6為雙干擾源實驗結(jié)果。自適應(yīng)陣的瞄準(zhǔn)方向為20°,,信號噪聲比(SNR)為30dB,;干擾1:干擾噪聲比為80dB(強干擾),到來角為0°,;干擾2:干擾噪聲比為20dB(弱干擾),,到來角為-20°。60dB加載,??梢钥吹教幚硐到y(tǒng)在兩個干擾方向均產(chǎn)生了相當(dāng)深的零點,一個零深約為-70dB(對強干擾),,另一個約為-30dB(對弱干擾),。其中對弱干擾的抑制沒有強干擾的明顯,原因在于對角加載的影響,。理論證明:對角加載在改善波束旁瓣性能的同時,,對弱干擾的抑制有所降低,在加載時加載值應(yīng)合理選擇,。
對于雙干擾,,實際測得系統(tǒng)的響應(yīng)時間為10ms。這只是采用四片TS101S并行處理的結(jié)果,,如果采用更多片TS101S,,則響應(yīng)時間會更短。這對于大多數(shù)實際雷達干擾環(huán)境來說,,可以保證干擾抑制系統(tǒng)的實時性,。
為了實時地完成自適應(yīng)波束形成,必須采用并行性能優(yōu)越的自適應(yīng)波束形成算法和高性能的處理器及多處理器并行處理技術(shù),。本文給出了一種并行性能較好的數(shù)據(jù)域自適應(yīng)波束形成算法——MQRD-SMI算法,,研究了算法原理,并重點討論了其Systolic陣結(jié)構(gòu)及該算法基于多TS101S的并行實現(xiàn)方案,,獲得了較滿意的實驗結(jié)果,。采用更多片以及更高性能的DSP進行并行處理,可獲得更高的速度,本文的設(shè)計思路仍然適用,。
參考文獻
1 龔耀寰.自適應(yīng)濾波——時域自適應(yīng)濾波和智能天線.北京:電子工業(yè)出版社,,2003
2 Teitelbaum K.A.Flexible processor for a digital adaptive array radar.IEEE Trans Systems Magazine,May 1991,,AES:18~22
3 Rader C M.VLSI Systolic arrays for adaptive nulling.IEEE Singal Processing Magazine,,1996
4 Analog Devices Inc.ADSP-TS101 TigerSHARC Processor Hardware Reference.USA,2004
5 劉書明,,蘇 濤,,羅軍輝.TigerSHARC DSP 應(yīng)用系統(tǒng)設(shè)計.北京:電子工業(yè)出版社,2004