文獻(xiàn)標(biāo)識(shí)號(hào): A
DOI:10.16157/j.issn.0258-7998.2017.01.013
中文引用格式: 宋立國(guó),,胡承秀,亓洪亮. 面向SAR雷達(dá)信號(hào)處理的異構(gòu)多核SoC研究[J].電子技術(shù)應(yīng)用,,2017,,43(1):50-52,56.
英文引用格式: Song Liguo,,Hu Chengxiu,,Qi Hongliang. Heterogeneous multi-core SoC architecture exploration of SAR radar digital system[J].Application of Electronic Technique,2017,,43(1):50-52,,56.
0 引言
合成孔徑雷達(dá)(SAR)作為一種全天時(shí),、全天候的有源主動(dòng)式微波成像系統(tǒng),以其優(yōu)越的二維高分辨率特性,在國(guó)防,、地質(zhì)、自然資源勘探與監(jiān)測(cè),、地形繪測(cè),、災(zāi)害估計(jì)等領(lǐng)域中已經(jīng)得到了日益廣泛的應(yīng)用。SAR的搭載平臺(tái)也從機(jī)載到星載,,向著更高的太空發(fā)展,。日本、加拿大,、美國(guó)以及俄羅斯都陸續(xù)展開(kāi)星載SAR成像技術(shù)的研究,。
星載SAR系統(tǒng)結(jié)構(gòu)如圖1所示。傳統(tǒng)的SAR 成像處理需要將原始回波數(shù)據(jù)記錄下傳至地面站進(jìn)行, 采用原始SAR數(shù)據(jù)壓縮算法,,即分塊自適應(yīng)量化(BAQ),,但SAR原始數(shù)據(jù)熵值很高,無(wú)損壓縮算法壓縮比太低,,這不僅要求雷達(dá)衛(wèi)星具有高帶寬的下行數(shù)據(jù)鏈路,而且還受到衛(wèi)星過(guò)頂時(shí)間的限制?,F(xiàn)在普遍希望在星上完成原始數(shù)據(jù)的處理,,只將處理結(jié)果下傳,但SAR系統(tǒng)龐大的數(shù)據(jù)量以及高實(shí)時(shí)性要求高性能信號(hào)處理器,。
TS201是ADI公司TigerSHARC系列處理器,,具有非常強(qiáng)的運(yùn)算能力,在雷達(dá)陣列信號(hào)處理中,,TS201應(yīng)用非常廣泛,。SAR處理系統(tǒng)中,普遍采用多顆TS201共同完成信號(hào)處理,,文獻(xiàn)[1]中機(jī)載SAR系統(tǒng)采用12顆TS201,,文獻(xiàn)[2]無(wú)人機(jī)SAR系統(tǒng)采用8顆TS201,文獻(xiàn)[3]星載SAR系統(tǒng)采用16顆TS201,。利用幾十片TS201搭建星載SAR雷達(dá)系統(tǒng),,無(wú)論從功耗、可靠性,、重量,、體積等方面都將很難滿(mǎn)足星上處理的要求。同時(shí),,在研制過(guò)程中,,由于系統(tǒng)采用多片DSP器件,系統(tǒng)過(guò)于復(fù)雜,,調(diào)試?yán)щy,。
1 異構(gòu)多核SoC
隨著處理器設(shè)計(jì)技術(shù)的進(jìn)步,單核SoC邁向多核SoC,,以提供更加強(qiáng)大的計(jì)算能力,,如csx600[4],Tile-Gx36[5],,QorIQT4080[6],。由于SAR雷達(dá)信號(hào)處理中計(jì)算密集型應(yīng)用的多樣性和復(fù)雜性,使得多核異構(gòu)成為面向這類(lèi)復(fù)雜應(yīng)用的片上系統(tǒng)首選方案,。異構(gòu)多核SoC優(yōu)勢(shì)是將結(jié)構(gòu)、功能,、功耗,、運(yùn)算性能各不相同的多個(gè)處理器集成在芯片上,并通過(guò)任務(wù)分工和劃分,,將不同的任務(wù)分配給不同的處理單元,,讓每個(gè)處理單元處理自己擅長(zhǎng)的任務(wù),這種多核異構(gòu)的組織方式執(zhí)行任務(wù)更有效率,,實(shí)現(xiàn)了資源的最佳化配置,,而且降低了整體功耗,。同時(shí),芯片上各個(gè)處理器還可以動(dòng)態(tài)地改變可重構(gòu)資源之間的互連關(guān)系,,控制數(shù)據(jù)流的流動(dòng),,進(jìn)一步提高運(yùn)算的數(shù)據(jù)吞吐率。
1.1 異構(gòu)多核SoC系統(tǒng)結(jié)構(gòu)
異構(gòu)多核SoC(MPSoC)是北京微電子技術(shù)研究所在成功研制出32位高可靠微處理器后,,開(kāi)發(fā)的一款高性能異構(gòu)多核嵌入式數(shù)字信號(hào)處理器,。
多核處理器芯片內(nèi)部主要由一個(gè)兼容SPARC V8的主控制器和16個(gè)DSP引擎組成。12個(gè)DSP引擎包括8個(gè)兼容SPARC V8的精簡(jiǎn)處理器和4個(gè)可重構(gòu)浮點(diǎn)蝶形運(yùn)算加速單元RBE,、4個(gè)可重構(gòu)矢量加速單元RAE,。芯片中DSP引擎按照2維網(wǎng)格結(jié)構(gòu)規(guī)則排列,形成并行的處理單元陣列,由高速片上互連總線鏈接,,主控制器和16個(gè)DSP引擎能夠同時(shí)并行運(yùn)行,。其整體結(jié)構(gòu)如圖2所示。
芯片采用片上網(wǎng)絡(luò)結(jié)構(gòu),,所有的單元和模塊與具有自主知識(shí)產(chǎn)權(quán)的片上網(wǎng)絡(luò)總線(SANOC-BUS)相連接,。SANOC-BUS呈規(guī)則的二維網(wǎng)格結(jié)構(gòu),連接有存儲(chǔ)器模塊(RAM),、PE,、RAE、RBE,、LINK,、只讀存儲(chǔ)器(ROM,存儲(chǔ)旋轉(zhuǎn)因子)和64位SDRAM存儲(chǔ)器接口,。
在片上網(wǎng)絡(luò)系統(tǒng)中,,各模塊主要功能為:
(1)PE, 哈佛結(jié)構(gòu)DSP核,由整數(shù)單元(IU),、FPU,、內(nèi)部存儲(chǔ)器和總線接口4部分組成。
(2)RBE單元采用配置計(jì)算領(lǐng)域中可重構(gòu)的概念,,根據(jù)不同的配置指令,,RBE執(zhí)行單精度浮點(diǎn)蝶形運(yùn)算、乘累加運(yùn)算,、復(fù)數(shù)乘和求模等不同的運(yùn)算,支持?jǐn)?shù)據(jù)流處理,。
(3)RAE以流處理的方式加速大量數(shù)據(jù)的規(guī)則運(yùn)算,此單元采用配置計(jì)算領(lǐng)域中可重構(gòu)的概念,,根據(jù)不同的配置指令,,RAE執(zhí)行矢量字節(jié)加減運(yùn)算、矢量字節(jié)乘累加等不同的運(yùn)算,支持?jǐn)?shù)據(jù)流處理。
(4)LINK模塊功能與TS201的LINK模塊功能兼容,,支持與RAM模塊和SDRAM之間DMA傳遞,。
(5)RAM中的數(shù)據(jù)既能夠被主控制器和PE讀寫(xiě),支持RAM模塊之間,、RAM模塊和SDRAM之間DMA傳遞,。
1.2 片上網(wǎng)絡(luò)總線設(shè)計(jì)
片上網(wǎng)絡(luò)SANOC_BUS由5層相同的總線系統(tǒng)組成,每層總線系統(tǒng)采用2維網(wǎng)格結(jié)構(gòu),,包括4條水平線和4條垂直線,。如圖3所示,這5層總線系統(tǒng)分別命名為:L_P2M,、L_I2M,、L_P2P、L_DMA,、L_CMD,,負(fù)責(zé)傳輸不同的數(shù)據(jù)包,規(guī)定如下:
(1)L_P2M:負(fù)責(zé)為處理單元PE對(duì)存儲(chǔ)器的訪問(wèn)傳遞信息,;
(2)L_I2M:負(fù)責(zé)為link接口和SDRAM接口對(duì)存儲(chǔ)器的訪問(wèn)傳遞信息,;
(3)L_P2P:負(fù)責(zé)在處理單元PE間相互訪問(wèn)傳遞信息;
(4)L_DMA:負(fù)責(zé)處理單元PE和存儲(chǔ)器之間的快速DMA數(shù)據(jù)傳遞,;
(5)L_CMD:負(fù)責(zé)傳遞主控制器和處理單元PE針對(duì)控制寄存器組和狀態(tài)寄存器組的訪問(wèn),。
上圖中,在每層總線上,,水平線和垂直線的交叉點(diǎn)在此層2維網(wǎng)格平面中擁有唯一的坐標(biāo),。規(guī)定坐標(biāo)原點(diǎn)定義為網(wǎng)格的左上角,坐標(biāo)以(x,,y)方式表示,,x軸方向向右,y軸方向向下,。
每層總線內(nèi)部存在兩種傳遞模式:動(dòng)態(tài)傳遞和靜態(tài)傳遞,。
(1)動(dòng)態(tài)傳遞
對(duì)于動(dòng)態(tài)傳遞,不需要任何設(shè)置,,芯片硬件自動(dòng)完成數(shù)據(jù)包的打包和解析,。在多核內(nèi)部總線中,所有的數(shù)據(jù)傳遞按照X-Y蟲(chóng)蠕維序動(dòng)態(tài)的方式進(jìn)行傳遞,。在傳遞數(shù)據(jù)時(shí),,不需要預(yù)先規(guī)劃好單獨(dú)的路徑,數(shù)據(jù)在觸發(fā)傳遞時(shí)自動(dòng)加入包頭信息,,在傳遞過(guò)程中依靠路由結(jié)點(diǎn)內(nèi)部仲裁機(jī)制自動(dòng)尋找路徑的總線。動(dòng)態(tài)傳遞為分時(shí)復(fù)用,交叉結(jié)點(diǎn)間的傳遞通道在不同時(shí)刻傳遞不同的數(shù)據(jù)包,,這些數(shù)據(jù)包的源和目的允許不同,。
動(dòng)態(tài)總線數(shù)據(jù)傳遞包頭格式定義如圖4所示。
在路由單元中,,仲裁邏輯規(guī)定為:在沒(méi)有到達(dá)目的坐標(biāo)時(shí),,按照XY蟲(chóng)蠕維序路由機(jī)制傳遞;在到達(dá)目的坐標(biāo)后,,傳遞到位于此坐標(biāo)處的DSP引擎,。
(2)靜態(tài)傳遞
靜態(tài)傳遞功能,目的是快速處理規(guī)則的流運(yùn)算,。數(shù)據(jù)流在靜態(tài)傳遞過(guò)程中,,具有唯一確定的源坐標(biāo)地址和目的坐標(biāo)地址,并且傳遞通道完全被源和目的間的數(shù)據(jù)傳遞所獨(dú)占,。在應(yīng)用靜態(tài)傳遞時(shí),,需要設(shè)置目的地址和所占用的總線層,占用總線層一旦設(shè)定,,就不能夠再傳遞其它動(dòng)態(tài)數(shù)據(jù)包,。靜態(tài)傳遞數(shù)據(jù)包包頭格式如圖5所示。
靜態(tài)傳遞功能對(duì)總線具有獨(dú)占性,,數(shù)據(jù)流在整個(gè)傳遞過(guò)程中,,僅利用一個(gè)數(shù)據(jù)包頭標(biāo)志??偩€中進(jìn)行靜態(tài)傳遞的路徑只被單一的處理單元或存儲(chǔ)器發(fā)出的數(shù)據(jù)所占用,,其它處理單元若也想采用靜態(tài)傳遞的方式傳遞數(shù)據(jù),只能為其規(guī)劃一條單獨(dú)的數(shù)據(jù)傳遞通道,。
靜態(tài)傳遞包頭格式如圖5所示,,“目的坐標(biāo)”,“預(yù)路由坐標(biāo)”,,“傳遞層號(hào)”需要預(yù)先設(shè)置,。
“預(yù)路由坐標(biāo)”的功能描述如下:雖然依靠X-Y路由機(jī)制,數(shù)據(jù)包能夠主動(dòng)找到目的地址,,但在靜態(tài)傳遞數(shù)據(jù)時(shí),,每個(gè)數(shù)據(jù)包都會(huì)很長(zhǎng),由于對(duì)數(shù)據(jù)傳遞通道具有獨(dú)占性,,可能會(huì)阻礙其它靜態(tài)數(shù)據(jù)包的傳遞,,為此,增加“預(yù)路由坐標(biāo)”參數(shù)設(shè)計(jì),。數(shù)據(jù)包首先按照“預(yù)路由坐標(biāo)”傳遞,,先按照X軸參數(shù)傳遞,再按照Y軸參數(shù)傳遞;當(dāng)“預(yù)路由坐標(biāo)”參數(shù)傳遞完后,,再按照X-Y路由機(jī)制達(dá)到目的坐標(biāo),。
2 異構(gòu)多核SoC的應(yīng)用
2.1 性能比較
在SAR雷達(dá)信號(hào)處理中,對(duì)FFT算法的處理速度是評(píng)價(jià)多核處理器性能非常重要和關(guān)鍵的指標(biāo),。表1為多核處理器與目前比較常用的數(shù)字信號(hào)處理器(DSP)快速處理32 K點(diǎn)單精度浮點(diǎn)FFT運(yùn)算性能比較,。
多種不同可重構(gòu)加速處理單元結(jié)合在一起,發(fā)揮各自的優(yōu)勢(shì):主控制器發(fā)揮靈活的控制功能,;RSIC架構(gòu)的PE適合非規(guī)則數(shù)據(jù)處理,,可重配置的RBE/RAE適合數(shù)據(jù)流處理。不同功能單元相互獨(dú)立,,每個(gè)單元的功能劃分相對(duì)單一,,把運(yùn)算、存儲(chǔ),、控制,、調(diào)度等功能分散在不同的功能單元中實(shí)現(xiàn),降低系統(tǒng)功耗,,降低了每個(gè)處理單元的復(fù)雜度,改善了系統(tǒng)的可實(shí)現(xiàn)性,。
2.2 SAR算法處理
圖6為利用ERS-2衛(wèi)星數(shù)據(jù)處理結(jié)果。圖6(a)中方框中圍起來(lái)的部分為北京西邊官?gòu)d水庫(kù)的遙感圖像,,圖6(b)為SAR雷達(dá)數(shù)據(jù)經(jīng)過(guò)CS算法處理的結(jié)果,。
3 結(jié)論
異構(gòu)多核SoC具備高性能、高可靠性,、擴(kuò)展能力強(qiáng),、低功耗的特點(diǎn),主要面向雷達(dá)信號(hào)處理,,星載圖像處理等高數(shù)據(jù)吞吐率,、計(jì)算密集型的應(yīng)用領(lǐng)域,也可用于對(duì)可靠性要求非常高的多任務(wù)實(shí)時(shí)控制系統(tǒng),。SoC內(nèi)采用多層二維網(wǎng)格總線結(jié)構(gòu),,每一層總線傳遞各自特定的信息包,互不干擾,,片內(nèi)總線帶寬非常高,,不會(huì)成為影響性能的瓶頸,能夠在此基礎(chǔ)上開(kāi)發(fā)面向各種應(yīng)用的異構(gòu)多核SoC,。
參考文獻(xiàn)
[1] 蔣留兵,,車(chē)?yán)?新一代通用機(jī)載雷達(dá)信號(hào)處理機(jī)的實(shí)現(xiàn)[J].電子設(shè)計(jì)工程,2009(5):79-81.
[2] 郝慧軍.無(wú)人機(jī)載SAR實(shí)時(shí)信號(hào)處理設(shè)計(jì)及實(shí)現(xiàn)[J].科技視界,,2015(26):7-8.
[3] 朱木.同步軌道SAR實(shí)時(shí)成像算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),,2014.
[4] YUAN M,,BAKER J W.Scalable and efficient associative processor solution to guarantee real time requirements for air traffic control systems[M].2012 IEEE 26th international parallel and distributed processing symposium p1688-1695.
[5] http://www.tilera.com/pdf/productbrief.
[6] 飛思卡爾推出基于Layerscape架構(gòu)的全新QorIQ系列多核處理器[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2014(5):77-77.
作者信息:
宋立國(guó)1,,胡承秀2,,亓洪亮1
(1.北京微電子技術(shù)研究所,北京100076,;2.北京宇航系統(tǒng)工程研究所,北京100076)