《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于DM642的EDMA圖像處理系統(tǒng)
基于DM642的EDMA圖像處理系統(tǒng)
電子發(fā)燒友
摘要: 1 前言  DM642 (TMS320DM642)型處理器是TI最新推出的面向多媒體處理領(lǐng)域的數(shù)字信號(hào)處理器(DSP).給多媒體設(shè)備的實(shí)現(xiàn)提供了另一種有效的手段,。 DM642建立在C64x DSP核基礎(chǔ)上.采用德州儀器公司開(kāi)發(fā)的第二代高性能的先進(jìn)的超長(zhǎng)指令字結(jié)構(gòu)VeloeiTl.2TM,在600MHz的時(shí)鐘頻率下.DM642每秒可以進(jìn)行24億次16位的乘累加或48億次的8位的乘累加,。這樣強(qiáng)大的運(yùn)算能力使得DM642可以進(jìn)行實(shí)時(shí)多視頻圖像處理,。它的增強(qiáng)型直接內(nèi)存存取 (EDMA)對(duì)DSP圖像處理系統(tǒng)是非常重要的,,它可以在沒(méi)有CPU參與的情況下完成映射存儲(chǔ)空間中數(shù)據(jù)搬移。靈活使用EDMA可以大大提高數(shù)據(jù)傳輸效率,。以:DM642為例,,結(jié)合Sobel算法給出EDMA的一種具體控制和實(shí)現(xiàn)方法,?! ? DM642的EDMA控制器  DM042的EMDA能提供超過(guò)2Gb/s的外部帶寬.支持64路獨(dú)立觸發(fā)的事件傳輸,,總共有85個(gè)參數(shù)對(duì)“Linking”或“Chaining”進(jìn)行配置。Linking是在1個(gè)事件被觸發(fā)時(shí)允許1個(gè)序列進(jìn)行傳輸,。Chaining是當(dāng)1個(gè)通道的數(shù)據(jù)傳輸完畢時(shí)觸發(fā)另1個(gè)通道的數(shù)據(jù)傳輸,。 Linking和
Abstract:
Key words :

  1 前言

  DM642 (TMS320DM642)型處理器是TI最新推出的面向多媒體處理領(lǐng)域的數(shù)字信號(hào)處理器(DSP).給多媒體設(shè)備的實(shí)現(xiàn)提供了另一種有效的手段。 DM642建立在C64x DSP核基礎(chǔ)上.采用德州儀器公司開(kāi)發(fā)的第二代高性能的先進(jìn)的超長(zhǎng)指令字結(jié)構(gòu)VeloeiTl.2TM,在600MHz的時(shí)鐘頻率下.DM642每秒可以進(jìn)行24億次16位的乘累加或48億次的8位的乘累加,。這樣強(qiáng)大的運(yùn)算能力使得DM642可以進(jìn)行實(shí)時(shí)多視頻圖像處理,。它的增強(qiáng)型直接內(nèi)存存取 (EDMA)對(duì)DSP圖像處理系統(tǒng)是非常重要的,它可以在沒(méi)有CPU參與的情況下完成映射存儲(chǔ)空間中數(shù)據(jù)搬移,。靈活使用EDMA可以大大提高數(shù)據(jù)傳輸效率,。以:DM642為例,結(jié)合Sobel算法給出EDMA的一種具體控制和實(shí)現(xiàn)方法,。

  2 DM642的EDMA控制器

  DM042的EMDA能提供超過(guò)2Gb/s的外部帶寬.支持64路獨(dú)立觸發(fā)的事件傳輸,,總共有85個(gè)參數(shù)對(duì)“Linking”或“Chaining”進(jìn)行配置。Linking是在1個(gè)事件被觸發(fā)時(shí)允許1個(gè)序列進(jìn)行傳輸,。Chaining是當(dāng)1個(gè)通道的數(shù)據(jù)傳輸完畢時(shí)觸發(fā)另1個(gè)通道的數(shù)據(jù)傳輸,。 Linking和Chaining使得僅僅被CPU初始配置之后EDMA能夠連續(xù)的自動(dòng)運(yùn)行。EDMA的特點(diǎn)決定了其適合圖像處理的功能,。由于圖像處理的原始數(shù)據(jù)量很大.同時(shí)圖像處理中也會(huì)產(chǎn)生同等量的中間數(shù)據(jù).對(duì)于片內(nèi)存儲(chǔ)資源有限的高速DSP來(lái)說(shuō),一般需要借用外部存儲(chǔ)空間,。為了提高系統(tǒng)的實(shí)時(shí)處理能力.可以將數(shù)據(jù)在不同存儲(chǔ)空間轉(zhuǎn)移的任務(wù)交給EDMA來(lái)完成,而CPU只用于數(shù)據(jù)的計(jì)算,。同時(shí),,EDMA對(duì)數(shù)據(jù)重排功能可以?xún)?yōu)化圖像數(shù)據(jù)在內(nèi)存中的存儲(chǔ),這不僅可以提高內(nèi)部存儲(chǔ)空間的利用效率.而且可以提高數(shù)據(jù)的傳輸速率,。雖然對(duì)圖像數(shù)據(jù)的傳輸也可由軟件實(shí)現(xiàn),,但將消耗大量的CPU時(shí)鐘周期。使DSP的高速性能難以發(fā)揮,。而由EDMA來(lái)完成同樣的工作幾乎不占用CPU的時(shí)鐘周期,。

  在C64xDSP中.EDMA控制器負(fù)責(zé)片內(nèi)L2存儲(chǔ)器與其他設(shè)備之間的數(shù)據(jù)傳輸。EDMA控制器和DMA在結(jié)構(gòu)上有很大的不同.其增強(qiáng)之處包括:

  提供了64個(gè)通道;

  通道間的優(yōu)先級(jí)可以設(shè)置;

  支持不同結(jié)構(gòu)數(shù)據(jù)傳輸?shù)逆溄印?/p>

  EDMA控制器由以下幾部分組成;

  事件和中斷處理寄存器;

  事件編碼器;

  參數(shù)RAM;

  硬件地址產(chǎn)生,。

  其中,事件寄存器控制對(duì)EDMA事件進(jìn)行捕獲,。1個(gè)事件相當(dāng)于1個(gè)同步信號(hào),由它觸發(fā)1個(gè)EDMA通道開(kāi)始數(shù)據(jù)傳輸,。如果有多個(gè)事件同時(shí)發(fā)生.則由事件編碼器對(duì)它進(jìn)行分辨,。EDMA的參數(shù)RAM中存放了有關(guān)的傳輸參數(shù),這些參數(shù)會(huì)被送入地址發(fā)生器硬件.進(jìn)而產(chǎn)生讀寫(xiě)操作所需要的地址,。

  EDMA支持8bit,、16bit和32bit數(shù)據(jù)的存儲(chǔ)。在EDMA中定義了下列概念:

  (1) 數(shù)據(jù)單元(element)的傳輸,。單個(gè)數(shù)據(jù)單元從源地址向目的地址傳輸.如果需要,,每1個(gè)數(shù)據(jù)單元都可以由同步事件觸發(fā)傳輸;

  (2) 幀(frame),。l組數(shù)據(jù)單元組成1幀,l幀中的數(shù)據(jù)單元可以是相鄰連續(xù)存放的,,也可以是間隔存放的.幀傳輸可以選擇是否受同步事件控制,,“幀” 一般在1維傳輸中提及;

  (3) 陣列(array)。1組連續(xù)的數(shù)據(jù)單元組成1個(gè)陣列.在1個(gè)陣列中的數(shù)據(jù)單元不允許間隔存放,。1個(gè)陣列的傳輸可以選擇是否受同步事件控制,。“陣列 ”一般在2維傳輸中提及;

  (4) 塊(block)。多個(gè)幀或者多個(gè)陣列的數(shù)據(jù)組成1個(gè)數(shù)據(jù)塊;

  (5) 1維(1一D)傳輸,。多個(gè)數(shù)據(jù)幀組成1個(gè)1維的數(shù)據(jù)傳輸,。Block中幀的個(gè)數(shù)可以是 l~65536。

  (6) 2維(2一D)傳輸,。多個(gè)數(shù)據(jù)陣列組成1個(gè)2維的數(shù)據(jù)傳輸,。第1維是陣列中的數(shù)據(jù)單元,第2維是陣列的個(gè)數(shù),。

  3 EDMA的控制機(jī)制

  3.1 事件與事件控制寄存器

  EDMA有64個(gè)通道.每1個(gè)通道都有1個(gè)事件與之關(guān)聯(lián).由這些事件觸發(fā)相應(yīng)通道的傳輸,。

  3.2 傳輸參數(shù)與參數(shù) RAM

  EDMA控制器與DMA控制器在結(jié)構(gòu)上有所區(qū)別。C64x的.EDMA控制器是基于RAM結(jié)構(gòu),。參數(shù).RAM(Parameter RAM,。PaRAM)的容量是2KB,總共可以存放85組EDMA傳輸控制參數(shù),。多組參數(shù)還可以彼此連接起來(lái),,從而實(shí)現(xiàn)某些負(fù)責(zé)數(shù)據(jù)流的傳輸.例如循環(huán)緩存和數(shù)據(jù)排序等。參數(shù)RAM中保存的內(nèi)容包括:

  64個(gè)EDMA通道對(duì)應(yīng)的入口傳輸參數(shù).每組參數(shù)包括6個(gè)字;

  用于重加載,,鏈接的傳輸參數(shù)組,。每組參數(shù)包括24字節(jié);

  8字節(jié)空余的RAM可以作為“草稿區(qū)”(scratch pad area)。

  一旦捕獲到某個(gè)事件.控制器將從PaRAM頂部的64組入口參數(shù)中讀取數(shù)據(jù)對(duì)應(yīng)的控制參數(shù)送往地址發(fā)生器硬件,。

  表l給出1組EDMA傳輸參數(shù)的內(nèi)部結(jié)構(gòu),,總共6個(gè)字.192bit??梢酝ㄟ^(guò)32bit的外設(shè)總線(xiàn)對(duì)EDMA的參數(shù).RAM進(jìn)行訪(fǎng)問(wèn),。

  

 

  可選參數(shù)(Option Parameter),32bit,,用戶(hù)可以根據(jù)情況選擇設(shè)置該參數(shù),。

  SRC/DST地址.32bit,用于存放EDMA訪(fǎng)問(wèn)起始的源地址和目的地址,,可以通過(guò)可選參數(shù)中的SUM/DUM位設(shè)定對(duì)SRC/DST地址的修改方式,。

  數(shù)據(jù)單元計(jì)數(shù)(Element Count),16bit無(wú)符號(hào)數(shù).存放l幀(1一D傳輸)或1個(gè)陣列(2一D傳輸)中的數(shù)據(jù)單元數(shù),。

  幀/陣列計(jì)數(shù)(Frame/Array Count),,16bit無(wú)符號(hào)數(shù).存放的是1-D數(shù)據(jù)傳輸中的幀計(jì)數(shù),,或是2一D數(shù)據(jù)傳輸中的陣列計(jì)數(shù)。

  數(shù)據(jù)單元,,幀,,陣列索引(Element/Frame/ArrayIndex).16bit無(wú)符號(hào)數(shù),作為地址修改的索引值,。數(shù)據(jù)單元索引只應(yīng)用于1-D 傳輸,為下一數(shù)據(jù)單元的地址偏移值(2一D傳輸不允許數(shù)據(jù)單元間隔存放),。幀,,陣列索引用于控制下一幀,陣列的地址索引,。

  數(shù)據(jù)計(jì)數(shù)的重加載(Element Count Reload),,16bit無(wú)符號(hào)數(shù)。用于在每幀最后一個(gè)數(shù)據(jù)元素傳輸之后.重新加載傳輸計(jì)數(shù)值,。這個(gè)參數(shù)只能用于1一D傳輸中,。

  鏈接地址(Link Address),16bit,。當(dāng)設(shè)定可選參數(shù)中的LINK=1時(shí),,可以由鏈接地址確定下1個(gè)EDMA事件采用參數(shù)的裝載,重裝載地址,,從而使多組 EDMA傳輸參數(shù)形成EDMA傳輸鏈,。

  4 EDMA的傳輸操作

  EDMA進(jìn)行數(shù)據(jù)傳輸時(shí)有2種啟動(dòng)方式,1種是CPU啟動(dòng).另1種是由同步事件觸發(fā),。每1個(gè)通道的啟動(dòng)是相互獨(dú)立的,。

  4.1 CPU啟動(dòng)EDMA/非同步的 EDMA

  CPU可以通過(guò)寫(xiě)事件置位寄存器(ESR)啟動(dòng)1個(gè)EDMA通道。向ESR中某1位寫(xiě)1時(shí),,將強(qiáng)行觸發(fā)對(duì)應(yīng)的事件,。此時(shí),與正常的事件響應(yīng)過(guò)程類(lèi)似,, EDMA的PaRAM中的傳輸參數(shù)被送入地址發(fā)生器.完成對(duì)EMIF,、L2存儲(chǔ)器或外設(shè)的存取訪(fǎng)問(wèn)。由CPU啟動(dòng)的EDMA屬于非同步的數(shù)據(jù)傳輸,。EER 中的事件使能與否不會(huì)影響這種EDMA傳輸?shù)膯?dòng),。

  4.2 由事件觸發(fā) EDMA

  一旦事件編碼器捕獲到1個(gè)觸發(fā)事件并鎖存在ER寄存器中,將導(dǎo)致PaRAM中對(duì)應(yīng)的參數(shù)被送入地址發(fā)生器.進(jìn)而執(zhí)行有關(guān)的傳輸操作,。盡管是由事件啟動(dòng)傳輸操作,,但是事件本身必須首先被CPU使能。EER寄存器負(fù)責(zé)控制事件的使能,。觸發(fā)EDMA傳輸?shù)耐绞录梢栽从谕庠O(shè),,外部器件的中斷或某個(gè)EDMA通道結(jié)束,。與DMA的情況不同,與EDMA的每1個(gè)通道相關(guān)聯(lián)的觸發(fā)事件是固定的,。因此,,如果假設(shè)EER中的EVT4=1,那么EXT_INT4引腳的外部中斷信號(hào)就會(huì)啟動(dòng)EDMA通道4的傳輸,。所以,,每個(gè)事件也就指定了1個(gè)特定的EDMA通道。

  5 在實(shí)時(shí)圖像處理系統(tǒng)中的應(yīng)用

  在實(shí)時(shí)圖形處理系統(tǒng)中,,經(jīng)常是把數(shù)據(jù)塊轉(zhuǎn)移,,例如從視頻通道采集數(shù)據(jù)傳送到SDRAM中作為后續(xù)處理的緩存,或是把數(shù)據(jù)傳送到片內(nèi)RAM中,。EDMA使數(shù)據(jù)的傳送簡(jiǎn)單易行,。下面以把數(shù)據(jù)從視頻通道傳送到片內(nèi)RAM中并作Sobel邊緣提取算法和把數(shù)據(jù)從視頻通道傳送到SDRAM中并作So—bel邊緣提取算法為例。

  (1)把數(shù)據(jù)從視頻通道通過(guò)1維方式傳送到片內(nèi)RAM中并作Sobel邊緣提取算法

  只對(duì)攝像頭采集的I塊數(shù)據(jù)進(jìn)行Sobel邊緣提取,。采用一維EDMA傳送方式,,每1次傳送采集1行中的部分?jǐn)?shù)據(jù)(DAT_copy()函數(shù))。在PAL制式下.先把1行數(shù)據(jù)放到nMemTemp數(shù)組中,,然后對(duì)從144行到432行,、從180列到435列的圖像進(jìn)行Sobel邊緣提取.最后把變換后的數(shù)據(jù)輸出到顯示緩沖區(qū).如圖1所示。

  

 

  

 

  因?yàn)镾obel算法需要3行數(shù)據(jù),,所以可以開(kāi)辟1個(gè)可以存放3行數(shù)據(jù)的緩沖區(qū),,通過(guò)指針的交換把從視頻通道過(guò)來(lái)的數(shù)據(jù)分別放到緩沖區(qū)中。保存的3行圖像使用翻卷的緩沖區(qū)管理,,3個(gè)變量分別指示當(dāng)前使用的y行,、y—l行和y一2行在緩沖區(qū)中的起始偏移量??梢赃@樣:輪流往3塊緩存區(qū)拷貝數(shù)據(jù).只要改變拷貝的指針就可以,。在拷貝當(dāng)前這1塊的時(shí)候.已經(jīng)拷貝的另外2塊數(shù)據(jù)依然沒(méi)有變化,所以就可以實(shí)現(xiàn)3塊數(shù)據(jù)保存采集圖像中的相鄰3行數(shù)據(jù).如表2所示,。

  

 

  

 

  

 

  (2)把數(shù)據(jù)從視頻通道通過(guò)2維方式傳送到SDRAM中并作Sobel邊緣提取算法可以通過(guò)DAT_copy2d 0函數(shù)直接把采集的l幅圖像亮度分量存放到SDRAM中,,如下:

  

 

  其中.m_dbFrameBufferTemp是指向SDRAM中緩沖區(qū)的指針,numPixels是1行的像素?cái)?shù),,num-Lines是行數(shù),。當(dāng)把數(shù)據(jù)存放到SDRAM的1個(gè)數(shù)組中后.Sobel算法的實(shí)現(xiàn)就非常簡(jiǎn)單了。當(dāng)然也可以參照1維的方法來(lái)實(shí)現(xiàn),。

  6 結(jié)束語(yǔ)

  大批量的圖像數(shù)據(jù)傳輸和復(fù)雜算法的處理一直是高速數(shù)字圖像處理器的速度瓶頸,,利用DSP的EDMA功能可以在不中斷信號(hào)處理器算法處理工作的同時(shí)完成圖像數(shù)據(jù)的搬移,在有效地解決了大批量圖像數(shù)據(jù)傳輸速度瓶頸的同時(shí),又能讓DSP的處理器核專(zhuān)門(mén)從事算法處理工作,,極大地提高了系統(tǒng)的并行性能,。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。