1 前言
DM642 (TMS320DM642)型處理器是TI最新推出的面向多媒體處理領(lǐng)域的數(shù)字信號(hào)處理器(DSP).給多媒體設(shè)備的實(shí)現(xiàn)提供了另一種有效的手段。 DM642建立在C64x DSP核基礎(chǔ)上.采用德州儀器公司開(kāi)發(fā)的第二代高性能的先進(jìn)的超長(zhǎng)指令字結(jié)構(gòu)VeloeiTl.2TM,在600MHz的時(shí)鐘頻率下.DM642每秒可以進(jìn)行24億次16位的乘累加或48億次的8位的乘累加,。這樣強(qiáng)大的運(yùn)算能力使得DM642可以進(jìn)行實(shí)時(shí)多視頻圖像處理,。它的增強(qiáng)型直接內(nèi)存存取 (EDMA)對(duì)DSP圖像處理系統(tǒng)是非常重要的,它可以在沒(méi)有CPU參與的情況下完成映射存儲(chǔ)空間中數(shù)據(jù)搬移,。靈活使用EDMA可以大大提高數(shù)據(jù)傳輸效率,。以:DM642為例,結(jié)合Sobel算法給出EDMA的一種具體控制和實(shí)現(xiàn)方法,。
2 DM642的EDMA控制器
DM042的EMDA能提供超過(guò)2Gb/s的外部帶寬.支持64路獨(dú)立觸發(fā)的事件傳輸,,總共有85個(gè)參數(shù)對(duì)“Linking”或“Chaining”進(jìn)行配置。Linking是在1個(gè)事件被觸發(fā)時(shí)允許1個(gè)序列進(jìn)行傳輸,。Chaining是當(dāng)1個(gè)通道的數(shù)據(jù)傳輸完畢時(shí)觸發(fā)另1個(gè)通道的數(shù)據(jù)傳輸,。 Linking和Chaining使得僅僅被CPU初始配置之后EDMA能夠連續(xù)的自動(dòng)運(yùn)行。EDMA的特點(diǎn)決定了其適合圖像處理的功能,。由于圖像處理的原始數(shù)據(jù)量很大.同時(shí)圖像處理中也會(huì)產(chǎn)生同等量的中間數(shù)據(jù).對(duì)于片內(nèi)存儲(chǔ)資源有限的高速DSP來(lái)說(shuō),一般需要借用外部存儲(chǔ)空間,。為了提高系統(tǒng)的實(shí)時(shí)處理能力.可以將數(shù)據(jù)在不同存儲(chǔ)空間轉(zhuǎn)移的任務(wù)交給EDMA來(lái)完成,而CPU只用于數(shù)據(jù)的計(jì)算,。同時(shí),,EDMA對(duì)數(shù)據(jù)重排功能可以?xún)?yōu)化圖像數(shù)據(jù)在內(nèi)存中的存儲(chǔ),這不僅可以提高內(nèi)部存儲(chǔ)空間的利用效率.而且可以提高數(shù)據(jù)的傳輸速率,。雖然對(duì)圖像數(shù)據(jù)的傳輸也可由軟件實(shí)現(xiàn),,但將消耗大量的CPU時(shí)鐘周期。使DSP的高速性能難以發(fā)揮,。而由EDMA來(lái)完成同樣的工作幾乎不占用CPU的時(shí)鐘周期,。
在C64xDSP中.EDMA控制器負(fù)責(zé)片內(nèi)L2存儲(chǔ)器與其他設(shè)備之間的數(shù)據(jù)傳輸。EDMA控制器和DMA在結(jié)構(gòu)上有很大的不同.其增強(qiáng)之處包括:
提供了64個(gè)通道;
通道間的優(yōu)先級(jí)可以設(shè)置;
支持不同結(jié)構(gòu)數(shù)據(jù)傳輸?shù)逆溄印?/p>
EDMA控制器由以下幾部分組成;
事件和中斷處理寄存器;
事件編碼器;
參數(shù)RAM;
硬件地址產(chǎn)生,。
其中,事件寄存器控制對(duì)EDMA事件進(jìn)行捕獲,。1個(gè)事件相當(dāng)于1個(gè)同步信號(hào),由它觸發(fā)1個(gè)EDMA通道開(kāi)始數(shù)據(jù)傳輸,。如果有多個(gè)事件同時(shí)發(fā)生.則由事件編碼器對(duì)它進(jìn)行分辨,。EDMA的參數(shù)RAM中存放了有關(guān)的傳輸參數(shù),這些參數(shù)會(huì)被送入地址發(fā)生器硬件.進(jìn)而產(chǎn)生讀寫(xiě)操作所需要的地址,。
EDMA支持8bit,、16bit和32bit數(shù)據(jù)的存儲(chǔ)。在EDMA中定義了下列概念:
(1) 數(shù)據(jù)單元(element)的傳輸,。單個(gè)數(shù)據(jù)單元從源地址向目的地址傳輸.如果需要,,每1個(gè)數(shù)據(jù)單元都可以由同步事件觸發(fā)傳輸;
(2) 幀(frame),。l組數(shù)據(jù)單元組成1幀,l幀中的數(shù)據(jù)單元可以是相鄰連續(xù)存放的,,也可以是間隔存放的.幀傳輸可以選擇是否受同步事件控制,,“幀” 一般在1維傳輸中提及;
(3) 陣列(array)。1組連續(xù)的數(shù)據(jù)單元組成1個(gè)陣列.在1個(gè)陣列中的數(shù)據(jù)單元不允許間隔存放,。1個(gè)陣列的傳輸可以選擇是否受同步事件控制,。“陣列 ”一般在2維傳輸中提及;
(4) 塊(block)。多個(gè)幀或者多個(gè)陣列的數(shù)據(jù)組成1個(gè)數(shù)據(jù)塊;
(5) 1維(1一D)傳輸,。多個(gè)數(shù)據(jù)幀組成1個(gè)1維的數(shù)據(jù)傳輸,。Block中幀的個(gè)數(shù)可以是 l~65536。
(6) 2維(2一D)傳輸,。多個(gè)數(shù)據(jù)陣列組成1個(gè)2維的數(shù)據(jù)傳輸,。第1維是陣列中的數(shù)據(jù)單元,第2維是陣列的個(gè)數(shù),。
3 EDMA的控制機(jī)制
3.1 事件與事件控制寄存器
EDMA有64個(gè)通道.每1個(gè)通道都有1個(gè)事件與之關(guān)聯(lián).由這些事件觸發(fā)相應(yīng)通道的傳輸,。
3.2 傳輸參數(shù)與參數(shù) RAM
EDMA控制器與DMA控制器在結(jié)構(gòu)上有所區(qū)別。C64x的.EDMA控制器是基于RAM結(jié)構(gòu),。參數(shù).RAM(Parameter RAM,。PaRAM)的容量是2KB,總共可以存放85組EDMA傳輸控制參數(shù),。多組參數(shù)還可以彼此連接起來(lái),,從而實(shí)現(xiàn)某些負(fù)責(zé)數(shù)據(jù)流的傳輸.例如循環(huán)緩存和數(shù)據(jù)排序等。參數(shù)RAM中保存的內(nèi)容包括:
64個(gè)EDMA通道對(duì)應(yīng)的入口傳輸參數(shù).每組參數(shù)包括6個(gè)字;
用于重加載,,鏈接的傳輸參數(shù)組,。每組參數(shù)包括24字節(jié);
8字節(jié)空余的RAM可以作為“草稿區(qū)”(scratch pad area)。
一旦捕獲到某個(gè)事件.控制器將從PaRAM頂部的64組入口參數(shù)中讀取數(shù)據(jù)對(duì)應(yīng)的控制參數(shù)送往地址發(fā)生器硬件,。
表l給出1組EDMA傳輸參數(shù)的內(nèi)部結(jié)構(gòu),,總共6個(gè)字.192bit??梢酝ㄟ^(guò)32bit的外設(shè)總線(xiàn)對(duì)EDMA的參數(shù).RAM進(jìn)行訪(fǎng)問(wèn),。
可選參數(shù)(Option Parameter),32bit,,用戶(hù)可以根據(jù)情況選擇設(shè)置該參數(shù),。
SRC/DST地址.32bit,用于存放EDMA訪(fǎng)問(wèn)起始的源地址和目的地址,,可以通過(guò)可選參數(shù)中的SUM/DUM位設(shè)定對(duì)SRC/DST地址的修改方式,。
數(shù)據(jù)單元計(jì)數(shù)(Element Count),16bit無(wú)符號(hào)數(shù).存放l幀(1一D傳輸)或1個(gè)陣列(2一D傳輸)中的數(shù)據(jù)單元數(shù),。
幀/陣列計(jì)數(shù)(Frame/Array Count),,16bit無(wú)符號(hào)數(shù).存放的是1-D數(shù)據(jù)傳輸中的幀計(jì)數(shù),,或是2一D數(shù)據(jù)傳輸中的陣列計(jì)數(shù)。
數(shù)據(jù)單元,,幀,,陣列索引(Element/Frame/ArrayIndex).16bit無(wú)符號(hào)數(shù),作為地址修改的索引值,。數(shù)據(jù)單元索引只應(yīng)用于1-D 傳輸,為下一數(shù)據(jù)單元的地址偏移值(2一D傳輸不允許數(shù)據(jù)單元間隔存放),。幀,,陣列索引用于控制下一幀,陣列的地址索引,。
數(shù)據(jù)計(jì)數(shù)的重加載(Element Count Reload),,16bit無(wú)符號(hào)數(shù)。用于在每幀最后一個(gè)數(shù)據(jù)元素傳輸之后.重新加載傳輸計(jì)數(shù)值,。這個(gè)參數(shù)只能用于1一D傳輸中,。
鏈接地址(Link Address),16bit,。當(dāng)設(shè)定可選參數(shù)中的LINK=1時(shí),,可以由鏈接地址確定下1個(gè)EDMA事件采用參數(shù)的裝載,重裝載地址,,從而使多組 EDMA傳輸參數(shù)形成EDMA傳輸鏈,。
4 EDMA的傳輸操作
EDMA進(jìn)行數(shù)據(jù)傳輸時(shí)有2種啟動(dòng)方式,1種是CPU啟動(dòng).另1種是由同步事件觸發(fā),。每1個(gè)通道的啟動(dòng)是相互獨(dú)立的,。
4.1 CPU啟動(dòng)EDMA/非同步的 EDMA
CPU可以通過(guò)寫(xiě)事件置位寄存器(ESR)啟動(dòng)1個(gè)EDMA通道。向ESR中某1位寫(xiě)1時(shí),,將強(qiáng)行觸發(fā)對(duì)應(yīng)的事件,。此時(shí),與正常的事件響應(yīng)過(guò)程類(lèi)似,, EDMA的PaRAM中的傳輸參數(shù)被送入地址發(fā)生器.完成對(duì)EMIF,、L2存儲(chǔ)器或外設(shè)的存取訪(fǎng)問(wèn)。由CPU啟動(dòng)的EDMA屬于非同步的數(shù)據(jù)傳輸,。EER 中的事件使能與否不會(huì)影響這種EDMA傳輸?shù)膯?dòng),。
4.2 由事件觸發(fā) EDMA
一旦事件編碼器捕獲到1個(gè)觸發(fā)事件并鎖存在ER寄存器中,將導(dǎo)致PaRAM中對(duì)應(yīng)的參數(shù)被送入地址發(fā)生器.進(jìn)而執(zhí)行有關(guān)的傳輸操作,。盡管是由事件啟動(dòng)傳輸操作,,但是事件本身必須首先被CPU使能。EER寄存器負(fù)責(zé)控制事件的使能,。觸發(fā)EDMA傳輸?shù)耐绞录梢栽从谕庠O(shè),,外部器件的中斷或某個(gè)EDMA通道結(jié)束,。與DMA的情況不同,與EDMA的每1個(gè)通道相關(guān)聯(lián)的觸發(fā)事件是固定的,。因此,,如果假設(shè)EER中的EVT4=1,那么EXT_INT4引腳的外部中斷信號(hào)就會(huì)啟動(dòng)EDMA通道4的傳輸,。所以,,每個(gè)事件也就指定了1個(gè)特定的EDMA通道。
5 在實(shí)時(shí)圖像處理系統(tǒng)中的應(yīng)用
在實(shí)時(shí)圖形處理系統(tǒng)中,,經(jīng)常是把數(shù)據(jù)塊轉(zhuǎn)移,,例如從視頻通道采集數(shù)據(jù)傳送到SDRAM中作為后續(xù)處理的緩存,或是把數(shù)據(jù)傳送到片內(nèi)RAM中,。EDMA使數(shù)據(jù)的傳送簡(jiǎn)單易行,。下面以把數(shù)據(jù)從視頻通道傳送到片內(nèi)RAM中并作Sobel邊緣提取算法和把數(shù)據(jù)從視頻通道傳送到SDRAM中并作So—bel邊緣提取算法為例。
(1)把數(shù)據(jù)從視頻通道通過(guò)1維方式傳送到片內(nèi)RAM中并作Sobel邊緣提取算法
只對(duì)攝像頭采集的I塊數(shù)據(jù)進(jìn)行Sobel邊緣提取,。采用一維EDMA傳送方式,,每1次傳送采集1行中的部分?jǐn)?shù)據(jù)(DAT_copy()函數(shù))。在PAL制式下.先把1行數(shù)據(jù)放到nMemTemp數(shù)組中,,然后對(duì)從144行到432行,、從180列到435列的圖像進(jìn)行Sobel邊緣提取.最后把變換后的數(shù)據(jù)輸出到顯示緩沖區(qū).如圖1所示。
因?yàn)镾obel算法需要3行數(shù)據(jù),,所以可以開(kāi)辟1個(gè)可以存放3行數(shù)據(jù)的緩沖區(qū),,通過(guò)指針的交換把從視頻通道過(guò)來(lái)的數(shù)據(jù)分別放到緩沖區(qū)中。保存的3行圖像使用翻卷的緩沖區(qū)管理,,3個(gè)變量分別指示當(dāng)前使用的y行,、y—l行和y一2行在緩沖區(qū)中的起始偏移量??梢赃@樣:輪流往3塊緩存區(qū)拷貝數(shù)據(jù).只要改變拷貝的指針就可以,。在拷貝當(dāng)前這1塊的時(shí)候.已經(jīng)拷貝的另外2塊數(shù)據(jù)依然沒(méi)有變化,所以就可以實(shí)現(xiàn)3塊數(shù)據(jù)保存采集圖像中的相鄰3行數(shù)據(jù).如表2所示,。
(2)把數(shù)據(jù)從視頻通道通過(guò)2維方式傳送到SDRAM中并作Sobel邊緣提取算法可以通過(guò)DAT_copy2d 0函數(shù)直接把采集的l幅圖像亮度分量存放到SDRAM中,,如下:
其中.m_dbFrameBufferTemp是指向SDRAM中緩沖區(qū)的指針,numPixels是1行的像素?cái)?shù),,num-Lines是行數(shù),。當(dāng)把數(shù)據(jù)存放到SDRAM的1個(gè)數(shù)組中后.Sobel算法的實(shí)現(xiàn)就非常簡(jiǎn)單了。當(dāng)然也可以參照1維的方法來(lái)實(shí)現(xiàn),。
6 結(jié)束語(yǔ)
大批量的圖像數(shù)據(jù)傳輸和復(fù)雜算法的處理一直是高速數(shù)字圖像處理器的速度瓶頸,,利用DSP的EDMA功能可以在不中斷信號(hào)處理器算法處理工作的同時(shí)完成圖像數(shù)據(jù)的搬移,在有效地解決了大批量圖像數(shù)據(jù)傳輸速度瓶頸的同時(shí),又能讓DSP的處理器核專(zhuān)門(mén)從事算法處理工作,,極大地提高了系統(tǒng)的并行性能,。