相關(guān)測速是以隨機(jī)過程的相關(guān)理論和信息理論為基礎(chǔ)發(fā)展起來的[1-2],,它的應(yīng)用始于上世紀(jì)40年代,,首先應(yīng)用于軍事上,然后逐漸轉(zhuǎn)移到科學(xué)研究和民用上,,現(xiàn)在已經(jīng)在各個(gè)領(lǐng)域內(nèi)得到日益廣泛的應(yīng)用,。
盡管相關(guān)測速的運(yùn)算量非常巨大,,但是隨著EDA技術(shù)的高速發(fā)展,大規(guī)??删幊踢壿嬈骷﨏PLD/FPGA的出現(xiàn),,集成電路做得比以前更快、規(guī)模更大,。設(shè)計(jì)人員有很大的自由度去設(shè)計(jì)實(shí)現(xiàn)用途專一的集成化數(shù)字電路:在實(shí)驗(yàn)室里,,在電腦系統(tǒng)前,現(xiàn)場設(shè)計(jì),、現(xiàn)場編程,、現(xiàn)場配置、現(xiàn)場修改和現(xiàn)場驗(yàn)證,,從而在現(xiàn)場實(shí)現(xiàn)數(shù)字系統(tǒng)的單片化設(shè)計(jì)和應(yīng)用,。這意味著無需更改電路,只要改寫FPGA內(nèi)部功能,,整個(gè)系統(tǒng)即可實(shí)現(xiàn)新功能,,即一個(gè)最小的芯片方案可以轉(zhuǎn)換來執(zhí)行多個(gè)功能,硬件的配置變得如同軟件一樣靈活方便,,而其速度和集成度,,也隨著VLS工藝的發(fā)展而迅速提高,這就為相關(guān)測速的實(shí)際應(yīng)用提供了硬件平臺,。只要找到合適的算法并建立相應(yīng)的硬件處理系統(tǒng),,運(yùn)算速度和精度就能達(dá)到預(yù)期的要求。
1 系統(tǒng)硬件及相關(guān)算法的確定
本文測速的原理是:以CCD攝像頭作為前端裝置,,將CCD攝像頭所采集的圖像信息送到FPGA中,由FPGA對其進(jìn)行處理,,并給出當(dāng)前運(yùn)行的速度,。在滿足速度上限的條件下,連續(xù)兩次采集的圖像必然有重疊的部分,。對連續(xù)兩次的圖像進(jìn)行相關(guān)處理,,就可以得到它們之間的位置關(guān)系,再結(jié)合采樣間隔時(shí)間,,從而可以得出速度,。
由于圖像處理算法涉及的運(yùn)算量比較大,對系統(tǒng)的快速處理能力和大數(shù)據(jù)量的吞吐能力有嚴(yán)格的要求[3],,因此系統(tǒng)中的核心器件FPGA的選擇必須遵循以下原則:(1)調(diào)試使用方便,;(2)適當(dāng)?shù)捻憫?yīng)速度;(3)適當(dāng)夠用的邏輯資源,;(4)足夠的輸入輸出(I/O)端口,。
根據(jù)系統(tǒng)要求,本文采用Altera公司的超大規(guī)模可編程邏輯器件Cyclone II[4],。Cyclone II系列FPGA是繼Cyclone系列低成本FPGA在市場上取得成功之后,,Altera公司推出的更低成本的FPGA。Altera采用相同的方法在盡可能小的裸片面積上構(gòu)建了Cyclone II系列,,擴(kuò)展了低成本FPGA的密度,,最多達(dá)68 416個(gè)邏輯單元(LE)和1.1 Mbit的嵌入式存儲器,從而可以在低成本的FPGA上實(shí)現(xiàn)復(fù)雜的數(shù)字系統(tǒng),。優(yōu)異的性價(jià)比使CycloneII系列FPGA可以廣泛地應(yīng)用于汽車電子,、消費(fèi)電子、音/視頻處理,、通信以及測試測量等終端產(chǎn)品市場,。
在測速系統(tǒng)的設(shè)計(jì)中,假設(shè)攝像頭采集到的原始圖大小為1 280×1 024,,為了保證采集的圖像背景區(qū)域能夠有明顯的目標(biāo),,比較理想的情況是將模板區(qū)域取得越大越好,將目標(biāo)全部包括在內(nèi)[5-6],。當(dāng)搜索區(qū)域大小為m×m, 模板大小為n×n時(shí),,歸一化互相關(guān)算法所需的運(yùn)算次數(shù)約為(5n2+9)×(m-n+1)2次,計(jì)算量巨大,。如果采用512×512大小的搜索區(qū)域,,模板采用32×32大小,運(yùn)算乘加次數(shù)近12億次,,硬件將無法提供足夠的乘加器,。如果采用128×128的搜索區(qū)域和32×32的模板,圖像的檢索區(qū)域比較小,,測速的范圍會比較低,,精度也會下降。綜合考慮攝像頭采集圖像的范圍和精度,,并且充分利用硬件所能提供的內(nèi)部存儲單元,,本文將搜索區(qū)域設(shè)定為256×256,模板大小設(shè)定為32×32,,如圖1所示,。
同時(shí)采用簡化的互相關(guān)算法來實(shí)現(xiàn)相關(guān)匹配,所以選擇差的絕對值和相關(guān)法SAD(Sum of Absolute Difference)作相關(guān)計(jì)算,。
2 測速系統(tǒng)的構(gòu)成及設(shè)計(jì)
根據(jù)所需的功能,,將系統(tǒng)劃分為以下幾個(gè)模塊,分別加以實(shí)現(xiàn),。如圖2所示,。
(1)CCD攝像頭數(shù)據(jù)采集模塊
攝像頭采集的數(shù)據(jù)需要有圖像幀和消隱幀,。當(dāng)前幀是圖像幀時(shí),讀入圖像的行數(shù)據(jù),,讀入1 280×1 024個(gè)數(shù)據(jù)后,,列計(jì)數(shù)X_Cont和行計(jì)數(shù)Y_Cont歸零。消隱幀時(shí)不輸出,。
(2)Raw to RGB壓縮模塊
通過內(nèi)部設(shè)置一個(gè)1 280×10 bit的FIFO,,同時(shí)輸出兩行數(shù)據(jù),通過輸入的行計(jì)數(shù)和列計(jì)數(shù)模塊的奇偶將原Byer格式的數(shù)據(jù)壓縮成RGB格式,,4個(gè)點(diǎn)壓縮成一個(gè)點(diǎn),,圖像大小變成640×512。同時(shí),,通過內(nèi)置的時(shí)鐘計(jì)數(shù)模塊將當(dāng)前輸出的RGB所在的行列值輸出,,范圍為640×512。
(3)處理流程1
M4K寫入控制器:CCD時(shí)鐘,。通過當(dāng)前輸入的行列坐標(biāo),,確定觸發(fā)背景M4K內(nèi)存模塊和模板M4K內(nèi)存模塊的寫入使能。背景M4K大小設(shè)為256×256×4 bit,,模板M4K大小設(shè)為32×32×4 bit,。當(dāng)該模塊工作時(shí),相關(guān)模塊不工作,,以防止未寫完數(shù)據(jù)就做相關(guān)處理,。
M4K模塊:存放處理過的4 bit灰度數(shù)據(jù),讀寫時(shí)鐘分開,,有寫使能位,。
(4)處理流程2
SdRam接口:提供兩個(gè)寫端口和兩個(gè)讀端口,可同時(shí)處理,。內(nèi)部連接了PLL倍頻器,,將SDRam的處理速度倍增到100 MB,然后通過內(nèi)部的讀寫和刷新狀態(tài)機(jī)控制讀寫,。
VGA控制模塊:由I2C控制生成行同步信息,并將讀入的RGB數(shù)據(jù)通過系數(shù)處理送到解碼器輸出VGA圖像,。
測速模塊:模板選擇的位置固定在圖像的正中,,即第192行192列開始的32×32大小的數(shù)據(jù),通過輸入的(X,,Y)坐標(biāo)和(192,,192)的差值得到像素的偏移量。然后通過實(shí)際的圖像大小和距離的比例系數(shù),,乘以當(dāng)前的處理頻率,,得到當(dāng)前的物體移動速度,。
為了計(jì)算偏移量和相對位移,必須引入除法運(yùn)算,,而除法運(yùn)算是通過許多移位寄存器和加法器構(gòu)成的,。運(yùn)算極其耗時(shí),且需要大量邏輯單元和查找表,,對處理速度有很大影響,。所以選取MegaWizard生成的除法器來減少所需的運(yùn)算時(shí)間。
最后,,由于實(shí)際的數(shù)據(jù)均為16進(jìn)制,,為了滿足顯示的10進(jìn)制坐標(biāo)換算的需要,設(shè)計(jì)了16進(jìn)制到10進(jìn)制LED顯示的轉(zhuǎn)換模塊,,實(shí)現(xiàn)了速度的直觀顯示,,如圖3所示。
綜上所述,,通過模塊化設(shè)計(jì)和綜合設(shè)計(jì),,在FPGA上實(shí)現(xiàn)了測速需要的功能設(shè)計(jì)。
本文對攝像頭采集到的數(shù)據(jù)進(jìn)行處理,。選取圖像正中的256×256個(gè)像素位置作為背景區(qū)域,,其中的32×32個(gè)像素作為模板選取區(qū)域,通過前后兩幀的相關(guān)得到模板在后一幀中的位移像素值,。測速示意圖如圖4所示,。
如果按照理想的相似三角形判斷,攝像頭可以測量的速度可以達(dá)到無限大,。設(shè)背景區(qū)域長寬均為X cm,,最大速度可以達(dá)到(X×(256-32)/256)/0.529 4=1.9×0.875X cm/s,測量精度為(X/256)/0.529 4=1.9×X/256,。但是由于攝像頭對光強(qiáng)的敏感程度和目標(biāo)的實(shí)際采樣灰度受噪聲的影響,,以及受安裝位置和與被測物體距離的限制,實(shí)際測量速度范圍是有限的,。在測試中采用的背景大小為20 cm×20 cm,,離檢測面距離30 cm左右,100 MHz工作頻率,,測速的最大值可達(dá)到(20×(256-32)/256)/0.529 4=33.056 cm/s,。
整個(gè)測速系統(tǒng)可以根據(jù)實(shí)際應(yīng)用情況設(shè)定參數(shù)來調(diào)整搜索區(qū)域,具有很寬的測速范圍,。相對于傳統(tǒng)的接觸式測速系統(tǒng),,克服了物體運(yùn)動異常時(shí)測量出現(xiàn)的原理性誤差;相對于非接觸的一維測速系統(tǒng),,克服了測速的單一性,,可以測量物體在各種運(yùn)動方向上移動的速度,。如果使用高性能FPGA進(jìn)行多路并行的相關(guān)運(yùn)算,搭配高速高分辨率的攝像頭,,完全可以解決全圖互相關(guān)算法處理的計(jì)算量巨大的問題,,使測速的精度和速度得到進(jìn)一步提高。這種測速方式具有的一系列優(yōu)點(diǎn),,使其發(fā)展空間非常廣闊,,可以廣泛應(yīng)用到各個(gè)領(lǐng)域。
總之,,本文研究的基于FPGA的相關(guān)測速系統(tǒng),,能夠?qū)崿F(xiàn)非接觸式和高精度的測量。其中,,融合了信號采集與處理,、邏輯器件FPGA和互相關(guān)技術(shù)等,具有學(xué)科交叉融合的特點(diǎn),。在各種傳送帶,、紙板、熱軋鋼板,、汽車和列車等運(yùn)動物體的非接觸測速上具有較大的實(shí)際應(yīng)用價(jià)值,,為解決非接觸式運(yùn)動物體測速問題提供了技術(shù)手段。
參考文獻(xiàn)
[1] BERGER C.Optical Sensor for Velocity and Slip Measurement of Automobile Belt Drives[C].IEEE,,2002,,36(l):823-828.
[2] 謝維達(dá),王春輝,,邵德榮.基于FPGA的二維相關(guān)測速方法研究[J].測控技術(shù),,2004,23(1):66-68.
[3] 張志剛.FPGA與SOPC設(shè)計(jì)教程-DE2實(shí)踐[M].西安:西安電子科技大學(xué)出版社,,2007.
[4] 陳忠平,高金定,高見芳.基于Quartus Ⅱ的FPGA/CPLD設(shè)計(jì)與實(shí)踐[M].北京:電子工業(yè)出版社,,2010.
[5] (美)HASKELL R E,HANNA D M.FPGA數(shù)字邏輯設(shè)計(jì)教 程:Verilog[M].鄭利浩,,王荃,,陳華鋒,譯.北京:電子工業(yè)出版社,,2010.
[6] 吳繼華,,蔡海寧,王誠.Altera FPGA/CPLD設(shè)計(jì)(高級篇)(第2版)[M].北京:人民郵電出版社,,2011.