文獻標識碼: A
文章編號: 0258-7998(2013)12-0141-04
運動目標檢測與跟蹤是在動態(tài)圖像分析的基礎(chǔ)上,結(jié)合圖像模式識別和圖像跟蹤方法對圖像序列中的目標進行檢測,、識別、跟蹤的過程,。人體目標識別與跟蹤是該領(lǐng)域的重要課題之一,,在安防監(jiān)控、客流統(tǒng)計等方面應(yīng)用廣泛,。
目前目標跟蹤算法可以分為兩類:(1)基于模型的方法,,如模板匹配、圖像分割和活動輪廓法[1]。以Mean Shift算法和Snake算法為代表,,其中Mean Shift以目標顏色進行建模,,具有較好的實時性和跟蹤性能,但目標顏色與背景顏色接近時跟蹤失??;Snake算法基于目標輪廓進行跟蹤,受目標初始形狀和位置影響較大,,計算量大不適合實時操作,。(2)基于運動的方法,如光流法和特特征點法[1],,現(xiàn)有的基于特征點跟蹤算以目標的質(zhì)心或任意特征點實現(xiàn)對目標的跟蹤,,在處理多目標跟蹤時效果較差[2]。
本文提出了將檢測區(qū)按32×32像素點進行分割,,以圖像序列多狀態(tài)轉(zhuǎn)移綜合判定前景目標和背景的情況,,完成背景的提取與更新;基于運動的方法,,提出利用目標的亮度和顏色信息,,以及在圖像序列中的相對位置來構(gòu)建代價函數(shù)的算法,進行目標特征匹配與跟蹤,,改善多目標情況下的跟蹤性能,。以商場客流統(tǒng)計為例,從人體目標運動檢測、特征匹配跟蹤和計數(shù)三方面展開論述,。
1 人體運動檢測
在客流量統(tǒng)計中運動目標檢測有獲取目標在場景中的位置信息及獲取目標盡可能多的特征信息兩個任務(wù),。
商場客流統(tǒng)計攝像頭常安裝于出入口正上方垂直向下攝取圖像,屬于靜止背景的目標識別,,常用算法有幀間差分法,、背景差分法和光流法。
1.1 幀間差分法
幀差法具有運算量小,、對光照和陰影等外界因素不敏感的優(yōu)點,。但其缺點也非常明顯:無法檢測出靜止或移動速度緩慢的目標,相反在目標移動較快時,,檢測出來的目標又遠大于實際目標,;亮度、顏色等特征單一的目標在差分運算后將形成較大的空洞,,造成差分結(jié)果不連通,,即便進行圖像的膨脹和腐蝕等形態(tài)學(xué)方面的處理,也不能消除空洞的影響,。圖1所示為相鄰兩幀差分結(jié)果信息相對豐富,,而圖2(a)中目標信息單一,,圖2(b)差分結(jié)果只有目標輪廓,采用參考文獻[3]等改進的差分算法對運動目標進行提取,,結(jié)果如圖2(c)所示,。
1.2 背景分塊更新算法
背景差與幀間差相比,檢測出的目標內(nèi)部區(qū)域不會出現(xiàn)較大的空洞,,可以將目標完整提取出來,,獲取豐富的特征信息,便于目標的匹配跟蹤,。
常用的方法包括基于卡爾曼濾波模型,、基于高斯背景模型和基于簡單概率統(tǒng)計的方法等,前兩種方法實現(xiàn)過程較為復(fù)雜,,且算法的實現(xiàn)對硬件要求高,。第三種方法在沒有運動目標長時間滯留的情況下效果較好,且運算量不大,,符合實時性要求,;在實際應(yīng)用中,由于天氣,、光照等外界條件的變化,,或目標長時間滯留,影響了背景的準確更新,,由此可能會得到虛假的運動目標,,從而造成誤判。
基于概率統(tǒng)計的背景更新方法,,常以一段時間內(nèi)序列幀圖像每個像素做差分運算,,滿足預(yù)設(shè)條件,則進行背景更新[4],。如圖3所示,,按32×32像素大小將檢測區(qū)域進行分割,對每個分塊圖像按照圖4所示將其分成初始狀態(tài)Status0,當三幀差結(jié)果判定圖像無前景目標和干擾時,進入Status1取背景數(shù)據(jù)BG1;在該狀態(tài)若有前景目標運動,則進入Status2;當前景目標消失,、圖像恢復(fù)靜止,則進入Status3取背景數(shù)據(jù)BG3,,據(jù)BG1、BG3差分運算判定進行背景更新,,否則返回Status0,。
圖4中,②主要判斷是否有前景運動目標存在,,與①檢測圖像細微變化不同,,人體運動時幀差結(jié)果較大、差分像素點數(shù)也較大,,故將步驟(2)中的亮度閾值LumT1修改為LumT2=2LumT1,步驟(4)中閾值CntT1修改為CntT2=10CntT1。當Cnti i=1,2,3均大于CntT2時判定有前景目標移動Flag2=1,,由Status1跳轉(zhuǎn)到Status2,。
對所有分塊區(qū)域按照圖4方法進行背景更新,可以得到整個檢測區(qū)的背景數(shù)據(jù),。
1.3 光流法
光流法的優(yōu)點在于能夠檢測獨立運動的目標,,對背景處于靜態(tài)或是動態(tài)的環(huán)境均能適用,但是計算量較大,,無法保證實用性和實時性[1],。
2 人體運動目標跟蹤和計數(shù)
采用分塊更新的方法可準確提取背景信息有效檢測出前景目標,識別人體運動,。在此基礎(chǔ)上實現(xiàn)人體特征結(jié)點的創(chuàng)建,、跟蹤和計數(shù)。
2.1 虛擬檢測區(qū)
圖3中將檢測區(qū)域劃分為3個區(qū)域,、2條計數(shù)線,,分別是:
①③創(chuàng)建區(qū),創(chuàng)建人體特征結(jié)點,;
②跟蹤區(qū),,匹配人體特征信息,跟蹤人體運動,;
④出計數(shù)線,當人體從③區(qū)域跨過該計數(shù)線時,,出計數(shù)值加1,標注為⑦,。
⑤進計數(shù)線,,當人體從①區(qū)跨過該計數(shù)線時,進計數(shù)值加1,,標注為⑥,。
2.2 人體特征結(jié)點的創(chuàng)建
采用9宮格方法查找背景差結(jié)果的連通域[5],得到圖3中⑧所示的人體目標的位置,、長寬信息,,綜合判斷其是否在①③區(qū)域,以及長寬大小,、比例等信息,,創(chuàng)建該目標Person[i], i為人體目標序號, i=[1:I],I為當前場景下目標個數(shù),,其信息如下:
Person[i].x第i個人中心位置x坐標,;
Person[i].y第i個人中心位置y坐標;
Person[i].W人體寬度,;
Person[i].H人體高度,;
Person[i].Cnt包含的特征方塊個數(shù),;
Person[i].Dir 創(chuàng)建區(qū)域。
而該目標的特征信息由PsnFeature[i][m]表示,,m表示特征方塊序號,,m=[1:Person[i].Cnt]
PsnFeature[i][m].x該特征方塊x坐標;
PsnFeature[i][m].y該特征方塊y坐標,;
PsnFeature[i][m].Ymean 該特征塊Y分量均值,;
PsnFeature[i][m].Umean 該特征塊U分量均值;
PsnFeature[i][m].Vmean 該特征塊V分量均值,;
Y,、U、V均值采用算術(shù)平均的方法獲得,。
2.3 特征匹配與跟蹤
目標在檢測區(qū)域內(nèi)運動軌跡無規(guī)律可循,,特別是當人流量較大時,人體的運動軌跡雜亂,。提出以目標特征信息進行匹配,、跟蹤的算法,步驟如下:
(1)獲取當前幀數(shù)據(jù)與背景做差分運算,;
(2)查找連通域,,去除干擾點保存變量為:
Zone[k].x 第k個連通域中心x坐標;
Zone[k].y第k個連通域中心y坐標;
Zone[k].Cnt 第k個連通域特征方塊個數(shù)。
k=[1:K],K為當前計算的滿足條件的連通域個數(shù),隸屬于第k個連通域的特征信息方塊,,表示為變量ZoneFeature[k][m],,其中m=[1:Zone[k].Cnt]
ZoneFeature[k][m].x第m個方塊x坐標;
ZoneFeature[k][m].y第m個方塊y坐標;
ZoneFeature[k][m].Ymean特征塊Y分量均值;
ZoneFeature[k][m].Umean特征塊U分量均值;
ZoneFeature[k][m].Vmean特征塊V分量均值。
(3)計算第i個目標與第k個連通域(k=[1:K])的距離和顏色特征差異保存為變量CompDist[i][k]和CompRes[i][k],并做歸一化處理,,構(gòu)建代價函數(shù),,得到第i個目標與所有連通域的代價函數(shù)值CstFun[i][k]=0.6CompDist[i][k]+0.4CompRes[i][k]。
(4)將步驟(3)重復(fù)I次,,得到I×K的代價函數(shù)矩陣CstFun,;
(5)由CstFun得到與第i個目標最為匹配的連通域,即滿足CstFun[i][k]最小的序號k,,用Zone[k]變量更新Person[i]變量,,用ZoneFeature[k]更新PsnFeature[i]變量,完成目標跟蹤,。
圖5所示為采用該算法對走出某賣場出入口的兩人進行跟蹤的結(jié)果,。
2.4 計數(shù)
Person[i]跟隨第i個目標的運動不斷被更新,當滿足2.1節(jié)所述條件時計數(shù),,之后將Person[i]結(jié)點刪除,,其他出邊界的情況則只刪除結(jié)點不計數(shù)。
3 算法實現(xiàn)和結(jié)果分析
TMS320DM648是一款針對多媒體處理和視頻安全與監(jiān)控領(lǐng)域,基于VelociTITM超長指令結(jié)構(gòu)的高性價比的單核DSP芯片,。結(jié)合視頻解碼芯片TVP5154,,視頻編碼SAA7015實現(xiàn)了4路PAL格式視頻輸入,,1路PAL格式視頻輸出的商場客流統(tǒng)計系統(tǒng),其結(jié)構(gòu)如圖6所示[6],。
將該系統(tǒng)成功應(yīng)用于某家電賣場,,其中抽取了2個時間段共7 h,統(tǒng)計結(jié)果如表1所示,現(xiàn)場人工計數(shù)為實際值,,系統(tǒng)計數(shù)為檢測值。由表1可見統(tǒng)計準確率保持在95%左右,,注意到 “正大門”,、“通信門”和“數(shù)碼門”這3個門在2個時間段內(nèi)系統(tǒng)均多計,而“服務(wù)門”均少計,,說明算法性能穩(wěn)定,,不會出現(xiàn)忽多計、忽少計的情況,。
本文針對基于概率模型的背景更新方法進行了改進,,更新了背景分區(qū)域,提高了背景更新的可靠性和準確性,。在此基礎(chǔ)上提出了以目標位置,、亮度和顏色構(gòu)建代價函數(shù)的特征匹配和跟蹤算法,并將其成功應(yīng)用于商場客流統(tǒng)計系統(tǒng),,在TMS320DM648硬件平臺同時處理4路PAL視頻,,且客流統(tǒng)計準確率穩(wěn)定在95%。結(jié)果表明,,該算法有較好的目標識別,、匹配和跟蹤能力。
參考文獻
[1] 趙艷啟. 運動目標識別與跟蹤算法的研究[D].南京:河海大學(xué),2005.
[2] 金鑫.基于改進特征跟蹤的客流量統(tǒng)計[J].計算機工程,,2012,38(15):175-178.
[3] 丁磊,宮寧生.基于改進的三幀差分法運動目標檢測[J].電視技術(shù),,2013,37(1):151-153.
[4] 曹海青.基于全局和局部特征的目標識別研究[J].微型機與應(yīng)用,2011,30(14):41-43.
[5] 孫抗,汪渤,鄭智輝.基于局部亮度直方圖特征的實時目標識別與跟蹤[J].系統(tǒng)工程與電子技術(shù),2011,33(9):
1927-1931.
[6] 王文武.嵌入式客流量統(tǒng)計模塊的設(shè)計和實現(xiàn)[J].電子技術(shù)應(yīng)用,,2011,37(8):33-35.