《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 基于ROI區(qū)域強(qiáng)分辨力HOG特征的視頻行人檢測(cè)
基于ROI區(qū)域強(qiáng)分辨力HOG特征的視頻行人檢測(cè)
來(lái)源:微型機(jī)與應(yīng)用2013年第7期
張 璐,,陳淑榮
(上海海事大學(xué) 信息工程學(xué)院,,上海 201306)
摘要: 針對(duì)傳統(tǒng)梯度方向直方圖(HOG)行人檢測(cè)系統(tǒng)中檢測(cè)窗掃描區(qū)域過(guò)大,、HOG特征維度大而引起的檢測(cè)速度慢問(wèn)題,提出了改進(jìn)的視頻行人檢測(cè)算法,。通過(guò)運(yùn)動(dòng)信息提取感興趣(ROI)目標(biāo)區(qū)域,,利用Fisher準(zhǔn)則和多尺度特性選取具有強(qiáng)分辨力的行人HOG特征從而降低特征維數(shù),結(jié)合支持向量機(jī)(SVM)檢測(cè)行人,。實(shí)驗(yàn)結(jié)果表明,,本文方法在保證視頻行人檢測(cè)的準(zhǔn)確率的同時(shí),有效地提高了行人檢測(cè)的速率,。
Abstract:
Key words :

摘  要: 針對(duì)傳統(tǒng)梯度方向直方圖(HOG)行人檢測(cè)系統(tǒng)中檢測(cè)窗掃描區(qū)域過(guò)大,、HOG特征維度大而引起的檢測(cè)速度慢問(wèn)題,提出了改進(jìn)的視頻行人檢測(cè)算法,。通過(guò)運(yùn)動(dòng)信息提取感興趣(ROI)目標(biāo)區(qū)域,,利用Fisher準(zhǔn)則和多尺度特性選取具有強(qiáng)分辨力的行人HOG特征從而降低特征維數(shù),結(jié)合支持向量機(jī)(SVM)檢測(cè)行人,。實(shí)驗(yàn)結(jié)果表明,,本文方法在保證視頻行人檢測(cè)的準(zhǔn)確率的同時(shí),有效地提高了行人檢測(cè)的速率,。
關(guān)鍵詞: 行人檢測(cè),;感興趣區(qū)域;梯度方向直方圖,;Fisher準(zhǔn)則

 行人檢測(cè)是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域中的研究熱點(diǎn),在視頻監(jiān)控中有廣泛的應(yīng)用。目前,,用于行人檢測(cè)的方法主要分為3類(lèi):(1)基于運(yùn)動(dòng)信息的方法[1-2],,根據(jù)行人運(yùn)動(dòng)信息(如步態(tài))實(shí)現(xiàn)行人檢測(cè),實(shí)時(shí)性好但只限于運(yùn)動(dòng)行人,;(2)基于先驗(yàn)知識(shí)建模的方法[3],,利用已知先驗(yàn)知識(shí)構(gòu)建人體模板和待測(cè)目標(biāo)進(jìn)行匹配,但模板的初始參數(shù)難以獲??;(3)基于特征統(tǒng)計(jì)分類(lèi)的方法[4-9],根據(jù)訓(xùn)練數(shù)據(jù)獲取有效分類(lèi)器對(duì)輸入檢測(cè)窗口進(jìn)行檢測(cè),,實(shí)現(xiàn)簡(jiǎn)單且檢測(cè)效果較好,,是目前靜態(tài)圖像行人檢測(cè)的主流方法,但對(duì)視頻行人檢測(cè)速度較慢,。因此,,如何保證視頻行人檢測(cè)的準(zhǔn)確率,并提高檢測(cè)速度是一個(gè)急需解決的問(wèn)題,。
1 本文行人檢測(cè)方法
 視頻錄像中行人的不同姿勢(shì),、復(fù)雜的背景變化對(duì)算法的檢測(cè)準(zhǔn)確率和檢測(cè)速度都提出了嚴(yán)格要求。本文提出利用視頻中的運(yùn)動(dòng)信息獲取ROI區(qū)域,,結(jié)合Fisher準(zhǔn)則挑選強(qiáng)分辨力行人HOG特征,,并結(jié)合SVM分類(lèi)器檢測(cè)行人。其中,,訓(xùn)練部分采用正負(fù)樣本庫(kù)提取強(qiáng)分辨力HOG行人特征,,并通過(guò)SVM訓(xùn)練得到強(qiáng)分辨力HOG特征的行人分類(lèi)器。檢測(cè)時(shí)利用幀間信息獲得ROI區(qū)域,,通過(guò)多層次縮放ROI區(qū)域獲取所有檢測(cè)窗,,并利用強(qiáng)分辨力行人HOG特征來(lái)表征檢測(cè)窗中行人,通過(guò)訓(xùn)練好的分類(lèi)器實(shí)現(xiàn)對(duì)視頻中行人的檢測(cè),。該算法框架如圖1所示,。
1.1 視頻圖像ROI目標(biāo)區(qū)域提取
 視頻幀圖像中存在大量的非人區(qū)域,全局掃描需要很多冗余計(jì)算,。本文采用三幀差分法獲取運(yùn)動(dòng)目標(biāo)前景,,進(jìn)行二值化處理、形態(tài)學(xué)處理和前景塊擴(kuò)展,,獲取ROI目標(biāo)區(qū)域,。具體實(shí)現(xiàn)步驟如下。

其中,,u是0~1的一個(gè)值,,w,、h分別表示前景塊的寬、高,。
(5)標(biāo)記擴(kuò)展后的行人目標(biāo)前景塊集合,,構(gòu)建ROI區(qū)域以進(jìn)行后續(xù)的特征提取和檢測(cè)。ROI目標(biāo)區(qū)域提取如圖2所示,。

1.2 強(qiáng)分辨力行人特征提取
1.2.1 多尺度HOG特征
 HOG特征是通過(guò)計(jì)算局部區(qū)域的梯度方向直方圖描述目標(biāo)形狀特征,,對(duì)光照變化和小量的偏移不敏感。DALAL N提出的基本HOG是在64×128的檢測(cè)窗內(nèi)提取105個(gè)16×16等大小的Block特征塊,,利用這些特征塊構(gòu)成描述符來(lái)訓(xùn)練和檢測(cè)行人,。
 等大小的基本HOG特征塊對(duì)描述行人較大的部位(如頭部、身體等)的整體信息能力有限,,因此本文構(gòu)建HOG特征時(shí)采用了多尺度[6]方法,,對(duì)于64×128檢測(cè)窗,Block塊的大小選取依次從16×16到64×128,,寬高比(w∶h)分別取1∶1,、1∶2和2∶1,共獲得452個(gè)不同尺度的Block塊,。
 在特征塊提取過(guò)程中,,為避免特征塊交疊而引起的重復(fù)計(jì)算,引入“積分圖[6]”思想,,每個(gè)像素點(diǎn)的特征由9維向量表示,,即:

2 實(shí)驗(yàn)及結(jié)果分析
 本文實(shí)驗(yàn)在MATLAB2008a上實(shí)現(xiàn),計(jì)算機(jī)環(huán)境配置為3 GHz CPU和2 GB內(nèi)存,。采用的數(shù)據(jù)來(lái)源于INRIA行人數(shù)據(jù)庫(kù)和PETS2006視頻庫(kù),。在提取強(qiáng)分辨力行人特征時(shí),分別將INRIA樣本庫(kù)中的1 000個(gè)正,、負(fù)樣本用于訓(xùn)練和檢測(cè),,并利用強(qiáng)分辨力HOG行人特征分類(lèi)器對(duì)PETS2006視頻庫(kù)的視頻行人進(jìn)行檢測(cè)。實(shí)驗(yàn)采用libsvm工具包,,選用線性SVM訓(xùn)練分類(lèi)器,。
 文中通過(guò)對(duì)單尺度基本HOG擴(kuò)展,得到Block數(shù)為452的多尺度HOG,,并利用Fisher準(zhǔn)則分別對(duì)不同尺度HOG進(jìn)行降維處理,,獲得不同維數(shù)的強(qiáng)分辨力特征,結(jié)合SVM分類(lèi)器驗(yàn)證不同尺度,、不同維度的特征檢測(cè)效果,。實(shí)驗(yàn)結(jié)果如表1所示。

 實(shí)驗(yàn)表明,,擴(kuò)展后的多尺度HOG特征,,SVM分類(lèi)準(zhǔn)確率顯著提高,;相同特征維數(shù)下(表中只列出Block數(shù)為105、30,、10的特征),,多尺度特征比單尺度特征具有更高的檢測(cè)準(zhǔn)確率且降維幅度越大,,多尺度特征優(yōu)勢(shì)越明顯,。
 文中采用設(shè)定最低檢測(cè)率來(lái)提高檢測(cè)速率,利用SVM分類(lèi)的效果來(lái)選擇最佳分辨力特征,。如表1所示,,在多尺度下,當(dāng)選取特征塊數(shù)為10時(shí),,保證了行人檢測(cè)的準(zhǔn)確率,,提取、檢測(cè)的速率比基本HOG都有所提高,,檢測(cè)速率提高了9.7倍,。本文取多尺度下Block數(shù)為10的特征集作為f′select,訓(xùn)練分類(lèi)器進(jìn)行行人檢測(cè)和分類(lèi),。
 實(shí)驗(yàn)通過(guò)ROI目標(biāo)區(qū)域提取,,大大降低了檢測(cè)窗口數(shù)量,并與傳統(tǒng)HOG全局掃描算法,、Adaboost[3,,8]算法作比較。由于本文算法ROI目標(biāo)區(qū)域大小直接受行人數(shù)量,、大小影響,,實(shí)驗(yàn)選取統(tǒng)一的單行人視頻序列進(jìn)行測(cè)試,幀像素大小為720×480,。實(shí)驗(yàn)結(jié)果如表2所示,。

 參考文獻(xiàn)[3,8]提到的Adaboost算法是利用一系列弱分類(lèi)器組合強(qiáng)分類(lèi)器,,根據(jù)每個(gè)樣本分類(lèi)結(jié)果修改權(quán)值進(jìn)行下一層分類(lèi)訓(xùn)練,,訓(xùn)練分類(lèi)器時(shí)依次對(duì)每個(gè)特征集單獨(dú)訓(xùn)練,耗費(fèi)時(shí)間很長(zhǎng),。本文算法采用Fisher準(zhǔn)則提取的強(qiáng)分辨力行人特征訓(xùn)練分類(lèi)器,,特征整體一次投影實(shí)現(xiàn)一次分類(lèi),具有優(yōu)勢(shì),。
實(shí)驗(yàn)證明,,本文算法比全局掃描減少了檢測(cè)窗數(shù)量,顯著提高了檢測(cè)的速率,;在保證準(zhǔn)確率的前提下改進(jìn)單尺度HOG,,利用多尺度降維HOG進(jìn)一步提高行人的檢測(cè)速率,。本文算法不僅大幅度提高了行人檢測(cè)的速率,而且保證了視頻行人檢測(cè)準(zhǔn)確率在90%以上,。
 本文針對(duì)傳統(tǒng)HOG特征在行人檢測(cè)中存在高維度計(jì)算的問(wèn)題,,提出一種利用視頻運(yùn)動(dòng)信息和強(qiáng)分辨力行人HOG特征相結(jié)合的視頻行人檢測(cè)算法。利用INRIA行人庫(kù)和PETS2006視頻庫(kù)驗(yàn)證了算法的有效性,。后續(xù)將針對(duì)夜間,、雨天等復(fù)雜背景,進(jìn)一步驗(yàn)證和改進(jìn)算法,。
參考文獻(xiàn)
[1] 劉鑫,,劉輝,強(qiáng)振平,,等.混合高斯模型和幀間差分相融合的自適應(yīng)背景模型[J].中國(guó)圖象圖形學(xué)報(bào),,2008,4:729-734.
[2] 王成亮,,周佳,,黃晟.基于高斯混合模型與PCA_HOG的快速運(yùn)動(dòng)人體檢測(cè)[J].計(jì)算機(jī)應(yīng)用研究,2012,,29(6):2156-2160.
[3] 周晨卉,,王生進(jìn),丁曉青.基于局部特征級(jí)聯(lián)分類(lèi)器和模板匹配的行人檢測(cè)[J].中國(guó)圖象圖形學(xué)報(bào),,2010,,15(5):824-829.
[4] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition,, CVPR2005,, 2005,1:886-893.
[5] 孫昀,,劉富強(qiáng),,李志鵬.基于穩(wěn)定區(qū)域梯度直方圖的行人檢測(cè)方法[J].計(jì)算機(jī)輔助設(shè)計(jì)圖形學(xué)報(bào),2012,,24(3):372-377.
[6] 黃茜,,顧杰鋒,楊文亮.基于梯度向量直方圖的行人檢測(cè)[J].科學(xué)技術(shù)與工程,,2009(13):3646-3651.
[7] 姚雪琴,,李曉華,周激流.基于邊緣對(duì)稱行和HOG的行人檢測(cè)方法[J].人工智能及識(shí)別技術(shù),,2012,,38(5):179-182.
[8] 種衍文,匡湖林,李清泉.一種基于多特征和機(jī)器學(xué)習(xí)的分級(jí)行人檢測(cè)方法[J].自動(dòng)化學(xué)報(bào).2012,,38(3):375-381.

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。