《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于ROI區(qū)域強(qiáng)分辨力HOG特征的視頻行人檢測
基于ROI區(qū)域強(qiáng)分辨力HOG特征的視頻行人檢測
來源:微型機(jī)與應(yīng)用2013年第7期
張 璐,,陳淑榮
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
摘要: 針對傳統(tǒng)梯度方向直方圖(HOG)行人檢測系統(tǒng)中檢測窗掃描區(qū)域過大、HOG特征維度大而引起的檢測速度慢問題,,提出了改進(jìn)的視頻行人檢測算法,。通過運(yùn)動信息提取感興趣(ROI)目標(biāo)區(qū)域,利用Fisher準(zhǔn)則和多尺度特性選取具有強(qiáng)分辨力的行人HOG特征從而降低特征維數(shù),,結(jié)合支持向量機(jī)(SVM)檢測行人,。實(shí)驗(yàn)結(jié)果表明,本文方法在保證視頻行人檢測的準(zhǔn)確率的同時,,有效地提高了行人檢測的速率,。
Abstract:
Key words :

摘  要: 針對傳統(tǒng)梯度方向直方圖(HOG)行人檢測系統(tǒng)中檢測窗掃描區(qū)域過大、HOG特征維度大而引起的檢測速度慢問題,,提出了改進(jìn)的視頻行人檢測算法,。通過運(yùn)動信息提取感興趣(ROI)目標(biāo)區(qū)域,利用Fisher準(zhǔn)則和多尺度特性選取具有強(qiáng)分辨力的行人HOG特征從而降低特征維數(shù),,結(jié)合支持向量機(jī)(SVM)檢測行人,。實(shí)驗(yàn)結(jié)果表明,本文方法在保證視頻行人檢測的準(zhǔn)確率的同時,,有效地提高了行人檢測的速率,。
關(guān)鍵詞: 行人檢測;感興趣區(qū)域,;梯度方向直方圖,;Fisher準(zhǔn)則

 行人檢測是計(jì)算機(jī)視覺和模式識別領(lǐng)域中的研究熱點(diǎn),在視頻監(jiān)控中有廣泛的應(yīng)用,。目前,,用于行人檢測的方法主要分為3類:(1)基于運(yùn)動信息的方法[1-2],根據(jù)行人運(yùn)動信息(如步態(tài))實(shí)現(xiàn)行人檢測,,實(shí)時性好但只限于運(yùn)動行人,;(2)基于先驗(yàn)知識建模的方法[3],利用已知先驗(yàn)知識構(gòu)建人體模板和待測目標(biāo)進(jìn)行匹配,,但模板的初始參數(shù)難以獲?。唬?)基于特征統(tǒng)計(jì)分類的方法[4-9],,根據(jù)訓(xùn)練數(shù)據(jù)獲取有效分類器對輸入檢測窗口進(jìn)行檢測,,實(shí)現(xiàn)簡單且檢測效果較好,是目前靜態(tài)圖像行人檢測的主流方法,,但對視頻行人檢測速度較慢。因此,,如何保證視頻行人檢測的準(zhǔn)確率,,并提高檢測速度是一個急需解決的問題。
1 本文行人檢測方法
 視頻錄像中行人的不同姿勢,、復(fù)雜的背景變化對算法的檢測準(zhǔn)確率和檢測速度都提出了嚴(yán)格要求,。本文提出利用視頻中的運(yùn)動信息獲取ROI區(qū)域,,結(jié)合Fisher準(zhǔn)則挑選強(qiáng)分辨力行人HOG特征,并結(jié)合SVM分類器檢測行人,。其中,,訓(xùn)練部分采用正負(fù)樣本庫提取強(qiáng)分辨力HOG行人特征,并通過SVM訓(xùn)練得到強(qiáng)分辨力HOG特征的行人分類器,。檢測時利用幀間信息獲得ROI區(qū)域,,通過多層次縮放ROI區(qū)域獲取所有檢測窗,并利用強(qiáng)分辨力行人HOG特征來表征檢測窗中行人,,通過訓(xùn)練好的分類器實(shí)現(xiàn)對視頻中行人的檢測,。該算法框架如圖1所示。
1.1 視頻圖像ROI目標(biāo)區(qū)域提取
 視頻幀圖像中存在大量的非人區(qū)域,,全局掃描需要很多冗余計(jì)算,。本文采用三幀差分法獲取運(yùn)動目標(biāo)前景,進(jìn)行二值化處理,、形態(tài)學(xué)處理和前景塊擴(kuò)展,,獲取ROI目標(biāo)區(qū)域。具體實(shí)現(xiàn)步驟如下,。

其中,,u是0~1的一個值,w,、h分別表示前景塊的寬,、高。
(5)標(biāo)記擴(kuò)展后的行人目標(biāo)前景塊集合,,構(gòu)建ROI區(qū)域以進(jìn)行后續(xù)的特征提取和檢測,。ROI目標(biāo)區(qū)域提取如圖2所示。

1.2 強(qiáng)分辨力行人特征提取
1.2.1 多尺度HOG特征
 HOG特征是通過計(jì)算局部區(qū)域的梯度方向直方圖描述目標(biāo)形狀特征,,對光照變化和小量的偏移不敏感,。DALAL N提出的基本HOG是在64×128的檢測窗內(nèi)提取105個16×16等大小的Block特征塊,利用這些特征塊構(gòu)成描述符來訓(xùn)練和檢測行人,。
 等大小的基本HOG特征塊對描述行人較大的部位(如頭部,、身體等)的整體信息能力有限,因此本文構(gòu)建HOG特征時采用了多尺度[6]方法,,對于64×128檢測窗,,Block塊的大小選取依次從16×16到64×128,寬高比(w∶h)分別取1∶1,、1∶2和2∶1,,共獲得452個不同尺度的Block塊。
 在特征塊提取過程中,,為避免特征塊交疊而引起的重復(fù)計(jì)算,,引入“積分圖[6]”思想,,每個像素點(diǎn)的特征由9維向量表示,即:

2 實(shí)驗(yàn)及結(jié)果分析
 本文實(shí)驗(yàn)在MATLAB2008a上實(shí)現(xiàn),,計(jì)算機(jī)環(huán)境配置為3 GHz CPU和2 GB內(nèi)存,。采用的數(shù)據(jù)來源于INRIA行人數(shù)據(jù)庫和PETS2006視頻庫。在提取強(qiáng)分辨力行人特征時,,分別將INRIA樣本庫中的1 000個正,、負(fù)樣本用于訓(xùn)練和檢測,并利用強(qiáng)分辨力HOG行人特征分類器對PETS2006視頻庫的視頻行人進(jìn)行檢測,。實(shí)驗(yàn)采用libsvm工具包,,選用線性SVM訓(xùn)練分類器。
 文中通過對單尺度基本HOG擴(kuò)展,,得到Block數(shù)為452的多尺度HOG,,并利用Fisher準(zhǔn)則分別對不同尺度HOG進(jìn)行降維處理,獲得不同維數(shù)的強(qiáng)分辨力特征,,結(jié)合SVM分類器驗(yàn)證不同尺度,、不同維度的特征檢測效果。實(shí)驗(yàn)結(jié)果如表1所示,。

 實(shí)驗(yàn)表明,,擴(kuò)展后的多尺度HOG特征,SVM分類準(zhǔn)確率顯著提高,;相同特征維數(shù)下(表中只列出Block數(shù)為105,、30、10的特征),,多尺度特征比單尺度特征具有更高的檢測準(zhǔn)確率且降維幅度越大,,多尺度特征優(yōu)勢越明顯。
 文中采用設(shè)定最低檢測率來提高檢測速率,,利用SVM分類的效果來選擇最佳分辨力特征,。如表1所示,在多尺度下,,當(dāng)選取特征塊數(shù)為10時,,保證了行人檢測的準(zhǔn)確率,提取,、檢測的速率比基本HOG都有所提高,,檢測速率提高了9.7倍。本文取多尺度下Block數(shù)為10的特征集作為f′select,,訓(xùn)練分類器進(jìn)行行人檢測和分類,。
 實(shí)驗(yàn)通過ROI目標(biāo)區(qū)域提取,大大降低了檢測窗口數(shù)量,并與傳統(tǒng)HOG全局掃描算法,、Adaboost[3,8]算法作比較,。由于本文算法ROI目標(biāo)區(qū)域大小直接受行人數(shù)量,、大小影響,實(shí)驗(yàn)選取統(tǒng)一的單行人視頻序列進(jìn)行測試,,幀像素大小為720×480,。實(shí)驗(yàn)結(jié)果如表2所示。

 參考文獻(xiàn)[3,,8]提到的Adaboost算法是利用一系列弱分類器組合強(qiáng)分類器,,根據(jù)每個樣本分類結(jié)果修改權(quán)值進(jìn)行下一層分類訓(xùn)練,訓(xùn)練分類器時依次對每個特征集單獨(dú)訓(xùn)練,,耗費(fèi)時間很長,。本文算法采用Fisher準(zhǔn)則提取的強(qiáng)分辨力行人特征訓(xùn)練分類器,特征整體一次投影實(shí)現(xiàn)一次分類,,具有優(yōu)勢,。
實(shí)驗(yàn)證明,本文算法比全局掃描減少了檢測窗數(shù)量,,顯著提高了檢測的速率,;在保證準(zhǔn)確率的前提下改進(jìn)單尺度HOG,利用多尺度降維HOG進(jìn)一步提高行人的檢測速率,。本文算法不僅大幅度提高了行人檢測的速率,,而且保證了視頻行人檢測準(zhǔn)確率在90%以上。
 本文針對傳統(tǒng)HOG特征在行人檢測中存在高維度計(jì)算的問題,,提出一種利用視頻運(yùn)動信息和強(qiáng)分辨力行人HOG特征相結(jié)合的視頻行人檢測算法,。利用INRIA行人庫和PETS2006視頻庫驗(yàn)證了算法的有效性。后續(xù)將針對夜間,、雨天等復(fù)雜背景,,進(jìn)一步驗(yàn)證和改進(jìn)算法。
參考文獻(xiàn)
[1] 劉鑫,,劉輝,,強(qiáng)振平,等.混合高斯模型和幀間差分相融合的自適應(yīng)背景模型[J].中國圖象圖形學(xué)報(bào),,2008,,4:729-734.
[2] 王成亮,周佳,,黃晟.基于高斯混合模型與PCA_HOG的快速運(yùn)動人體檢測[J].計(jì)算機(jī)應(yīng)用研究,,2012,29(6):2156-2160.
[3] 周晨卉,王生進(jìn),,丁曉青.基于局部特征級聯(lián)分類器和模板匹配的行人檢測[J].中國圖象圖形學(xué)報(bào),,2010,15(5):824-829.
[4] DALAL N,, TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition,, CVPR2005, 2005,,1:886-893.
[5] 孫昀,,劉富強(qiáng),李志鵬.基于穩(wěn)定區(qū)域梯度直方圖的行人檢測方法[J].計(jì)算機(jī)輔助設(shè)計(jì)圖形學(xué)報(bào),,2012,,24(3):372-377.
[6] 黃茜,顧杰鋒,,楊文亮.基于梯度向量直方圖的行人檢測[J].科學(xué)技術(shù)與工程,,2009(13):3646-3651.
[7] 姚雪琴,李曉華,,周激流.基于邊緣對稱行和HOG的行人檢測方法[J].人工智能及識別技術(shù),,2012,38(5):179-182.
[8] 種衍文,,匡湖林,,李清泉.一種基于多特征和機(jī)器學(xué)習(xí)的分級行人檢測方法[J].自動化學(xué)報(bào).2012,38(3):375-381.

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。