基于ROI區(qū)域強分辨力HOG特征的視頻行人檢測-AET-電子技術應用

基于ROI區(qū)域強分辨力HOG特征的視頻行人檢測

來源：微型機與應用2013年第7期

張璐，陳淑榮

（上海海事大學信息工程學院，上海 201306）

摘要： 針對傳統(tǒng)梯度方向直方圖（HOG）行人檢測系統(tǒng)中檢測窗掃描區(qū)域過大、HOG特征維度大而引起的檢測速度慢問題，提出了改進的視頻行人檢測算法。通過運動信息提取感興趣（ROI）目標區(qū)域，利用Fisher準則和多尺度特性選取具有強分辨力的行人HOG特征從而降低特征維數(shù)，結合支持向量機（SVM）檢測行人。實驗結果表明，本文方法在保證視頻行人檢測的準確率的同時，有效地提高了行人檢測的速率。

關鍵詞： 計算機視覺圖像處理行人檢測感興趣區(qū)域梯度方向直方圖 Fisher準則

Abstract：

Key words :

　行人檢測是計算機視覺和模式識別領域中的研究熱點，在視頻監(jiān)控中有廣泛的應用。目前，用于行人檢測的方法主要分為3類：（1）基于運動信息的方法[1-2]，根據(jù)行人運動信息（如步態(tài)）實現(xiàn)行人檢測，實時性好但只限于運動行人；（2）基于先驗知識建模的方法[3]，利用已知先驗知識構建人體模板和待測目標進行匹配，但模板的初始參數(shù)難以獲取；（3）基于特征統(tǒng)計分類的方法[4-9]，根據(jù)訓練數(shù)據(jù)獲取有效分類器對輸入檢測窗口進行檢測，實現(xiàn)簡單且檢測效果較好，是目前靜態(tài)圖像行人檢測的主流方法，但對視頻行人檢測速度較慢。因此，如何保證視頻行人檢測的準確率，并提高檢測速度是一個急需解決的問題。
1 本文行人檢測方法
　視頻錄像中行人的不同姿勢、復雜的背景變化對算法的檢測準確率和檢測速度都提出了嚴格要求。本文提出利用視頻中的運動信息獲取ROI區(qū)域，結合Fisher準則挑選強分辨力行人HOG特征，并結合SVM分類器檢測行人。其中，訓練部分采用正負樣本庫提取強分辨力HOG行人特征，并通過SVM訓練得到強分辨力HOG特征的行人分類器。檢測時利用幀間信息獲得ROI區(qū)域，通過多層次縮放ROI區(qū)域獲取所有檢測窗，并利用強分辨力行人HOG特征來表征檢測窗中行人，通過訓練好的分類器實現(xiàn)對視頻中行人的檢測。該算法框架如圖1所示。
1.1 視頻圖像ROI目標區(qū)域提取
　視頻幀圖像中存在大量的非人區(qū)域，全局掃描需要很多冗余計算。本文采用三幀差分法獲取運動目標前景，進行二值化處理、形態(tài)學處理和前景塊擴展，獲取ROI目標區(qū)域。具體實現(xiàn)步驟如下。

其中，ｕ是0~1的一個值，w、h分別表示前景塊的寬、高。
（5）標記擴展后的行人目標前景塊集合，構建ROI區(qū)域以進行后續(xù)的特征提取和檢測。ROI目標區(qū)域提取如圖2所示。

1.2 強分辨力行人特征提取
1.2.1 多尺度HOG特征
　HOG特征是通過計算局部區(qū)域的梯度方向直方圖描述目標形狀特征，對光照變化和小量的偏移不敏感。DALAL N提出的基本HOG是在64×128的檢測窗內提取105個16×16等大小的Block特征塊，利用這些特征塊構成描述符來訓練和檢測行人。
　等大小的基本HOG特征塊對描述行人較大的部位（如頭部、身體等）的整體信息能力有限，因此本文構建HOG特征時采用了多尺度[6]方法，對于64×128檢測窗，Block塊的大小選取依次從16×16到64×128，寬高比（w∶h）分別取1∶1、1∶2和2∶1，共獲得452個不同尺度的Block塊。
　在特征塊提取過程中，為避免特征塊交疊而引起的重復計算，引入“積分圖[6]”思想，每個像素點的特征由9維向量表示，即：

2 實驗及結果分析
　本文實驗在MATLAB2008a上實現(xiàn)，計算機環(huán)境配置為3 GHz CPU和2 GB內存。采用的數(shù)據(jù)來源于INRIA行人數(shù)據(jù)庫和PETS2006視頻庫。在提取強分辨力行人特征時，分別將INRIA樣本庫中的1 000個正、負樣本用于訓練和檢測，并利用強分辨力HOG行人特征分類器對PETS2006視頻庫的視頻行人進行檢測。實驗采用libsvm工具包，選用線性SVM訓練分類器。
　文中通過對單尺度基本HOG擴展，得到Block數(shù)為452的多尺度HOG，并利用Fisher準則分別對不同尺度HOG進行降維處理，獲得不同維數(shù)的強分辨力特征，結合SVM分類器驗證不同尺度、不同維度的特征檢測效果。實驗結果如表1所示。

　實驗表明，擴展后的多尺度HOG特征，SVM分類準確率顯著提高；相同特征維數(shù)下（表中只列出Block數(shù)為105、30、10的特征），多尺度特征比單尺度特征具有更高的檢測準確率且降維幅度越大，多尺度特征優(yōu)勢越明顯。
　文中采用設定最低檢測率來提高檢測速率，利用SVM分類的效果來選擇最佳分辨力特征。如表1所示，在多尺度下，當選取特征塊數(shù)為10時，保證了行人檢測的準確率，提取、檢測的速率比基本HOG都有所提高，檢測速率提高了9.7倍。本文取多尺度下Block數(shù)為10的特征集作為f′select，訓練分類器進行行人檢測和分類。
　實驗通過ROI目標區(qū)域提取，大大降低了檢測窗口數(shù)量，并與傳統(tǒng)HOG全局掃描算法、Adaboost[3，8]算法作比較。由于本文算法ROI目標區(qū)域大小直接受行人數(shù)量、大小影響，實驗選取統(tǒng)一的單行人視頻序列進行測試，幀像素大小為720×480。實驗結果如表2所示。

　參考文獻[3，8]提到的Adaboost算法是利用一系列弱分類器組合強分類器，根據(jù)每個樣本分類結果修改權值進行下一層分類訓練，訓練分類器時依次對每個特征集單獨訓練，耗費時間很長。本文算法采用Fisher準則提取的強分辨力行人特征訓練分類器，特征整體一次投影實現(xiàn)一次分類，具有優(yōu)勢。
實驗證明，本文算法比全局掃描減少了檢測窗數(shù)量，顯著提高了檢測的速率；在保證準確率的前提下改進單尺度HOG，利用多尺度降維HOG進一步提高行人的檢測速率。本文算法不僅大幅度提高了行人檢測的速率，而且保證了視頻行人檢測準確率在90%以上。
　本文針對傳統(tǒng)HOG特征在行人檢測中存在高維度計算的問題，提出一種利用視頻運動信息和強分辨力行人HOG特征相結合的視頻行人檢測算法。利用INRIA行人庫和PETS2006視頻庫驗證了算法的有效性。后續(xù)將針對夜間、雨天等復雜背景，進一步驗證和改進算法。
參考文獻
[1] 劉鑫，劉輝，強振平，等.混合高斯模型和幀間差分相融合的自適應背景模型[J].中國圖象圖形學報，2008，4：729-734.
[2] 王成亮，周佳，黃晟.基于高斯混合模型與PCA_HOG的快速運動人體檢測[J].計算機應用研究，2012，29（6）：2156-2160.
[3] 周晨卉，王生進，丁曉青.基于局部特征級聯(lián)分類器和模板匹配的行人檢測[J].中國圖象圖形學報，2010，15（5）：824-829.
[4] DALAL N， TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition， CVPR2005， 2005，1：886-893.
[5] 孫昀，劉富強，李志鵬.基于穩(wěn)定區(qū)域梯度直方圖的行人檢測方法[J].計算機輔助設計圖形學報，2012，24（3）：372-377.
[6] 黃茜，顧杰鋒，楊文亮.基于梯度向量直方圖的行人檢測[J].科學技術與工程，2009（13）：3646-3651.
[7] 姚雪琴，李曉華，周激流.基于邊緣對稱行和HOG的行人檢測方法[J].人工智能及識別技術，2012，38（5）：179-182.
[8] 種衍文，匡湖林，李清泉.一種基于多特征和機器學習的分級行人檢測方法[J].自動化學報.2012，38（3）：375-381.

原創(chuàng)聲明：此內容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權禁止轉載。

相關內容