摘 要: 為解決HOG行人檢測(cè)過(guò)程緩慢的問(wèn)題,,在梯度向量直方圖HOG中引入block權(quán)重的概念,,通過(guò)合理篩選block,組成行人的特征向量,,然后使用線性SVM作為分類器,,重新進(jìn)行學(xué)習(xí),達(dá)到減少信息冗余,、提高檢測(cè)效率的目的,。在INRIA庫(kù)上進(jìn)行實(shí)驗(yàn),結(jié)果表明,,通過(guò)合理選擇block,,能夠在不影響檢測(cè)效果的情況下,顯著減少block的數(shù)目,,達(dá)到提高檢測(cè)速度的目的,。
關(guān)鍵詞: HOG;行人檢測(cè),;SVM分類器,;block權(quán)重
計(jì)算機(jī)視覺(jué)處理是計(jì)算機(jī)人工智能的一個(gè)重要研究方向,它的最終目標(biāo)是通過(guò)計(jì)算機(jī)模擬人類視覺(jué),,實(shí)現(xiàn)對(duì)現(xiàn)實(shí)場(chǎng)景的理解和推理,。其中,對(duì)于輸入場(chǎng)景通過(guò)計(jì)算機(jī)實(shí)現(xiàn)目標(biāo)的自動(dòng)識(shí)別分類,,即目標(biāo)識(shí)別,,是實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)的一個(gè)基礎(chǔ)部分,也是目前的一個(gè)研究熱點(diǎn),。比較成功的商業(yè)化應(yīng)用實(shí)例是人臉識(shí)別系統(tǒng),它是通過(guò)計(jì)算機(jī)對(duì)人臉的智能識(shí)別,,實(shí)現(xiàn)對(duì)不同人身份的確認(rèn),。在人體識(shí)別方面,由于人體自身姿態(tài),、衣著的多樣性以及人體外觀變化大,,目前尚沒(méi)有較為成熟的算法,。
目前,人體識(shí)別主要有基于多模板匹配[1],、基于邊緣輪廓特征[2]和基于運(yùn)動(dòng)特征[3]等各種方法,。然而,從實(shí)際效果來(lái)看,,目前最好的是DALAL N和TRIGGS B提出的基于HOG特征的人體檢測(cè)方法[4],。DALAL N等人通過(guò)使用16×16大小的塊在檢測(cè)窗口中滑動(dòng),然后按一定方式統(tǒng)計(jì)塊中的梯度向量直方圖,,將各個(gè)塊的梯度向量直方圖串聯(lián),,組成特征向量,最終利用SVM對(duì)獲取的特征向量進(jìn)行訓(xùn)練,,獲取分類器,。按照該方法,如果選擇檢測(cè)窗口大小是128×64,,block大小為16×16,,cell大小為4×4,bin分為9個(gè)方向,,每次block移動(dòng)8,,那么獲得的向量大小為3 780維,檢測(cè)效果雖然理想,,但是耗時(shí),,難以達(dá)到實(shí)時(shí)性的要求。
本文通過(guò)對(duì)基于HOG特征的人體檢測(cè)算法進(jìn)行分析,,提出了一種基于感興趣區(qū)域進(jìn)行HOG提取的算法,。該算法在適當(dāng)影響檢測(cè)效果的條件下,能夠較好地減少計(jì)算量,,達(dá)到提高計(jì)算速度的目的,。
1 行人檢測(cè)算法
1.1 特征選取
HOG是DALAL N等人在2005年提出的一種基于梯度的特征提取過(guò)程,它的內(nèi)容主要有4點(diǎn):(1)使用梯度作為特征提取對(duì)象,,將梯度向量劃分為統(tǒng)計(jì)bin,;(2)將梯度向量圖劃分為網(wǎng)格狀的cell,以cell為單位統(tǒng)計(jì)梯度向量直方圖,;(3)以block為單位,,對(duì)cell進(jìn)行統(tǒng)計(jì),得到三維梯度向量直方圖,,并進(jìn)行歸一化,,減少局部光照的影響;(4)收集所有的block,,合并成最終圖像的HOG特征向量,。
分別利用3種不同的方法通過(guò)改變決策函數(shù)中的閾值b對(duì)測(cè)試樣本進(jìn)行檢測(cè),,得到漏警率和虛警率的關(guān)系如圖4所示。
由圖4可以看出,,在3種檢測(cè)方式中,,原始HOG檢測(cè)方式檢測(cè)效果最好;通過(guò)人工選擇感興趣區(qū)域,,保留41個(gè)block后提取特征向量進(jìn)行分類,,檢測(cè)效果有一定的下降,這主要是由于人類主觀經(jīng)驗(yàn)的不足,,不能完全合理確定起主要作用的特征,,導(dǎo)致特征選擇不充分的原因。
二次block訓(xùn)練的方法通過(guò)引入block權(quán)重的概念,,利用原始訓(xùn)練得到的決策函數(shù)中的信息來(lái)確定感興趣block,,在選取的block數(shù)目減少到原始的1/5即20個(gè)時(shí),在顯著提高計(jì)算速度的情況下仍然能夠得到較精確的分類器,。
實(shí)驗(yàn)結(jié)果證明,,本文提出的兩種減少特征維數(shù)、提高分類效率的算法在實(shí)際的應(yīng)用中較為有效,。
HOG特征是目前在行人檢測(cè)過(guò)程中較為有效的一種方法,,在人體檢測(cè)過(guò)程中有著很高的識(shí)別率,然而HOG由于計(jì)算量較大,、檢測(cè)速度慢,,因此限制了HOG的應(yīng)用。本文通過(guò)對(duì)HOG的分析,,發(fā)現(xiàn)可以通過(guò)減少HOG中冗余block,,從而減少計(jì)算量,提高檢測(cè)速度,。
參考文獻(xiàn)
[1] 呂治國(guó),,徐昕,賀漢根.基于可變模板和支持向量機(jī)的人體檢測(cè)[J].計(jì)算機(jī)應(yīng)用,,2007(9):2258-2261.
[2] 陳實(shí),,馬天駿,黃萬(wàn)紅,,等.基于形狀上下文描述子的步態(tài)識(shí)別[J].模式識(shí)別與人工智能,,2007(6):794-799.
[3] 韓鴻哲,王志良,,劉冀偉,,等.基于線性判別分析和支持向量機(jī)的步態(tài)識(shí)別[J].模式識(shí)別與人工智能,2005(2):160-164.
[4] DALAL N,, TRIGGS B. Histograms of oriented gradients for human detection[C]. CVPR’05,, 2005.
[5] 焦李成,周偉達(dá),,張莉,,等. 智能目標(biāo)識(shí)別與分類[M].北京:科學(xué)出版社,2010.