《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 一種基于SSD與FRN相結(jié)合的密集連接行人檢測算法
一種基于SSD與FRN相結(jié)合的密集連接行人檢測算法
2020年信息技術(shù)與網(wǎng)絡(luò)安全第12期
馮婷婷,,葛華勇,,孫家慧
東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,,上海201620
摘要: 現(xiàn)實(shí)場景行人的復(fù)雜性和多樣性使得行人檢測成為計(jì)算機(jī)視覺領(lǐng)域中一個既具有研究價值又極具挑戰(zhàn)性的熱門課題,為提高其準(zhǔn)確性,,提出一種基于SSD(Single Shot Multibox Detector)與FRN(Filter Response Normalization)相結(jié)合的密集連接行人檢測算法,將串聯(lián)式的SSD基礎(chǔ)網(wǎng)絡(luò)修改為引入上下文語義信息的多層融合的密集連接的FRN網(wǎng)絡(luò)結(jié)構(gòu),運(yùn)用聚類思想設(shè)置適宜行人尺度的候選框,,并且根據(jù)行人尺寸的統(tǒng)計(jì)分布規(guī)律調(diào)整不同檢測層的縮放因子,,從而實(shí)現(xiàn)端到端訓(xùn)練,。在融合數(shù)據(jù)集和VOC2007TEST數(shù)據(jù)集上驗(yàn)證該模型的性能,,相比于SSD方法,該方法準(zhǔn)確率AP(Average Precision)分別提高5.8%,、2.9%,具有更高的準(zhǔn)確性和魯棒性,。
中圖分類號: TP301.6
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.010
引用格式: 馮婷婷,,葛華勇,孫家慧. 一種基于SSD與FRN相結(jié)合的密集連接行人檢測算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2020,,39(12):56-60,66.
A densely connected pedestrian detection algorithm based on the combination of SSD and FRN
Feng Tingting,,Ge Huayong,,Sun Jiahui
School of Information Science and Technology,Donghua University,,Shanghai 201620,,China
Abstract: The complexity and diversity of pedestrians in real scenes make pedestrian detection a hot topic with both research value and challenge in the field of computer vision. In order to improve its accuracy, this paper proposes a densely connected pedestrian detection algorithm based on the combination of SSD and FRN, modifies the serial SSD basic network into a multi-layered densely-connected FRN network structure that introduces contextual semantic information, and uses clustering ideas to set candidate boxes suitable for pedestrian scale, and adjusts the scaling factors of different detection layers according to the statistical distribution law of pedestrian size, so as to achieve end-to-end training. The performance of the model is verified on the fusion dataset and the VOC2007TEST dataset. Compared with the SSD method, the accuracy of the method AP is improved by 5.8% and 2.9% respectively, with higher accuracy and robustness.
Key words : pedestrian detection;dense connection,;clustering algorithm,;SSD;FRN

0 引言

    行人檢測作為計(jì)算機(jī)視覺技術(shù)的重要分支和智能化產(chǎn)品的核心技術(shù),,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,,其能夠從圖像或視頻中識別出行人,并給出其具體的位置,,在車輛輔助駕駛和行人重識別技術(shù)等方面有巨大的研究價值和應(yīng)用前景,。行人檢測作為車輛輔助駕駛技術(shù)中不可或缺的一部分,可以及時檢測出車輛前方的行人并針對實(shí)際狀況及時提醒司機(jī)或者緊急制動,,從而避免交通事故的發(fā)生,;在刑偵工作中,刑偵人員經(jīng)常要瀏覽多個攝像頭中的視頻,,此時先進(jìn)行行人檢測判斷視頻中是否存在行人,,把視頻中的行人篩選出來,再利用行人重識別技術(shù)查找某個特定的行人在哪些攝像頭曾經(jīng)出現(xiàn)過,可為刑偵工作帶來便利,。

    近十幾年間,,基于深度學(xué)習(xí)的行人檢測技術(shù)取得了巨大進(jìn)步,能夠自動學(xué)習(xí)從圖像像素中提取的基于邊緣的低級特征和基于語義信息的高級特征,。其分為兩階段檢測算法和單階段檢測算法,。在兩階段檢測算法中,文獻(xiàn)[1]提出了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(Region based Convolutional Neural Network,,R-CNN),,文獻(xiàn)[2]提出了空間金字塔池化(Spatial Pyramid Pooling,SPP)網(wǎng)絡(luò),,文獻(xiàn)[3]提出了快速基于區(qū)域的卷積網(wǎng)絡(luò)方法(Fast-RCNN),,文獻(xiàn)[4-5]提出了Faster-RCNN。這些目標(biāo)檢測算法的訓(xùn)練過程步驟繁瑣,,檢測速度慢,,沒有達(dá)到實(shí)時的檢測標(biāo)準(zhǔn)?;诖?,以REDMON J[6]提出的統(tǒng)一實(shí)時目標(biāo)檢測框架(You only look once,Yolo)和以Liu Wei[7]提出的單階段多尺度檢測器(Single Shot MultiBox Detector,,SSD)框架為代表的單階段檢測算法由此產(chǎn)生,。Yolo存在定位精度、召回率等較低的問題,,泛化能力相對較弱,,為了解決該算法的缺陷,2016年Liu Wei等提出SSD算法進(jìn)行多尺度檢測,,在保證速度的同時提高了檢測精度,,但是其對于小目標(biāo)檢測不精準(zhǔn),加之在實(shí)際生活中,,由于行人穿著,、姿態(tài)、尺度,、視角,、光照和復(fù)雜背景等多方面原因,在檢測精度及速度方面的提高仍是研究重點(diǎn),。由此針對行人多尺度問題,,本文提出一種FRN提升模型性能的密集連接的SSD行人檢測算法,嘗試引入不依賴批尺寸大小的上下文語義信息的多層特征融合的密集連接網(wǎng)絡(luò)結(jié)構(gòu),,結(jié)合行人檢測任務(wù)特點(diǎn)進(jìn)行優(yōu)化與改進(jìn),。




本文詳細(xì)內(nèi)容請下載:http://forexkbc.com/resource/share/2000003230




作者信息:

馮婷婷,,葛華勇,孫家慧

(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,,上海201620)

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。