文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.010
引用格式: 馮婷婷,,葛華勇,孫家慧. 一種基于SSD與FRN相結(jié)合的密集連接行人檢測算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2020,,39(12):56-60,66.
0 引言
行人檢測作為計(jì)算機(jī)視覺技術(shù)的重要分支和智能化產(chǎn)品的核心技術(shù),,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,,其能夠從圖像或視頻中識別出行人,并給出其具體的位置,,在車輛輔助駕駛和行人重識別技術(shù)等方面有巨大的研究價值和應(yīng)用前景,。行人檢測作為車輛輔助駕駛技術(shù)中不可或缺的一部分,可以及時檢測出車輛前方的行人并針對實(shí)際狀況及時提醒司機(jī)或者緊急制動,,從而避免交通事故的發(fā)生,;在刑偵工作中,刑偵人員經(jīng)常要瀏覽多個攝像頭中的視頻,,此時先進(jìn)行行人檢測判斷視頻中是否存在行人,,把視頻中的行人篩選出來,再利用行人重識別技術(shù)查找某個特定的行人在哪些攝像頭曾經(jīng)出現(xiàn)過,可為刑偵工作帶來便利,。
近十幾年間,,基于深度學(xué)習(xí)的行人檢測技術(shù)取得了巨大進(jìn)步,能夠自動學(xué)習(xí)從圖像像素中提取的基于邊緣的低級特征和基于語義信息的高級特征,。其分為兩階段檢測算法和單階段檢測算法,。在兩階段檢測算法中,文獻(xiàn)[1]提出了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(Region based Convolutional Neural Network,,R-CNN),,文獻(xiàn)[2]提出了空間金字塔池化(Spatial Pyramid Pooling,SPP)網(wǎng)絡(luò),,文獻(xiàn)[3]提出了快速基于區(qū)域的卷積網(wǎng)絡(luò)方法(Fast-RCNN),,文獻(xiàn)[4-5]提出了Faster-RCNN。這些目標(biāo)檢測算法的訓(xùn)練過程步驟繁瑣,,檢測速度慢,,沒有達(dá)到實(shí)時的檢測標(biāo)準(zhǔn)?;诖?,以REDMON J[6]提出的統(tǒng)一實(shí)時目標(biāo)檢測框架(You only look once,Yolo)和以Liu Wei[7]提出的單階段多尺度檢測器(Single Shot MultiBox Detector,,SSD)框架為代表的單階段檢測算法由此產(chǎn)生,。Yolo存在定位精度、召回率等較低的問題,,泛化能力相對較弱,,為了解決該算法的缺陷,2016年Liu Wei等提出SSD算法進(jìn)行多尺度檢測,,在保證速度的同時提高了檢測精度,,但是其對于小目標(biāo)檢測不精準(zhǔn),加之在實(shí)際生活中,,由于行人穿著,、姿態(tài)、尺度,、視角,、光照和復(fù)雜背景等多方面原因,在檢測精度及速度方面的提高仍是研究重點(diǎn),。由此針對行人多尺度問題,,本文提出一種FRN提升模型性能的密集連接的SSD行人檢測算法,嘗試引入不依賴批尺寸大小的上下文語義信息的多層特征融合的密集連接網(wǎng)絡(luò)結(jié)構(gòu),,結(jié)合行人檢測任務(wù)特點(diǎn)進(jìn)行優(yōu)化與改進(jìn),。
本文詳細(xì)內(nèi)容請下載:http://forexkbc.com/resource/share/2000003230
作者信息:
馮婷婷,,葛華勇,孫家慧
(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,,上海201620)