文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.200067
中文引用格式: 王林,,黃三麗. YOLOv3網(wǎng)絡(luò)在車標(biāo)檢測(cè)中的應(yīng)用[J].電子技術(shù)應(yīng)用,2020,46(9):34-37,,42.
英文引用格式: Wang Lin,,Huang Sanli. Application of YOLOv3 network in vehicle logo detection[J]. Application of Electronic Technique,2020,,46(9):34-37,,42.
0 引言
近年來,,隨著人工智能技術(shù)的不斷發(fā)展,,其被廣泛用于公共安全、教育,、人機(jī)交互等領(lǐng)域,,例如:人臉檢測(cè)[1]、圖像分類[2],、圖像分割等,。同樣的車標(biāo)檢測(cè)技術(shù)對(duì)于完善智能交通具有重要作用,能夠輔助實(shí)現(xiàn)車輛信息的確認(rèn),。21世紀(jì)以來,,隨著國(guó)民經(jīng)濟(jì)快速發(fā)展,汽車數(shù)量在我國(guó)的增長(zhǎng)速度越來越快,。汽車數(shù)量過多帶來交通壓力的同時(shí)也會(huì)帶來其他問題:套牌車,、假車牌事件頻頻發(fā)生。這些事件的發(fā)生意味著僅僅通過車牌來確認(rèn)車輛準(zhǔn)確信息將受到阻礙,。同車牌一樣,車標(biāo)也是車輛的一個(gè)重要屬性,,在結(jié)合車牌信息后,,就能更準(zhǔn)確地確認(rèn)車輛信息。國(guó)內(nèi)外學(xué)者對(duì)車標(biāo)檢測(cè)采用了不同的方法進(jìn)行研究,。一般而言,,分為傳統(tǒng)機(jī)器學(xué)習(xí)方法和卷積神經(jīng)網(wǎng)絡(luò)方法。
采用傳統(tǒng)機(jī)器學(xué)習(xí)方法在進(jìn)行車標(biāo)檢測(cè)時(shí)繁瑣,,需要分為兩個(gè)獨(dú)立的步驟:首先進(jìn)行車標(biāo)定位,,然后進(jìn)行車標(biāo)識(shí)別。文獻(xiàn)[3]-[4]采用傳統(tǒng)機(jī)器學(xué)習(xí)方法在進(jìn)行車標(biāo)定位和識(shí)別過程中都需要由專業(yè)人員人工設(shè)計(jì)特定特征,但是這些特征對(duì)于光照,、陰影,、車身傾斜等的變化所表現(xiàn)出來的魯棒性不強(qiáng),在應(yīng)用于實(shí)際場(chǎng)景下會(huì)出現(xiàn)低檢測(cè)率和識(shí)別率問題,。針對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)方法的不足,,卷積神經(jīng)網(wǎng)絡(luò)方法應(yīng)運(yùn)而生。
早在20世紀(jì)80年代末期,卷積神經(jīng)網(wǎng)絡(luò)[5]技術(shù)就已經(jīng)應(yīng)用于視覺任務(wù)中,,但由于當(dāng)時(shí)設(shè)備的運(yùn)算能力不強(qiáng)和數(shù)據(jù)資源的不足,,這一技術(shù)并沒有得到研究人員的廣泛研究和長(zhǎng)足的發(fā)展。后來得益于GPU(Graphics Processing Unit)強(qiáng)大的計(jì)算能力和互聯(lián)網(wǎng)上豐富的數(shù)據(jù)資源,,卷積神經(jīng)網(wǎng)絡(luò)技術(shù)得到了進(jìn)一步的發(fā)展,,而且也取得了突破性的進(jìn)展。卷積神經(jīng)網(wǎng)絡(luò)一般包含卷積層,、池化層,、全連接層等。借助于卷積神經(jīng)網(wǎng)絡(luò)的強(qiáng)表達(dá)能力,,不需要人工設(shè)計(jì)特征,,在網(wǎng)絡(luò)學(xué)習(xí)車標(biāo)特征后就能自動(dòng)進(jìn)行車標(biāo)的定位以及分類。2014年,,GIRSHICK R等[6]人第一次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于目標(biāo)檢測(cè)上并且獲得了比只使用方向梯度直方圖[7](Histogram of Oriented Gradient,,HOG)特征更高的準(zhǔn)確率,該網(wǎng)絡(luò)稱為區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Region Convlutional Network,,R-CNN),。但該網(wǎng)絡(luò)存在耗時(shí)久的弊端,伴隨著對(duì)該網(wǎng)絡(luò)框架的不斷改進(jìn),,其目標(biāo)檢測(cè)的精度不斷提高,,運(yùn)行時(shí)間也不斷減少。2015年,,HE K[8]等人通過改進(jìn)R-CNN網(wǎng)絡(luò)縮短其檢測(cè)時(shí)間,,但其最大幀率也只能達(dá)到5FPS。這對(duì)于幀率最小為25FPS的監(jiān)控視頻來說是遠(yuǎn)遠(yuǎn)不夠的,。為了在準(zhǔn)確率和時(shí)間上得到均衡,,YOLO網(wǎng)絡(luò)[9]得到了應(yīng)用,它將物體檢測(cè)作為回歸問題來求解,,在輸入圖像后經(jīng)過一次前饋就能得到圖像中所有待檢測(cè)物體的位置和其所屬的類別以及相應(yīng)的置信度,,進(jìn)行目標(biāo)檢測(cè)時(shí)耗時(shí)少。
目前采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行車標(biāo)檢測(cè)時(shí)遇到兩個(gè)問題:(1)公開的車標(biāo)數(shù)據(jù)集少且包含的車標(biāo)種類少[10],;(2)采用卷積神經(jīng)網(wǎng)絡(luò)方法時(shí)參數(shù)多,,運(yùn)行耗時(shí)。因此,本文提出的采用改進(jìn)的YOLOv3[11]網(wǎng)絡(luò)進(jìn)行車標(biāo)檢測(cè)主要有以下兩個(gè)貢獻(xiàn):(1)替換YOLOv3中的Darknet-53為層數(shù)少的Darknet-19[12]結(jié)構(gòu),,減少運(yùn)算量進(jìn)而減少車標(biāo)檢測(cè)時(shí)間,;(2)構(gòu)建了一個(gè)包含46類車標(biāo)的數(shù)據(jù)集。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000002976
作者信息:
王 林,,黃三麗
(西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,,陜西 西安710048)