《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > YOLOv3網(wǎng)絡(luò)在車標(biāo)檢測(cè)中的應(yīng)用
YOLOv3網(wǎng)絡(luò)在車標(biāo)檢測(cè)中的應(yīng)用
2020年電子技術(shù)應(yīng)用第9期
王 林,黃三麗
西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,陜西 西安710048
摘要: 針對(duì)車標(biāo)檢測(cè)存在檢測(cè)時(shí)間長(zhǎng),、檢測(cè)率低、可識(shí)別類型少的問題,,提出一種采用You Only Look Once(YOLOv3)網(wǎng)絡(luò)的方法,。為了使該網(wǎng)絡(luò)適用于小目標(biāo)的車標(biāo)檢測(cè),將目標(biāo)特征提取結(jié)構(gòu)Darknet-53換成Darknet-19,,并且將多尺度預(yù)測(cè)層數(shù)減少為兩層以減少網(wǎng)絡(luò)參數(shù)數(shù)量,。同時(shí),為了增大車標(biāo)在圖像中所占比例,,讓卷積神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)更多的車標(biāo)特征,,采用將車輛從圖像中裁剪后進(jìn)行人工標(biāo)注的方法,構(gòu)建了一個(gè)包含46類車標(biāo)的數(shù)據(jù)集(VLDS-46),。實(shí)驗(yàn)結(jié)果表明,,采用該模型進(jìn)行車標(biāo)檢測(cè)時(shí)能在實(shí)現(xiàn)高檢測(cè)率的同時(shí)達(dá)到實(shí)時(shí)性要求,檢測(cè)平均耗時(shí)為9 ms,。
中圖分類號(hào): TN98
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.200067
中文引用格式: 王林,,黃三麗. YOLOv3網(wǎng)絡(luò)在車標(biāo)檢測(cè)中的應(yīng)用[J].電子技術(shù)應(yīng)用,2020,46(9):34-37,,42.
英文引用格式: Wang Lin,,Huang Sanli. Application of YOLOv3 network in vehicle logo detection[J]. Application of Electronic Technique,2020,,46(9):34-37,,42.
Application of YOLOv3 network in vehicle logo detection
Wang Lin,Huang Sanli
School of Automation and Information Engineering,,Xi′an University of Technology,,Xi′an 710048,China
Abstract: Aiming at the problem that the vehicle logo detection has long detection time, low detection rate and few identifiable types, a method using You Only Look Once(YOLOv3) network is proposed. In order to make the network suitable for vehicle target detection of small targets, the target feature extraction structure Darknet-53 is replaced with Darknet-19 and the multi-scale prediction layer is reduced to two layers to reduce the number of network parameters. At the same time, in order to increase the proportion of the car logo in the image and let the convolutional neural network can learn more car logo features, this paper adopts a method of cutting the vehicle from the image and manually marking it, constructing a class of 46 vehicles Data set(VLDS-46). The experimental results show that when the model is used for vehicle logo detection, the real-time requirement can be achieved while achieving high detection rate, and the average detection time is 9 ms.
Key words : vehicle logo detection,;convolutional neural network,;data set;Darknet-19

0 引言

    近年來,,隨著人工智能技術(shù)的不斷發(fā)展,,其被廣泛用于公共安全、教育,、人機(jī)交互等領(lǐng)域,,例如:人臉檢測(cè)[1]、圖像分類[2],、圖像分割等,。同樣的車標(biāo)檢測(cè)技術(shù)對(duì)于完善智能交通具有重要作用,能夠輔助實(shí)現(xiàn)車輛信息的確認(rèn),。21世紀(jì)以來,,隨著國(guó)民經(jīng)濟(jì)快速發(fā)展,汽車數(shù)量在我國(guó)的增長(zhǎng)速度越來越快,。汽車數(shù)量過多帶來交通壓力的同時(shí)也會(huì)帶來其他問題:套牌車,、假車牌事件頻頻發(fā)生。這些事件的發(fā)生意味著僅僅通過車牌來確認(rèn)車輛準(zhǔn)確信息將受到阻礙,。同車牌一樣,車標(biāo)也是車輛的一個(gè)重要屬性,,在結(jié)合車牌信息后,,就能更準(zhǔn)確地確認(rèn)車輛信息。國(guó)內(nèi)外學(xué)者對(duì)車標(biāo)檢測(cè)采用了不同的方法進(jìn)行研究,。一般而言,,分為傳統(tǒng)機(jī)器學(xué)習(xí)方法和卷積神經(jīng)網(wǎng)絡(luò)方法。

    采用傳統(tǒng)機(jī)器學(xué)習(xí)方法在進(jìn)行車標(biāo)檢測(cè)時(shí)繁瑣,,需要分為兩個(gè)獨(dú)立的步驟:首先進(jìn)行車標(biāo)定位,,然后進(jìn)行車標(biāo)識(shí)別。文獻(xiàn)[3]-[4]采用傳統(tǒng)機(jī)器學(xué)習(xí)方法在進(jìn)行車標(biāo)定位和識(shí)別過程中都需要由專業(yè)人員人工設(shè)計(jì)特定特征,但是這些特征對(duì)于光照,、陰影,、車身傾斜等的變化所表現(xiàn)出來的魯棒性不強(qiáng),在應(yīng)用于實(shí)際場(chǎng)景下會(huì)出現(xiàn)低檢測(cè)率和識(shí)別率問題,。針對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)方法的不足,,卷積神經(jīng)網(wǎng)絡(luò)方法應(yīng)運(yùn)而生。

    早在20世紀(jì)80年代末期,卷積神經(jīng)網(wǎng)絡(luò)[5]技術(shù)就已經(jīng)應(yīng)用于視覺任務(wù)中,,但由于當(dāng)時(shí)設(shè)備的運(yùn)算能力不強(qiáng)和數(shù)據(jù)資源的不足,,這一技術(shù)并沒有得到研究人員的廣泛研究和長(zhǎng)足的發(fā)展。后來得益于GPU(Graphics Processing Unit)強(qiáng)大的計(jì)算能力和互聯(lián)網(wǎng)上豐富的數(shù)據(jù)資源,,卷積神經(jīng)網(wǎng)絡(luò)技術(shù)得到了進(jìn)一步的發(fā)展,,而且也取得了突破性的進(jìn)展。卷積神經(jīng)網(wǎng)絡(luò)一般包含卷積層,、池化層,、全連接層等。借助于卷積神經(jīng)網(wǎng)絡(luò)的強(qiáng)表達(dá)能力,,不需要人工設(shè)計(jì)特征,,在網(wǎng)絡(luò)學(xué)習(xí)車標(biāo)特征后就能自動(dòng)進(jìn)行車標(biāo)的定位以及分類。2014年,,GIRSHICK R等[6]人第一次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于目標(biāo)檢測(cè)上并且獲得了比只使用方向梯度直方圖[7](Histogram of Oriented Gradient,,HOG)特征更高的準(zhǔn)確率,該網(wǎng)絡(luò)稱為區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Region Convlutional Network,,R-CNN),。但該網(wǎng)絡(luò)存在耗時(shí)久的弊端,伴隨著對(duì)該網(wǎng)絡(luò)框架的不斷改進(jìn),,其目標(biāo)檢測(cè)的精度不斷提高,,運(yùn)行時(shí)間也不斷減少。2015年,,HE K[8]等人通過改進(jìn)R-CNN網(wǎng)絡(luò)縮短其檢測(cè)時(shí)間,,但其最大幀率也只能達(dá)到5FPS。這對(duì)于幀率最小為25FPS的監(jiān)控視頻來說是遠(yuǎn)遠(yuǎn)不夠的,。為了在準(zhǔn)確率和時(shí)間上得到均衡,,YOLO網(wǎng)絡(luò)[9]得到了應(yīng)用,它將物體檢測(cè)作為回歸問題來求解,,在輸入圖像后經(jīng)過一次前饋就能得到圖像中所有待檢測(cè)物體的位置和其所屬的類別以及相應(yīng)的置信度,,進(jìn)行目標(biāo)檢測(cè)時(shí)耗時(shí)少。

    目前采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行車標(biāo)檢測(cè)時(shí)遇到兩個(gè)問題:(1)公開的車標(biāo)數(shù)據(jù)集少且包含的車標(biāo)種類少[10],;(2)采用卷積神經(jīng)網(wǎng)絡(luò)方法時(shí)參數(shù)多,,運(yùn)行耗時(shí)。因此,本文提出的采用改進(jìn)的YOLOv3[11]網(wǎng)絡(luò)進(jìn)行車標(biāo)檢測(cè)主要有以下兩個(gè)貢獻(xiàn):(1)替換YOLOv3中的Darknet-53為層數(shù)少的Darknet-19[12]結(jié)構(gòu),,減少運(yùn)算量進(jìn)而減少車標(biāo)檢測(cè)時(shí)間,;(2)構(gòu)建了一個(gè)包含46類車標(biāo)的數(shù)據(jù)集。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000002976




作者信息:

王  林,,黃三麗

(西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,,陜西 西安710048)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。