《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于改進(jìn)YOLOv5的車(chē)輛屬性檢測(cè)
基于改進(jìn)YOLOv5的車(chē)輛屬性檢測(cè)
2022年電子技術(shù)應(yīng)用第7期
劉 俊,,鐘國(guó)韻,黃斯雯,,劉麒麟
東華理工大學(xué) 信息工程學(xué)院,,江西 南昌330013
摘要: 車(chē)輛屬性檢測(cè)是一個(gè)基礎(chǔ)任務(wù),其屬性檢測(cè)結(jié)果可以被應(yīng)用到很多下游的交通視覺(jué)任務(wù),。提出了一種基于YOLOv5的車(chē)輛屬性檢測(cè)改進(jìn)算法,。針對(duì)檢測(cè)目標(biāo)較小的問(wèn)題,加入了卷積注意力模塊,,讓網(wǎng)絡(luò)模型把更多的注意力放在小目標(biāo)對(duì)象上,;針對(duì)數(shù)據(jù)集樣本種類(lèi)較少的問(wèn)題,改進(jìn)了YOLOv5的馬賽克數(shù)據(jù)增強(qiáng)方式;使用自門(mén)控激活函數(shù)Swish,,起到抑制噪聲,、加快收斂速度并提升模型魯棒性的作用。此外,,還在公開(kāi)車(chē)輛數(shù)據(jù)集VeRi-776的基礎(chǔ)上進(jìn)行了詳細(xì)的車(chē)輛屬性標(biāo)注,,構(gòu)建了一個(gè)車(chē)輛屬性數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明,,改進(jìn)后的算法比原始YOLOv5的平均精確率提升了4.6%,,能夠準(zhǔn)確地檢測(cè)到車(chē)輛圖像的通用屬性,可以供下游任務(wù)使用,。
中圖分類(lèi)號(hào): TP391,;TP183
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.222802
中文引用格式: 劉俊,鐘國(guó)韻,,黃斯雯,,等. 基于改進(jìn)YOLOv5的車(chē)輛屬性檢測(cè)[J].電子技術(shù)應(yīng)用,2022,,48(7):19-24,29.
英文引用格式: Liu Jun,,Zhong Guoyun,,Huang Siwen,et al. Vehicle attribute detection based on improved YOLOv5[J]. Application of Electronic Technique,,2022,,48(7):19-24,29.
Vehicle attribute detection based on improved YOLOv5
Liu Jun,,Zhong Guoyun,,Huang Siwen,Liu Qilin
School of Information Engineering,,East China University of Technology,,Nanchang 330013,China
Abstract: Vehicle attribute detection is a basic task, which can be applied to many downstream traffic vision tasks. This paper presents an improved vehicle attribute detection algorithm based on YOLOv5. Aiming at the problem of small target detection, this paper adds the convolution attention module to make the network model pay more attention to the small target object. Aiming at the problem of less sample types of the dataset, this paper improves the mosaic data enhancement method of YOLOv5. The self-gated activation function Swish is used to suppress noise, accelerate convergence speed, and improve the robustness of the model. In addition, this paper also makes a detailed vehicle attribute labeling based on the public vehicle dataset VeRi-776, and constructs a vehicle attribute dataset. The experimental results show that the average accuracy of the improved algorithm is 4.6 % higher than that of the original YOLOv5, which can accurately detect the general attributes of vehicle images and can be used for downstream tasks.
Key words : vehicle attribute,;object detection,;YOLOv5 algorithm

0 引言

    目前計(jì)算機(jī)視覺(jué)研究者們?cè)谥饾u探索車(chē)輛圖像數(shù)據(jù)處理的落地應(yīng)用,以助力智慧交通,。車(chē)輛屬性檢測(cè)就是其中一個(gè)基礎(chǔ)的計(jì)算機(jī)視覺(jué)任務(wù),,主要檢測(cè)車(chē)輛的車(chē)燈、車(chē)牌,、車(chē)輛logo等車(chē)輛屬性區(qū)域位置,,其結(jié)果可以被應(yīng)用到很多下游的交通視覺(jué)任務(wù)。例如利用檢測(cè)到的車(chē)燈屬性來(lái)判定車(chē)輛是否變道打轉(zhuǎn)向燈;車(chē)牌屬性可以作為車(chē)牌OCR識(shí)別的輸入,,還可結(jié)合整體的車(chē)輛屬性,,來(lái)實(shí)現(xiàn)車(chē)輛重識(shí)別等[1]

    由于早期顯卡的顯存和計(jì)算能力的限制,,神經(jīng)網(wǎng)絡(luò)無(wú)法設(shè)計(jì)得很深,,導(dǎo)致當(dāng)時(shí)目標(biāo)檢測(cè)的研究還是偏向于傳統(tǒng)的圖像處理,主要可以分為區(qū)域選擇,、特征提取和分類(lèi)三步,。區(qū)域選擇一般是通過(guò)在圖像上進(jìn)行逐塊像素的遍歷,來(lái)找到與目標(biāo)匹配的區(qū)域,;特征提取則是依據(jù)研究員的相關(guān)先驗(yàn)知識(shí),,如待檢測(cè)目標(biāo)的形狀、紋理,、明暗顏色等,,從上一步獲取的區(qū)域中提取特征,代表算法有尺度不變特征變換(SIFT)[2]和方向梯度直方圖(HOG)[3],;最后是訓(xùn)練分類(lèi)器將特征分類(lèi),,主要利用將待分類(lèi)數(shù)據(jù)的特征向量映射到高維空間,以實(shí)現(xiàn)將不同類(lèi)別的數(shù)據(jù)分開(kāi),,經(jīng)典算法有支持向量機(jī)(SVM)[4]和AdaBoost[5],。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000004580




作者信息:

劉  俊,,鐘國(guó)韻,,黃斯雯,劉麒麟

(東華理工大學(xué) 信息工程學(xué)院,,江西 南昌330013)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。