《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計應(yīng)用 > 基于雙流卷積神經(jīng)網(wǎng)絡(luò)和生成式對抗網(wǎng)絡(luò)的行人重識別算法
基于雙流卷積神經(jīng)網(wǎng)絡(luò)和生成式對抗網(wǎng)絡(luò)的行人重識別算法
《信息技術(shù)與網(wǎng)絡(luò)安全》2020年第6期
林 通,,陳 新,,唐 曉,,賀 玲,,李 浩
中國人民解放軍空軍預(yù)警學(xué)院,,湖北 武漢430019
摘要: 近年來,,針對行人重識別問題的深度學(xué)習(xí)技術(shù)研究取得了很大的進(jìn)展,。然而,,在解決實際數(shù)據(jù)的特征樣本不平衡問題時,,效果仍然不理想,。為了解決這一問題,設(shè)計了一個更有效的模型,,該模型很好地解決了目標(biāo)的不同姿態(tài)的干擾以及數(shù)據(jù)集中的圖片數(shù)量不足的問題,。首先,通過遷移姿態(tài)生成對抗網(wǎng)絡(luò)生成行人不同姿勢的圖片,,解決姿態(tài)干擾及圖片數(shù)量不足的問題,。然后利用兩種不同的獨(dú)立卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,并將其結(jié)合得到綜合特征,。最后,,利用提取的特征完成行人重識別。采用姿勢轉(zhuǎn)換方法對數(shù)據(jù)集進(jìn)行擴(kuò)展,,有效地克服了由目標(biāo)不同姿勢引起的識別誤差,,識別錯誤率降低了6%。實驗結(jié)果表明,,該模型在Market-1501和DukeMTMC-Reid上達(dá)到了更好的識別準(zhǔn)確度,。在DukeMTMC-Reid數(shù)據(jù)集上測試時,Rank-1準(zhǔn)確度增加到92.10%,,mAP 達(dá)到84.60%,。
中圖分類號: TP18
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.002
引用格式: 林通,陳新,,唐曉,,等. 基于雙流卷積神經(jīng)網(wǎng)絡(luò)和生成式對抗網(wǎng)絡(luò)的行人重識別算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,,39(6):7-12.
Dual stream ConvNet-Gan for person re-identification
Lin Tong,,Chen Xin,Tang Xiao,,He Ling,,Li Hao
People′s Liberation Army Force Army Early Warning Academy,Wuhan 430019,,China
Abstract: The performance of current algorithm of person re-identification(ReID) has been made great progress, but there are still a lot of difficults in dealing with different backgrounds and poses. In order to cope with the difficult in actual scenes, this paper proposes a novel model, which can very well solve the problem that the characters have different poses and the number of pictures in the dataset is insufficient and uneven. Firstly the IDs with a relatively small number of images are screened out to expand by transferring pose and solve the problem of imbalanced datasets. Then two different convolutional neural networks are used to extract picture features and they are joined to get different characteristics. In the end, the task with extracted features is completed. This model solves the impact of different poses on the recognition effect very well. At the same time, it uses two independent feature extraction networks to extract the features of the person more comprehensively. Experimental results confirm that this model significantly improves performance and achieves high accuracy in Market-1501 and DukeMTMC-Reid. When tested on the DukeMTMC-Reid dataset, Rank-1 was increased to 92.10%, and mAP was increased to 84.60%.
Key words : person ReID,;CNN,;generative adversarial network;pose transfer

行人重識別(ReID)的目的是利用計算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù),。由于其在安全和監(jiān)控方面的重要應(yīng)用,,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。這一任務(wù)極具挑戰(zhàn)性,,因為不同相機(jī)拍攝的圖像往往包含由背景,、視角、人體姿勢等變化引起的顯著變化,。

在過去的幾十年中,,大多數(shù)現(xiàn)有的研究都集中在度量學(xué)習(xí)和特征學(xué)習(xí)上,設(shè)計盡可能抵消類內(nèi)變化的算法已經(jīng)成為了行人重識別的主要目標(biāo)之一,。起初,行人重識別的研究主要是基于全局特征,,即基于全局圖像獲得特征向量,。為獲得更好的效果,開始引入局部特征,,常用的局部特征提取方法包括圖像分割,、骨架關(guān)鍵點(diǎn)定位和姿態(tài)校正。行人重識別任務(wù)還面臨一個非常大的問題,,即很難獲得數(shù)據(jù),。到目前為止,最大的數(shù)據(jù)集只有幾千個目標(biāo)和上萬張圖片,。隨著生成性對抗網(wǎng)絡(luò)(GAN)技術(shù)的發(fā)展,,越來越多的學(xué)者試圖利用這種方法來擴(kuò)展數(shù)據(jù)集。然而,,大多數(shù)現(xiàn)有的針對行人重識別的算法需要大量標(biāo)記數(shù)據(jù),,這限制了它在實際應(yīng)用場景中的魯棒性和可用性,因為手動標(biāo)記一個大型數(shù)據(jù)集是昂貴和困難的,。最近的一些文獻(xiàn)在使用無監(jiān)督學(xué)習(xí)來解決此問題,,改進(jìn)人工標(biāo)注的特征。由于不同數(shù)據(jù)集之間的圖像有明顯差異,,在提取圖片特征問題上效果仍不理想,。本文方法的貢獻(xiàn)主要有兩個方面。一方面,,采用均衡采樣策略和姿勢遷移方法對數(shù)據(jù)集進(jìn)行擴(kuò)充有效地緩解了行人姿勢各異造成的干擾,。另一方面,利用兩種不同的網(wǎng)絡(luò)結(jié)構(gòu)從圖像的不同方面提取特征,,使模型能學(xué)習(xí)到更為豐富全面的信息,。實驗結(jié)果表明,,該方法具有較高的精度。例如,,在Market-1501數(shù)據(jù)集上,,這一模型Rank-1準(zhǔn)確度達(dá)到了96.0%,mAP達(dá)到了90.1%,,與現(xiàn)有算法相比,,性能有較大提升。



本文詳細(xì)內(nèi)容請下載:http://forexkbc.com/resource/share/2000003145


作者信息:

林  通,,陳  新,,唐  曉,賀  玲,,李  浩

(中國人民解放軍空軍預(yù)警學(xué)院,,湖北 武漢430019)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。