文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.06.002
引用格式: 林通,陳新,,唐曉,,等. 基于雙流卷積神經(jīng)網(wǎng)絡(luò)和生成式對抗網(wǎng)絡(luò)的行人重識別算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,,39(6):7-12.
行人重識別(ReID)的目的是利用計算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù),。由于其在安全和監(jiān)控方面的重要應(yīng)用,,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。這一任務(wù)極具挑戰(zhàn)性,,因為不同相機(jī)拍攝的圖像往往包含由背景,、視角、人體姿勢等變化引起的顯著變化,。
在過去的幾十年中,,大多數(shù)現(xiàn)有的研究都集中在度量學(xué)習(xí)和特征學(xué)習(xí)上,設(shè)計盡可能抵消類內(nèi)變化的算法已經(jīng)成為了行人重識別的主要目標(biāo)之一,。起初,行人重識別的研究主要是基于全局特征,,即基于全局圖像獲得特征向量,。為獲得更好的效果,開始引入局部特征,,常用的局部特征提取方法包括圖像分割,、骨架關(guān)鍵點(diǎn)定位和姿態(tài)校正。行人重識別任務(wù)還面臨一個非常大的問題,,即很難獲得數(shù)據(jù),。到目前為止,最大的數(shù)據(jù)集只有幾千個目標(biāo)和上萬張圖片,。隨著生成性對抗網(wǎng)絡(luò)(GAN)技術(shù)的發(fā)展,,越來越多的學(xué)者試圖利用這種方法來擴(kuò)展數(shù)據(jù)集。然而,,大多數(shù)現(xiàn)有的針對行人重識別的算法需要大量標(biāo)記數(shù)據(jù),,這限制了它在實際應(yīng)用場景中的魯棒性和可用性,因為手動標(biāo)記一個大型數(shù)據(jù)集是昂貴和困難的,。最近的一些文獻(xiàn)在使用無監(jiān)督學(xué)習(xí)來解決此問題,,改進(jìn)人工標(biāo)注的特征。由于不同數(shù)據(jù)集之間的圖像有明顯差異,,在提取圖片特征問題上效果仍不理想,。本文方法的貢獻(xiàn)主要有兩個方面。一方面,,采用均衡采樣策略和姿勢遷移方法對數(shù)據(jù)集進(jìn)行擴(kuò)充有效地緩解了行人姿勢各異造成的干擾,。另一方面,利用兩種不同的網(wǎng)絡(luò)結(jié)構(gòu)從圖像的不同方面提取特征,,使模型能學(xué)習(xí)到更為豐富全面的信息,。實驗結(jié)果表明,,該方法具有較高的精度。例如,,在Market-1501數(shù)據(jù)集上,,這一模型Rank-1準(zhǔn)確度達(dá)到了96.0%,mAP達(dá)到了90.1%,,與現(xiàn)有算法相比,,性能有較大提升。
本文詳細(xì)內(nèi)容請下載:http://forexkbc.com/resource/share/2000003145
作者信息:
林 通,,陳 新,,唐 曉,賀 玲,,李 浩
(中國人民解放軍空軍預(yù)警學(xué)院,,湖北 武漢430019)