《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 一種基于改進Mask R-CNN模型的遙感圖像目標識別方法
一種基于改進Mask R-CNN模型的遙感圖像目標識別方法
信息技術與網(wǎng)絡安全
余慧明,,周志祥,,彭 楊,崔志斌
(武漢興圖新科電子股份有限公司 平臺產(chǎn)品部,,湖北 武漢430073)
摘要: 目標識別技術作為機器視覺領域的一個重要分支,,在各個領域有著重要的應用。鑒于一般的目標識別模型在遙感圖片中表現(xiàn)不佳,,另外需要識別的目標數(shù)量較多,,尺寸大小不一,因此在經(jīng)典的目標識別Mask R-CNN模型的基礎上,,提出了一種融合了通道注意力機制和數(shù)據(jù)增強技術的模型Mask R-CNN模型,。在輸入圖片數(shù)據(jù)時,首先通過Random-Batch images操作對數(shù)據(jù)進行增強處理,,提高模型對尺寸大小不一的目標識別的準確率,;然后提取特征時,將原Mask R-CNN模型中的FPN改進為BiFPN,,使提取到的特征能更好體現(xiàn)原本的圖片信息,;在最后的Mask階段,增加了通道注意力機制,,使得模型更多地得到需要的信息,。經(jīng)過實驗表明,,此模型在遙感圖像的特殊目標細粒度識別中有良好的表現(xiàn)。對于同一個數(shù)據(jù)集,,其評價指標在各個方面都要優(yōu)于其他對比算法,。
中圖分類號: TP389.1
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.03.007
引用格式: 余慧明,周志祥,,彭楊,,等. 一種基于改進Mask R-CNN模型的遙感圖像目標識別方法[J].信息技術與網(wǎng)絡安全,2021,,40(3):38-42,,47.
A remote sensing image target recognition method based on improved Mask R-CNN model
Yu Huiming,Zhou Zhixiang,,Peng Yang,,Cui Zhibin
(Wuhan Xing Tu Xin Ke Co.,Ltd.,,Platform Products Department,,Wuhan 430073,China)
Abstract: As an important branch in the field of machine vision, target recognition technology has important applications in various fields. In view of the fact that the general target recognition model does not perform well in remote sensing images, the number of targets that need to be recognized is large, and the sizes are different, based on the classic target recognition Mask R-CNN model, a Mask R-CNN model fusing channel attention mechanism and data enhancement technology is proposed. When inputting image data, the data through the Random-Batch images operation to improve the accuracy of the model′s recognition of targets of different sizes is first enhanced; then, when extracting features, the FPN in the original Mask R-CNN model is improved to BiFPN, so that the extracted features can better reflect the original picture information; in the final Mask stage, the channel attention mechanism is added, so that the model can get more information. Experiments show that this model is used in remote sensing images. It has a good performance in the fine-grained recognition of special targets. For the same data set, its evaluation indicators are superior to other comparison algorithms in all aspects.
Key words : target recognition,;Mask R-CNN,;channel attention;data enhancement

0 引言

隨著人工智能的興起,,深度學習[1]算法各個領域的優(yōu)勢被體現(xiàn)出來,。對視頻、圖像中的多目標,、細粒度的目標識別技術,,可以方便人們在復雜的情景中快速定位到所需要的檢測目標。隨著場景的復雜度加深,,基于基礎模型的各種改進版本層出不窮,。

在過去近10年中,目標識別技術又有了飛速的發(fā)展,,從最開始的機器學習算法,,再到目前主流的深度學習目標識別算法,如RCNN[2],、SSP-Net[3]、Fast R-CNN[4],、Faster R-CNN[5],,目標識別技術已經(jīng)在各個領域都有了很好的應用。但是,,由于數(shù)據(jù)集的制約,,針對遙感圖像的軍事目標識別卻是一個例外,。另外,軍事碼頭物體數(shù)量眾多,,需要檢測的目標與其他物體交錯相間,,大大降低了模型的準確性。對于一些密集型的目標檢測,,PAN X[6]等人提出了一個由特征選擇模塊(Feature Selection Module,,F(xiàn)SM)和動態(tài)優(yōu)化頭(Dynamic Refinement Head,DRH)組成的動態(tài)優(yōu)化網(wǎng)絡,。FSM使神經(jīng)元能夠根據(jù)目標物體的形狀和方向調整接受野,,而DRH使模型能夠以一種對象感知的方式動態(tài)地改進預測。何代毅[7]等人就提出了一種基于改進 Mask-RCNN[8]的建筑物自動提取方法,在網(wǎng)絡的設計中添加了路徑聚合網(wǎng)絡和特征增強功能,通過監(jiān)督和遷移學習的方式在Inria航空影像標簽數(shù)據(jù)集中進行多線程迭代訓練與模型優(yōu)化學習,實現(xiàn)了建筑物的自動精確分割和提取,。對于數(shù)據(jù)集缺乏等問題,,林通[9]等人通過遷移姿態(tài)生成對抗網(wǎng)絡生成姿態(tài)不同的行人圖片,對數(shù)據(jù)集進行了擴充,。


本文詳細內容請下載:http://forexkbc.com/resource/share/2000003422




作者信息:

余慧明,,周志祥,彭  楊,,崔志斌

(武漢興圖新科電子股份有限公司 平臺產(chǎn)品部,,湖北 武漢430073)


此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載,。