中文引用格式: 何兆蓉,,郭健,徐琦,,等. 基于改進(jìn)Mask R-CNN的非結(jié)構(gòu)環(huán)境小目標(biāo)語義分割算法[J]. 電子技術(shù)應(yīng)用,,2024,50(10):76-81.
英文引用格式: He Zhaorong,,Guo Jian,,Xu Qi,et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique,,2024,,50(10):76-81.
引言
隨著計(jì)算機(jī)技術(shù)的持續(xù)進(jìn)步,,傳統(tǒng)的語義分割算法對(duì)于大規(guī)模的對(duì)象檢測(cè)網(wǎng)絡(luò)模型具有很高的識(shí)別精度,但是,,這些算法在識(shí)別小目標(biāo)對(duì)象時(shí)面臨著不少的挑戰(zhàn),,如存在錯(cuò)誤識(shí)別或者由于候選框之間相互重疊而無法識(shí)別的相關(guān)問題。在非結(jié)構(gòu)環(huán)境中,,處理零部件的數(shù)據(jù)存在許多挑戰(zhàn),,如缺陷樣本的數(shù)量較少、狀態(tài)特征存在顯著差異,、特征粒度差異性較小等,。傳統(tǒng)的語義分割方法檢測(cè)的性能比較容易受到環(huán)境因素的影響,,如照明強(qiáng)度、場(chǎng)景遮擋等,,從而導(dǎo)致檢測(cè)的準(zhǔn)確性較低,、適應(yīng)能力較弱。深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)具有許多優(yōu)勢(shì),,包括強(qiáng)大的泛化能力,、高檢測(cè)準(zhǔn)確性以及對(duì)環(huán)境照明變化的抵抗力強(qiáng)等,因此,,深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入整合到小目標(biāo)零件的檢測(cè)中,。
在復(fù)雜環(huán)境下針對(duì)小目標(biāo)的語義分割研究中,魏永超等[1]提出了一種基于Mask R-CNN 算法的改進(jìn)算法,,以解決對(duì)缺陷類型的有限和對(duì)非結(jié)構(gòu)化環(huán)境中對(duì)小目標(biāo)缺陷的語義分割效果差強(qiáng)人意的問題,。通過添加SENet模塊并改善NMS算法,使新模型的準(zhǔn)確性得到了顯著提高,。文韜[2]解決了傳統(tǒng)Mask R-CNN中小目標(biāo)對(duì)象的低識(shí)別率的問題,,并使用GFPN作為Mask R-CNN模型的功能采集。該模型通過融合從GFPN獲得的特征來設(shè)置各種特征的權(quán)重,。茍軍年等[3]解決了復(fù)雜背景,、小像素目標(biāo)以及Mask R-CNN模型對(duì)于傳輸電路中絕緣子缺陷檢測(cè)不充分的問題。將卷積注意力模塊(Convolutional Block Attention Module, CBAM)引入特征提取網(wǎng)絡(luò)中,,以達(dá)到從空間和通道角度提高小目標(biāo)的特征保留,。
本文以空間衛(wèi)星作為非結(jié)構(gòu)環(huán)境的實(shí)驗(yàn)場(chǎng)景,以衛(wèi)星帆板展開機(jī)構(gòu)的爆炸螺栓作為待檢測(cè)的小目標(biāo)物體,。衛(wèi)星帆板展開異常是空間衛(wèi)星故障中最常見的形式之一,,造成這種故障的原因主要是爆炸螺栓未完全。此時(shí)解決故障的方式一般是通過識(shí)別未完全爆炸或未爆炸的螺栓進(jìn)行補(bǔ)充剪切操作,。針對(duì)衛(wèi)星帆板的維修任務(wù),,首先需要檢測(cè)并識(shí)別出空間衛(wèi)星中的一些目標(biāo)物體,如衛(wèi)星帆板的反光板面以及未完全爆炸的螺栓等,。
針對(duì)小目標(biāo)零件的語義分割研究,,程敦誠等[4]使用U-net8將螺母、螺桿和其他信息標(biāo)記成為不同顏色,,并對(duì)其圖片進(jìn)行語義分割,,以檢測(cè)螺栓是否處于正常的狀態(tài)。羅隆福等[5]提出一種基于深度學(xué)習(xí)的螺栓裂紋檢測(cè)方法,,該方法使用DeepLab v3 plus 算法在螺栓上執(zhí)行語義分割,。李紅衛(wèi)等[6]利用深度學(xué)習(xí)框架Mask R-CNN[7]智能分析了通過機(jī)械臂視覺傳感器獲得的視覺信息,并根據(jù)RGB圖像數(shù)據(jù)實(shí)現(xiàn)了小目標(biāo)零部件的語義分割,。
本文在上述研究的基礎(chǔ)上,,結(jié)合衛(wèi)星帆板中爆炸螺栓的結(jié)構(gòu)特征,,提出了一種基于注意力機(jī)制的Mask R-CNN語義分割優(yōu)化算法,在改進(jìn)模型中完成對(duì)爆炸螺栓的語義分割,,并與原Mask R-CNN的網(wǎng)絡(luò)模型進(jìn)行性能對(duì)比,,改進(jìn)后模型優(yōu)勢(shì)顯著。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://forexkbc.com/resource/share/2000006182
作者信息:
何兆蓉,,郭健,,徐琦,韓銳
(南京理工大學(xué) 自動(dòng)化學(xué)院,,江蘇 南京 210094)