基于邊窗濾波和擴張卷積的礦井行人檢測-AET-電子技術應用

基于邊窗濾波和擴張卷積的礦井行人檢測

2020年電子技術應用第10期

劉欣，李衛(wèi)龍，張燦明

安徽省煤炭科學研究院，安徽合肥230001

摘要： 在數(shù)字化礦山中，行人檢測系統(tǒng)能夠大幅減少事故傷亡，是保護工人安全的重要手段。為了構建高性能的行人檢測系統(tǒng)，提出了一種基于邊窗濾波和擴張卷積的礦井行人檢測模型。具體來說，針對復雜惡劣的礦井環(huán)境，采用邊窗濾波抑制視頻圖像中的干擾信號，提升圖像質量。此外，考慮到行人目標的多尺度特性，在模型中引入擴張卷積增加特征的感受野，進而提升檢測性能。大量的對比實驗證明了邊窗濾波和擴張卷積的有效性，模型在礦井數(shù)據(jù)集上獲得94.3 mAP和99.1%檢測率的優(yōu)異性能。

關鍵詞： 行人檢測邊窗濾波擴張卷積深度學習

中圖分類號： TN919.8；TP919.8；TP391.41
文獻標識碼： A
DOI：10.16157/j.issn.0258-7998.200363
中文引用格式： 劉欣，李衛(wèi)龍，張燦明. 基于邊窗濾波和擴張卷積的礦井行人檢測[J].電子技術應用，2020，46(10)：42-46，50.
英文引用格式： Liu Xin，Li Weilong，Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique，2020，46(10)：42-46，50.

Mine pedestrian detection based on side-window filter and dilated convolution

Liu Xin，Li Weilong，Zhang Canming

Anhui Academy of Coal Science，Hefei 230001，China

Abstract： In digitalized mines, pedestrian detection system is able to greatly reduce accident casualties, which is an essential strategy for guaranteeing workers′ well-being. In order to establish mine pedestrian detection system with high performance, a mine pedestrian detection based on side-window filter and dilated convolution is proposed. Specifically, in terms of mines environment with complicated and hostile conditions, side-window filter is adopted to suppress disturbing signals in surveillance pictures, improving image quality. In addition, considering the multi-scale characteristic of pedestrian objects, dilated convolution is introduced into model to increase receptive field of features, thus enhancing detection performance. A number of comparison experiments are conducted to illustrate the effectiveness of side-window filter and dilated convolution, and the model achieves excellent performance of 94.3 mAP and 99.1% of detection accuracy on the mine dataset.

Key words : pedestrian detection；side-window filter；dilated convolution；deep learning

0 引言

數(shù)字化礦山是實現(xiàn)智能化、現(xiàn)代化煤炭生產的重要基礎，對于煤炭產業(yè)的可持續(xù)發(fā)展有著極為重要的意義。采礦自動化、運輸智能化、管理信息化是實現(xiàn)數(shù)字化礦山的三項關鍵技術^[1]。實現(xiàn)這些技術的前提是構建智能感知系統(tǒng)，而礦井行人檢測系統(tǒng)是實現(xiàn)井下智能調度、安全監(jiān)測等技術的先決條件^[2]。

近些年來，深度學習技術在多個計算機視覺領域迅猛發(fā)展^[3]，并在多個任務上獲得了優(yōu)異的性能，例如人臉檢測^[4]、物體分揀^[5]、缺陷檢測^[6]。具體到行人檢測任務上，R-CNN^[7]率先將深度學習技術應用在目標檢測任務。在此基礎上，F(xiàn)aster R-CNN^[8]改進候選框選擇機制，完備端對端檢測框架。2019年，來自Google Brain的TAN M等研究人員^[9]提出了基于自動網(wǎng)絡尋優(yōu)技術的EfficientNet，該模型通過動態(tài)調整網(wǎng)絡的深度、寬度和分辨率，尋找最優(yōu)的模型設計，在圖像分類、目標檢測等多個領域獲得先進表現(xiàn)。

圖像在構建和傳輸過程中，常因為外界干擾而導致質量退化。常見的解決方案是采用濾波方法對圖像做去噪處理^[10]。濾波算法可分成兩類：線性濾波和非線性濾波。常見的線性濾波包括盒子濾波、高斯濾波；非線性濾波包括中值濾波、雙邊濾波等。在深度學習算法中，濾波算法常用于圖像預處理、特征提取、邊緣獲取等。尤其是對于邊緣檢測，濾波算法基于研究人員對于圖像的先驗知識，充分地提取圖像的邊緣信息，實現(xiàn)對興趣區(qū)域的精準定位分割^[11]。傳統(tǒng)濾波算法受限于濾波核結構和運算機理，雖然可以抑制噪聲，但同時會造成邊緣信息丟失，對檢測模型產生負面影響。近些年來，大量的保邊濾波算法被提出，用于保留的更多的邊緣信息，例如全變分濾波算法^[12]、加權最小二乘濾波^[13]和導向濾波^[14]等。

對于礦井環(huán)境，構建行人檢測模型需要考慮多個特定的環(huán)境因素，包括監(jiān)控設備所處環(huán)境光線不足、粉塵點多，且捕獲圖像存在較多干擾信號等硬件設備上的不利因素，又要考慮對多目標、不同尺度的行人目標實現(xiàn)準確檢測的要求。針對這些難點，本文從視頻圖像的處理和檢測模型的改進兩個角度出發(fā)，采用邊窗濾波抑制視頻圖像的干擾信號，在模型網(wǎng)絡中引入擴張卷積處理多尺度目標。實驗證明模型在礦井數(shù)據(jù)集上取得了優(yōu)異的檢測性能。本文的主要貢獻如下：針對礦井環(huán)境存在的多樣不利因素，采用邊窗濾波抑制視頻圖像的干擾信號，為行人檢測模型提供優(yōu)質的輸入圖像；采用先進的EfficientNet作為網(wǎng)絡主干，用于提取輸入圖像的特征，并在網(wǎng)絡主干中引入擴張卷積，增大特征的感受野，促使網(wǎng)絡在多尺度目標上獲得更為優(yōu)異的檢測性能。

本文詳細內容請下載:http://forexkbc.com/resource/share/2000003018

作者信息:

劉欣，李衛(wèi)龍，張燦明

(安徽省煤炭科學研究院，安徽合肥230001)

原創(chuàng)聲明：此內容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權禁止轉載。

相關內容