文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2020.08.011
引用格式: 王文成,,蔣慧,喬倩,,等. 基于深度學(xué)習(xí)的魚類識(shí)別與檢測(cè)的算法研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2020,
39(8):57-61,,66.
海洋作為地球上最大的生態(tài)系統(tǒng)包含極其豐富的生物和非生物資源。雖然我國(guó)海洋面積有300多萬(wàn)平方千米,,但是漁業(yè)資源作為海洋資源中重要的一項(xiàng)資源,,近年來(lái)呈現(xiàn)逐漸衰退趨勢(shì)。對(duì)周圍海域內(nèi)海底環(huán)境進(jìn)行實(shí)時(shí)監(jiān)測(cè),,分析研究海域中代表性魚類的分布概況及生活習(xí)性,,對(duì)于漁業(yè)資源可持續(xù)發(fā)展、探測(cè)未知生物資源有著重要意義,。
目標(biāo)識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域重要的研究方向之一,。隨著科學(xué)技術(shù)的進(jìn)步、計(jì)算硬件設(shè)備水平的提高,,基于深度學(xué)習(xí)的目標(biāo)識(shí)別檢測(cè)方法受到了人們廣泛關(guān)注,。杜衛(wèi)東等提出一種基于支持向量機(jī)(SVM)的多方位聲散射數(shù)據(jù)決策融合的魚類識(shí)別方法,識(shí)別準(zhǔn)確率達(dá)到90%以上,,姚潤(rùn)璐等通過(guò)分割魚體,,獲得魚肚、魚背圖像,,通過(guò)提取紋理特征和形狀特征,,識(shí)別率達(dá)到75%,相較于傳統(tǒng)的目標(biāo)檢測(cè)算法,,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的目標(biāo)檢測(cè)算法通過(guò)學(xué)習(xí)自動(dòng)提取顏色,、輪廓等底層的特征和更高級(jí)、抽象的特征,,然后利用分類模型進(jìn)行分類檢測(cè),,其檢測(cè)結(jié)果具有更高的精度和魯棒性。林明旺等采用VGG16模型進(jìn)行魚類分類識(shí)別,,但是數(shù)據(jù)集背景干擾強(qiáng)度大,,雖然進(jìn)行微調(diào),穩(wěn)定性仍然不好,。王文成等用ResNet50網(wǎng)絡(luò)模型對(duì)十種魚類做了分類識(shí)別,,準(zhǔn)確率達(dá)到了93.33%,但是數(shù)據(jù)集數(shù)量有限,,識(shí)別精度不高,;張俊龍等提出在預(yù)處理過(guò)程中使用權(quán)重化卷積操作,,對(duì)海洋魚類識(shí)別準(zhǔn)確率提升23%,在視頻觀測(cè)中精準(zhǔn)識(shí)別魚類;梁紅等通過(guò)對(duì)圖像進(jìn)行水下降噪的方法,,并且對(duì)預(yù)訓(xùn)練的網(wǎng)絡(luò)微調(diào)參數(shù),,在海洋魚類數(shù)據(jù)集上識(shí)別準(zhǔn)確率達(dá)到85.08%。
基于CNN的目標(biāo)檢測(cè)算法依據(jù)是否需要提取候選區(qū)域分為:基于有候選區(qū)域的目標(biāo)檢測(cè)算法和基于無(wú)候選區(qū)域的目標(biāo)檢測(cè)算法兩種,。區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(R-CNN),、快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Fast R-CNN)、超快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Faster R-CNN),,都屬于代表性的基于候選區(qū)域的目標(biāo)檢測(cè)算法,。該類算法從圖像中事先提取一系列可能的對(duì)象候選區(qū)域,然后從這些候選區(qū)域中提取特征并進(jìn)行判斷分類,。2019年,,袁紅春等人利用Faster R-CNN目標(biāo)檢測(cè)方法應(yīng)用到水下魚類種類識(shí)別中,識(shí)別準(zhǔn)率達(dá)到98.12%,。該類算法的檢測(cè)準(zhǔn)確率較高,,但是處理速度較慢,。無(wú)候選區(qū)域的目標(biāo)檢測(cè)算法的代表性算法有單級(jí)式目標(biāo)檢測(cè)(YOLO),、單點(diǎn)多盒檢測(cè)器(SSD)及其改進(jìn)的算法YOLO v2和深度監(jiān)督對(duì)象檢測(cè)器(DSOD)。此類算法去除候選區(qū)域提取過(guò)程,,使用神經(jīng)網(wǎng)絡(luò)直接將一整張圖片輸入神經(jīng)網(wǎng)絡(luò),,然后預(yù)測(cè)出bounding box的坐標(biāo)和物體的類別,、置信度,,檢測(cè)物體速度較快,。李慶忠等對(duì)YOLO實(shí)時(shí)目標(biāo)檢測(cè)算法進(jìn)行了改進(jìn),,采用遷移學(xué)習(xí)法訓(xùn)練網(wǎng)絡(luò),,預(yù)處理中圖像增強(qiáng)以及視頻幀數(shù)檢測(cè)速率上做了改變,,該算法提升了對(duì)海底小目標(biāo)檢測(cè)的性能,但存在檢測(cè)精度低,、檢測(cè)小目標(biāo)會(huì)有遺漏等問(wèn)題,。SSD算法同時(shí)融合了proposal-free的提取和Faster R-CNNs算法的優(yōu)點(diǎn),,與其他檢測(cè)算法相比,,即使輸入圖像尺寸小,SSD依然有更好的精度,。DSOD是一種改進(jìn)的SSD網(wǎng)絡(luò)框架算法。相比于SSD目標(biāo)檢測(cè)算法,,DSOD整個(gè)網(wǎng)絡(luò)采用密集的短連接和通道拼接技術(shù),,使得DSOD 的模型參數(shù)更小,同時(shí)能直接在目標(biāo)數(shù)據(jù)集上進(jìn)行訓(xùn)練,,而無(wú)需在ImageNet、COCO,、PASCAL VOC等公開數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。
基于上述的分析,,由于分類識(shí)別和檢測(cè)任務(wù)在統(tǒng)計(jì)分布和損失函數(shù)的差異,存在學(xué)習(xí)上的偏差,,為了解決這個(gè)問(wèn)題,本文利用深度監(jiān)督對(duì)象檢測(cè)器(DSOD)方法對(duì)選定魚類圖像進(jìn)行檢測(cè)分類識(shí)別研究,,該模型具有高效的目標(biāo)檢測(cè)網(wǎng)絡(luò),保持了處理速度,,提升了對(duì)小目標(biāo)的檢測(cè)性能,。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000003248
作者信息:
王文成1,,蔣 慧1,喬 倩1,,祝捍皓2,,鄭 紅2
(1.浙江海洋大學(xué) 船舶與機(jī)電工程學(xué)院,,浙江 舟山316022,;
2.浙江海洋大學(xué) 海洋科學(xué)與技術(shù)學(xué)院,,浙江 舟山316022)