《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 設(shè)計(jì)應(yīng)用 > 融合輕量化與梯形結(jié)構(gòu)的學(xué)生行為檢測(cè)算法
融合輕量化與梯形結(jié)構(gòu)的學(xué)生行為檢測(cè)算法
2022年電子技術(shù)應(yīng)用第12期
張 穎1,,張 喆1,,龍光利2
1.西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,,陜西 西安710048,; 2.陜西理工大學(xué) 物理與電信工程學(xué)院,,陜西 漢中723000
摘要: 為了解決常見(jiàn)目標(biāo)檢測(cè)算法在課堂場(chǎng)景中難以有效應(yīng)用的問(wèn)題,,提出了一種融合輕量化與梯形結(jié)構(gòu)的學(xué)生行為檢測(cè)算法。該算法基于YOLOv4架構(gòu),,針對(duì)目標(biāo)分類(lèi)和分布空間的特點(diǎn),,提出一種新的“梯”形特征融合結(jié)構(gòu),并結(jié)合MobileNetv2思想,,優(yōu)化模型參數(shù)得到梯形-MobileDarknet19特征提取網(wǎng)絡(luò),,既減少了網(wǎng)絡(luò)的計(jì)算量,提高了工作效率,,同時(shí)加強(qiáng)了目標(biāo)特征的信息傳輸,,提升了模型學(xué)習(xí)能力;在尺度檢測(cè)階段引入5層的DenseNet網(wǎng)絡(luò),,增強(qiáng)網(wǎng)絡(luò)對(duì)小目標(biāo)的檢測(cè)能力,。實(shí)驗(yàn)結(jié)果表明,提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%,,相比于其他主流算法,,在學(xué)生課堂行為檢測(cè)任務(wù)中具有較好的實(shí)用性。
中圖分類(lèi)號(hào): TP399
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.222837
中文引用格式: 張穎,,張喆,,龍光利. 融合輕量化與梯形結(jié)構(gòu)的學(xué)生行為檢測(cè)算法[J].電子技術(shù)應(yīng)用,2022,,48(12):47-53.
英文引用格式: Zhang Ying,,Zhang Zhe,Long Guangli. Student behavior detection algorithm combining lightweight and trapezoidal structure[J]. Application of Electronic Technique,,2022,,48(12):47-53.
Student behavior detection algorithm combining lightweight and trapezoidal structure
Zhang Ying1,Zhang Zhe1,,Long Guangli2
1.School of Automation and Information Engineering,,Xi′an University of Technology,Xi′an 710048,,China,; 2.School of Physics and Telecommunications Engineering,Shaanxi University of Technology,,Hanzhong 723000,,China
Abstract: In order to solve the problem that common target detection algorithms are difficult to apply effectively in classroom scenarios, a student behavior detection algorithm combining lightweight and trapezoidal structure is proposed. The algorithm is based on YOLOv4 architecture, according to the characteristics of target classification and distribution space, a new “trapezoidal” feature fusion structure is proposed, and combined with the MobileNetv2 idea, the model parameters are optimized to obtain a trapezoidal-MobileDarknet19 feature extraction network, which not only reduces the computational load of the network, but also improves the work efficiency. At the same time, it strengthens the information transmission of target features and improves the learning ability of the model. In the scale detection stage, a five-layer DenseNet network is introduced to enhance the network′s detection ability for small targets. The experimental results show that the proposed YOLOv4-ST algorithm is better than the original one. The mAP of YOLOv4 algorithm is improved by 5.5%. Compared with other mainstream algorithms, it has better practicability in the task of student classroom behavior detection.
Key words : trapezoidal structure;student behavior detection,;YOLOv4,;feature fusion;DenseNet

0 引言

    隨著教育現(xiàn)代化的推進(jìn),,信息化教學(xué)越來(lái)越普遍,,作為學(xué)校教育中最基本也是最重要的環(huán)節(jié),,課堂教學(xué)面臨著傳統(tǒng)走向現(xiàn)代的變革。課堂中,,老師通過(guò)觀(guān)察學(xué)生的表現(xiàn)獲得授課情況的反饋,,但一對(duì)多的教學(xué)方式存在著觀(guān)察不全面、可信度低,、無(wú)法實(shí)時(shí)掌握學(xué)生課堂學(xué)習(xí)情況等問(wèn)題,。將基于深度學(xué)習(xí)的行為檢測(cè)應(yīng)用到課堂教學(xué)場(chǎng)景中,通過(guò)實(shí)時(shí)監(jiān)控,,幫助老師全面地掌握學(xué)生課堂狀態(tài),,及時(shí)合理地調(diào)整教學(xué)進(jìn)度和策略,不僅能夠提高教學(xué)效率,,還能夠推動(dòng)智能化教學(xué)的發(fā)展,,為今后現(xiàn)代化課堂的探索奠定了基礎(chǔ)。

    近年來(lái),,隨著深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域取得了突破性進(jìn)展[1],,F(xiàn)aster-RCNN(Faster Region-based Convolutional Neural Networks)[2]、SSD(Single Shot Detection)[3],、YOLO(You Only Look Once)[4-6]等目標(biāo)檢測(cè)算法也相繼出現(xiàn),。Zheng等[7]通過(guò)一種新的特征融合策略改進(jìn)Faster R-CNN進(jìn)行行為檢測(cè),但檢測(cè)精度不高,;Liu等[8]提出了一種基于雙流結(jié)構(gòu)的改進(jìn)時(shí)空注意力模型,,將空間和時(shí)間特征分別饋入空間長(zhǎng)短期記憶(Long Short-rm Memory,LSTM)和時(shí)間LSTM,,融合特征來(lái)識(shí)別視頻中的不同動(dòng)作,;2020年,Bochkovskiy等[9]提出YOLOv4算法,,該算法的網(wǎng)絡(luò)骨干結(jié)構(gòu)使用了結(jié)合跨階段部分連接[10](Cross Stage Partial Connection)與Darknet53結(jié)合而形成的CSPDarknet53特征提取結(jié)構(gòu),,有效提升了檢測(cè)精度和速度;Ren等[11]通過(guò)在YOLOv4的特征提取結(jié)構(gòu)中添加了跳躍式的連接,,能夠融合更多的特征,,在一定程度上提升了學(xué)生行為檢測(cè)精度,但效率較低,。以上研究表明,深度學(xué)習(xí)用于學(xué)生行為檢測(cè)具有一定的理論基礎(chǔ)和實(shí)踐可行性,。雖然許多檢測(cè)算法在應(yīng)用領(lǐng)域表現(xiàn)優(yōu)異,,但對(duì)于課堂場(chǎng)景來(lái)說(shuō),學(xué)生活動(dòng)范圍有限,,受攝像頭位置及視覺(jué)角度的影響,,學(xué)生目標(biāo)較小且行為易受遮擋,導(dǎo)致會(huì)出現(xiàn)漏檢錯(cuò)檢、檢測(cè)精度低等問(wèn)題,。其次,,課堂學(xué)生行為檢測(cè)需要建立特定的學(xué)生行為數(shù)據(jù)集,要從海量的課堂監(jiān)控視頻進(jìn)行篩選和制作,,并選用適合的先驗(yàn)框參數(shù),,以適應(yīng)學(xué)生目標(biāo)尺寸。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000005039,。




作者信息:

張  穎1,,張  喆1,龍光利2

(1.西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,,陜西 西安710048,;

2.陜西理工大學(xué) 物理與電信工程學(xué)院,陜西 漢中723000)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載,。