《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 設(shè)計(jì)應(yīng)用 > 結(jié)合不確定性估計(jì)的輕量級(jí)人體關(guān)鍵點(diǎn)檢測(cè)算法
結(jié)合不確定性估計(jì)的輕量級(jí)人體關(guān)鍵點(diǎn)檢測(cè)算法
電子技術(shù)應(yīng)用
王亞?wèn)|,秦會(huì)斌
(杭州電子科技大學(xué) 新型電子器件與應(yīng)用研究所,,浙江 杭州 310018)
摘要: 人體關(guān)鍵點(diǎn)檢測(cè)在智能視頻監(jiān)控,、人機(jī)交互等領(lǐng)域有重要應(yīng)用。針對(duì)基于熱圖的人體關(guān)鍵點(diǎn)檢測(cè)算法依賴(lài)高分辨率熱圖,、計(jì)算資源消耗大的問(wèn)題,,提出一種結(jié)合不確定性估計(jì)的輕量級(jí)算法。使用低分辨率熱圖,,結(jié)合不確定性估計(jì)預(yù)測(cè)誤差分布的尺度參數(shù),,提高了預(yù)測(cè)結(jié)果的可信度;利用尺度參數(shù)監(jiān)督和約束熱圖,,緩解梯度消失,,增強(qiáng)了網(wǎng)絡(luò)的魯棒性。COCO數(shù)據(jù)集上實(shí)驗(yàn)結(jié)果表明,,與積分姿態(tài)回歸算法相比,,改進(jìn)后算法的平均精度提高了3.3%,降低了資源占用,。
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.233938
中文引用格式: 王亞?wèn)|,,秦會(huì)斌. 結(jié)合不確定性估計(jì)的輕量級(jí)人體關(guān)鍵點(diǎn)檢測(cè)算法[J]. 電子技術(shù)應(yīng)用,2023,,49(10):40-45.
英文引用格式: Wang Yadong,,Qin Huibin. Lightweight human key point detection algorithm with uncertainty[J]. Application of Electronic Technique,2023,,49(10):40-45.
Lightweight human key point detection algorithm with uncertainty
Wang Yadong,,Qin Huibin
(Institute of New Electron Device and Application,, Hangzhou Dianzi University, Hangzhou 310018,, China)
Abstract: Human key point detection has important applications in intelligent video surveillance, human-computer interaction and other fields. Aiming at the problem that the human key point detection algorithm based on heatmap depends on high-resolution heatmap and consumes large computational resources, a lightweight algorithm combined with uncertainty estimation is proposed. The reliability of prediction results is improved by using low resolution heatmap and combining uncertainty to estimate the scale parameters of prediction error distribution. The scale parameter is used to monitor and constrain the heatmap to alleviate the gradient disappearance and enhance the robustness of the network. The experiments on COCO dataset show that the average accuracy of the improved algorithm is improved by 3.3% and the resource occupation is reduced compared with integral pose regression.
Key words : human key point detection,;uncertainty estimation;lightweight,;integral pose regression(IPR)

0 引言

隨著社會(huì)發(fā)展,,監(jiān)控視頻分析正從人工走向智能,從傳統(tǒng)走向現(xiàn)代,。人體關(guān)鍵點(diǎn)檢測(cè)是以人為中心的視頻分析中的重要環(huán)節(jié),又稱(chēng)為人體姿態(tài)估計(jì)[1],。人體關(guān)鍵點(diǎn)是具有明確語(yǔ)義的關(guān)節(jié)點(diǎn)和部位,,是行為識(shí)別[2]、人機(jī)交互[3]和動(dòng)作捕捉[4]等應(yīng)用的重要基礎(chǔ),。

隨著卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,,CNN)的發(fā)展,人體關(guān)鍵點(diǎn)檢測(cè)取得顯著進(jìn)步,,精度逐漸提升,。基于深度卷積神經(jīng)網(wǎng)絡(luò)的人體關(guān)鍵點(diǎn)檢測(cè)算法分為兩類(lèi):基于熱圖表示的檢測(cè)方法和基于坐標(biāo)表示的回歸方法,。

自從Tompson等人[5]首次提出用熱圖表示關(guān)節(jié)點(diǎn),,檢測(cè)方法成為二維姿態(tài)估計(jì)的主流。孫科等人[6]針對(duì)關(guān)鍵點(diǎn)檢測(cè)任務(wù)提出HRNet,,整個(gè)網(wǎng)絡(luò)中保持高分辨率的特征圖,,通過(guò)并行連接多個(gè)不同分辨率的子網(wǎng)絡(luò),并在它們之間進(jìn)行信息交互和融合,,避免了信息的丟失和模糊,。檢測(cè)方法具有精度高、訓(xùn)練效率高和空間泛化性好等優(yōu)點(diǎn),。但是熱圖分辨率低于原圖分辨率導(dǎo)致的量化誤差和解碼過(guò)程中argmax操作不可微分,,使得檢測(cè)方法依賴(lài)高分辨率熱圖,限制了在嵌入式設(shè)備中的使用,。

回歸方法在人體姿態(tài)估計(jì)中研究較早,,但相關(guān)工作較少?;貧w方法直接端到端產(chǎn)生圖像中關(guān)鍵點(diǎn)的坐標(biāo),。Toshev等人[7]首次提出利用CNN回歸坐標(biāo)進(jìn)行人體姿態(tài)估計(jì)。Carreira等人[8]提出了一個(gè)迭代誤差反饋框架(Iterative Error Feedback,,IEF),,引入自上而下的反饋,,預(yù)測(cè)當(dāng)前估算值的偏移量并進(jìn)行迭代矯正。Nie等人[9]提出了單階段的多人姿態(tài)估計(jì)網(wǎng)絡(luò)(Single-stage Multi-person Pose Machine,,SPM),,采用根節(jié)點(diǎn)預(yù)測(cè)人體位置,然后預(yù)測(cè)關(guān)節(jié)點(diǎn)的偏移量,?;貧w方法擁有簡(jiǎn)單靈活高效等優(yōu)點(diǎn),但性能仍遜色于檢測(cè)方法,,尤其在遮擋,、截?cái)嗪瓦\(yùn)動(dòng)模糊等場(chǎng)景中誤差較大。


本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000005711




作者信息:

王亞?wèn)|,,秦會(huì)斌

(杭州電子科技大學(xué) 新型電子器件與應(yīng)用研究所,,浙江 杭州 310018)


微信圖片_20210517164139.jpg


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。