摘 要: 提出了一種利用雙閾值自適應變化逼近視頻鏡頭分割最佳閾值的算法,,在雙閾值各區(qū)間漏檢或誤檢的判別通過相似度差異來完成,。實驗結果表明,該算法能夠得到較為理想的錯檢率,,并能得到比固定閾值算法更低的漏檢率,。
關鍵詞: 足球視頻; OpenCV,; 自適應雙閾值,; 鏡頭邊界檢測
鏡頭邊界檢測與分割是進行基于內容的足球視頻查詢、檢索與精彩度分析的重要環(huán)節(jié),,其目的是將輸入的視頻流分割成基本視頻單元的集合,,最終提取出關鍵幀和運動信息。相比于模板匹配,、邊緣輪廓特征和聚類算法[1-2],,基于直方圖比較的算法[3]效率較高,應用普遍,。但利用直方圖進行視頻分割的效果與直方圖相似度算法的選取,、門限值的設置有很大關系,。
Bhattacharyya距離完全匹配是0,完全不匹配是1,,為了進行比較,,圖1中的B相似度定義為1-Bhattacharyya距離。從圖1可以看出:(1)隨著閾值的提高,,鏡頭檢測的誤檢數(shù)增多,;隨著閾值的降低,鏡頭檢測的漏檢數(shù)增多,。雖然選取一個適當?shù)拈撝的苁圭R頭檢測的誤檢數(shù)與漏檢數(shù)之和達到最低點,,但對于固定閾值的檢測算法,很難得到誤檢數(shù)與漏檢數(shù)都很低的結果,;(2)在采用固定閾值檢測時,,不同的直方圖相似度檢測算法閾值選取的最佳點也不同。因此,,為了同時獲得較低的誤檢率與漏檢率[4],,在鏡頭檢測與分割過程中自適應改變閾值具有非常重要的意義[5-7]。本文提出了利用雙閾值自適應變化來動態(tài)跟蹤最佳閾值的鏡頭檢測與分割算法,,對于降低漏檢取得了較好的檢測效果,。
2 基于雙閾值的視頻分割算法
2.1 基于直方圖鏡頭檢測與分割的足球視頻的特點
利用直方圖進行足球視頻鏡頭檢測與分割,可能造成過高的誤檢率,,這主要有以下幾方面原因:(1)足球視頻近景鏡頭中人物離鏡頭過近,,人物的運動造成視頻幀直方圖突變而形成誤檢;(2)中遠景中,,為了跟蹤比賽節(jié)奏,,鏡頭運動速度過快,造成視頻幀直方圖突變而形成誤檢,;(3)視頻中大量回放鏡頭的開始與結束是以漸變而不是切變發(fā)生的,,在漸變的過程中如果檢測閾值較低,就會造成單幀鏡頭分割的現(xiàn)象,。另外,,由于足球視頻一般是在某一個時間段內(比如下午)連續(xù)錄制的,亮度和飽和度的影響可以忽略,,直方圖距離的計算應以色度直方圖為主,,但在球場局部區(qū)域形成大面積陰影時,,要適當提高亮度直方圖相似度的影響因子,。
2.2 基于雙閾值的分割算法
基于雙閾值的分割算法的基本思想是:設置一個較大的閾值Tb和一個較小的閾值Ts,當直方圖的相似度小于Ts時,,分割鏡頭出現(xiàn),;當相似度大于Tb時,,沒有分割鏡頭出現(xiàn);當相似度介于Tb與Ts之間時,,表明閾值設置不合理,,若是漏檢,則應降低Tb,,若是誤檢,,則應加大Ts。算法的關鍵是判斷漏檢還是誤檢以及動態(tài)調整閾值的策略,。為了消除上述原因形成的誤檢鏡頭,,分割算法引入了鏡頭長度(shotlength,即鏡頭內幀數(shù))sl,,當檢測到鏡頭變換時,,首先判斷sl是否小于某一臨界值,如果小于則認為是誤檢,,不進行鏡頭分割,。具體的算法步驟如圖2所示。
閾值常量TU與TD的設置應滿足如下條件:當stt>TU時,,不應發(fā)生誤檢,;當stt<TD時,不應發(fā)生漏檢,。因此,,應設置極大的TU與極小的TD。當stt>(Tb+Ts)/2 時,,說明Ts不合理,,應提高Ts,從圖2可以看出,,stt越大,,Ts提高得越快;當stt<(Tb+Ts)/2時,,說明Tb不合理,,應降低Tb,從圖2可以看出,,stt越小,,Tb下降得越快。當stt在[TU,,Tb],、[Tb,Ts]和[Ts,TD]各區(qū)間時,,算法通過前后兩個相似度差值的絕對值來判斷是否發(fā)生漏檢或誤檢,,當漏檢發(fā)生時,適當提高Tb,,當誤檢發(fā)生時,,適當降低Ts;sl的最小值選取50,,即當幀頻為25幀/s時,,忽略時長小于2 s的鏡頭。
3 實驗結果與分析
本文在Visual C++開發(fā)平臺上利用OpenCV視覺庫實現(xiàn)了上述算法,。選取2010南非世界杯足球比賽的兩個視頻片斷進行分析,,實驗視頻中包括近景、中景,、遠景以及切變與漸變等鏡頭變換,。鏡頭中,人,、球和攝像機自身運動較大,。首先將視頻從RGB空間轉換到HSV空間,再對H通道的直方圖單獨進行分析,,直方圖相似度采用相交算法和B算法,。閾值常量TU、TD分別取1和0,。實驗結果如表1,、表2所示。
從表1和表2的檢測結果可以看出,,采用雙閾值的檢測方法對B算法和相交算法均適用,,檢測的誤檢數(shù)與漏檢數(shù)之和均小于(視頻片段1)或逼近(視頻片段2)采用固定閾值的檢測方案得出的最佳結果。比較可知,,采用雙閾值檢測能夠得到較少的漏檢數(shù),。由于視頻2片段在開始時并沒有太大的相似度波動,閾值收斂速度降低,,在開始時易造成誤檢和漏檢,,因此采用雙閾值B算法得到的誤檢數(shù)與漏檢數(shù)之和略高于固定閾值方案。采用固定閾值B檢測算法在閾值為0.9時檢測的漏檢偏高,,主要是因為鏡頭長度略大于50的誤檢太多,,導致后續(xù)視頻漏檢的產生。該雙閾值檢測算法可用于在檢測算法的最佳閾值未知的情況下,,要求盡量降低漏檢時的情況,。各種算法所需的時間如表3所示。
表3的數(shù)據(jù)是在各算法運行在相同的系統(tǒng)環(huán)境下得到的,計算所需時間時不考慮分割后的單鏡頭視頻的存儲時間,,只考慮分割算法的計算時間,。從表3可看出,,各個算法所需的計算時間大體相當,。這主要是由于雙閾值算法只是引入了一些簡單的比較和算術運算,并沒有增加算法的復雜度,,算法計算簡單,。
本文提出了利用雙閾值自適應變化動態(tài)跟蹤視頻分割中最佳閾值的方法。從實驗結果可以看出,,本算法能夠得到較低的檢測誤差,,同固定閾值相比,算法的漏檢數(shù)少,。但算法在判斷漏檢和誤檢時,,根據(jù)相似度差值分別采用了固定的參數(shù)0.08、0.12和0.2,,針對足球視頻的特點自適應改變上述參數(shù),,對于算法結果有很大改善。因此,,下一步的工作是對上述參數(shù)的設置展開研究,。
參考文獻
[1] Zhu Ce, Lin Xiao,, Chau L P. Hexagon-based search pattern for fast block motion estimation[J]. IEEE Transactions on Circuits and Systems for Video Technology,, 2002, 12(5): 349-355.
[2] CHENG W G,, XU D,, JIANG Y W, et al. Information theoreticmetrics in shot boundary detection[C]. Proeedings of IIH-MSP,, LNCS 3683,, Melbourne, Australia,, Sept. 2005. 388-394.
[3] RINSKA I K,, CARRATO S. Temporal video segmentation: a survey[J]. Signal Processing: Image Communication, 2001,, 16(5): 477-500.
[4] Jiang Xinghao,, Sun Tanfeng, Fang Zhixin,, et al. A video shot boundary detection method based on variable-size window [J]. Journal of Shanghai Jiaotong University,, 2009, 43(11):1681-1684.
[5] QI Y, HAUPTMANN A,, LIU T. Supervised classification for video shot segmentation[C]. Proceedings of the International Conference on Multimedia and EXPO,, Washington: IEEE Computer Society, 2003.
[6] MATSUMOTO K,, NAITO M,, HOASHI K, et al. SVM-based boundary detection with a novel feature[C]. Proceedings of the International Conference on Multimedia and EXPO. Washington: IEEE Computer Society,,2006.
[7] Cao Jiaorong,, Cai Anni. Algorithm for shot boundary detection based on support vector machine in compressed domain [J]. Acta Electronica Sinica, 2008,, 36(1):203-208.