摘 要:針對目標(biāo)容易受背景干擾或局部的、不完全遮擋時Camshift算法易產(chǎn)生局部最大值導(dǎo)致丟失目標(biāo)的問題。通過人體姿態(tài)估計算法檢測到行人邊界框和關(guān)節(jié)點位置,依據(jù)的關(guān)節(jié)點位置提取行人的身體部分,進(jìn)而得到局部顏色直方圖;通過行人邊界框,計算全局直方圖均衡化;利用行人間局部直方圖的相似性得分,預(yù)測下一幀中目標(biāo)行人可能的位置,并以此確定Camshift算法的搜索區(qū)域。通過實驗證明,改進(jìn)后的算法可以更好地跟蹤行人。
關(guān)鍵詞:人體姿態(tài)估計 顏色直方圖 Camshift 直方圖均衡
《視聽》(月刊)創(chuàng)刊于2006年,是廣西第一份國內(nèi)外公開發(fā)行的以廣播影視為主體內(nèi)容,兼有新聞傳播、新媒體理論探索的當(dāng)代學(xué)術(shù)性省級綜合月刊。由廣西廣播電影電視局主管,廣西人民廣播電臺、廣西電視臺主辦。
行人跟蹤是計算機(jī)視覺領(lǐng)域重要的研究方向,尤其是在視頻監(jiān)控領(lǐng)域愈發(fā)發(fā)達(dá)的今天,行人跟蹤算法的提出可以大大地減少人工成本,應(yīng)用到生活中的許多方面。
目前,國內(nèi)外許多學(xué)者對行人跟蹤算法開展廣泛研究。其中,Camshift算法因計算量小,易于實現(xiàn)而被廣泛使用,文獻(xiàn)[1]提出了一種多特征融合的Camshift算法,提取行人的多個特征,然后把各個特征的相似度作為權(quán)值系數(shù),通過加權(quán)融合方法得到最優(yōu)中心位置。文獻(xiàn)[2]把kalman與Camshift相結(jié)合,通過kalman濾波器預(yù)測目標(biāo)行人可能的位置,但當(dāng)行人被遮擋時預(yù)測值會不準(zhǔn)確。
1 顏色特征
1.1 局部顏色直方圖
該文通過AlphaPose[3]算法得到行人的關(guān)節(jié)點位置,通過關(guān)節(jié)點框出人體的各個部分[4]。包括上臂、下臂、上腿、下腿、頭肩、上軀干和下軀干等肢體區(qū)域。人體的顏色信息主要表現(xiàn)在上軀干和下軀干,并且這兩部分很少收到背景的干擾,可以充分地代表這個人的顏色特征。局部顏色直方圖針對的是這兩部分。
為了減少光照對圖片造成的影響,顏色直方圖在HSV坐標(biāo)系下提取。
1.2 全局顏色直方圖
全局顏色直方圖是對由AlphaPose算法檢測到的行人框圖像的顏色直方圖,所提取的圖像不僅包括行人的信息還包括大量的背景信息,全局顏色直方圖的做法與局部提取顏色特征的方法相同。但當(dāng)行人的顏色信息與背景的顏色信息相似時,提取的局部顏色信息與全局顏色信息差別不是很大,容易導(dǎo)致跟蹤的過程中目標(biāo)丟失。該文使用直方圖均衡化來處理[5],更加突出行人顏色信息。
上面的過程是灰度圖像的直方圖均衡化,若對該文中所采用的圖片進(jìn)行直方圖均衡化,需要將彩色圖像的每路通道進(jìn)行量化,在依次采用上述的方法,最后可以得到均衡化后的彩色圖像的顏色直方圖。
2 預(yù)測目標(biāo)位置
該文通過AlphaPose算法檢測出下一幀圖像中所有行人的邊界框和關(guān)節(jié)點,計算出現(xiàn)的行人與目標(biāo)行人的局部顏色直方圖的相似性得分,采用巴氏系數(shù)來計算:
3 改進(jìn)的Camshift算法
Camshift算法是對Mean-Shift算法的改進(jìn),Camshift算法的基本思路是利用運動目標(biāo)的顏色特征對其跟蹤窗口的尺寸及位置進(jìn)行確定,并能不斷地調(diào)整跟蹤窗口的尺寸以適應(yīng)運動目標(biāo)大小的變化。
實現(xiàn)過程如下。
(1)讀取一張包含目標(biāo)人物的行人圖像,并把RGB顏色模型變?yōu)镠SV顏色模型,并提取其中的H分量。
(2)利用AlphaPose算法得到目標(biāo)人物的邊界框和關(guān)節(jié)點,把這個邊界框作為跟蹤窗口。
(3)計算行人邊界框的H、S、V分量的均衡化顏色直方圖和由通過關(guān)節(jié)點得到的上軀干和下軀干的局部顏色直方圖,得到顏色概率分布圖I(x,y)。
(4)計算目標(biāo)人物邊界框的質(zhì)心位置,并把跟蹤窗口中心點移動至質(zhì)心位置,判斷跟蹤窗口的移動距離是否滿足大于設(shè)定的閾值的條件,若不滿足條件,需要重新計算質(zhì)心位置,直到滿足條件為止。
(5)通過計算局部顏色直方圖的相似度來預(yù)測下一幀中目標(biāo)人物的質(zhì)心位置。
(6)重復(fù)上述的步驟(3)-步驟(5),直到完成檢測完所有的圖像。
4 實驗結(jié)果與分析
該文的程序是Python3.7及OpenCV3.0函數(shù)庫編寫。該文選擇了大小為12801080的PRW數(shù)據(jù)集,圖1為從PRW數(shù)據(jù)集選取的一部分連續(xù)幀,該文選取方框中的男人作為跟蹤對象,跟蹤結(jié)果如圖1(a)(b)所示。
由圖1(a)可知,當(dāng)目標(biāo)人物沒有遮擋,沒有大的場景變化時,可以很好地跟蹤目標(biāo),即使出現(xiàn)(b)的情況,也可以很好地跟蹤目標(biāo)。
5 結(jié)語
該文提出了一種改進(jìn)的Camshift算法。該算法通過AlphaPose算法得到的行人邊界框和關(guān)節(jié)點位置,通過得到的關(guān)節(jié)點位置提取行人上軀干和下軀干,得到局部顏色直方圖,根據(jù)局部顏色直方圖的相似性得分預(yù)測下一幀中行人目標(biāo)的位置;通過對行人邊界框進(jìn)行全局顏色直方圖均衡化,增強(qiáng)行人與背景間的對比度。實驗表明,該算法有很好的跟蹤效果。
參考文獻(xiàn)
[1] 吳瑋,鄭娟毅,杜樂.多特征融合的Camshift運動目標(biāo)跟蹤算法[J].計算機(jī)科學(xué),2018,45(7):252-258.
[2] 楊軍,湯全武,張昊楠.基于Kalman算法改進(jìn)的Camshift運動目標(biāo)跟蹤算法[J].信息通信,2018(12):78-81.
[3] Fang Haoshu,Xie Shuqin,Tai Yuwing,et al.RMPE: Regional Multi-Person Pose Estimation[A].IEEE International Conference on Computer Vision (ICCV)[C].2016.
[4] Xu Jing,Zhao Rui,Zhu Feng,et al.Attention-Aware Compositional Network for Person Re-identification[J]. CVPR,2018(5):2119-2128.
[5] 付麗梅.使用彩色直方圖均衡法改進(jìn)的Mean Shift行人跟蹤算法[J].軟件工程,2019,22(2):17-19.
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >