本發(fā)明涉及圖像處理和機(jī)器視覺技術(shù)領(lǐng)域,具體涉及一種基于蜂群算法優(yōu)化歸一化割的學(xué)習(xí)者姿態(tài)識(shí)別方法。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和數(shù)字化時(shí)代的到來,在線學(xué)習(xí)作為一種便捷新穎的學(xué)習(xí)方式,成為一種主導(dǎo)的遠(yuǎn)程教育形式,日益廣泛地影響著我們的學(xué)習(xí)和工作。學(xué)習(xí)者的身體姿態(tài)部分體現(xiàn)了學(xué)習(xí)者的學(xué)習(xí)狀態(tài)。學(xué)習(xí)者姿態(tài)識(shí)別能夠有效地評(píng)價(jià)在線學(xué)習(xí)過程中學(xué)習(xí)者的學(xué)習(xí)狀態(tài),使教師得到更多的反饋信息,對(duì)于教師事后分析學(xué)習(xí)者的學(xué)習(xí)狀態(tài)、改進(jìn)教學(xué)過程具有重要作用。
張鴻宇等人提出了一種基于深度圖像的多學(xué)習(xí)者姿態(tài)識(shí)別的方法,首先通過kinect的紅外傳感器獲取包含深度信息的深度圖像,利用深度圖像進(jìn)行人像-背景分離,結(jié)合人臉檢測技術(shù)對(duì)人體輪廓進(jìn)行篩選校正,然后提取人體的輪廓特征hu矩,采用svm分類器對(duì)輪廓特征進(jìn)行分類和識(shí)別,實(shí)驗(yàn)表明這種方法可以獲得正坐、舉手和低頭等3種坐姿的較為準(zhǔn)確的識(shí)別率。張永強(qiáng)提出一種hu不變矩和人工魚群優(yōu)化支持向量機(jī)的人體運(yùn)動(dòng)姿態(tài)識(shí)別方法,首先以二維連續(xù)圖像為基礎(chǔ),采用高斯模型和背景差相結(jié)合的方法將人體運(yùn)動(dòng)目標(biāo)提取出來,然后提取圖像中人體運(yùn)動(dòng)姿態(tài)識(shí)別的7個(gè)hu不變矩,將其輸入到svm中進(jìn)行訓(xùn)練,并采用人工魚群算法對(duì)svm參數(shù)進(jìn)行優(yōu)化,通過尋找一個(gè)最優(yōu)超平面,將所有人體運(yùn)動(dòng)姿態(tài)分類數(shù)據(jù)集中的類別分開,完成識(shí)別,實(shí)驗(yàn)結(jié)果表明,該方法是一種有效的人體運(yùn)動(dòng)姿態(tài)識(shí)別方法。黃國范等人提出了一種人體動(dòng)作姿態(tài)的自動(dòng)識(shí)別方法,采用圖像差分方法檢測出圖像序列中的人體動(dòng)作姿態(tài),用運(yùn)動(dòng)歷史圖像和運(yùn)動(dòng)能量圖像分別表示動(dòng)作姿態(tài)發(fā)生的區(qū)域以及動(dòng)作姿態(tài)發(fā)生的過程,并從中提取出改進(jìn)的不變矩作為特征向量,采用模板匹配的方法進(jìn)行人體動(dòng)作姿態(tài)的自動(dòng)識(shí)別,實(shí)驗(yàn)結(jié)果表明該方法顯著地提高了人體動(dòng)作姿態(tài)的識(shí)別效率。
上述姿態(tài)識(shí)別模型在進(jìn)行目標(biāo)提取階段采用深度圖像或圖像差分法將人體目標(biāo)提取出來;在進(jìn)行特征提取階段,提取出hu矩作為特征向量,hu矩不能完全提取圖像中的信息,而且它們是非正交的,具有信息冗余性。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明針對(duì)已有技術(shù)的不足,提供一種分割效果好、識(shí)別率高的基于蜂群算法優(yōu)化歸一化割的學(xué)習(xí)者姿態(tài)識(shí)別方法。
解決上述技術(shù)問題所采用的技術(shù)方案由下述步驟組成:
(1)人像與背景的分離
引入萊維飛行和動(dòng)態(tài)權(quán)重的蜂群算法優(yōu)化歸一化割,對(duì)學(xué)習(xí)者姿態(tài)圖像進(jìn)行分割,得到原圖像的二值圖像,實(shí)現(xiàn)人像與背景分離,步驟如下:
1)對(duì)彩色圖像紅﹑綠﹑藍(lán)三個(gè)顏色通道分別進(jìn)行模糊c均值聚類預(yù)處理,把圖像劃分成n塊最大相似區(qū)域,n為6~20的正整數(shù),取各區(qū)域在三個(gè)顏色通道上灰度值的平均值表示這個(gè)區(qū)域的像素值,以所有區(qū)域像素值構(gòu)造無向帶權(quán)圖g=(v,e),v是圖中的頂點(diǎn),e是連通兩個(gè)頂點(diǎn)的邊。
2)無向帶權(quán)圖g頂點(diǎn)集v分成兩個(gè)獨(dú)立的連通分圖a、b,a∪b=v,a∩b=φ,歸一化割準(zhǔn)則為:
式中,
3)隨機(jī)生成np個(gè)個(gè)體的初始蜜源位置xi,i=1,...,np,np是蜜源的個(gè)數(shù),np為有限的正整數(shù),采用式(1)作為適應(yīng)度函數(shù),確定每個(gè)初始蜜源的適應(yīng)度值。
4)為蜜源xi分配一只引領(lǐng)蜂,按式(2)進(jìn)行搜索,產(chǎn)生新蜜源,并評(píng)價(jià)新蜜源的適應(yīng)度,根據(jù)貪婪選擇的方法確定保留的蜜源。
xij(t+1)=xij(t)+step_size(t)×u(0,1)(2)
式中,xij是xi在第j個(gè)方向的位置,j∈{1,2,...,d},d是搜索維度,d為6~20的正整數(shù);t是局部搜索方法中的第t次迭代,t∈{1,2,...,m},最大迭代次數(shù)m,m為有限的正整數(shù);u(0,1)是在[0,1]之間的隨機(jī)數(shù);step_size(t)×u(0,1)是萊維分布中隨機(jī)飛行部分,其中:
step_size(t)=0.001×s(t)×slc(3)
式中,slc取全局最優(yōu)適應(yīng)度值,s(t)是通過萊維分布產(chǎn)生的步長;步長s通過式(4)確定:
其中,0<β<2,u和v由式(5)所示的正態(tài)分布確定,如式(5)所示:
其中
其中,γ(.)是gamma函數(shù)。
5)由公式(6)確定引領(lǐng)蜂找到的蜜源被跟隨的概率:
fiti是第i個(gè)蜜源的適應(yīng)度值。
6)跟隨蜂采用公式(7)方式進(jìn)行搜索,產(chǎn)生新蜜源,根據(jù)貪婪選擇方法確定保留的蜜源;
式中j是在[1,d]中的一個(gè)隨機(jī)整數(shù),表示引領(lǐng)蜂隨機(jī)地選擇一維進(jìn)行搜索;t是第t次迭代;k∈{1,2,...,np},k≠i,表示在np個(gè)蜜源中隨機(jī)選擇一個(gè)不等于i的蜜源;
w(t)=(wmax-wmin)g(t)+wmin(8)
wmax表示權(quán)重的上界,wmin表示權(quán)重的下界,0≤wmin<wmax≤1。
g(t)是群體的進(jìn)化成功率,其值由公式(9)得到:
公式(9)中,c(i,t)是個(gè)體蜂i在第t代的進(jìn)化成功率,由公式(10)得:
式中,
7)如果蜜源xi經(jīng)過閾值limit次迭代搜索而沒有找到更好的蜜源,limit為正整數(shù),且limit≤m,該蜜源xi將會(huì)被放棄,對(duì)應(yīng)的引領(lǐng)蜂角色變?yōu)閭刹旆?,否則直接轉(zhuǎn)到9)。
8)偵察蜂根據(jù)公式(11)按照隨機(jī)游動(dòng)方式產(chǎn)生新蜜源:
xij(t+1)=xij(t)+r(xil(t)-xim(t))(11)
式中xij是xi在第j個(gè)方向的位置,r是(0,1)之間的隨機(jī)數(shù),且服從均勻分布;xil(t)和xim(t)表示第t代的兩個(gè)隨機(jī)解,xil是xi在第l個(gè)方向的位置,l∈{1,2,...,d},xim是xi在第m個(gè)方向的位置,m∈{1,2,...,d},m≠l。
9)重復(fù)4)~8)最大迭代次數(shù)m次,則終止,輸出最優(yōu)解,否則轉(zhuǎn)到4)。
10)結(jié)合最優(yōu)適應(yīng)度值及個(gè)體蜂最優(yōu)位置指導(dǎo)分割圖像,得到原圖像的二值圖像,實(shí)現(xiàn)人像與背景的分離。
(2)對(duì)二值化后的圖像提取出學(xué)習(xí)者的輪廓圖像
1)對(duì)二值化后的圖像進(jìn)行膨脹。
2)膨脹后的圖像減去膨脹前的圖像,填充圖像的空洞區(qū)域,得到學(xué)習(xí)者的輪廓圖像。
(3)采用zernike矩進(jìn)行特征提取
1)用標(biāo)準(zhǔn)矩的方法對(duì)學(xué)習(xí)者的輪廓圖進(jìn)行歸一化處理,得到平移、尺度歸一化后的圖像。
2)設(shè)計(jì)zernike正交多項(xiàng)式
zernike多項(xiàng)式{vpq(x,y)}是定義在單位圓盤(x2+y2≤1)上的復(fù)值正交函數(shù)集,其表示形式:
vpq(x,y)=vpq(η,θ)=rpq(η)eiqθ(12)
其中,p是非負(fù)整數(shù),q是滿足以下條件的整數(shù):p-|q|是偶數(shù),而且|q|≤p;η表示原點(diǎn)到點(diǎn)(x,y)的矢量距離,且η≤1;θ表示矢量η與x軸逆時(shí)針方向的夾角。rpq(η)是實(shí)值徑向多項(xiàng)式:
3)用正交p階q重的zernike多項(xiàng)式構(gòu)造多階zernike矩:
式中,g(x,y)是歸一化后的學(xué)習(xí)者輪廓圖像,x和y表示圖像的位置,x2+y2≤1;*號(hào)表示共軛。
4)提取多階zernike矩特征向量,作為學(xué)習(xí)者行為姿態(tài)識(shí)別的輸入量。
(4)采用支持向量機(jī)對(duì)特征向量進(jìn)行訓(xùn)練以及識(shí)別學(xué)習(xí)者的姿態(tài)
將學(xué)習(xí)者姿態(tài)的特征向量分為訓(xùn)練樣本和測試樣本兩類,學(xué)習(xí)者姿態(tài)圖像按照所屬的類別分為正坐的標(biāo)簽為1、舉手的標(biāo)簽為2、低頭的標(biāo)簽為3,將學(xué)習(xí)者姿態(tài)訓(xùn)練樣本的特征向量及標(biāo)簽輸入支持向量機(jī)分類器訓(xùn)練,并將學(xué)習(xí)者姿態(tài)測試樣本的特征向量及標(biāo)簽輸入支持向量機(jī)分類器,由分類器對(duì)學(xué)習(xí)者姿態(tài)進(jìn)行識(shí)別。
在本發(fā)明的人像與背景的分離步驟(1)中,本發(fā)明的步驟1)為:對(duì)彩色圖像紅﹑綠﹑藍(lán)三個(gè)顏色通道分別進(jìn)行模糊c均值聚類預(yù)處理,把圖像劃分成n塊最大相似區(qū)域,n最佳為14,取各區(qū)域在三個(gè)顏色通道上灰度值的平均值表示這個(gè)區(qū)域的像素值,以所有區(qū)域像素值構(gòu)造無向帶權(quán)圖g=(v,e),v是圖中的頂點(diǎn),e是連通兩個(gè)頂點(diǎn)的邊。
在本發(fā)明的步驟4)為:為蜜源xi分配一只引領(lǐng)蜂,按式(2)進(jìn)行搜索,產(chǎn)生新蜜源,并評(píng)價(jià)新蜜源的適應(yīng)度,根據(jù)貪婪選擇的方法確定保留的蜜源。
xij(t+1)=xij(t)+step_size(t)×u(0,1)(2)
式中,xij是xi在第j個(gè)方向的位置,j∈{1,2,...,d},d是搜索維度,d最佳為14,t是局部搜索方法中的第t次迭代,t∈{1,2,...,m},最大迭代次數(shù)m,m最佳為100。u(0,1)是在[0,1]之間的隨機(jī)數(shù);step_size(t)×u(0,1)是萊維分布中隨機(jī)飛行部分,其中:
step_size(t)=0.001×s(t)×slc(3)
式中,slc取全局最優(yōu)適應(yīng)度值,s(t)是通過萊維分布產(chǎn)生的步長;步長s通過式(4)確定:
其中,β最佳為1.5,u和v由式(5)所示的正態(tài)分布確定,如式(5)所示:
其中
其中,γ(.)是gamma函數(shù)。
所述的步驟6)為:跟隨蜂采用公式(7)方式進(jìn)行搜索,產(chǎn)生新蜜源,根據(jù)貪婪選擇方法確定保留的蜜源。
式中j是在[1,14]中的一個(gè)隨機(jī)整數(shù),表示引領(lǐng)蜂隨機(jī)地選擇一維進(jìn)行搜索;t是第t次迭代;k∈{1,2,...,100},k≠i,表示在100個(gè)蜜源中隨機(jī)選擇一個(gè)不等于i的蜜源;
w(t)=(wmax-wmin)g(t)+wmin(8)
wmax表示權(quán)重的上界,wmin表示權(quán)重的下界,wmin最佳為0.2,wmax最佳為0.8,g(t)是群體的進(jìn)化成功率,其值由公式(9)得到:
(9)式中,c(i,t)是個(gè)體蜂i在第t代的進(jìn)化成功率,由公式(10)得:
式中,
在本發(fā)明的步驟7)為:如果蜜源xi經(jīng)過閾值limit次迭代搜索而沒有找到更好的蜜源,limit最佳為5,該蜜源xi將會(huì)被放棄,對(duì)應(yīng)的引領(lǐng)蜂角色變?yōu)閭刹旆?,否則直接轉(zhuǎn)到9)。
在本發(fā)明的步驟8)為:偵察蜂根據(jù)公式(11)按照隨機(jī)游動(dòng)方式產(chǎn)生新蜜源:
xij(t+1)=xij(t)+r(xil(t)-xim(t))(11)
式中xij是xi在第j個(gè)方向的位置,r是(0,1)之間的隨機(jī)數(shù),且服從均勻分布;xil(t)和xim(t)表示第t代的兩個(gè)隨機(jī)解,xil是xi在第l個(gè)方向的位置,l∈{1,2,...,14},xim是xi在第m個(gè)方向的位置,m∈{1,2,...,14},m≠l。
在本發(fā)明的步驟9)為:重復(fù)4)~8)最大迭代次數(shù)100次,則終止,輸出最優(yōu)解,否則轉(zhuǎn)到4)。
本發(fā)明采用引入萊維飛行和動(dòng)態(tài)權(quán)重的蜂群算法優(yōu)化歸一化割,對(duì)圖像進(jìn)行分割,根據(jù)需要較好地提取出目標(biāo)。本發(fā)明采用zernike矩進(jìn)行特征提取,zernike矩是基于zernike多項(xiàng)式的正交函數(shù),與hu矩相比,它能構(gòu)造任意高階矩,具有很好的特征表達(dá)能力,噪聲敏感度較小,解決了hu不變矩不能完全提取圖像中的信息的問題,分類效果更加理想。本發(fā)明在蜂群算法中引入萊維飛行機(jī)制,根據(jù)其不同的飛行步長采用不同搜索方式,不僅可以豐富種群多樣性還可以避免早熟收斂,陷入局部最優(yōu);并在蜂群算法中采用動(dòng)態(tài)權(quán)重機(jī)制,根據(jù)種群的進(jìn)化率來調(diào)整個(gè)體蜂搜索方式,動(dòng)態(tài)地平衡全局搜索和局部搜索能力。本發(fā)明具有分割效果好、識(shí)別率高等優(yōu)點(diǎn),可用于學(xué)習(xí)者姿態(tài)識(shí)別以及其它的圖像識(shí)別和分類任務(wù)。
附圖說明
圖1是學(xué)習(xí)者姿態(tài)識(shí)別方法流程圖。
圖2是學(xué)習(xí)者原始圖像。
圖3是學(xué)習(xí)者二值輪廓圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步詳細(xì)說明,但本發(fā)明不限于下述的實(shí)施例。
實(shí)施例1
以學(xué)習(xí)者舉手、正坐、低頭姿態(tài)為例,學(xué)習(xí)者姿態(tài)識(shí)別方法步驟如下:
(1)人像與背景的分離
引入萊維飛行和動(dòng)態(tài)權(quán)重的蜂群算法優(yōu)化歸一化割,對(duì)學(xué)習(xí)者姿態(tài)圖像進(jìn)行分割,得到原圖像的二值圖像,實(shí)現(xiàn)人像與背景分離,步驟如下:
1)對(duì)彩色圖像紅﹑綠﹑藍(lán)三個(gè)顏色通道分別進(jìn)行模糊c均值聚類預(yù)處理,把圖像劃分成n塊最大相似區(qū)域,本實(shí)施例n為14,取各區(qū)域在三個(gè)顏色通道上灰度值的平均值表示這個(gè)區(qū)域的像素值,以所有區(qū)域像素值構(gòu)造無向帶權(quán)圖g=(v,e),v是圖中的頂點(diǎn),e是連通兩個(gè)頂點(diǎn)的邊。
2)無向帶權(quán)圖g頂點(diǎn)集v分成兩個(gè)獨(dú)立的連通分圖a、b,a∪b=v,a∩b=φ,歸一化割準(zhǔn)則為:
式中,
3)隨機(jī)生成np個(gè)個(gè)體的初始蜜源位置xi,i=1,...,np,np是蜜源的個(gè)數(shù),np為有限的正整數(shù),本實(shí)施例的np為100,np也可取其它有限正整數(shù),采用式(1)作為適應(yīng)度函數(shù),確定每個(gè)初始蜜源的適應(yīng)度值。
4)為蜜源xi分配一只引領(lǐng)蜂,按式(2)進(jìn)行搜索,產(chǎn)生新蜜源,并評(píng)價(jià)新蜜源的適應(yīng)度,根據(jù)貪婪選擇的方法確定保留的蜜源:
xij(t+1)=xij(t)+step_size(t)×u(0,1)(2)
式中,xij是xi在第j個(gè)方向的位置,j∈{1,2,...,d},d是搜索維度,本實(shí)施例的d為14,t是局部搜索方法中的第t次迭代,t∈{1,2,...,m},最大迭代次數(shù)m,m為100;u(0,1)是在[0,1]之間的隨機(jī)數(shù);step_size(t)×u(0,1)是萊維分布中隨機(jī)飛行部分,其中:
step_size(t)=0.001×s(t)×slc(3)
式中,slc取全局最優(yōu)適應(yīng)度值,s(t)是通過萊維分布產(chǎn)生的步長;步長s通過式(4)確定:
其中,0<β<2,本實(shí)施例的β為1.5,u和v由式(5)所示的正態(tài)分布確定,如式(5)所示:
其中
其中,γ(.)是gamma函數(shù)。
本實(shí)施例式(2)中,將蜂群算法中的相應(yīng)的步驟進(jìn)行了修改,在蜂群算法中引入萊維分布中隨機(jī)飛行部分step_size(t)×u(0,1),根據(jù)其不同的飛行步長采用不同搜索方式,不僅可以豐富種群多樣性還可以避免早熟收斂,陷入局部最優(yōu)。
5)由公式(6)確定引領(lǐng)蜂找到的蜜源被跟隨的概率:
fiti是第i個(gè)蜜源的適應(yīng)度值。
6)跟隨蜂采用公式(7)方式進(jìn)行搜索,產(chǎn)生新蜜源,根據(jù)貪婪選擇方法確定保留的蜜源;
式中j是在[1,14]中的一個(gè)隨機(jī)整數(shù),表示引領(lǐng)蜂隨機(jī)地選擇一維進(jìn)行搜索;t是第t次迭代;k∈{1,2,...,100},k≠i,表示在100個(gè)蜜源中隨機(jī)選擇一個(gè)不等于i的蜜源;
w(t)=(wmax-wmin)g(t)+wmin(8)
wmax表示權(quán)重的上界,wmin表示權(quán)重的下界,0≤wmin<wmax≤1,本實(shí)施例wmin為0.2,wmax為0.8,g(t)是群體的進(jìn)化成功率,其值由公式(9)得到:
(9)式中,c(i,t)是個(gè)體蜂i在第t代的進(jìn)化成功率,由公式(10)得:
式中,
本實(shí)施例對(duì)蜂群算法進(jìn)行了修改,在式(7)中補(bǔ)入動(dòng)態(tài)權(quán)重w(t),在蜂群算法中采用動(dòng)態(tài)權(quán)重機(jī)制,根據(jù)種群的進(jìn)化率來調(diào)整個(gè)體蜂搜索方式,動(dòng)態(tài)地平衡全局搜索和局部搜索能力。
7)如果蜜源xi經(jīng)過閾值limit次迭代搜索而沒有找到更好的蜜源,limit為正整數(shù),且limit≤m,本實(shí)施例的limit為5,該蜜源xi將會(huì)被放棄,對(duì)應(yīng)的引領(lǐng)蜂角色變?yōu)閭刹旆洌駝t直接轉(zhuǎn)到9)。
8)偵察蜂根據(jù)公式(11)按照隨機(jī)游動(dòng)方式產(chǎn)生新蜜源:
xij(t+1)=xij(t)+r(xil(t)-xim(t))(11)
式中xij是xi在第j個(gè)方向的位置,r是(0,1)之間的隨機(jī)數(shù),且服從均勻分布;xil(t)和xim(t)表示第t代的兩個(gè)隨機(jī)解,xil是xi在第l個(gè)方向的位置,l∈{1,2,...,14},xim是xi在第m個(gè)方向的位置,m∈{1,2,...,14},m≠l。
本實(shí)施例對(duì)蜂群算法進(jìn)行了修改,式(11)由xij=xminj+rand(0,1)(xmaxj-xminj)修改而成,應(yīng)用隨機(jī)游動(dòng)在蜂群算法中能夠使得快速收斂到全局最優(yōu)解。
9)重復(fù)4)~8)最大迭代次數(shù)100次,則終止,輸出最優(yōu)解,否則轉(zhuǎn)到4)。
10)結(jié)合最優(yōu)適應(yīng)度值及個(gè)體蜂最優(yōu)位置指導(dǎo)分割圖像,得到原圖像的二值圖像,實(shí)現(xiàn)人像與背景的分離。
(2)對(duì)二值化后的圖像運(yùn)用數(shù)學(xué)形態(tài)學(xué)運(yùn)算提取出學(xué)習(xí)者的輪廓圖像
1)對(duì)二值化后的圖像進(jìn)行膨脹;
2)膨脹后的圖像減去膨脹前的圖像,填充圖像的空洞區(qū)域,得到學(xué)習(xí)者的輪廓圖像;
(3)采用zernike矩進(jìn)行特征提取
1)用標(biāo)準(zhǔn)矩的方法對(duì)學(xué)習(xí)者的輪廓圖進(jìn)行歸一化處理,得到平移、尺度歸一化后的圖像,步驟如下:
a.定義標(biāo)準(zhǔn)矩mpq為:
mpq=∑∑xpyqf(x,y)
式中,階數(shù)p,q=0,1,2...,f(x,y)是目標(biāo)圖像,x和y表示像素的坐標(biāo)位置,f代表像素的數(shù)值。
b.由標(biāo)準(zhǔn)矩得到目標(biāo)圖像的形心坐標(biāo)
c.定義一個(gè)尺度因子
d.通過坐標(biāo)變換公式
得到平移、尺度歸一化后的圖像。
2)設(shè)計(jì)zernike正交多項(xiàng)式;
zernike多項(xiàng)式{vpq(x,y)}是定義在單位圓盤(x2+y2≤1)上的復(fù)值正交函數(shù)集,其表示形式:
vpq(x,y)=vpq(η,θ)=rpq(η)eiqθ(12)
其中,p是非負(fù)整數(shù),q是滿足以下條件的整數(shù):p-|q|是偶數(shù),而且|q|≤p;η表示原點(diǎn)到點(diǎn)(x,y)的矢量距離,且η≤1;θ表示矢量η與x軸逆時(shí)針方向的夾角;rpq(η)是實(shí)值徑向多項(xiàng)式:
3)用正交p階q重的zernike多項(xiàng)式構(gòu)造多階zernike矩:
式中,g(x,y)是歸一化后的學(xué)習(xí)者輪廓圖像,x和y表示圖像的位置,x2+y2≤1;*號(hào)表示共軛;
4)提取多階zernike矩特征向量,作為學(xué)習(xí)者行為姿態(tài)識(shí)別的輸入量。p,q的取值及相應(yīng)的學(xué)習(xí)者輪廓zernike矩特征數(shù)據(jù)見表1。
表1是學(xué)習(xí)者輪廓zernike矩特征數(shù)據(jù)
由表1可見,zernike矩能構(gòu)造高階矩,具有很好的特征表達(dá)能力。
本實(shí)施例采用zernike矩進(jìn)行特征提取,zernike矩是基于zernike多項(xiàng)式的正交函數(shù),與hu矩相比,它能構(gòu)造任意高階矩,具有很好的特征表達(dá)能力,噪聲敏感度較小,解決了hu不變矩不能完全提取圖像中的信息的問題,分類效果更加理想。
(4)采用支持向量機(jī)對(duì)特征向量進(jìn)行訓(xùn)練以及識(shí)別學(xué)習(xí)者的姿態(tài)
將學(xué)習(xí)者姿態(tài)的特征向量分為訓(xùn)練樣本和測試樣本兩類,學(xué)習(xí)者姿態(tài)圖像按照所屬的類別分為正坐的標(biāo)簽為1、舉手的標(biāo)簽為2、低頭的標(biāo)簽為3,將學(xué)習(xí)者姿態(tài)訓(xùn)練樣本的特征向量及標(biāo)簽輸入支持向量機(jī)分類器訓(xùn)練,并將學(xué)習(xí)者姿態(tài)測試樣本的特征向量及標(biāo)簽輸入支持向量機(jī)分類器,由分類器對(duì)學(xué)習(xí)者姿態(tài)進(jìn)行識(shí)別。
實(shí)施例2
以學(xué)習(xí)者舉手、正坐、低頭姿態(tài)為例,學(xué)習(xí)者姿態(tài)識(shí)別方法步驟如下:
(1)人像與背景的分離
引入萊維飛行和動(dòng)態(tài)權(quán)重的蜂群算法優(yōu)化歸一化割,對(duì)學(xué)習(xí)者姿態(tài)圖像進(jìn)行分割,得到原圖像的二值圖像,實(shí)現(xiàn)人像與背景分離,步驟如下:
1)對(duì)彩色圖像紅﹑綠﹑藍(lán)三個(gè)顏色通道分別進(jìn)行模糊c均值聚類預(yù)處理,把圖像劃分成n塊最大相似區(qū)域,n為6,取各區(qū)域在三個(gè)顏色通道上灰度值的平均值表示這個(gè)區(qū)域的像素值,以所有區(qū)域像素值構(gòu)造無向帶權(quán)圖g=(v,e),v是圖中的頂點(diǎn),e是連通兩個(gè)頂點(diǎn)的邊。
步驟2)和步驟3)與實(shí)施例1相同。
4)為蜜源xi分配一只引領(lǐng)蜂,按式(2)進(jìn)行搜索,產(chǎn)生新蜜源,并評(píng)價(jià)新蜜源的適應(yīng)度,根據(jù)貪婪選擇的方法確定保留的蜜源;
xij(t+1)=xij(t)+step_size(t)×u(0,1)(2)
式中,xij是xi在第j個(gè)方向的位置,j∈{1,2,...,d},d是搜索維度,本實(shí)施例的d為6,t是局部搜索方法中的第t次迭代,t∈{1,2,...,m},最大迭代次數(shù)m,m為100;u(0,1)是在[0,1]之間的隨機(jī)數(shù);step_size(t)×u(0,1)是萊維分布中隨機(jī)飛行部分,其中:
step_size(t)=0.001×s(t)×slc(3)
式中,slc取全局最優(yōu)適應(yīng)度值,s(t)是通過萊維分布產(chǎn)生的步長;步長s通過式(4)確定:
其中,0<β<2,本實(shí)施例的β為1.5,u和v由式(5)所示的正態(tài)分布確定,如式(5)所示:
其中
其中,γ(.)是gamma函數(shù)。
步驟5)與實(shí)施例1相同。
6)跟隨蜂采用公式(7)方式進(jìn)行搜索,產(chǎn)生新蜜源,根據(jù)貪婪選擇方法確定保留的蜜源;
式中j是在[1,6]中的一個(gè)隨機(jī)整數(shù),表示引領(lǐng)蜂隨機(jī)地選擇一維進(jìn)行搜索;t是第t次迭代;k∈{1,2,...,100},k≠i,表示在100個(gè)蜜源中隨機(jī)選擇一個(gè)不等于i的蜜源;
w(t)=(wmax-wmin)g(t)+wmin(8)
wmax表示權(quán)重的上界,wmin表示權(quán)重的下界,0≤wmin<wmax≤1本實(shí)施例wmin為0,wmax為0.8,g(t)是群體的進(jìn)化成功率,其值由公式(9)得到:
(9)式中,c(i,t)是個(gè)體蜂i在第t代的進(jìn)化成功率,由公式(10)求得:
式中,
7)如果蜜源xi經(jīng)過閾值limit次迭代搜索而沒有找到更好的蜜源,limit為正整數(shù),且limit≤m,本實(shí)施例的limit為1,該蜜源xi將會(huì)被放棄,對(duì)應(yīng)的引領(lǐng)蜂角色變?yōu)閭刹旆?,否則直接轉(zhuǎn)到9)。
8)偵察蜂根據(jù)公式(11)按照隨機(jī)游動(dòng)方式產(chǎn)生新蜜源:
xij(t+1)=xij(t)+r(xil(t)-xim(t))(11)
式中xij是xi在第j個(gè)方向的位置,r是(0,1)之間的隨機(jī)數(shù),且服從均勻分布;xil(t)和xim(t)表示第t代的兩個(gè)隨機(jī)解,xil是xi在第l個(gè)方向的位置,l∈{1,2,...,6},xim是xi在第m個(gè)方向的位置,m∈{1,2,...,6},m≠l。
其它步驟與實(shí)施例1相同。
實(shí)施例3
以學(xué)習(xí)者舉手、正坐、低頭姿態(tài)為例,學(xué)習(xí)者姿態(tài)識(shí)別方法步驟如下:
(2)人像與背景的分離
引入萊維飛行和動(dòng)態(tài)權(quán)重的蜂群算法優(yōu)化歸一化割,對(duì)學(xué)習(xí)者姿態(tài)圖像進(jìn)行分割,得到原圖像的二值圖像,實(shí)現(xiàn)人像與背景分離,步驟如下:
1)對(duì)彩色圖像紅﹑綠﹑藍(lán)三個(gè)顏色通道分別進(jìn)行模糊c均值聚類預(yù)處理,把圖像劃分成n塊最大相似區(qū)域,n為20,取各區(qū)域在三個(gè)顏色通道上灰度值的平均值表示這個(gè)區(qū)域的像素值,以所有區(qū)域像素值構(gòu)造無向帶權(quán)圖g=(v,e),v是圖中的頂點(diǎn),e是連通兩個(gè)頂點(diǎn)的邊。
步驟2)和步驟3)與實(shí)施例1相同。
4)為蜜源xi分配一只引領(lǐng)蜂,按式(2)進(jìn)行搜索,產(chǎn)生新蜜源,并評(píng)價(jià)新蜜源的適應(yīng)度,根據(jù)貪婪選擇的方法確定保留的蜜源;
xij(t+1)=xij(t)+step_size(t)×u(0,1)(2)
式中,xij是xi在第j個(gè)方向的位置,j∈{1,2,...,d},d是搜索維度,本實(shí)施例的d為20,t是局部搜索方法中的第t次迭代,t∈{1,2,...,m},最大迭代次數(shù)m,m為100;u(0,1)是在[0,1]之間的隨機(jī)數(shù);step_size(t)×u(0,1)是萊維分布中隨機(jī)飛行部分,其中:
step_size(t)=0.001×s(t)×slc(3)
式中,slc取全局最優(yōu)適應(yīng)度值,s(t)是通過萊維分布產(chǎn)生的步長;步長s通過式(4)確定:
其中,0<β<2,本實(shí)施例的β為1.5,u和v由式(5)所示的正態(tài)分布確定,如式(5)所示:
其中
其中,γ(.)是gamma函數(shù)。
步驟5)與實(shí)施例1相同。
6)跟隨蜂采用公式(7)方式進(jìn)行搜索,產(chǎn)生新蜜源,根據(jù)貪婪選擇方法確定保留的蜜源;
式中j是在[1,20]中的一個(gè)隨機(jī)整數(shù),表示引領(lǐng)蜂隨機(jī)地選擇一維進(jìn)行搜索;t是第t次迭代;k∈{1,2,...,100},k≠i,表示在100個(gè)蜜源中隨機(jī)選擇一個(gè)不等于i的蜜源;
w(t)=(wmax-wmin)g(t)+wmin(8)
wmax表示權(quán)重的上界,wmin表示權(quán)重的下界,0≤wmin<wmax≤1本實(shí)施例wmin為0.2,wmax為1,g(t)是群體的進(jìn)化成功率,其值由公式(9)得到:
(9)式中,c(i,t)是個(gè)體蜂i在第t代的進(jìn)化成功率,由公式(10)求得:
式中,
7)如果蜜源xi經(jīng)過閾值limit次迭代搜索而沒有找到更好的蜜源,limit為正整數(shù),且limit≤m,本實(shí)施例的limit為100,該蜜源xi將會(huì)被放棄,對(duì)應(yīng)的引領(lǐng)蜂角色變?yōu)閭刹旆?,否則直接轉(zhuǎn)到9)。
8)偵察蜂根據(jù)公式(11)按照隨機(jī)游動(dòng)方式產(chǎn)生新蜜源:
xij(t+1)=xij(t)+r(xil(t)-xim(t))(11)
式中xij是xi在第j個(gè)方向的位置,r是(0,1)之間的隨機(jī)數(shù),且服從均勻分布;xil(t)和xim(t)表示第t代的兩個(gè)隨機(jī)解,xil是xi在第l個(gè)方向的位置,l∈{1,2,...,20},xim是xi在第m個(gè)方向的位置,m∈{1,2,...,20},m≠l。
其它步驟與實(shí)施例1相同。