本發(fā)明的技術(shù)方案涉及圖像數(shù)據(jù)處理中的圖像識(shí)別方法,具體地說是一種奶牛個(gè)體識(shí)別的方法。
背景技術(shù):
信息技術(shù)高速發(fā)展,農(nóng)業(yè)現(xiàn)代化步伐不斷加快,規(guī)模化、信息化奶牛養(yǎng)殖場得到了廣泛應(yīng)用,我國已基本形成高密度、集中化的奶牛養(yǎng)殖體系。奶牛個(gè)體識(shí)別作為奶牛信息化管理的基礎(chǔ),成為當(dāng)前畜牧業(yè)發(fā)展的一個(gè)研究熱點(diǎn)。隨著人工智能、模式識(shí)別領(lǐng)域研究的不斷深入,圖像處理正向著高速率、高分辨率、立體化、多媒體化、智能化和標(biāo)準(zhǔn)化方向發(fā)展。利用圖像處理方法將奶牛個(gè)體識(shí)別與計(jì)算機(jī)視覺相聯(lián)系,已逐漸成為一項(xiàng)推動(dòng)大規(guī)模奶牛信息化管理的重要舉措。
早期針對(duì)奶牛個(gè)體識(shí)別問題主要采取人工識(shí)別方法,但該方法耗時(shí)耗力、誤識(shí)別率較高。之后發(fā)展為采用標(biāo)簽識(shí)別的方法,分別為每頭奶牛佩戴上唯一的標(biāo)識(shí)號(hào)碼,但是依然存在人工量大、工作繁瑣的缺點(diǎn),此外,標(biāo)簽容易破損、過多的人為干涉可能降低奶牛產(chǎn)奶量,從而影響牛場的經(jīng)濟(jì)效益。目前畜牧業(yè)比較流行的識(shí)別技術(shù)是無線射頻技術(shù),但該方法無法實(shí)現(xiàn)遠(yuǎn)距離識(shí)別,同時(shí)識(shí)別率和成本的性價(jià)比較低。隨著計(jì)算機(jī)視覺的發(fā)展,結(jié)合奶牛特有的黑白條紋信息,利用圖像處理方法實(shí)現(xiàn)奶牛個(gè)體識(shí)別逐步引起國內(nèi)外相關(guān)學(xué)者的關(guān)注。wandrew等人在ieee圖像處理國際會(huì)議上發(fā)表的《automaticindividualholsteinfriesiancattleidentificationviaselectivelocalcoatpatternmatchinginrgb-dimagery》論文中提出了一種采用選擇性局部層模式特征用在彩色描述(rgb-d)圖像上進(jìn)行匹配的方法,該方法通過在奶牛rgb-d框架體系中采用自上而下的深度分割奶牛軀干圖像,然后提取仿射尺度不變特征轉(zhuǎn)換(asift)描述算子作為唯一標(biāo)識(shí),采用支持向量機(jī)(svm)進(jìn)行學(xué)習(xí)分類從而達(dá)到奶牛個(gè)體識(shí)別的目的。但是該方法對(duì)奶牛個(gè)體所處的環(huán)境依賴性比較強(qiáng),如果處在有光照或背景復(fù)雜的自然環(huán)境下,識(shí)別正確率難以保證。ahmeds等人在ieee計(jì)算機(jī)學(xué)會(huì)上發(fā)表的《muzzle-basedcattleidentificationusingspeeduprobustfeatureapproach》論文中提出了運(yùn)用加速魯棒特征(surf)算子提取奶牛嘴部紋理特征點(diǎn),然后利用svm分類器對(duì)奶牛個(gè)體進(jìn)行分類識(shí)別的方法,但是該方法對(duì)于采集數(shù)據(jù)的位置比較敏感,奶牛嘴部數(shù)據(jù)獲取具有一定的難度。cn105260750a公開了一種奶牛個(gè)體識(shí)別方法,該方法通過將捕捉到的奶牛實(shí)時(shí)圖像與事先建立好的模板圖像庫進(jìn)行匹配,將能夠成功匹配的模板庫中的奶牛個(gè)體的標(biāo)簽作為待識(shí)別奶牛的類別,但是該方法效率較低,每次匹配過程需要遍歷模板的數(shù)量可能很大。caic等人在信號(hào)與信息處理協(xié)會(huì)高峰會(huì)議上發(fā)表的《cattlefacerecognitionusinglocalbinarypatterndescriptor》論文中提出了一種基于牛臉模型的局部二值模式(lbp)紋理特征的方法,通過稀疏化和低秩分解用來提高圖片處理方法的魯棒性從而有效克服圖片中光照影響、圖像錯(cuò)位和閉塞的情況,結(jié)果表明lbp在一定程度上可以正確識(shí)別出奶牛個(gè)體,但是奶牛臉部相對(duì)奶牛軀干包含的個(gè)體特有信息較少,識(shí)別正確率仍不夠理想。cn201710000628.5公開了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的奶牛個(gè)體識(shí)別方法,該方法模型參數(shù)設(shè)置需要較高的技巧性,需要反復(fù)實(shí)驗(yàn)進(jìn)行訓(xùn)練和測試,并沒有統(tǒng)一參照的標(biāo)準(zhǔn),模型的建立較困難。
現(xiàn)有技術(shù)中,奶牛個(gè)體的智能識(shí)別大都采用傳統(tǒng)通用的圖像處理方法,沒有針對(duì)奶牛個(gè)體特點(diǎn),尤其沒有根據(jù)奶牛軀干黑白花紋形狀的唯一性來選取出適合的圖像處理方法,導(dǎo)致奶牛個(gè)體識(shí)別的準(zhǔn)確率低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是:提供一種奶牛個(gè)體識(shí)別的方法,是利用小波變換結(jié)合改進(jìn)的kpca方法進(jìn)行奶牛個(gè)體的特征提取,最后送入svm多分類器進(jìn)行學(xué)習(xí)分類,完成奶牛個(gè)體識(shí)別的方法;該方法克服了現(xiàn)有技術(shù)中,奶牛個(gè)體的智能識(shí)別方法大都仍采用通用的圖像處理方法,沒有針對(duì)奶牛個(gè)體特點(diǎn),尤其沒有根據(jù)奶牛軀干黑白花紋形狀的唯一性來選取出適合的圖像處理方法,導(dǎo)致奶牛個(gè)體識(shí)別準(zhǔn)確率低的缺陷。
上述kpca的中文含義是核主成分分析(下同)。
本發(fā)明中解決該技術(shù)問題所采用的技術(shù)方案是:一種奶牛個(gè)體識(shí)別的方法,利用小波變換結(jié)合改進(jìn)的kpca方法進(jìn)行奶牛個(gè)體的特征提取,最后送入svm多分類器進(jìn)行學(xué)習(xí)分類,完成奶牛個(gè)體識(shí)別,具體步驟如下:
第一步,奶牛視頻數(shù)據(jù)采集:
在奶牛數(shù)量>300頭的規(guī)范奶牛養(yǎng)殖場,在自然良好的環(huán)境下利用攝像設(shè)備錄制來回行走的20頭奶牛,每頭奶牛采集8段視頻,不同側(cè)面各4段,每段視頻14s~16s,幀速度為29幀/秒,至此完成奶牛視頻數(shù)據(jù)的采集;
第二步,將奶牛視頻數(shù)據(jù)轉(zhuǎn)化為圖片序列并進(jìn)行歸一化:
分別將第一步采集的20頭奶牛的視頻數(shù)據(jù)轉(zhuǎn)化成圖片序列,初始圖片大小為1920×1080像素,對(duì)初始圖片進(jìn)行截圖,人工截取圖片中奶牛個(gè)體,并去除多余的背景圖像;從牛場所有奶牛個(gè)體中隨機(jī)抽取總數(shù)1/10的樣本,人工測量每頭抽樣奶牛個(gè)體身體部位寬度和高度比例,然后求取所有抽樣個(gè)體該比例的平均值近似作為每頭奶牛個(gè)體身體比例,至此確定出奶牛個(gè)體部位寬度和高度平均比例為8:5,在保證特征有效提取的前提下成比例縮小圖片尺寸,最終利用編寫的matlab程序?qū)⒔?jīng)過上述處理的20頭奶牛的圖片序列中的每張圖片歸一化為128×80像素,將20頭奶牛從1到20編號(hào),表示20個(gè)待識(shí)別的不同奶牛個(gè)體,每頭奶牛保留1000張有效圖片,至此完成視頻轉(zhuǎn)化圖片序列并進(jìn)行歸一化的操作;
第三步,利用小波變換提取奶牛個(gè)體的四個(gè)不同分量特征:
選取haar型小波對(duì)上述第二步歸一化后的奶牛個(gè)體圖像做一層小波分解,得到尺寸大小相等的四個(gè)不同分量子圖,分別用ll子圖、lh子圖、hl子圖、hh子圖表示,四個(gè)不同分量子圖中不同程度的包含了奶牛個(gè)體的有效信息,ll子圖低頻部分是原始奶牛個(gè)體圖像的近似,包含了奶牛個(gè)體的大部分信息;lh子圖和hl子圖部分分別包含了奶牛個(gè)體軀干中水平和垂直方向的黑白條紋的邊緣信息;hh子圖部分包含了對(duì)角方向信息,至此完成利用小波變換提取奶牛個(gè)體的四個(gè)不同分量特征;
第四步,利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維:
利用改進(jìn)的kpca方法對(duì)上述第三步利用小波變換提取的奶牛個(gè)體的四個(gè)不同分量特征,即ll分量特征、lh分量特征、hl分量特征和hh分量特征進(jìn)行特征降維,步驟如下:
(4.1)設(shè)置奶牛個(gè)體的融合信息組數(shù),計(jì)算各組的融合向量:
設(shè)置奶牛個(gè)體的融合信息組數(shù),即設(shè)奶牛個(gè)體的樣本總數(shù)為n=20000,其中樣本類別數(shù)為c=20,每類樣本個(gè)數(shù)即每類的各特征子圖個(gè)數(shù)為m=1000,向量化后具有m個(gè)特征向量,將同一類樣本類內(nèi)分成p組,用公式(1)計(jì)算各組的融合向量:
式(1)中,
規(guī)定分組時(shí)候要遵從保持組內(nèi)相似性的原則;
(4.2)確定原空間的初始非線性主成分個(gè)數(shù)q:
通過選擇rbf核函數(shù)來計(jì)算上述(4.1)步的融合向量在特征空間中的協(xié)方差矩陣a={aij}n×n,其第i行,第j列元素aij計(jì)算如公式(3)所示:
aij=(φ(xi)·φ(xj))=a(xi,xj)(3)
式(3)中,“·”表示向量內(nèi)積運(yùn)算符號(hào),φ(·)是對(duì)應(yīng)的非線性變換,其中“·”表示函數(shù)φ的一個(gè)自變量,a(·,·)表示核函數(shù),其中兩個(gè)“·”表示函數(shù)a的兩個(gè)自變量;xi,xj表示第i個(gè)和第j個(gè)融合向量,依照公式(4)計(jì)算協(xié)方差矩陣a的特征方程:
aα=nλα(4)
式(4)中,n表示分組之后所有融合向量的個(gè)數(shù),n=p×c,其中c=20,表示奶牛類別數(shù),將求解得到的n維特征向量αr,r=1,2,...依據(jù)特征值λr(r=1,2...)從大到小順序進(jìn)行排列,然后通過公式(5)設(shè)置特征值貢獻(xiàn)率β的值來選取特征值和對(duì)應(yīng)特征向量的個(gè)數(shù)q,即確定原空間的初始非線性主成分個(gè)數(shù)為q;
(4.3)選出維數(shù)相對(duì)最小的主成分:
引入表征類別信息的維數(shù)度量參數(shù)來衡量上述(4.2)步中的初始非線性主成分的有效性,進(jìn)而選出維數(shù)相對(duì)最小的主成分,該維數(shù)度量參數(shù)可以通過類內(nèi)聚集程度和類間離散程度求得,維數(shù)度量參數(shù)如公式(6)所示:
式(6)中,ik表示同類樣本第k維分量的聚集程度,dk表示不同類樣本第k維分量的離散程度,維數(shù)度量參數(shù)δ越小表示類別越分明,越有利于后續(xù)的分類識(shí)別;利用枚舉法從初值q逐漸減小主成分個(gè)數(shù)并反復(fù)進(jìn)行相應(yīng)的實(shí)驗(yàn),直到奶牛個(gè)體識(shí)別正確率較前一次正確率下降幅度大于3%時(shí)結(jié)束,在平衡識(shí)別率和識(shí)別速率兩方面性能的前提下,確定出維數(shù)相對(duì)最小個(gè)數(shù)d(d<q)的值,選取前d個(gè)最小的δ對(duì)應(yīng)的主成分,即為該奶牛個(gè)體圖像類別信息最全面和維數(shù)相對(duì)最小的主成分,由此選出維數(shù)相對(duì)最小的主成分;
(4.4)計(jì)算奶牛個(gè)體樣本在特征空間上的投影:
計(jì)算奶牛個(gè)體樣本在上述(4.3)步中得到的維數(shù)相對(duì)最小的主成分組成的特征空間上的投影:
第r個(gè)非線性主成分vr如公式(7)所示:
式(7)中,
式(8)中,“·”表示向量內(nèi)積運(yùn)算符號(hào),則奶牛個(gè)體樣本x在公式(9)中選取的這d個(gè)主成分組成的特征空間中的投影bx即為:
式(9)中,“[]”表示組成向量的符號(hào);
至此完成利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維;
第五步,加權(quán)融合四個(gè)不同分量特征:
對(duì)上述第四步利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維之后的各子圖特征進(jìn)行加權(quán)融合,其中l(wèi)l子圖、lh子圖、hl子圖和hh子圖所占比例別用ω1、ω2、ω3和ω4表示,滿足方程組(10):
ω1、ω2、ω3和ω4作為四個(gè)分量子圖的融合權(quán)值,將經(jīng)過改進(jìn)的kpca方法降維之后的四個(gè)不同分量特征按照公式(11)和(12)進(jìn)行加權(quán)融合得到奶牛圖像的最終的特征矩陣y;
加權(quán)融合計(jì)算公式如公式(11):
y=ω1llkpca+ω2lhkpca+ω3hlkpca+ω4hhkpca(11)
式(11)中y表示加權(quán)融合總特征,即奶牛圖像的最終特征矩陣;llkpca、lhkpca、hlkpca和hhkpca分別表示ll子圖、lh子圖、hl子圖和hh子圖經(jīng)過改進(jìn)的kpca方法處理之后得到的特征矩陣;
式(12)中part表示某一子圖分量,分別取ll、lh、hl和hh,partkpca表示part分量經(jīng)kpca方法降維之后的特征向量,“[]”表示組成向量的符號(hào);
至此完成加權(quán)融合四個(gè)不同分量特征;
第六步,將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測試集:
由于依據(jù)上述第二步的每頭奶牛保留下1000張圖片,在經(jīng)過上述處理步驟之后具有相應(yīng)的1000個(gè)特征向量,分別將每頭奶牛的1000個(gè)特征向量以隨機(jī)方式劃分成800個(gè)訓(xùn)練數(shù)據(jù)和200個(gè)測試數(shù)據(jù),最終組成包含16000個(gè)特征向量的訓(xùn)練矩陣和包含4000個(gè)特征向量的測試矩陣,至此完成將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測試集;
第七步,svm訓(xùn)練:
(7.1)構(gòu)造svm多分類器:
構(gòu)造通過一個(gè)決策函數(shù)將多類問題向兩類問題轉(zhuǎn)化的“一對(duì)多”的方式進(jìn)行處理的svm多分類器,該svm多分類器的決策函數(shù)g(x)如公式(13)所示,即每次將全部奶牛訓(xùn)練數(shù)據(jù)分為“屬于第k(k=1,2,3......)頭”和“不屬于第k頭”兩大類,設(shè)定好svm參數(shù)進(jìn)行學(xué)習(xí),然后利用測試數(shù)據(jù)進(jìn)行測試;
其中x為待識(shí)別奶牛個(gè)體樣本,c表示所有奶牛個(gè)體類別數(shù),fm(x)表示第m類的分類函數(shù),為傳統(tǒng)的svm二分類器決策函數(shù)形式,可以直接調(diào)用matlab語言的svm工具包;
(7.2)利用svm多分類器進(jìn)行訓(xùn)練:
選取線性核函數(shù),將上述第六步處理好的奶牛訓(xùn)練集數(shù)據(jù)送入svm進(jìn)行建模訓(xùn)練,得到訓(xùn)練好的模型,至此完成svm訓(xùn)練;
第八步,svm測試:
將上述第六步中處理好的奶牛測試集數(shù)據(jù)送入第七步訓(xùn)練好的模型中進(jìn)行測試,得出預(yù)測結(jié)果,至此完成svm測試;
第九步,識(shí)別出奶牛個(gè)體:
根據(jù)第八步測試過程得到相應(yīng)的預(yù)測結(jié)果,輸出測試集中各特征向量對(duì)應(yīng)的奶牛不同個(gè)體的標(biāo)號(hào),識(shí)別出奶牛個(gè)體;
由此完成對(duì)奶牛個(gè)體的有效識(shí)別。
上述一種奶牛個(gè)體識(shí)別的方法,所述類內(nèi)聚集程度計(jì)算公式如公式(14):
其中ik表示同類樣本第k維分量的聚集程度,c表示融合向量的類別數(shù),p表示每類融合向量的個(gè)數(shù),
上述一種奶牛個(gè)體識(shí)別的方法,所述類間離散程度計(jì)算公式如公式(15):
其中dk表示不同類樣本第k維分量的離散程度,c表示融合向量的類別數(shù),p表示每類融合向量的個(gè)數(shù),mik表示第i類樣本第k維分量的累加,zijk表示第i類第j個(gè)樣本的第k維分量值。
上述基于小波變換和改進(jìn)核主成分分析的奶牛個(gè)體識(shí)別方法,其中所述“小波變換、haar型小波、尺度函數(shù)、小波函數(shù)、kpca方法、svm分類器”都是公知的。
本發(fā)明的有益效果如下:
與現(xiàn)有技術(shù)相比,本發(fā)明具有如下突出的實(shí)質(zhì)性特點(diǎn):
本發(fā)明應(yīng)用小波變換和改進(jìn)的kpca方法進(jìn)行奶牛個(gè)體識(shí)別,小波變換具有多分辨率能力,負(fù)責(zé)提取奶牛的有效特征,得到四個(gè)包含不同特征信息的分量子圖,但是特征維數(shù)依然較大,所以引入改進(jìn)的kpca方法進(jìn)行特征降維處理,在簡化特征的同時(shí)進(jìn)一步提取奶牛適于分類的有效信息,之后將經(jīng)過改進(jìn)的kpca方法處理的的各子圖特征以<0.8,0.085,0.085,0.03>權(quán)值比例序列進(jìn)行加權(quán)融合得到最終的特征矩陣,保證了信息的完整性,從而提取到有效的奶牛個(gè)體特征。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下顯著的進(jìn)步:
(1)本發(fā)明方法將小波變換和改進(jìn)的kpca方法進(jìn)行結(jié)合使用,對(duì)奶牛個(gè)體黑白花紋特征進(jìn)行了有效提取和降維,提高了分類的準(zhǔn)確性。
(2)本發(fā)明方法對(duì)傳統(tǒng)的kpca方法進(jìn)行改進(jìn),通過設(shè)置適當(dāng)?shù)娜诤辖M數(shù),引入組內(nèi)融合向量代替整組信息,在信息全面、識(shí)別率相當(dāng)?shù)幕A(chǔ)上,提高了方法效率,同時(shí)考慮到傳統(tǒng)kpca方法僅考慮了信息最大化,并沒有針對(duì)后續(xù)分類目的即沒有根據(jù)任何類別信息進(jìn)行降維,有理由相信降維后的主成分特征中依然可能包含多余信息,所以本發(fā)明方法在上述引入融合向量的基礎(chǔ)上還設(shè)置了類內(nèi)聚集程度和類間離散程度,從而求取度量參數(shù),根據(jù)該度量參數(shù)進(jìn)一步降低特征向量的維數(shù),進(jìn)一步提高效率,更有利于后面的個(gè)體分類。
附圖說明
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步說明。
圖1是本發(fā)明方法的流程示意圖。
圖2(a)是一頭奶牛個(gè)體的視頻數(shù)據(jù)轉(zhuǎn)化成的原始圖片圖。
圖2(b)是對(duì)圖2(a)經(jīng)過一層haar型小波變換處理得到的效果示例圖。
具體實(shí)施方式
圖1所示實(shí)施例表明,本發(fā)明奶牛個(gè)體識(shí)別方法的流程是:s1:奶牛視頻數(shù)據(jù)采集;s2:將奶牛視頻數(shù)據(jù)轉(zhuǎn)化為圖片序列并進(jìn)行歸一化;s3:利用小波變換提取奶牛個(gè)體的四個(gè)不同分量特征;s4:利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維;s5:加權(quán)融合四個(gè)不同分量特征;s6:將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測試集;s7:訓(xùn)練集進(jìn)行svm訓(xùn)練;s8:測試集送入s7步訓(xùn)練好的模型中進(jìn)行svm測試;s9:識(shí)別出奶牛個(gè)體。
圖2a所示是一頭奶牛個(gè)體的視頻數(shù)據(jù)轉(zhuǎn)化成的原始圖片圖。
圖2b所示實(shí)施例表明,在通過對(duì)奶牛視頻數(shù)據(jù)轉(zhuǎn)化為圖片序列并進(jìn)行歸一化后,對(duì)圖2a進(jìn)行一層haar小波變換得到圖2b中所包含ll分量、lh分量、hl分量和hh分量四個(gè)子圖,可以明顯看出ll子圖低頻部分是原始奶牛個(gè)體圖像的近似,包含了奶牛個(gè)體的大部分信息;lh子圖和hl子圖部分分別包含了奶牛個(gè)體軀干中水平和垂直方向的黑白條紋的邊緣信息;hh子圖部分包含了對(duì)角方向信息,信息量較少。
實(shí)施例1
第一步,奶牛視頻數(shù)據(jù)采集:
為保證樣本量的充足,本發(fā)明的初始數(shù)據(jù)采用奶牛視頻,在奶牛數(shù)量>300頭的規(guī)范奶牛養(yǎng)殖場,在自然良好的環(huán)境下利用攝像設(shè)備錄制來回行走的20頭奶牛,每頭奶牛采集8段視頻,不同側(cè)面各4段,每段視頻14s,幀速度為29幀/秒,至此完成奶牛視頻數(shù)據(jù)的采集;
第二步,將奶牛視頻數(shù)據(jù)轉(zhuǎn)化為圖片序列并進(jìn)行歸一化:
分別將第一步采集的20頭奶牛的視頻數(shù)據(jù)轉(zhuǎn)化成圖片序列,初始圖片大小為1920×1080像素,對(duì)初始圖片進(jìn)行截圖,人工截取圖片中奶牛個(gè)體,并去除多余的背景圖像;從牛場所有奶牛個(gè)體中隨機(jī)抽取總數(shù)1/10的樣本,人工測量每頭抽樣奶牛個(gè)體身體部位寬度和高度比例,然后求取所有抽樣個(gè)體該比例的平均值近似作為每頭奶牛個(gè)體身體比例,至此確定出奶牛個(gè)體部位寬度和高度平均比例為8:5,在保證特征有效提取的前提下成比例縮小圖片尺寸,最終利用編寫的matlab程序?qū)⒔?jīng)過上述處理的20頭奶牛的圖片序列中的每張圖片歸一化為128×80像素,將20頭奶牛從1到20編號(hào),表示20個(gè)待識(shí)別的不同奶牛個(gè)體,每頭奶牛保留1000張有效圖片,至此完成視頻轉(zhuǎn)化圖片序列并進(jìn)行歸一化的操作;
第三步,利用小波變換提取奶牛個(gè)體的四個(gè)不同分量特征:
選取haar型小波對(duì)上述第二步歸一化后的奶牛個(gè)體圖像做一層小波分解,得到對(duì)應(yīng)的四個(gè)不同分量子圖即四個(gè)不同的64×40的小波系數(shù),圖像大小均為原始圖像的1/4,分別用ll子圖、lh子圖、hl子圖、hh子圖表示,四個(gè)分量子圖中不同程度的包含了奶牛個(gè)體的有效信息,ll子圖低頻部分是原始奶牛個(gè)體圖像的近似,包含了奶牛個(gè)體的大部分信息;lh子圖和hl子圖部分分別包含了奶牛個(gè)體軀干中水平和垂直方向的黑白條紋的邊緣信息;hh子圖部分包含了對(duì)角方向信息,信息量較少;
至此完成利用小波變換提取奶牛個(gè)體的四個(gè)不同分量特征;
第四步,利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維:
利用改進(jìn)的kpca方法對(duì)上述第三步利用小波變換提取的奶牛個(gè)體的四個(gè)不同分量特征,即ll分量特征、lh分量特征、hl分量特征和hh分量特征進(jìn)行特征降維,步驟如下:
(4.1)設(shè)置奶牛個(gè)體的融合信息組數(shù),計(jì)算各組的融合向量:
設(shè)置奶牛個(gè)體的融合信息組數(shù),即設(shè)奶牛個(gè)體的樣本總數(shù)為n=20000,其中樣本類別數(shù)為c=20,每類樣本個(gè)數(shù)為m=1000,即對(duì)應(yīng)各分量子圖向量化之后的向量個(gè)數(shù)為m,將同一類樣本類內(nèi)分成p組,用公式(1)計(jì)算各組的融合向量:
式中,
本發(fā)明中通過分析拍攝的奶牛視頻幀速度為29幀/s,即每秒刷新29張圖片,結(jié)合奶牛行走速度,每秒內(nèi)奶牛個(gè)體的姿勢花紋信息圖片基本相同,劃為一組是合理的,由于實(shí)驗(yàn)數(shù)據(jù)庫每頭奶牛1000張圖片,在保證被組數(shù)整除的原則下p設(shè)置為40,即將每頭奶牛圖片劃為40組,然后帶入公式(1)計(jì)算各組內(nèi)的融合向量,利用融合向量來近似表征組內(nèi)各特征向量;
(4.2)確定原空間的初始非線性主成分個(gè)數(shù)q:
通過選擇rbf核函數(shù)來計(jì)算上述(4.1)步的融合向量在特征空間中的協(xié)方差矩陣a={aij}n×n,其第i行,第j列元素aij計(jì)算如公式(3)所示:
aij=(φ(xi)·φ(xj))=a(xi,xj)(3)
式(3)中,“·”表示向量內(nèi)積運(yùn)算符號(hào),φ(·)是對(duì)應(yīng)的非線性變換,其中“·”表示函數(shù)φ的一個(gè)自變量,a(·,·)表示核函數(shù),其中兩個(gè)“·”表示函數(shù)a的兩個(gè)自變量;xi,xj表示第i個(gè)和第j個(gè)融合向量,依照公式(4)計(jì)算協(xié)方差矩陣a的特征方程:
aα=nλα(4)
式(4)中,n表示分組之后所有融合向量的個(gè)數(shù),n=p×c,其中c=20,表示奶牛類別數(shù),將求解得到的n維特征向量αr,r=1,2,...依據(jù)特征值λr(r=1,2...)從大到小順序進(jìn)行排列,然后通過公式(5)設(shè)置特征值貢獻(xiàn)率β的值來選取特征值和對(duì)應(yīng)特征向量的個(gè)數(shù)q,即確定原空間的初始非線性主成分個(gè)數(shù)為q;
(4.3)選出維數(shù)相對(duì)最小的主成分:
引入表征類別信息的維數(shù)度量參數(shù)來衡量上述(4.2)步中的初始非線性主成分的有效性,進(jìn)而選出維數(shù)相對(duì)最小的主成分,該維數(shù)度量參數(shù)可以通過類內(nèi)聚集程度和類間離散程度求得,維數(shù)度量參數(shù)如公式(6)所示:
式(6)中,ik表示同類樣本第k維分量的聚集程度,dk表示不同類樣本第k維分量的離散程度,維數(shù)度量參數(shù)δ越小表示類別越分明,越有利于后續(xù)的分類識(shí)別;利用枚舉法從初值q逐漸減小主成分個(gè)數(shù)并反復(fù)進(jìn)行相應(yīng)的實(shí)驗(yàn),直到奶牛個(gè)體識(shí)別正確率較前一次正確率下降幅度大于3%時(shí)結(jié)束,在平衡識(shí)別率和識(shí)別速率兩方面性能的前提下,確定出維數(shù)相對(duì)最小個(gè)數(shù)d(d<q)的值,選取前d個(gè)最小的δ對(duì)應(yīng)的主成分,即為該奶牛個(gè)體圖像類別信息最全面和維數(shù)相對(duì)最小的主成分,由此選出維數(shù)相對(duì)最小的主成分;
所述類內(nèi)聚集程度計(jì)算公式如公式(14):
其中ik表示同類樣本第k維分量的聚集程度,c表示融合向量的類別數(shù),p表示每類融合向量的個(gè)數(shù),
所述類間離散程度計(jì)算公式如公式(15):
其中dk表示不同類樣本第k維分量的離散程度,c表示融合向量的類別數(shù),p表示每類融合向量的個(gè)數(shù),mik表示第i類樣本第k維分量的累加,zijk表示第i類第j個(gè)樣本的第k維分量值;
表1列舉出利用20頭奶牛的20000張圖片進(jìn)行d值選取的實(shí)例驗(yàn)證;其中“改進(jìn)的kpca方法1”表示僅引入融合向量而未加入度量參數(shù)的改進(jìn)的kpca方法,從實(shí)驗(yàn)序號(hào)2看出經(jīng)過未進(jìn)行度量參數(shù)之前的特征向量維數(shù)q為37,所以本文方法中選擇37以下的d,可以看出當(dāng)d取30或25時(shí)效果較佳,本發(fā)明實(shí)例中d值設(shè)為25;
表1.不同相對(duì)最小特征維數(shù)對(duì)比實(shí)驗(yàn)
(4.4)計(jì)算奶牛個(gè)體樣本在特征空間上的投影:
計(jì)算奶牛個(gè)體樣本在上述(4.3)步中得到的維數(shù)相對(duì)最小的主成分組成的特征空間上的投影:
第r個(gè)非線性主成分vr如公式(7)所示:
式(7)中,
式(8)中,“·”表示向量內(nèi)積運(yùn)算符號(hào),則奶牛個(gè)體樣本x在公式(9)中選取的d=25個(gè)主成分組成的特征空間中的投影bx即為:
式(9)中,“[]”表示組成向量的符號(hào);
至此完成利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維;
第五步,加權(quán)融合四個(gè)不同分量特征:
對(duì)上述第四步利用改進(jìn)的kpca方法進(jìn)行四個(gè)不同分量特征降維之后的各子圖特征進(jìn)行加權(quán)融合,其中l(wèi)l子圖、lh子圖、hl子圖和hh子圖所占比例別用ω1、ω2、ω3和ω4表示,滿足方程組(10):
表2給出利用20頭奶牛的20000張圖片進(jìn)行實(shí)例驗(yàn)證,得到不同融合權(quán)值序列下的奶牛個(gè)體的識(shí)別正確率:
表2.不同的特征融合權(quán)值序列識(shí)別正確率/%
表中“<>”表示組成ll子圖,lh子圖,hl子圖,hh子圖的權(quán)值序列符號(hào);本發(fā)明實(shí)例中選取ω1=0.8,ω2=ω3=0.085,ω4=0.03作為四個(gè)分量子圖的融合權(quán)值,將經(jīng)過改進(jìn)的kpca方法降維之后的四個(gè)不同分量特征按照公式(11)、(12)進(jìn)行加權(quán)融合得到奶牛圖像的最終的特征矩陣y;
加權(quán)融合計(jì)算公式如公式(11):
y=ω1llkpca+ω2lhkpca+ω3hlkpca+ω4hhkpca(11)
其中y表示加權(quán)融合總特征,即奶牛圖像的最終特征矩陣;llkpca、lhkpca、hlkpca和hhkpca分別表示ll子圖、lh子圖、hl子圖和hh子圖經(jīng)過改進(jìn)的kpca方法處理之后得到的特征矩陣;
公式(12)中part表示某一子圖分量,分別取ll、lh、hl和hh,partkpca表示part分量經(jīng)kpca方法降維之后的特征向量,“[]”表示組成向量的符號(hào);
至此完成加權(quán)融合四個(gè)不同分量特征;
第六步,將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測試集:
由于每頭奶牛保留下1000張圖片,在經(jīng)過上述步驟之后具有相應(yīng)的1000個(gè)特征向量,分別將每頭奶牛個(gè)體的1000個(gè)特征向量以隨機(jī)方式劃分成800個(gè)訓(xùn)練數(shù)據(jù)和200個(gè)測試數(shù)據(jù),最終組成包含16000個(gè)特征向量的訓(xùn)練矩陣和包含4000個(gè)特征向量的測試矩陣,至此完成數(shù)據(jù)劃分為訓(xùn)練集和測試集;
第七步,svm訓(xùn)練:
(7.1)構(gòu)造svm多分類器:
構(gòu)造通過一個(gè)決策函數(shù)將多類問題向兩類問題轉(zhuǎn)化的“一對(duì)多”的方式進(jìn)行處理的svm多分類器,即每次將全部奶牛訓(xùn)練數(shù)據(jù)分為“屬于第k(k=1,2,3......)頭”和“不屬于第k頭”兩大類,該svm多分類器的決策函數(shù)g(x)如公式(12):
其中x為待識(shí)別樣本,c表示所有個(gè)體類別數(shù),f(x)表示第m類的分類函數(shù),為傳統(tǒng)的二分類器決策函數(shù)形式,可以直接調(diào)用matlab語言的svm工具包;
(7.2)利用svm多分類器進(jìn)行訓(xùn)練:
選取線性核函數(shù)作為多類svm的核函數(shù),將20頭奶牛個(gè)體的16000個(gè)特征向量組成的訓(xùn)練矩陣送入svm進(jìn)行訓(xùn)練建模,得到訓(xùn)練好的模型,至此完成svm訓(xùn)練;
第八步,svm測試:
將20頭奶牛個(gè)體的4000個(gè)特征向量組成的測試矩陣送入第七步中訓(xùn)練好的svm模型中,得出預(yù)測結(jié)果,至此完成svm測試;
第九步,識(shí)別出奶牛個(gè)體:
根據(jù)第八步測試過程得到相應(yīng)的預(yù)測結(jié)果,輸出測試集中各特征向量對(duì)應(yīng)的奶牛不同個(gè)體的標(biāo)號(hào),識(shí)別出奶牛個(gè)體;
由此完成對(duì)奶牛個(gè)體的有效識(shí)別。
實(shí)施例2
除第一步奶牛視頻數(shù)據(jù)采集中,每段視頻為15s之外,其他同實(shí)施例1。
實(shí)施例3
除第一步奶牛視頻數(shù)據(jù)采集中,每段視頻為16s之外,其他同實(shí)施例1。
實(shí)施例4
利用20頭奶牛個(gè)體的20000張圖片按照實(shí)施例1中的步驟計(jì)算出識(shí)別正確率和識(shí)別時(shí)間,在同樣條件下,用“本發(fā)明方法”、“僅本發(fā)明的kpca方法”、“小波+傳統(tǒng)kpca方法”、“l(fā)bp方法”和“surf方法”五種方法計(jì)算得到的識(shí)別正確率和識(shí)別時(shí)間進(jìn)行對(duì)比,結(jié)果如表3所示:
表3.不同方法對(duì)比實(shí)驗(yàn)
為除去隨機(jī)結(jié)果的干擾,表3數(shù)據(jù)是相同條件下重復(fù)10次實(shí)驗(yàn)得到的平均結(jié)果;
實(shí)驗(yàn)序號(hào)1和實(shí)驗(yàn)序號(hào)2為分別采用本發(fā)明方法即小波變換結(jié)合改進(jìn)的kpca方法與僅采用本發(fā)明改進(jìn)的kpca方法對(duì)奶牛個(gè)體進(jìn)行識(shí)別;數(shù)據(jù)結(jié)果顯示,在融合組數(shù)和特征維數(shù)均相同的條件下,本發(fā)明方法的識(shí)別正確率明顯高于僅采用kpca方法的結(jié)果。這是由于奶牛圖像較大,小波變換壓縮圖片同時(shí)加權(quán)融合了各分量,一定程度上消除了噪聲信息,提高了有效信息的比例;
實(shí)驗(yàn)序號(hào)1和實(shí)驗(yàn)序號(hào)3表明,本發(fā)明方法較小波變換結(jié)合傳統(tǒng)kpca方法在識(shí)別結(jié)果基本相當(dāng)?shù)那闆r下,識(shí)別速度僅用了4.20s;
實(shí)驗(yàn)序號(hào)1、實(shí)驗(yàn)序號(hào)4及實(shí)驗(yàn)序號(hào)5表明,本發(fā)明方法較傳統(tǒng)奶牛識(shí)別方法雖然識(shí)別速度略低,但是平均識(shí)別率有了明顯提升,比lbp方法提高了5.83%,比surf方法提高了2.34%。
上述實(shí)施例中,所述“小波變換、kpca方法、svm分類器、lbp方法、surf方法”都是公知的。