本發(fā)明的涉及一種設(shè)施養(yǎng)殖羊應(yīng)激行為的監(jiān)測(cè)方法,通過分析羊叫聲信號(hào)特征來識(shí)別羊只相應(yīng)的應(yīng)激行為,屬于農(nóng)業(yè)工程測(cè)試技術(shù)領(lǐng)域。
背景技術(shù):
聲信號(hào)是家畜進(jìn)行交流的重要途徑,設(shè)施養(yǎng)殖舍內(nèi)羊叫聲信號(hào)包含了對(duì)其內(nèi)部機(jī)體狀況和需求的信息反饋,如羊只在打斗、饑餓、咳嗽、啃咬和尋伴時(shí),都會(huì)發(fā)出不同的叫聲信號(hào)。雖然不同種類畜禽的叫聲各異,但共性是其聲信號(hào)的變化與受到的外部刺激、內(nèi)分泌以及飲食、饑渴等條件影響有一定的相關(guān)性。目前,畜禽叫聲信息作為動(dòng)物福利評(píng)價(jià)指標(biāo)有一定的應(yīng)用,且畜禽發(fā)聲監(jiān)測(cè)方法與傳統(tǒng)生理生化參數(shù)指標(biāo)檢測(cè)方法相比,它具有無接觸、非侵入的優(yōu)點(diǎn)。因此,利用聲信號(hào)數(shù)字化處理技術(shù),對(duì)設(shè)施養(yǎng)殖羊叫聲信號(hào)進(jìn)行采集、特征參數(shù)提取和分類識(shí)別,建立羊叫聲信號(hào)特征參數(shù)與羊只不同應(yīng)激行為之間的相關(guān)性,進(jìn)行設(shè)施羊舍內(nèi)羊只應(yīng)激行為的統(tǒng)計(jì)分析并與環(huán)境調(diào)控相結(jié)合,對(duì)于構(gòu)建設(shè)施福利化養(yǎng)羊系統(tǒng)及羊只的健康狀況監(jiān)測(cè)等具有明顯的現(xiàn)實(shí)意義。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于,提供一種羊只在不同應(yīng)激行為下的叫聲信號(hào)監(jiān)測(cè)方法,主要監(jiān)測(cè)羊只的打斗、饑餓、咳嗽、啃咬和尋伴叫聲信號(hào),實(shí)現(xiàn)對(duì)羊叫聲信號(hào)的特征參數(shù)提取并進(jìn)行分類識(shí)別,達(dá)到設(shè)施養(yǎng)殖羊只應(yīng)激行為的無接觸自動(dòng)化監(jiān)測(cè)。
本發(fā)明的技術(shù)方案是:一種設(shè)施養(yǎng)殖羊應(yīng)激行為的聲信號(hào)監(jiān)測(cè)方法,其特征在于,包括以下步驟:
第一步、聲音信號(hào)采集:將聲音傳感器安裝在設(shè)施羊舍的中間位置,采集羊在不同應(yīng)激行為下的叫聲信號(hào);
第二步、預(yù)處理:對(duì)羊叫聲信號(hào)進(jìn)行預(yù)處理;
第三步:特征參數(shù)提?。禾崛⊙蚪新曅盘?hào)特征參數(shù),并對(duì)提取的特征參數(shù)進(jìn)行加權(quán);
第四步:建立識(shí)別模型:建立羊叫聲信號(hào)的識(shí)別模型,將羊叫聲信號(hào)中的一部分用于模型訓(xùn)練,得到模型參數(shù);
第五步:統(tǒng)計(jì)識(shí)別結(jié)果:對(duì)羊叫聲信號(hào)進(jìn)行分類識(shí)別,統(tǒng)計(jì)設(shè)施羊舍內(nèi)叫聲信號(hào)的類別和數(shù)量,用于設(shè)施羊舍的福利化狀況評(píng)價(jià)。
所述的第二步“預(yù)處理”包括:羊叫聲信號(hào)的預(yù)加重、分幀、加窗、小波去噪以及端點(diǎn)檢測(cè),其中小波去噪的閾值函數(shù)采用了一種調(diào)整因子的平滑函數(shù),適合于設(shè)施羊舍的風(fēng)機(jī)去噪。
所述的第三步“提取特征參數(shù)”包括以下流程:
(1)對(duì)所述羊叫聲信號(hào)x(n)進(jìn)行離散傅里葉變換,得到能量譜x(k),再進(jìn)行Mel頻率濾波、Log對(duì)數(shù)處理,得到羊叫聲信號(hào)的對(duì)數(shù)能量S(m);
(2)對(duì)所述對(duì)數(shù)能量S(m)進(jìn)行離散余弦變換求倒譜,得到12維羊叫聲信號(hào)梅爾頻率倒譜系數(shù)(MFCC),即聲信號(hào)特征參數(shù)C(n);求MFCC特征參數(shù)C(n)的一階差分,得到24維的羊叫聲信號(hào)的混合MFCC;
(3)對(duì)所述混合MFCC特征參數(shù)進(jìn)行CF比特征加權(quán),得到12維的羊叫聲信號(hào)特征參數(shù)。
所述的第三步“提取特征參數(shù)”中的特征加權(quán)方法是:
(1)計(jì)算羊不同類別叫聲信號(hào)的特征參數(shù)均值方差與同一類別叫聲信號(hào)特征參數(shù)均值的方差之和的比值F;
(2)計(jì)算羊叫聲信號(hào)的MFCC每維特征分量與其它維特征分量之間距離D;
(3)羊叫聲信號(hào)的MFCC各維特征分量的加權(quán)值CF=F/D。
所述的第四步的具體方法是:建立羊叫聲信號(hào)識(shí)別的隱馬爾科夫鏈/神經(jīng)網(wǎng)絡(luò)模型(HMM/ANN),利用HMM模型中的Viterbi解碼算法產(chǎn)生羊叫聲信號(hào)的最佳狀態(tài)轉(zhuǎn)移序列輸出概率,將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入,BP神經(jīng)網(wǎng)絡(luò)為三層網(wǎng)絡(luò),其輸出為羊叫聲信號(hào)的類別。
所述的第五步的具體方法是:對(duì)設(shè)施養(yǎng)殖場(chǎng)的羊叫聲進(jìn)行識(shí)別,并自動(dòng)統(tǒng)計(jì)每天羊叫聲的類別與其對(duì)應(yīng)數(shù)量,當(dāng)某天羊叫聲類別的對(duì)應(yīng)數(shù)量發(fā)生較大變化時(shí),進(jìn)行人工預(yù)警。
所述的聲音傳感器安裝在設(shè)施羊舍的2m高的中間位置,聲音傳感器由測(cè)量傳聲器及其前置放大器組成,測(cè)量的聲信號(hào)頻率范圍為10~20000Hz,聲音傳感器通過BNC接口與聲音采集卡相連接,單聲道采集,采樣頻率為32kHz,采樣精度為16bit;聲音數(shù)據(jù)采集為4通道同步采集、51.2kS/s的采樣頻率、24bit分辨率,采集卡以無線WiFi方式發(fā)送聲音數(shù)據(jù)至路由器,路由器與服務(wù)器通過以太網(wǎng)連接,采集的羊叫聲信號(hào)以6min為一個(gè)存儲(chǔ)單元,存儲(chǔ)格式為wav的聲音文件。
本發(fā)明的優(yōu)點(diǎn)是:與傳統(tǒng)生理生化參數(shù)指標(biāo)檢測(cè)方法相比,具有無接觸、非侵入的優(yōu)點(diǎn)。因此,利用聲信號(hào)數(shù)字化處理技術(shù),對(duì)設(shè)施養(yǎng)殖羊叫聲信號(hào)進(jìn)行采集、特征參數(shù)提取和分類識(shí)別,建立羊叫聲信號(hào)特征參數(shù)與羊只不同應(yīng)激行為之間的相關(guān)性,進(jìn)行設(shè)施羊舍內(nèi)羊只應(yīng)激行為的統(tǒng)計(jì)分析并與環(huán)境調(diào)控相結(jié)合,對(duì)于構(gòu)建設(shè)施福利化養(yǎng)羊系統(tǒng)及羊只健康狀況監(jiān)測(cè)等具有明顯的現(xiàn)實(shí)意義。
采用一種加權(quán)的梅爾頻率倒譜系數(shù)(MFCC)進(jìn)行羊叫聲信號(hào)特征參數(shù)提取,由于羊叫聲信號(hào)的MFCC特征參數(shù)各個(gè)分量對(duì)叫聲的表征能力是不相同的,MFCC特征分量中貢獻(xiàn)率小的不僅不能提高識(shí)別性能反而會(huì)使識(shí)別率降低,因此,為了提高羊叫聲信號(hào)的識(shí)別率,設(shè)計(jì)新的MFCC參數(shù),依據(jù)MFCC及其差分的混合參數(shù)各分量貢獻(xiàn)率的大小,對(duì)MFCC混合參數(shù)進(jìn)行特征分量加權(quán),得到的特征參數(shù)用于羊叫聲信號(hào)系統(tǒng)的識(shí)別。
由于HMM的動(dòng)態(tài)時(shí)序建模能力較強(qiáng),可以很好地描述不同類別的羊叫聲信號(hào),提高了羊叫信號(hào)的識(shí)別率,但也有著分類決策能力弱的缺點(diǎn),HMM在識(shí)別時(shí)通過計(jì)算樣本的最大累積狀態(tài)概率來判斷屬于哪個(gè)類別,僅用到狀態(tài)累積概率最大值而忽略其它的狀態(tài)累積概率值。人工神經(jīng)網(wǎng)絡(luò)(ANN)通過模擬人腦的功能和組織結(jié)構(gòu),是由對(duì)歷史信息有著記憶功能的權(quán)值互相連接組成,有著較強(qiáng)的分類決策能力,但動(dòng)態(tài)建模能力較差。將HMM的動(dòng)態(tài)建模能力和ANN模型的分類決策能力進(jìn)行互補(bǔ),采用HMM/ANN混合識(shí)別模型對(duì)羊叫聲信號(hào)進(jìn)行識(shí)別,可提高羊叫聲信號(hào)的識(shí)別率。附圖說明:
圖1是本發(fā)明設(shè)施養(yǎng)殖羊應(yīng)激行為的聲信號(hào)監(jiān)測(cè)方法的基本流程圖;
圖2是本發(fā)明羊叫聲信號(hào)的特征參數(shù)提取和分類識(shí)別流程圖;
圖3是羊叫聲信號(hào)的HMM模型;
圖4是羊叫聲信號(hào)的HMM/ANN混合模型圖;
圖5(a)是羊打斗叫聲信號(hào)的MFCC一階差分特征參數(shù)三維曲線圖;
圖5(b)是羊饑餓叫聲信號(hào)的MFCC一階差分特征參數(shù)三維曲線圖;
圖5(c)是羊咳嗽聲信號(hào)的MFCC一階差分特征參數(shù)三維曲線圖;
圖5(d)是羊啃咬叫聲信號(hào)的MFCC一階差分特征參數(shù)三維曲線圖;
圖5(e)是羊?qū)ぐ榻新曅盘?hào)的MFCC一階差分特征參數(shù)三維曲線圖。
具體實(shí)施方式
參見圖1,本發(fā)明一種設(shè)施養(yǎng)殖羊應(yīng)激行為的聲信號(hào)監(jiān)測(cè)方法,基本流程是:
第一步、聲音信號(hào)采集:將聲音傳感器安裝在設(shè)施羊舍的2m高的中間位置,聲音傳感器由測(cè)量傳聲器及其前置放大器組成,測(cè)量的聲信號(hào)頻率范圍為10~20000Hz,聲音傳感器通過BNC接口與NI聲音數(shù)據(jù)采集平臺(tái)的聲音采集卡相連接,單聲道采集,采樣頻率為32kHz,采樣精度為16bit。聲音數(shù)據(jù)采集為4通道同步采集、51.2kS/s的采樣頻率、24bit分辨率,NI聲音數(shù)據(jù)采集平臺(tái)以無線WiFi方式發(fā)送聲音數(shù)據(jù)至路由器,路由器與服務(wù)器通過以太網(wǎng)連接,采集的羊叫聲信號(hào)以6min為一個(gè)存儲(chǔ)單元儲(chǔ)存在服務(wù)器內(nèi),存儲(chǔ)格式為wav的聲音文件。對(duì)服務(wù)器上存儲(chǔ)的羊叫聲信號(hào)再進(jìn)行特征參數(shù)提取和分類識(shí)別,識(shí)別出羊叫聲信號(hào)所對(duì)應(yīng)的羊只行為,服務(wù)器進(jìn)行統(tǒng)計(jì)設(shè)施羊舍發(fā)生的打斗、饑餓、咳嗽、啃咬和尋伴共5種行為的數(shù)量,羊場(chǎng)管理人員可通過管理人員終端上網(wǎng)登陸服務(wù)器查詢到養(yǎng)殖舍內(nèi)羊只行為統(tǒng)計(jì)狀況,對(duì)設(shè)施羊舍的福利化養(yǎng)殖水平進(jìn)行評(píng)估。
參見圖2,本發(fā)明設(shè)施養(yǎng)殖羊叫聲信號(hào)的特征參數(shù)提取和分類識(shí)別方法是:
1、對(duì)羊叫聲信號(hào)進(jìn)行預(yù)加重、分幀、加窗、去噪以及端點(diǎn)檢測(cè)等常規(guī)預(yù)處理方法,但對(duì)聲信號(hào)去噪方法使用了小波去噪,其閾值函數(shù)采用了一種調(diào)整因子的平滑函數(shù),適合于設(shè)施羊舍的風(fēng)機(jī)去噪。本發(fā)明使用的小波去噪方法為:
(1)含噪羊舍聲信號(hào)的小波分解。選擇小波基函數(shù)和分解層數(shù),對(duì)羊舍含噪聲信號(hào)進(jìn)行小波變換,得到一組小波分解系數(shù)Wjk。
(2)小波系數(shù)的閾值處理。選擇一合適閾值,對(duì)小波分解的高頻系數(shù)Wjk進(jìn)行閾值處理,得到估計(jì)的系數(shù)使盡可能的小。噪聲分量是隨著小波系數(shù)增大而減小的,所以當(dāng)|Wjk|增大時(shí),希望和Wjk之間的偏差也能減小,不能是恒定偏差λ或簡(jiǎn)單的置為零,設(shè)計(jì)一種調(diào)整因子的平滑函數(shù)作為閾值函數(shù),表達(dá)式如下:
式中α代表調(diào)整因子,0≤α≤1,當(dāng)|Wjk|<λ時(shí),可以調(diào)節(jié)α的值來調(diào)整其幅值,實(shí)現(xiàn)對(duì)Wjk的壓縮處理。
(3)聲信號(hào)的重構(gòu)。根據(jù)小波分解的高頻估計(jì)小波系數(shù)和低頻小波系數(shù)進(jìn)行羊叫聲信號(hào)的小波重構(gòu),得出去噪后的羊叫聲的信號(hào)。
2、對(duì)羊叫聲信號(hào)進(jìn)行離散傅里葉變換,得到聲信號(hào)的對(duì)數(shù)能量,本發(fā)明使用的方法為:
(1)計(jì)算離散功率譜。通過離散傅里葉變換將聲信號(hào)從時(shí)域轉(zhuǎn)換到頻域上,再求聲信號(hào)頻譜幅度的平方,得到聲信號(hào)的能量譜,其在頻域上的能量分布代表了不同聲信號(hào)的特性,計(jì)算公式為:
式中:N—FFT的點(diǎn)數(shù);x(n)—羊叫聲信號(hào);x(k)—聲信號(hào)的能量譜。
(2)Mel濾波器組濾波。人耳聽覺對(duì)聲信號(hào)低頻與高頻部分的敏感度不同,由于人耳的遮蔽效應(yīng),響度較高的頻率成分(一般為低頻部分)會(huì)影響響度較低的頻率成分(一般為高頻部分),因此,聲信號(hào)轉(zhuǎn)換成梅爾頻率后,模擬人耳聽覺特性就需要讓梅爾頻率平均分布,這可使用M個(gè)三角帶通濾波器來實(shí)現(xiàn),濾波器的公式為:
其中式中:f[m]—第m個(gè)三角濾波器的中心點(diǎn);Hm[k]—k頻率在第m個(gè)三角濾波器的權(quán)重。另外f[m]也可進(jìn)一步表示為公式(4)所示。
式中:Fs—采樣頻率;M—濾波器組的個(gè)數(shù),取M=24;fL—濾波器組的最低頻率;fH—濾波器組的最高頻率;中心頻率為f[m],m=1,2,...,M。f[m]之間的距離是隨m值的增大而增寬,隨m值的減小而縮小。
(3)對(duì)數(shù)轉(zhuǎn)換。聲信號(hào)經(jīng)過Mel濾波后得到其能量系數(shù),需要對(duì)其進(jìn)行對(duì)數(shù)轉(zhuǎn)換使Mel頻譜與傅里葉頻率成對(duì)數(shù)關(guān)系,所以每個(gè)濾波器組輸出的對(duì)數(shù)能量為:
式中:S(m)—對(duì)數(shù)能量;Hm[k]—三角濾波器組;x(k)—聲音信號(hào)的能量譜。
3、對(duì)羊叫聲信號(hào)的對(duì)數(shù)能量進(jìn)行變換得到24維的MFCC及其一階差分的混合特征參數(shù),本發(fā)明使用的方法為:
(1)離散余弦變換(DCT)。由于同頻帶的能量變換成對(duì)數(shù)后已不再是當(dāng)初時(shí)域的值,將其稱作倒頻譜系數(shù),再經(jīng)DCT變換,減少特征參數(shù)維度間的相關(guān)性,將信息集中到低頻12維的系數(shù),以增加聲信號(hào)的識(shí)別效率,所得的MFCC表達(dá)式為:
式中:L—梅爾頻率倒譜系數(shù)的階數(shù);C(n)—梅爾頻率倒譜系數(shù)。
(2)MFCC差分特征參數(shù)。MFCC反映了聲音信號(hào)的靜態(tài)特性,而人耳對(duì)聲信號(hào)的動(dòng)態(tài)特性較敏感,因此,需要一種表示羊叫聲信號(hào)動(dòng)態(tài)特性的參數(shù)。在動(dòng)物聲信號(hào)識(shí)別中,一般采用一階差分MFCC參數(shù)來表示聲信號(hào)的動(dòng)態(tài)特性,把動(dòng)態(tài)和靜態(tài)特征參數(shù)結(jié)合起來,可以提高系統(tǒng)的識(shí)別率。MFCC差分參數(shù)可通過公式(7)得到。
其中,K是一階導(dǎo)數(shù)的時(shí)間差,其值取1,dt為第t個(gè)一階差分倒譜系數(shù),1≤k≤K,Ct為第t個(gè)倒譜系數(shù),L為倒譜系數(shù)的階數(shù)。圖5為羊只5種行為(打斗、饑餓、咳嗽、啃咬和尋伴)的叫聲信號(hào)一階差分MFCC特征參數(shù)圖,X、Y和Z軸分別代表聲信號(hào)的幀數(shù)、維數(shù)和MFCC的倒譜值,不同羊叫聲信號(hào)的MFCC系數(shù)的變化主要體現(xiàn)在兩個(gè)方面:一是幅度,二是變化的趨勢(shì)。MFCC參數(shù)反映了羊只的聲道特性,一階差分MFCC反映出聲信號(hào)的動(dòng)態(tài)變化特性,從圖中可以看出,一階差分MFCC在幅度和范圍的變化較大,動(dòng)態(tài)特性有了明顯的提高。
4、對(duì)羊叫聲信號(hào)MFCC混合特征參數(shù)進(jìn)行CF比特征加權(quán),得到12維的特征參數(shù),本發(fā)明使用的方法為:
(1)羊叫聲信號(hào)特征參數(shù)CF比的計(jì)算方法。CF比的計(jì)算方法如下,令Fb(i)表示不同羊叫聲信號(hào)的特征參數(shù)均值方差,則:
其中,M是羊叫聲信號(hào)的類別數(shù)量(M=5),ui和u分別表示第i種羊叫聲信號(hào)參數(shù)和所有羊叫聲信號(hào)參數(shù)的均值估計(jì),計(jì)算公式為:
其中,是第i種羊叫聲信號(hào)第j個(gè)聲信號(hào)樣本的特征參數(shù),j=1,2,…,N,i=1,2,…,M。N代表第i種羊叫聲信號(hào)的樣本個(gè)數(shù)。
令Fw(i)表示同一類羊叫聲信號(hào)特征參數(shù)均值的方差之和:
因此,重新定義Fisher比為:
MFCC的特征分量的距離定義為:
其中,和分別表示第i種羊叫聲信號(hào)的第j維和第k維的特征分量。MFCC的每維特征分量與其它維特征分量之間距離的測(cè)度值越大,則說明該維特征分量與其維特征分量的相關(guān)性越差。
對(duì)于L維中每一維特征分量的距離則定義為:
因此,所有種類羊叫聲信號(hào)的第j維特征分量的相關(guān)距離為:
基于特征相關(guān)性的Fisher準(zhǔn)則不但考慮了MFCC每維特征分量的區(qū)分度,而且考慮了該維特征分量與其它維特征分量的相關(guān)性,CF比定義為:
CF=F/dis(j) (15)
(2)羊叫聲信號(hào)MFCC混合特征參數(shù)的CF比特征加權(quán)。對(duì)羊叫聲信號(hào)的MFCC混合特征參數(shù)的每一維特征分量計(jì)算CF比,作為MFCC混合參數(shù)各維特征分量的貢獻(xiàn)度。根據(jù)羊叫聲信號(hào)MFCC混合參數(shù)的每一維特征分量的貢獻(xiàn)度,計(jì)算每一維特征分量的加權(quán)系數(shù)ηi,ηi的計(jì)算公式為:
式中,N為MFCC混合特征參數(shù)的維數(shù),CFi為MFCC混合參數(shù)的第i維的貢獻(xiàn)度,即CF比。對(duì)羊叫聲信號(hào)MFCC混合特征參數(shù)進(jìn)行加權(quán),加權(quán)系數(shù)ηi與混合參數(shù)的各維特征分量相乘,得到經(jīng)過加權(quán)的羊叫聲信號(hào)MFCC混合特征參數(shù)。
采用CF比對(duì)羊叫聲信號(hào)MFCC混合特征參數(shù)加權(quán),提升了特征參數(shù)中對(duì)羊叫聲信號(hào)表征信息的權(quán)重,降低干擾信息的權(quán)重,可提高羊叫聲信號(hào)的識(shí)別率。
5、建立羊叫聲信號(hào)的HMM/ANN識(shí)別模型,根據(jù)羊叫聲信號(hào)特征參數(shù)進(jìn)行分類識(shí)別。本發(fā)明使用的方法為:
(1)羊叫聲信號(hào)的隱馬爾科鏈模型(HMM)的建立。羊叫聲信號(hào)的HMM模型如圖3所示,在t時(shí)刻起,π表示當(dāng)前狀態(tài)Si處于隨機(jī)處于某個(gè)狀態(tài)的概率,用狀態(tài)轉(zhuǎn)移概率aij=P(qt+1=Sj|qt=Si)表示羊叫聲信號(hào)從狀態(tài)Si在t+1時(shí)刻轉(zhuǎn)移到Sj的概率,則全部概率aij(i,j=1,2,...,N)可用狀態(tài)轉(zhuǎn)移概率矩陣A表示;羊叫聲信號(hào)的每個(gè)狀態(tài)下有M(M=3)個(gè)不同子區(qū)域,O={o1,o2,...,oT}為觀測(cè)序列,T為聲信號(hào)幀數(shù),與提取的羊叫聲信號(hào)特征參數(shù)相對(duì)應(yīng),用表示所有區(qū)域?qū)?yīng)的概率分布函數(shù),整個(gè)羊叫聲信號(hào)識(shí)別HMM可以用λ=(A,B,π)表示。
(2)羊叫聲信號(hào)識(shí)別的HMM/ANN模型的建立。參見圖4,對(duì)羊只打斗、饑餓、咳嗽、啃咬、尋伴行為的聲信號(hào),設(shè)計(jì)相對(duì)應(yīng)的HMM,共設(shè)計(jì)5個(gè)羊叫聲信號(hào)HMM,分別對(duì)應(yīng)打斗聲λ1、饑餓聲λ2、咳嗽聲λ3、啃咬聲λ4和尋伴聲λ5,經(jīng)過Viterbi算法得到HMM的狀態(tài)轉(zhuǎn)移序列及其輸出概率,每種羊叫聲信號(hào)的HMM有6個(gè)狀態(tài)轉(zhuǎn)移序列,對(duì)應(yīng)的狀態(tài)累積輸出概率為{V(1),V(2),...,V(6)},一共可得到30個(gè)狀態(tài)累積輸出概率。BP神經(jīng)網(wǎng)絡(luò)的輸入層有30個(gè)神經(jīng)元,分別對(duì)應(yīng)著HMM的30個(gè)狀態(tài)累積概率,其輸出層有5個(gè)神經(jīng)元,分別對(duì)應(yīng)著5種類別的羊叫聲信號(hào),將羊叫聲信號(hào)中的一部分用于HMM/ANN模型訓(xùn)練,可得到HMM模型參數(shù)和ANN的權(quán)重值,當(dāng)ANN的隱含層神經(jīng)元數(shù)目為9,該模型的識(shí)別率最高。
(3)羊叫聲信號(hào)的分類識(shí)別。參見圖4,對(duì)于一個(gè)待判別的羊叫聲信號(hào)樣本O,即提取的羊叫聲信號(hào)特征參數(shù),對(duì)所有的HMM,分別采用Viterbi算法求出最大輸出概率P(O,O*|λm),m=1,2,3,4,5,其中O*為最佳狀態(tài)序列,則該樣本的羊叫聲信號(hào)類別歸屬為匹配概率最大的HMM。利用HMM模型中的Viterbi解碼算法產(chǎn)生5種羊叫聲信號(hào)的最佳狀態(tài)轉(zhuǎn)移序列輸出概率,將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入,BP神經(jīng)網(wǎng)絡(luò)為三層網(wǎng)絡(luò),其輸出即為羊叫聲信號(hào)的類別。