專利名稱:基于虛擬儀器技術(shù)的說話人vq-svm并行識別系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是信號處理和模式識別領(lǐng)域,具體涉及的是基于虛擬儀器技術(shù)的說話人 VQ-SVM并行識別系統(tǒng)。背景技術(shù):
說話人識別是通過分析說話人的語音特征達(dá)到識別出說話人身份的目的。說話人識別方法主要包括矢量量化方法、概率統(tǒng)計方法、判別分類器方法等。按說話人識別系統(tǒng)構(gòu)成原理,說話人識別主要包括訓(xùn)練和識別兩個階段如
圖1所示。首先獲取原始語音信號,再經(jīng)過預(yù)處理得到干凈的語音信號,然后提取語音特征參數(shù)之后再通過特定的方法實現(xiàn)說話人訓(xùn)練與識別。其說話人模型通常采用數(shù)據(jù)庫存儲大量按特定算法處理后的語音特征樣本,而待識別語音經(jīng)過預(yù)處理和特征提取后與數(shù)據(jù)庫中的樣本集進(jìn)行匹配計算后實現(xiàn)判別。任何單一方法既有優(yōu)勢也有局限,目前研究的較多的是將兩種或兩種以上方法結(jié)合在一起的混合識別方法。VQ技術(shù)是一種數(shù)據(jù)壓縮和編碼技術(shù);SVM是基于統(tǒng)計理論的機(jī)器學(xué)習(xí)方法。這兩種方法具有互補(bǔ)性,矢量量化(VQ)方法的優(yōu)點是大樣本分類特性較發(fā)好, 模型數(shù)量少,訓(xùn)練時間短,識別響應(yīng)較快,缺點是不能解決非線性問題,抗噪性能差;支持向量機(jī)(SVM)方法的優(yōu)點是小樣本分類較好,在解決非線性及高維模式識別問題中表現(xiàn)出特有的優(yōu)勢,缺點是訓(xùn)練算法復(fù)雜且訓(xùn)練速度慢,難以處理大樣本數(shù)據(jù)。雖然曾有VQ-SVM兩種方法混合進(jìn)行說話人識別,但各類運(yùn)算通常都是在MATLAB平臺上實現(xiàn)的。因此,若用多種不同方法也只能采用串行方式進(jìn)行。同樣,現(xiàn)有的VQ-SVM兩種方法混合進(jìn)行說話人識別也同樣是先用一種方法進(jìn)行初次識別再用另一種方法進(jìn)行二次識別的所謂串行識別。不難發(fā)現(xiàn)這種串行識別方法的最大弱點是即占用機(jī)器資源又浪費(fèi)識別時間。
發(fā)明內(nèi)容
本發(fā)明的目的是提供基于虛擬儀器技術(shù)的說話人VQ-SVM并行識別系統(tǒng),它用于解決現(xiàn)有的VQ-SVM兩種方法混合進(jìn)行說話人識別即占用機(jī)器資源又浪費(fèi)識別時間的問題。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是這種基于虛擬儀器技術(shù)的說話人 VQ-SVM并行識別系統(tǒng)包括語音預(yù)處理單元、特征提取單元、說話人模型單元、識別單元、 LabVIEff虛擬儀器平臺,在虛擬儀器平臺上通過LabVIEW子VI來實現(xiàn)將一個大程序分割成各小模塊,將程序中涉及到的調(diào)用MATLAB節(jié)點的程序部分都編寫成各子VI,通過調(diào)用這些子VI來實現(xiàn)系統(tǒng)的構(gòu)建;
采用VQ算法,建立VQ模型,初始碼本采用分裂法,選取特征向量的形心作為初始碼書,在LabVIEW中通過調(diào)用MATLAB節(jié)點來實現(xiàn)說話人模型的建立及存儲,算法公式如下
總失真Σ^^"1)計算新碼字
權(quán)利要求
1.一種基于虛擬儀器技術(shù)的說話人VQ-SVM并行識別系統(tǒng),其特征在于這種基于虛擬儀器技術(shù)的說話人VQ-SVM并行識別系統(tǒng)包括語音預(yù)處理單元、特征提取單元、說話人模型單元、識別單元、LabVIEW虛擬儀器平臺,在虛擬儀器平臺上通過LabVIEW子VI來實現(xiàn)將一個大程序分割成各小模塊,將程序中涉及到的調(diào)用MATLAB節(jié)點的程序部分都編寫成各子 VI,通過調(diào)用這些子VI來實現(xiàn)系統(tǒng)的構(gòu)建;采用VQ算法,建立VQ模型,初始碼本采用分裂法,選取特征向量的形心作為初始碼書, 在LabVIEW中通過調(diào)用MATLAB節(jié)點來實現(xiàn)說話人模型的建立及存儲,算法公式如下 計算新碼字
2.根據(jù)權(quán)利要求1所述的基于虛擬儀器技術(shù)的說話人VQ-SVM并行識別系統(tǒng),其特征在于所述的特征提取單元采用美爾頻率倒譜系數(shù)MFCC及其一階差分作為識別的特征參數(shù),通過在MATLAB7. 0環(huán)境下編程實現(xiàn)特征參數(shù)的提取,具體參數(shù)設(shè)置為幀長512,幀移 256,濾波器的個數(shù)為12,采樣頻率44100Hz,并去除了首尾各兩幀,因為這兩幀的一階差分為零,這樣就得到了 M維的語音特征向量。
全文摘要
本發(fā)明涉及的是基于虛擬儀器技術(shù)的說話人VQ-SVM并行識別系統(tǒng),這種基于虛擬儀器技術(shù)的說話人VQ-SVM并行識別系統(tǒng)包括語音預(yù)處理單元、特征提取單元、說話人模型單元、識別單元、LabVIEW虛擬儀器平臺,在虛擬儀器平臺上通過LabVIEW子VI來實現(xiàn)將一個大程序分割成各小模塊,將程序中涉及到的調(diào)用MATLAB節(jié)點的程序部分都編寫成各子VI,通過調(diào)用這些子VI來實現(xiàn)系統(tǒng)的構(gòu)建。本發(fā)明克服現(xiàn)有的VQ-SVM兩種方法混合進(jìn)行說話人識別時需要串行識別浪費(fèi)時間的,提出將VQ和SVM兩種方法集中在同一個平臺上實現(xiàn)并行識別處理,從而在提高整個系統(tǒng)的識別效果的前提下節(jié)省識別時間。
文檔編號G10L15/28GK102543075SQ20121000821
公開日2012年7月4日 申請日期2012年1月12日 優(yōu)先權(quán)日2012年1月12日
發(fā)明者劉昭廷, 劉祥樓, 吳香艷, 姜繼玉, 張明 申請人:東北石油大學(xué)