亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于psm變調(diào)的語音識(shí)別及其還原方法及其裝置的制作方法

文檔序號(hào):2818981閱讀:573來源:國知局
專利名稱:一種基于psm變調(diào)的語音識(shí)別及其還原方法及其裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于多媒體信息安全領(lǐng)域,具體涉及一種基于PSM變調(diào)的語音識(shí)別及其還原方法及其裝置。
背景技術(shù)
PSM(Pitch Scaling Modification)變調(diào)是最常用的語音處理之方法一。其功能是把一聲音變?yōu)榱硪宦犉饋碜匀粎s完全不同的聲音。PSM通常用于音樂制作或保護(hù)說話人的安全和隱私,但也有可能被罪犯用來掩飾聲音,以防被識(shí)別到身份。因此PSM變調(diào)后的話音還原和原說話人身份識(shí)別具有重要的應(yīng)用價(jià)值。 PSM的一般步驟 1)對(duì)信號(hào)x(n)分幀、加窗
廠⑷=Σ.濃(")‘e
/ =0
2)計(jì)算瞬時(shí)幅值
.2 π . -/--κ· η
Ν 0<η<Ν
\m
Ν—\
^ χ{η) ■ w (/τ) · e
.2π . -/--k-n
N
η=0
0</i<JV


3)通過本幀與前一幀的相位關(guān)系計(jì)算瞬時(shí)頻率
ω(k) = (k+^γ
K
N
(3)
其中Fs是抽樣頻率,△是相對(duì)中心頻率的偏移頻率。 4)頻譜伸縮。首先是瞬時(shí)幅值線性插值 F(K' ) I = μ |F(k) | + (1-μ) |F(k+l) 0 ^ k < Ν/2 i=「i'/a](5)
權(quán)利要求
1.一種基于PSM語音變調(diào)的識(shí)別方法,其特征在于,所述方法為輸入測試語音和參考語音,所述參考語音為經(jīng)過PSM變調(diào)后的語音,所述測試語音為未經(jīng)PSM變調(diào)的語音;提取測試語音的美頻率倒譜系數(shù);提取所述測試語音和參考語音的基頻,計(jì)算出伸縮系數(shù);對(duì)美頻率倒譜系數(shù)的提取算法采用所述伸縮系數(shù)進(jìn)行線性插值伸縮,得出改進(jìn)型提取算法, 用所述改進(jìn)型提取算法提取所述參考語音的美頻率倒譜系數(shù),根據(jù)所述參考語音的美頻率倒譜系數(shù)與所述測試語音的美頻率倒譜系數(shù)作匹配計(jì)算,若所得值大于預(yù)設(shè)值則識(shí)別為不同音源的語音,若不大于預(yù)設(shè)值,則識(shí)別為同一音源的語音。
2.根據(jù)權(quán)利要求1所述的基于PSM語音變調(diào)的識(shí)別方法,其特征在于,計(jì)算所述伸縮系數(shù)的估計(jì)方法為a' =Hiean (F》/mean (Ft),其中α ‘為所述估計(jì)伸縮系數(shù),mean (F》為所述參考語音的基頻值的平均值,mean (Ft)為所述測試語音的基頻值的平均值。
3.根據(jù)權(quán)利要求1所述的基于PSM語音變調(diào)的識(shí)別方法,其特征在于,所述基頻值的提取步驟如下(1)對(duì)信號(hào)加窗求得到任一時(shí)刻tmid前后一預(yù)定長度值的信號(hào);(2)求所述預(yù)定長度值的信號(hào)的自相關(guān)函數(shù)和窗函數(shù)的自相關(guān)函數(shù);(3)兩相關(guān)函數(shù)相除,最大值處即為周期T,獲取該時(shí)刻tmid的基頻F。
4.根據(jù)權(quán)利要求1所述的基于PSM語音變調(diào)的識(shí)別方法,其特征在于,所述改進(jìn)型提取算法為在美頻率倒譜系數(shù)提取算法中的加窗和FFT變換之后,對(duì)FFT系數(shù)的幅值|F(k) 進(jìn)行線性插值伸縮得出|F(k' )|。
5.根據(jù)權(quán)利要求1或4所述的基于PSM語音變調(diào)的識(shí)別方法,其特征在于,線性插值伸縮的值為所述伸縮系數(shù)的倒數(shù)。
6.根據(jù)權(quán)利要求1所述的基于PSM語音變調(diào)的識(shí)別方法,其特征在于所述匹配計(jì)算的方法為動(dòng)態(tài)時(shí)間規(guī)整算法。
7.根據(jù)權(quán)利要求1所述的基于PSM語音變調(diào)的識(shí)別方法所實(shí)現(xiàn)的語音還原方法,其特征在于,所述方法為,對(duì)判斷為與測試語音是相同音源的參考語音進(jìn)行以下步驟計(jì)算1)對(duì)待識(shí)別信號(hào)x(n)分幀、加窗、并進(jìn)行FFT變換
8.根據(jù)權(quán)利要求1所述的基于PSM語音變調(diào)的識(shí)別方法所實(shí)現(xiàn)的識(shí)別裝置,其特征在于,所述裝置包括第一語音輸入模塊,用于輸入測試語音; 第二語音輸入模塊,用于輸入?yún)⒖颊Z音; 第一提取模塊,用于提取測試語音的美頻率倒譜系數(shù);第二提取模塊,用于提取測試語音和參考語音的基頻,并根據(jù)提取的基頻計(jì)算出伸縮系數(shù);第三提取模塊,用于根據(jù)所述伸縮系數(shù)提取參考語音的美頻率倒譜系數(shù); 識(shí)別處理模塊,用于根據(jù)所述測試語音和參考語音的美頻率倒譜系數(shù),進(jìn)行匹配計(jì)算和識(shí)別;所述第一語音輸入模塊分別與所述第一提取模塊和第三提取模塊連接,所述第二語音輸入模塊分別與所述第二提取模塊和第三提取模塊連接所述第二提取模塊與所述第三提取模塊連接,所述識(shí)別處理模塊分別與所述第一提取模塊和第二處理模塊連接。
9.根據(jù)權(quán)利要求8所述的語音還原方法所實(shí)現(xiàn)的還原裝置,其特征在于,所述裝置包括,測試語音輸入模塊、參考語音輸入模塊,基頻提取模塊、處理模塊、還原模塊和語音輸出模塊,所述基頻提取模塊分別與所述測試語音輸入模塊和參考語音輸入模塊相連接,將輸入的語音傳輸?shù)剿龌l提取模塊進(jìn)行基頻提取,所述處理模塊與所述基頻提取模塊連接,根據(jù)提取的基頻計(jì)算出所述的伸縮系數(shù),所述還原模塊分別與所述參考語音輸入模塊和處理模塊連接,根據(jù)處理模塊計(jì)算出的伸縮系數(shù)還原參考語音,所述語音輸出模塊與所述還原模塊連接,輸出經(jīng)過還原的語音。
全文摘要
本發(fā)明公開一種基于PSM變調(diào)的語音識(shí)別及其還原方法及其裝置,利用語音的基頻特性估計(jì)變調(diào)后伸縮系數(shù),并對(duì)美頻率倒譜系數(shù)提取算法進(jìn)行了改進(jìn),即利用線性插值伸縮將估計(jì)的變調(diào)系數(shù)整合到美頻率倒譜系數(shù)提取算法中,使其能近似計(jì)算出變調(diào)語音在變調(diào)前的美頻率倒譜系數(shù)。最后利用時(shí)間動(dòng)態(tài)規(guī)整作為匹配方法,計(jì)算語音之間的相似度。同時(shí),還能利用該估計(jì)的伸縮系數(shù)將變調(diào)后的語音還原為原語音。
文檔編號(hào)G10L17/00GK102354496SQ20111018300
公開日2012年2月15日 申請(qǐng)日期2011年7月1日 優(yōu)先權(quán)日2011年7月1日
發(fā)明者王泳, 黃繼武 申請(qǐng)人:中山大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1