亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法與流程

文檔序號(hào):12736603閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,包括以下步驟:

S1對(duì)初始輸入語(yǔ)音信號(hào)進(jìn)行數(shù)字化采樣、預(yù)加重和得到預(yù)處理語(yǔ)音信號(hào);

S2根據(jù)伽馬通濾波器計(jì)算預(yù)處理語(yǔ)音信號(hào)的伽馬通濾波倒譜系數(shù);

S3對(duì)伽馬通濾波倒譜系數(shù)進(jìn)行滑動(dòng)差分處理;

S4根據(jù)自相關(guān)函數(shù)對(duì)預(yù)處理語(yǔ)音信號(hào)進(jìn)行基音頻率提??;

S5根據(jù)融合公式對(duì)伽馬通濾波倒譜系數(shù)、滑動(dòng)差分和基音頻率進(jìn)行特征數(shù)據(jù)融合;

S6根據(jù)核主成分分析對(duì)特征數(shù)據(jù)融合后的語(yǔ)音特征進(jìn)行降維處理。

2.根據(jù)權(quán)利要求1所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述預(yù)加重的傳遞函數(shù)為:

H(z)=1-a*z-1

其中,a表示預(yù)加重的系數(shù),H(z)表示傳遞函數(shù),z表示函數(shù)變量。

3.根據(jù)權(quán)利要求1所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述分幀加窗處理中采用的加窗函數(shù)為:

<mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.54</mn> <mo>-</mo> <mn>0.46</mn> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>&lsqb;</mo> <mn>2</mn> <mi>&pi;</mi> <mi>n</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <mtable> <mtr> <mtd> <mrow> <mn>0</mn> <mo>&le;</mo> <mi>n</mi> <mo>&le;</mo> <mrow> <mo>(</mo> <mi>L</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>n</mi> <mo>=</mo> <mi>e</mi> <mi>l</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mrow>

w(n)表示窗函數(shù),L表示窗函數(shù)的長(zhǎng)度。

4.根據(jù)權(quán)利要求1所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述伽馬通濾波倒譜系數(shù)通過(guò)對(duì)伽馬通濾波系數(shù)取對(duì)數(shù)和離散余弦變換處理得到;其中離散余弦變換的計(jì)算公式為:

<mrow> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <msqrt> <mfrac> <mn>2</mn> <mi>N</mi> </mfrac> </msqrt> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mfrac> <msqrt> <mn>2</mn> </msqrt> <mn>2</mn> </mfrac> <mi>x</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>&lsqb;</mo> <mfrac> <mrow> <mi>&pi;</mi> <mrow> <mo>(</mo> <mn>2</mn> <mi>n</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mi>k</mi> </mrow> <mrow> <mn>2</mn> <mi>N</mi> </mrow> </mfrac> <mo>&rsqb;</mo> <mo>,</mo> <mn>0</mn> <mo>&le;</mo> <mi>k</mi> <mo>&le;</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow>

X(k)表示離散余弦變換歸一函數(shù),x(n)表示一維語(yǔ)音信號(hào)序列,N表示信號(hào)序列范圍值。

5.根據(jù)權(quán)利要求1或4所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述伽馬通濾波器的時(shí)域脈沖響應(yīng)為:

其中:A為輸出增益,M為濾波器階數(shù),fc是中心頻率,是相位,ERB(fc)為等效矩形帶寬,t為時(shí)間。

6.根據(jù)權(quán)利要求1所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述滑動(dòng)差分處理如下:

△C(t)=C(t+d)-C(t-d)=[△c0(t),△c1(t),…,△cN-1(t)]

△C(t+p)=C(t+p+d)-C(t+p-d)

△C[t+(k-1)p]=C[t+(k-1)p+d]-C[t+(k-1)p-d]

將t時(shí)刻,t+p時(shí)刻一直到t+(k-1)p時(shí)刻的一階差分倒譜系數(shù)順序相連,即為當(dāng)前幀的滑動(dòng)差分特征向量:

△GFCC(t)=[△C(t),△C(t+p),…,△C(t+(k-1)p)]

上式中△C(t)表示第t幀語(yǔ)音的一階差分倒譜系數(shù);△cN-1(t)表示第t幀語(yǔ)音的第N-1個(gè)倒譜系數(shù);C(t+d)表示第t+d幀語(yǔ)音的GFCC系數(shù);C(t-d)表示第t-d幀語(yǔ)音的GFCC系數(shù);△C(t+p)表示第t+p幀語(yǔ)音的一階差分倒譜系數(shù);C(t+p+d)表示第t+p+d幀語(yǔ)音的GFCC系數(shù);C(t+p-d)表示第t+p-d幀語(yǔ)音的GFCC系數(shù);△C[t+(k-1)p]表示第t+(k-1)p幀語(yǔ)音的一階差分倒譜系數(shù);C[t+(k-1)p+d]表示第t+(k-1)p+d幀語(yǔ)音的GFCC系數(shù);C[t+(k-1)p-d]表示第t+(k-1)p-d幀語(yǔ)音的GFCC系數(shù)。

7.根據(jù)權(quán)利要求1所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述自相關(guān)函數(shù)為:

<mrow> <msub> <mi>R</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>K</mi> <mo>-</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>S</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <msub> <mi>S</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>+</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>

其中,Sn(m)為加窗后的語(yǔ)音信號(hào),Rn(k)表示自相關(guān)函數(shù)值,k表示時(shí)間的延遲量,K表示語(yǔ)音分幀后每幀的長(zhǎng)度。

8.根據(jù)權(quán)利要求1所述基于核主成分分析改進(jìn)Mel濾波器的語(yǔ)音特征提取方法,其特征在于:所述特征數(shù)據(jù)融合為:

<mrow> <mi>S</mi> <mo>=</mo> <mi>&alpha;</mi> <mfrac> <mrow> <msub> <mi>L</mi> <mrow> <mi>G</mi> <mi>F</mi> <mi>C</mi> <mi>C</mi> </mrow> </msub> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>L</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>k</mi> <mn>1</mn> </msub> </mrow> </mfrac> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>&alpha;</mi> <mo>)</mo> </mrow> <mfrac> <mrow> <msub> <mi>F</mi> <mrow> <mi>p</mi> <mi>i</mi> <mi>t</mi> <mi>c</mi> <mi>h</mi> </mrow> </msub> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>F</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>k</mi> <mn>2</mn> </msub> </mrow> </mfrac> </mrow>

其中,LGFCC為伽馬通濾波倒譜系數(shù)及其滑動(dòng)差分,F(xiàn)pitch為被測(cè)信號(hào)的基音頻率,S表示數(shù)據(jù)融合值,Lmax表示最大似然度之差,α表示權(quán)重調(diào)節(jié)系數(shù),k1、k2均表示拉普普拉斯平滑系數(shù),F(xiàn)max表示歸一化基音頻率參數(shù)。

當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1