亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于超完備傅里葉基的語音信號稀疏表示方法

文檔序號:9261975閱讀:404來源:國知局
基于超完備傅里葉基的語音信號稀疏表示方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及數(shù)字信號處理和模式分類技術(shù),特別設(shè)及一種基于超完備傅里葉基的 語音信號稀疏表示方法,即利用計算機對語音信號進行稀疏表示的方法。
【背景技術(shù)】
[0002] 語音信號稀疏表示在語音信號處理中有重要地位,它能降低信號處理成本,提高 壓縮效率。廣泛使用的稀疏變換有傅里葉變換、離散余弦變換等。該些方法的缺點在于稀 疏表示基固定,有時不能取得好的稀疏表示效果?;诔陚渥值涞男盘栂∈璞硎痉椒ㄓ?超完備的冗余函數(shù)系統(tǒng)代替?zhèn)鹘y(tǒng)的正交函數(shù)基,為信號的稀疏展開提供了極大的靈活性, 利用字典的冗余特性可W捕捉原始信號的自然特征,取得很好的信號稀疏表示效果。
[0003] 語音信號是人的發(fā)聲器官所發(fā)出的聲音。由于人的發(fā)聲系統(tǒng)的特殊性,語音在頻 譜上會呈現(xiàn)共振峰結(jié)構(gòu),在二維的語譜圖上則表現(xiàn)為緩慢變化的帶狀結(jié)構(gòu)。該說明語音信 號在頻域上具有稀疏性,具備稀疏展開條件。針對傅里葉變換基固定所造成的頻率分辨率 固定的缺點,本發(fā)明利用超完備的傅里葉基對語音信號進行稀疏表示,W提高語音信號的 稀疏表示性能。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的在于提供一種利用語音信號的頻域稀疏特性并利用超完備傅里葉 基對語音信號進行稀疏表示的方法。
[0005] 本發(fā)明的目的是該樣實現(xiàn)的:
[0006] 一種基于超完備傅里葉基的語音信號稀疏表示方法,其內(nèi)容包括如下步驟:
[0007] (1)根據(jù)需要構(gòu)造超完備傅里葉基;
[000引 似將輸入信號進行分帖,進行線性預(yù)測估計,獲得線性預(yù)測系數(shù);
[0009] (3)利用所獲得的線性預(yù)測系數(shù)求線性預(yù)測譜;
[0010] (4)捜索線性預(yù)測譜的局部極大值,獲得當(dāng)前帖語音的共振峰數(shù)目;
[ocm] (5)將步驟(4)所獲得的共振峰數(shù)作為依據(jù),利用超完備傅里葉基進行稀疏逼近,W獲得稀疏表示系數(shù),即獲得語音信號的稀疏表示;
[0012] (6)重復(fù)步驟(2)-巧),直至任務(wù)結(jié)束。
[0013] 作為人類特有的聲音,語音在頻譜上具有共振峰結(jié)構(gòu),是語音信號在頻域上具有 稀疏性的體現(xiàn),能夠在頻域上對語音信號進行稀疏表示。用超完備傅里葉基對語音信號進 行稀疏表示,彌補了離散傅里葉變換中基函數(shù)固定導(dǎo)致頻譜能量泄露的不足,可W在頻域 上對語音信號進行更好的稀疏逼近。線性預(yù)測譜的局部極大值與語譜中的共振峰具有對應(yīng) 關(guān)系,通過捜索線性預(yù)測譜局部極大值獲得的共振峰數(shù)目,為稀疏系數(shù)中非零元的數(shù)目提 供了依據(jù),提高了語音稀疏逼近性能。
[0014] 本發(fā)明將輸入的語音信號進行線性預(yù)測估計,獲得線性預(yù)測系數(shù),然后計算線性 預(yù)測譜,通過捜索線性預(yù)測譜的局部極大值獲得共振峰數(shù)目,W此作為稀疏系數(shù)中非零元 數(shù)目的依據(jù),最后用超完備傅里葉基對語音信號進行稀疏逼近w獲得稀疏系數(shù),完成語音 信號的稀疏表示。
[0015] 由于采用上述技術(shù)方案,本發(fā)明提供的一種基于超完備傅里葉基的語音信號稀疏 表示方法,與現(xiàn)有技術(shù)相比具有該樣的有益效果:
[0016] 現(xiàn)有的稀疏表示技術(shù),要么W能量殘余作為稀疏表示的終止條件,要么W固定的 稀疏表示系數(shù)數(shù)目作為稀疏表示的終止,沒有充分考慮語音信號本身特點。本發(fā)明利用線 性預(yù)測譜的局部極大值與語譜中的共振峰之間的對應(yīng)關(guān)系,通過捜索線性預(yù)測譜局部極大 值獲得的共振峰數(shù)目,為稀疏系數(shù)中非零元的數(shù)目提供了依據(jù),提高了語音稀疏逼近的性 能。
【附圖說明】
[0017] 圖1是語音稀疏表示流程圖。
【具體實施方式】
[001引下面結(jié)合附圖舉例對本發(fā)明做詳細的描述:
[0019] 一種基于超完備傅里葉基的語音信號稀疏表示方法,其實施例流程圖如圖1所 示,現(xiàn)根據(jù)圖1對本發(fā)明方法做詳細說明如下:
[0020] (1)根據(jù)需要的頻率分辨率構(gòu)造超完備傅里葉基;設(shè)待稀疏表示信號的帖長為N, 令
[0021]
[0022] 式中的《為離散頻率點,設(shè)所需的頻率分辨率為A= 231/M,式中M是頻率分辨 率控制參數(shù),為整數(shù),M決定超完備傅里葉基的頻率分辨率,M>N,M的值越大,則頻率分辨 率越局;則超完備傅里基A為 [002引A = [e (0) e ( A )…e (2 31 - A )]
[0024]A的維數(shù)為NXM;
[0025] (2)將輸入信號進行分帖,分帖后的信號為s(n),長度為N,建立P階線性預(yù)測模 型,使用Durbin遞推算法進行線性預(yù)測估計,獲得P個線性預(yù)測系數(shù),并組成線性預(yù)測系數(shù) 向量a=[ai32 …ap];
[0026] 做利用所獲得的線性預(yù)測系數(shù)向量a求線性預(yù)測譜H(ej'u)
[0027]
[002引式中的G為增益因子,可W設(shè)為1 ;
[0029] (4)對數(shù)字頻帶[0,31)進行抽樣,抽樣間隔為0 = 31/L,式中L為抽樣間隔控制 參數(shù),L> 0,且為整數(shù),L決定所得到的線性預(yù)測譜的光滑程度,L的大小可W根據(jù)需要進 行設(shè)定,L越大,所得到的線性預(yù)測譜幅值越光滑,將《 =ejw(0《n<L)代入|H(ej'u)I, 可得離散化的線性預(yù)測譜幅值,捜索線性預(yù)測譜幅值的局部極大值,根據(jù)預(yù)先設(shè)定的終止 條件,可獲得線性預(yù)測譜幅值的m個局部極大值,即為當(dāng)前帖語音的共振峰數(shù)目;
[0030] (5)將步驟(4)所獲得共振峰數(shù)m作為依據(jù),利用超完備傅里葉基進行稀疏逼近, W獲得稀疏表示系數(shù),即獲得語音信號的稀疏表示;
【主權(quán)項】
1. 一種基于超完備傅里葉基的語音信號稀疏表示方法,其特征在于該方法內(nèi)容包括如 下步驟: (1) 根據(jù)需要的頻率分辨率構(gòu)造超完備傅里葉基;設(shè)待稀疏表示信號的幀長為N,令 Θ(ω) = [I eJUeJU …eJN"T 式中的ω為離散頻率點,設(shè)所需的頻率分辨率為△ =2π/Μ,式中M是頻率分辨率控 制參數(shù),為整數(shù),M決定超完備傅里葉基的頻率分辨率,M > N,M的值越大,則頻率分辨率越 尚;則超完備傅里基A為 A = [e (O) e ( Δ ) ... e (2 π - Δ )] A的維數(shù)為NXM ; (2) 將輸入信號進行分幀,分幀后的信號為s (η),長度為N,建立P階線性預(yù)測模型,使 用Durbin遞推算法進行線性預(yù)測估計,獲得P個線性預(yù)測系數(shù),并組成線性預(yù)測系數(shù)向量 B - [£li 七··· £lp]; (3) 利用所獲得的線性預(yù)測系數(shù)向量a求線性預(yù)測譜H(e>)式中的G為增益因子,可以設(shè)為1 ; (4) 對數(shù)字頻帶[0, π)進行抽樣,抽樣間隔為Θ = π/L,式中L為抽樣間隔控制參數(shù), L > 0,且為整數(shù),L決定所得到的線性預(yù)測譜的光滑程度,L的大小可以根據(jù)需要進行設(shè)定, L越大,所得到的線性預(yù)測譜幅值越光滑,將ω = (〇 < n < L)代入|H(e>) I,可得離 散化的線性預(yù)測譜幅值,搜索線性預(yù)測譜幅值的局部極大值,根據(jù)預(yù)先設(shè)定的終止條件,可 獲得線性預(yù)測譜幅值的m個局部極大值,即為當(dāng)前幀語音的共振峰數(shù)目; (5) 將步驟(4)所獲得共振峰數(shù)m作為依據(jù),利用超完備傅里葉基進行稀疏逼近,以獲 得稀疏表示系數(shù),即獲得語音信號的稀疏表示; (6) 重復(fù)步驟(2)-(5),直至任務(wù)結(jié)束。
【專利摘要】本發(fā)明公開了一種基于超完備傅里葉基的語音信號稀疏表示方法,其步驟是:根據(jù)需要構(gòu)造超完備傅里葉基;將輸入信號進行分幀,進行線性預(yù)測估計,獲得線性預(yù)測系數(shù);利用所獲得的線性預(yù)測系數(shù)求線性預(yù)測譜;搜索線性預(yù)測譜的局部極大值,獲得當(dāng)前幀語音的共振峰數(shù)目;將所獲得共振峰數(shù)作為依據(jù),利用超完備傅里葉基進行稀疏逼近,以獲得稀疏表示系數(shù),即獲得語音信號的稀疏表示,從而完成語音信號的稀疏表示。本發(fā)明利用線性預(yù)測譜的局部極大值與語譜中的共振峰之間的對應(yīng)關(guān)系,通過搜索線性預(yù)測譜局部極大值獲得的共振峰數(shù)目,為稀疏系數(shù)中非零元的數(shù)目提供了依據(jù),提高了語音稀疏逼近的性能。
【IPC分類】G10L25/27
【公開號】CN104978972
【申請?zhí)枴緾N201510229462
【發(fā)明人】劉冠群, 張汝波, 楊大偉, 唐莉莉, 吳俊偉
【申請人】大連民族學(xué)院
【公開日】2015年10月14日
【申請日】2015年5月7日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1