專利名稱:一種獲取基音周期的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信號處理領(lǐng)域,尤其涉及一種獲取基音周期的方法和裝置。
背景技術(shù):
基音是指發(fā)濁音時聲帶震動所引起的周期性,基音周期為聲帶振動頻率 的倒數(shù)?;糁芷谠谡Z音信號處理中一直是一個很重要的參數(shù),基音周期的 檢測無論在語音信號的合成、編碼還是識別方面,都起著非常重要的作用。
盡管目前已經(jīng)對語音信號的基音周期檢測方面作了大量的研究工作,但 是語音信號固有的特點(diǎn)使得語音信號的基音檢測仍是語音信號處理中最困難 的問題之一。
現(xiàn)有技術(shù)中基音檢測的一種常用方法是基于自相關(guān)的檢測技術(shù),以下結(jié)
合圖1描述利用自相關(guān)檢測基音周期的方法。假定基音的周期為T,則首先設(shè) 定滑動窗的窗長為W, W的選擇一定不能小于T。在通話中,基音周期的長 度一般為4 ~ 10ms,因此滑動窗的窗長一般選擇10 ~ 12ms即可。 這里定義自相關(guān)函數(shù)為
其中,k表示滑動窗向左滑動的距離。如果該信號是個濁音,則它會具有 周期T,也就是我們要求的基音周期T。那么有
x(m) = x(附+ r)
則有
<formula>formula see original document page 5</formula>因此如果x(m)是一個周期信號的話,那么自相關(guān)函數(shù)i (&)具有和x(m) — 樣的周期特性。如果這段信號是個濁音信號(具有周期性)的話,那么/ ("的 值就比較大,會具有峰值并具有周期性;而清音(不具有周期性)的i (A:)值
就表現(xiàn)出雜亂無章,沒有什么規(guī)律。根據(jù)自相關(guān)系數(shù)的這個特性,就可以得 出基音周期。
使用自相關(guān)方法檢測基音周期的缺陷在于其準(zhǔn)確性不是很高,尤其在 外界存在干擾時容易發(fā)生誤判。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種獲取基音周期的方法和裝置,以實(shí)現(xiàn)對語音信 號基音周期的準(zhǔn)確獲取。
為達(dá)到上述目的,本發(fā)明的實(shí)施例提供一種獲取基音周期的方法,包括 以下步驟
獲取初始位置語音信號和其他一個或多個位置語音信號的相位; 根據(jù)所述相位,獲取所述初始位置語音信號的相位與所述其他位置語音
信號的相位的相似程度;
根據(jù)所述相位的相似程度獲取基音周期。 本發(fā)明的實(shí)施例還提供一種獲取基音周期的裝置,包括 相位獲取模塊,用于獲取語音信號中初始位置和其他位置的相位,并將
所述相位通知給相位相似程度獲取模塊;
相位相似程度獲取模塊,用于根據(jù)所述相位獲取模塊通知的相位,獲取
所述初始位置相位與其他位置相位的相似程度,并將所述相似程度通知基音
周期獲^^莫塊;
基音周期獲取模塊,用于根據(jù)所述相位相似程度獲取模塊的通知獲取基 音周期。
與現(xiàn)有技術(shù)相比,本發(fā)明的實(shí)施例具有以下優(yōu)點(diǎn) 基于語音信號的相位相似性進(jìn)行基音檢測,獲取到的基音周期具有較高 的準(zhǔn)確性,且實(shí)現(xiàn)簡單。
圖1是現(xiàn)有技術(shù)中通過自相關(guān)檢測基音周期的方法的示意圖2是本發(fā)明的實(shí)施例一中獲取基音周期的方法的流程圖3是本發(fā)明的實(shí)施例二中獲取基音周期的方法的流程圖4是本發(fā)明的實(shí)施例二中獲取語音信號相位的流程圖5是本發(fā)明的實(shí)施例二中獲取相位相似程度的流程圖6是本發(fā)明的實(shí)施例二中根據(jù)相位相似程度獲取基音周期的流程圖7是本發(fā)明的實(shí)施例二中另一根據(jù)相位相似程度獲取基音周期的流程
圖8是本發(fā)明實(shí)施例中的各個位置相位差絕對值的和的波形圖; 圖9是本發(fā)明實(shí)施例中的一種獲取基音周期的裝置圖; 圖10是本發(fā)明實(shí)施例中的一種基音周期獲取模塊的裝置圖; 圖11是本發(fā)明實(shí)施例中的另 一種基音周期獲取模塊的裝置圖。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例,對本發(fā)明的具體實(shí)施方式
作進(jìn)一步詳細(xì)描述 本發(fā)明實(shí)施例一中, 一種獲耳又基音周期的方法的流程如圖2所示,包括以 下步驟
步驟s201、對于一個語音信號,獲取初始位置語音信號的相位。 步驟s202、獲取其他位置語音信號的相位。
步驟s203、獲取其他位置語音信號的相位與初始位置語音信號的相位的相 似度。
步驟s204、根據(jù)相位的相似程度獲取基音周期。
本發(fā)明實(shí)施例二中,結(jié)合一個具體的語音信號, 一種獲取基音周期的方 法流程如圖3所示,包括以下步驟
步驟s301、對于一個語音信號,獲取初始位置尸(O)處語音信號的相位。 本實(shí)施例中以P(O)表示初始位置。
步驟s302、獲取其他位置尸(l), P(2)…尸(A0處語音信號的相位。 本實(shí)施例中以尸(l),尸(2)…尸(A0表示其他位置,其中位置尸(O),尸(l), 戶(2)...尸(>0之間可以是連續(xù)的,也可以中間間隔若干個樣點(diǎn),為了減小計算
量,尸(0)和尸(1)之間的距離最好等于一個預(yù)設(shè)的最小基音周期,尸(0)和尸(7V) 之間的距離最好等于一個預(yù)設(shè)的最大基音周期。其中,該預(yù)設(shè)的最大、最小 基音周期可以根據(jù)人聲音頻率的范圍來決定, 一般人聲音的頻率為50-500赫 茲,因此預(yù)設(shè)的最小基音周期可以為2ms,最大基音周期可以為20ms。假設(shè)采 樣頻率為10kHz,即每lms采10個樣點(diǎn),將初始位置尸(0)與P(1)之間的距離設(shè) 置為20個樣點(diǎn),即最小基音周期2ms;將初始位置戶(O)與尸(7V)之間的距離設(shè) 置為200個樣點(diǎn),即最大基音周期20ms。假定戶(0)的位置為第1000個樣點(diǎn),則 尸(l), P(2)…戶(A0的位置可取為第1020,…,1200個樣點(diǎn)。
步驟s303 、獲取初始位置尸(O)處語音信號的相位與位置尸(l), P(2)...戶(iV)處語音信號的相位的相似程度S(l), S(2)... 。
步驟s304、根據(jù)相位的相似程度獲取基音周期。
圖3中的步驟s301和s302可以按照圖4所示的方法獲取相位,包括以下步
驟
步驟s401、在需要獲取相位的位置選擇一段語音信號進(jìn)行力。窗,窗的類型 可以是矩形窗、漢明窗、三角窗等,優(yōu)選為矩形窗。
步驟402、對加窗的語音信號進(jìn)行傅立葉變換,變換之后的頻域參數(shù)包括 幅度信息和相位信息。
步驟401和402可以用下面公式表示
<formula>formula see original document page 8</formula>式(1 )中x(m)是語音時域信號,wO)是在區(qū)間
之外為零的分析 窗,n是需要獲取相位的時域位置,X(",A)是傅立葉變換之后的頻域信號,k
是離散的頻率點(diǎn),取值范圍為O,l..丄-l,和角頻率對應(yīng)的關(guān)系為0 =——
丄
L為窗的長度。
義(",Q是復(fù)數(shù)值,可以用幅度和相位的形式表示<formula>formula see original document page 8</formula>
式(2)中4a是第k個頻率點(diǎn)的幅度值,、&是第k個頻率點(diǎn)的相位。 因此在時域位置n處獲取的和各個頻率點(diǎn)對應(yīng)的相位包括 j , ,2 ... ,n 。
對于圖3中的步驟s303,可以用圖5所示的方法獲取相位相似程度,包 括以下步驟
步驟s501、對于每個位置P(l),尸(2)…P(A0,獲取各位置下各個頻率點(diǎn) 的相位和初始位置戶(O)各對應(yīng)頻率點(diǎn)的相位的差值。
步驟s502、對于每個位置,獲取該位置各個頻率點(diǎn)和初始位置各個頻率 點(diǎn)的上述相位差值的絕對值的和。
步驟s503、取每個位置相位差值的絕對值的和的倒數(shù),作為該位置的相 位與初始位置的相位的相似程度S(l) , S(2) ...S(AO 。
上述步驟s501 ~ s503可以用下面7〉式來表示
——^- (3)
S l- 6尸(0),yt
根據(jù)前面所述,可以知道在某個時域位置獲取的相位共有L個,且和各 個頻率點(diǎn)對應(yīng),由于高頻部分相位變化較大,且容易受到噪聲影響,因此在 獲取相似性時,通常只取部分頻率范圍內(nèi)的相位差, 一個優(yōu)選方案是^^50-500Hz范圍的相位差。在公式(3)中,KL是用于獲取相位差的最低頻率點(diǎn), KH是最高頻率點(diǎn),例如,根據(jù)經(jīng)驗(yàn),如果語音信號的采樣頻率為32kHz,窗 長取為512,則4艮據(jù)經(jīng)^驗(yàn)值,KL可耳又為l, KH可取為7。
對于圖3中的步驟s304,可以用圖6所示的方法獲取基音周期,步驟如
下
步驟s601、令最大的相位相似程度S'等于5"(1),相應(yīng)的位置尸'等于尸(l)。 步驟s602、令k等于2。
步驟s603、判斷S(k)是否大于S',如果是,則執(zhí)行步驟s604,否則跳轉(zhuǎn) 到步驟s605。
步驟s604、令S'等于S(A:),尸'等于 步驟s605、對k進(jìn)行累加,即^: = & + 1。
步驟s606、判斷A:是否大于W,如果是則執(zhí)行步驟s607,否則跳轉(zhuǎn)到步
驟s603。
步驟s607、獲取尸'與P(O)的差的絕對值,即得到基音周期。 對于圖3中的步驟s304,也可以用圖7所示的另外一種實(shí)現(xiàn)方式獲取基 音周期,步驟如下
步驟s701 、設(shè)置相位相似度門限S丄。 步驟s702、令6等于1。
步驟s703、判斷S("是否大于5Z,如果是則執(zhí)行步驟s704,否則執(zhí)行步 驟s705。
步驟s704、獲取戶(A)與尸(O)的差的絕對值,即是所求基音周期。獲取完 周期之后,則退出獲取基音周期的流程,即結(jié)束步驟s304。 步驟s705、對k進(jìn)行累加,即A:-A: + 1。
步驟s706、判斷A是否大于W,如果是則退出獲取基音周期的流程,即 結(jié)束步驟s304;如果否則跳轉(zhuǎn)到步驟s703。
在圖8中,上部是語音波形圖,采樣率為32khz,中間是采樣本發(fā)明方案 獲取的每個位置相位差值的絕對值的和,窗長取的是512,用于獲取相位差的 頻率點(diǎn)的范圍為1至7;圖的下部是相應(yīng)的相位相似程度,用圖6或圖7的方 法可以方便的檢測出基音周期為276個樣點(diǎn)。
通過使用上述實(shí)施例提供的獲取基音周期的方法,基于語音信號頻域相 位相似性進(jìn)行基音檢測,獲取到的基音周期具有較高的準(zhǔn)確性,且實(shí)現(xiàn)簡單。
本發(fā)明實(shí)施例的一種獲取基音周期的裝置如圖9所示,該裝置包括相位 獲取模塊10、相位相似程度獲取模塊20和基音周期獲取模塊30。其中相位 相似程度獲取模塊20分別與相位獲取模塊10以及基音周期獲取模塊30連接。
具體的,相位獲取模塊IO用于獲取一語音信號各位置的相位,然后通知 給相位相似程度獲取模塊20。其進(jìn)一步包括加窗子模塊11和變換子模塊12, 其中加窗子模塊11用于在需要獲取相位的位置選擇一段語音信號進(jìn)行加窗, 窗的類型可以是矩形窗、漢明窗、三角窗等,優(yōu)選為矩形窗。變換子模塊12 用于對加窗子模塊11加窗的語音信號進(jìn)行傅立葉變換,變換之后的參數(shù)包括 幅度信息和相位信息。
相位相似程度獲取模塊20用于獲取初始位置相位與其他位置相位的相似 程度,然后把獲取結(jié)果通知給基音周期獲取模塊30。
基音周期獲取模塊30根據(jù)相位相似程度獲取模塊20的通知獲取基音周期。
具體的,基音周期獲取模塊30可以進(jìn)一步包括判斷子模塊31和處理子 模塊32,如圖10所示,其中判斷子模塊31用于獲取最大的相位相似程度, 獲取的具體過程為依次比較各個位置的相位相似程度,直到得出最大值;進(jìn) 一步獲取最大值所對應(yīng)的位置并通知處理子模塊32。處理子模塊32通過獲取 所述最大值的位置與初始位置的差的絕對值來獲取基音周期。
具體的,基音周期獲取模塊30也可以進(jìn)一步包括門限設(shè)置子模塊33、比 較子模塊34和獲取子模塊35,如圖11所示,其中門限設(shè)置子模塊33用于設(shè) 置一個相位相似度門限,該門限設(shè)置的標(biāo)準(zhǔn)參考上述預(yù)設(shè)的最大最小基音周 期。比較子模塊34用于比較各個位置的相位相似度與門限設(shè)置子模塊33設(shè) 置的門限的大小,獲取最大的相位相似程度并通知給獲取子模塊35,獲取子 模塊35通過獲取比較子模塊34發(fā)送最大值的位置與初始位置的差的絕對值 來獲取基音周期。
通過使用上述實(shí)施例提供的獲取基音周期的裝置,基于語音信號頻域相 位相似性進(jìn)行基音檢測,獲取到的基音周期具有較高的準(zhǔn)確性,且實(shí)現(xiàn)簡單。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā) 明可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件, 但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案 本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來, 該獲取機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺設(shè)備 執(zhí)行本發(fā)明各個實(shí)施例所述的方法。
以上公開的僅為本發(fā)明的幾個具體實(shí)施例,但是,本發(fā)明并非局限于此, 任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種獲取基音周期的方法,其特征在于,包括以下步驟:獲取初始位置語音信號和其他一個或多個位置語音信號的相位;根據(jù)所述相位,獲取所述初始位置語音信號的相位與所述其他位置語音信號的相位的相似程度;根據(jù)所述相位的相似程度獲取基音周期。
2、 如權(quán)利要求1所述獲取基音周期的方法,其特征在于,所述獲取初始 位置語音信號和其他一個或多個位置語音信號的相位之前還包括確定所述初始位置和所述其他位置;
3、 如權(quán)利要求2所述獲取基音周期的方法,其特征在于,所述其他位置 的確定方法為確定與所述初始位置的距離等于一個預(yù)"i殳的最小基音周期的位置為第一 個位置,與所述初始位置的距離等于一個預(yù)設(shè)的最大基音周期的位置為最后 一個位置,其余位置分布在所述第一個位置和最后一個位置之間。
4、 如權(quán)利要求1所述獲取基音周期的方法,其特征在于,所述獲取初始 位置語音信號和其他位置語音信號的相位的步驟具體為對需要獲取相位位置的語音信號進(jìn)行加窗;對所述加窗的語音信號進(jìn)行傅立葉變換;根據(jù)所述傅立葉變換的結(jié)果獲取所述位置的語音信號的相位。
5、 如權(quán)利要求1所述獲取基音周期的方法,其特征在于,所述獲取初始 位置語音信號的相位與其他位置語音信號的相位的相似程度的步驟具體包 括對于其他位置,獲取所述初始位置語音信號的相位與所述其他位置語音 信號的相位差值;對于其他位置,獲取所述相位差值的絕對值的和;對于其他位置,根據(jù)所述絕對值的和獲取所述初始位置語音信號的相位 與所述其他位置語音信號的相位的相似程度。
6、 如權(quán)利要求1或5所述獲取基音周期的方法,其特征在于,所述根據(jù) 相位的相似程度獲取基音周期的步驟具體包括 獲取所述初始位置語音信號的相位與各其他位置語音信號的相位的相似程度中的最大相位相似程度;獲取所述最大相位相似程度的對應(yīng)位置; 獲取所述對應(yīng)位置與所述初始位置差的絕對值為基音周期。
7、 如權(quán)利要求1或5所述獲取基音周期的方法,其特征在于,所述根據(jù) 相位的相似程度獲取基音周期的步驟具體包括設(shè)定相位相似度門限值;將所述初始位置語音信號的相位與其他位置語音信號的相位的相似程度 與所述相位相似度門限值依次進(jìn)行比較;獲取第一次大于所述相位相似度門限值的相似程度所對應(yīng)的位置; 獲取所述位置與所述初始位置差的絕對值為基音周期。
8、 一種獲取基音周期的裝置,其特征在于,包括相位獲取模塊,用于獲取^語音信號中初始位置和其他位置的相位,并將 所述相位通知給相位相似程度獲取模塊;相位相似程度獲取模塊,用于根據(jù)所述相位獲取模塊通知的相位,獲取 所述初始位置相位與其他位置相位的相似程度,并將所述相似程度通知基音 周期獲取模塊;基音周期獲取模塊,用于根據(jù)所述相位相似程度獲取模塊的通知獲取基 音周期。
9、 如權(quán)利要求8所述,其特征在于,所述相位獲取模塊進(jìn)一步包括 加窗子模塊,用于對需要獲取相位位置的語音信號進(jìn)行加窗; 變換子模塊,用于對所述加窗子模塊加窗后的語音信號進(jìn)行傅立葉變換,所述變換之后的參數(shù)包括相位信息。
10、 如權(quán)利要求8所述,其特征在于,所述基音周期獲取模塊進(jìn)一步包括判斷子模塊,用于獲取最大的相位相似程度,進(jìn)一步獲取所述最大相位 相似程度對應(yīng)的位置;處理子模塊,用于根據(jù)所述判斷子模塊獲取的所述最大相位相似程度的位置與初始位置的差的絕對值,獲取基音周期。
11、如權(quán)利要求8所述,其特征在于,所述基音周期獲取模塊進(jìn)一步包括門限設(shè)置子模塊,用于設(shè)置相位相似度門限;比較子模塊,用于比較各其他位置的相位相似度與所述門限設(shè)置子模塊 設(shè)置的門限的大小,獲取第一個大于所述相位相似度門限的相位相似程度, 以及所述相位相似程度所對應(yīng)的位置;獲取子模塊,用于根據(jù)所述比較子模塊獲取的所述最大相位相似程度的 位置與初始位置的差的絕對值來獲取基音周期。
全文摘要
本發(fā)明公開了一種獲取基音周期的方法,包括以下步驟獲取初始位置語音信號和其他一個或多個位置語音信號的相位;根據(jù)所述相位,獲取所述初始位置語音信號的相位與所述其他位置語音信號的相位的相似程度;根據(jù)所述相位的相似程度獲取基音周期。本發(fā)明還提供一種獲取基音周期的裝置。通過使用本發(fā)明,基于語音信號頻域相位相似性進(jìn)行基音檢測,獲取到的基音周期具有較高的準(zhǔn)確性,且實(shí)現(xiàn)簡單。
文檔編號G10L21/00GK101383148SQ20071014603
公開日2009年3月11日 申請日期2007年9月7日 優(yōu)先權(quán)日2007年9月7日
發(fā)明者詹五洲 申請人:深圳華為通信技術(shù)有限公司