亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法

文檔序號(hào):9434121閱讀:297來(lái)源:國(guó)知局
基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,屬于語(yǔ)音活動(dòng)檢測(cè)技術(shù)領(lǐng) 域。
【背景技術(shù)】
[0002] 語(yǔ)音活動(dòng)檢測(cè)技術(shù)是從包含語(yǔ)音的一段信號(hào)中確定出語(yǔ)音信號(hào),在語(yǔ)音編碼,語(yǔ) 音識(shí)別,語(yǔ)音增強(qiáng)等方面發(fā)揮重要作用。
[0003] 經(jīng)過(guò)多年的發(fā)展,語(yǔ)音活動(dòng)檢測(cè)領(lǐng)域已經(jīng)涌現(xiàn)出一些高效實(shí)用的算法,比如:短時(shí) 能量方法,過(guò)零率方法,譜估計(jì)方法,自相關(guān)函數(shù)法等。其中以自相關(guān)函數(shù)算法為代表的檢 測(cè)方法目前已儼然成為了該領(lǐng)域公認(rèn)的標(biāo)準(zhǔn)。但是這類算法亦存在某些弊端,例如:當(dāng)噪聲 不斷增大時(shí),檢測(cè)效果降低,另外,上述方法主要假設(shè)噪聲為平穩(wěn)高斯白噪聲,對(duì)于非平穩(wěn) 噪聲檢測(cè)效果相對(duì)較差。
[0004] 針對(duì)上述問(wèn)題,目前已存在一些應(yīng)對(duì)方案。例如,基于聯(lián)合音視頻信號(hào)的方法能夠 提高對(duì)非平穩(wěn)噪聲的魯棒性,但是該方法需要附加特殊傳感器,成本較高。

【發(fā)明內(nèi)容】

[0005] 為解決現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于兩步排列熵的語(yǔ)音活動(dòng) 檢測(cè)方法,通過(guò)計(jì)算語(yǔ)音信號(hào)排列熵,對(duì)背景噪聲、清音、濁音進(jìn)行判斷。該方法對(duì)背景噪聲 的魯棒性較高,計(jì)算準(zhǔn)確高效,成本低。
[0006] 為了實(shí)現(xiàn)上述目標(biāo),本發(fā)明采用如下的技術(shù)方案:
[0007] -種基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,具體包括如下步驟:
[0008] (1)對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理,得到各幀語(yǔ)音信號(hào);
[0009] (2)計(jì)算各幀語(yǔ)音信號(hào)的短時(shí)能量;
[0010] (3)各幀語(yǔ)音信號(hào)進(jìn)行第一步排列熵計(jì)算;
[0011] (4)通過(guò)短時(shí)能量和排列熵,作第一步判斷,檢測(cè)噪聲和語(yǔ)音信號(hào);
[0012] (5)對(duì)檢測(cè)出的語(yǔ)音信號(hào)進(jìn)行第二步排列熵計(jì)算;
[0013] (6)判斷語(yǔ)音信號(hào)的清濁音。
[0014] 前述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟(1)中的分幀 處理通過(guò)對(duì)語(yǔ)音信號(hào)進(jìn)行固定時(shí)長(zhǎng)的分幀,確定幀長(zhǎng)和幀移,得到各幀語(yǔ)音信號(hào);
[0015] 前述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟(2)根據(jù)短時(shí) 能量計(jì)算公式得到語(yǔ)音信號(hào)的能量。
[0016] 前述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟(3)中的計(jì)算 第一步排列熵的工作過(guò)程包括如下步驟:
[0017] (3. 1)將語(yǔ)音信號(hào)數(shù)字化得到時(shí)間序列;
[0018] (3. 2)利用排列熵的計(jì)算公式得到該時(shí)間序列的排列熵值。
[0019] 前述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟(4)具體包括 如下步驟:
[0020] (4. 1)預(yù)先設(shè)定值rip,計(jì)算每幀短時(shí)能量和排列熵的比值ri。
[0021] (4. 2)比較ri與Ilp的大小,如果ri大于ri p,則判斷為語(yǔ)音信號(hào),反之,則判斷為 噪聲。
[0022] 前述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟(5)中對(duì)檢測(cè) 的語(yǔ)音信號(hào)進(jìn)行第二步排列熵計(jì)算包括如下步驟:
[0023] (5. 1)通過(guò)計(jì)算相鄰幀之間的差值,差值為正時(shí)用"1"表示,為負(fù)時(shí)用"0"表示;
[0024] (5.2)在上述步驟(5.2)的基礎(chǔ)上,重新構(gòu)建僅由"0"和"1"組成的新序列;
[0025] (5. 3)計(jì)算由步驟(5. 3)得到的新序列的排列熵、每幀短時(shí)能量和排列熵的比值 η 〇
[0026] 前述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征在于:所述步驟(6)中的判 斷清濁音的方法包括如下步驟:
[0027] (6. 1)預(yù)先設(shè)定ε和nuv,其中ε為排列熵的最大值的〇. 8倍,nuv為η最大值 的〇. 2倍;
[0028] (6. 2)比較每幀語(yǔ)音信號(hào)的排列熵PE和ε,η和nuv的大小,如果PE > ε并且 η < nuv,則判斷該幀語(yǔ)音信號(hào)為清音,否則判斷為濁音。
[0029] 本發(fā)明所達(dá)到的有益效果:充分利用了語(yǔ)音信號(hào)幀數(shù)之間的準(zhǔn)周期性,利用排列 熵作為語(yǔ)音信號(hào)復(fù)雜度的度量標(biāo)準(zhǔn),實(shí)現(xiàn)語(yǔ)音活動(dòng)檢測(cè)的目的。
【附圖說(shuō)明】
[0030] 圖1是清濁音波形比較圖。
【具體實(shí)施方式】
[0031] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。以下實(shí)施例僅用于更加清楚地說(shuō)明本發(fā)明 的技術(shù)方案,而不能以此來(lái)限制本發(fā)明的保護(hù)范圍。
[0032] 本發(fā)明涉及的一種基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,通過(guò)計(jì)算語(yǔ)音信號(hào)排列 熵,對(duì)背景噪聲、清音、濁音進(jìn)行判斷。對(duì)于含噪語(yǔ)音信號(hào),首先進(jìn)行第一步排列熵計(jì)算,對(duì) 語(yǔ)音和噪聲進(jìn)行識(shí)別,對(duì)分離出語(yǔ)音信號(hào)然后進(jìn)行第二步檢測(cè),計(jì)算排列熵,得到清音和濁 音的判斷結(jié)果。
[0033] 清濁音波形比較圖如圖1所示。由圖可知,濁音信號(hào)具有明顯的單調(diào)性,在tl到 t2時(shí)間內(nèi)單調(diào)遞減,t2到t3時(shí)間內(nèi)單調(diào)遞增,利用該特點(diǎn),在第二步排列熵檢測(cè)階段,重構(gòu) 新序列時(shí),tl到t2時(shí)間內(nèi)均為0,t2到t3時(shí)間內(nèi)均為1,新序列的復(fù)雜度較低,因?yàn)榕帕徐?的值較小,清音則〇和1交替出現(xiàn)的頻率較高,排列熵值較大,利用該特性即可判斷清濁音。
[0034] 下面結(jié)合實(shí)例對(duì)本發(fā)明作更進(jìn)一步的說(shuō)明。
[0035] 具體包括如下步驟:
[0036] (1)對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理,得到各幀語(yǔ)音信號(hào);
[0037] (2)計(jì)算各幀語(yǔ)音信號(hào)的短時(shí)能量;
[0038] (3)各幀語(yǔ)音信號(hào)進(jìn)行第一步排列熵計(jì)算;
[0039] (4)通過(guò)短時(shí)能量和排列熵,作第一步判斷,檢測(cè)噪聲和語(yǔ)音信號(hào);
[0040] (5)對(duì)檢測(cè)出的語(yǔ)音信號(hào)進(jìn)行第二步排列熵計(jì)算;
[0041] (6)判斷語(yǔ)音信號(hào)的清濁音;
[0042] 上述步驟中,步驟(1)~(4)為噪聲和語(yǔ)音信號(hào)的判斷步驟,步驟(5)~(6)為清 濁音和濁音的判斷步驟。
[0043] 步驟(3)和(5)中的排列熵,是一種基于復(fù)雜性量度的非線性動(dòng)力學(xué)參數(shù),能夠 快速、有效地反映系統(tǒng)的特征。
[0044] 下面簡(jiǎn)要介紹排列熵的計(jì)算方法:
[0045] 給定一個(gè)時(shí)間序列{x (i),i = 1,2,…,N},長(zhǎng)度為N,構(gòu)成一個(gè)嵌入因子為η的新 的嵌入向量序列 |X(i), i = 1,2,…,Ν-η+1},其中 X(i) = [x(i), x(i+l),…,x(i+n-l)]。
[0046] 對(duì)于一個(gè)長(zhǎng)度為η的序列共有η !個(gè)不同的排列。
[0047] 假設(shè)Q(Ji P表示X(i)中屬于j型排列的個(gè)數(shù),其中j = 1,2,…,η !。
[0048] 因此頻率P ( π j)可以表不為:
[0050] 根據(jù)所求概率,排列熵由下式得到:
[0052] 標(biāo)準(zhǔn)化排列熵PE為:
[0054] 時(shí)間序列復(fù)雜度越高,排列熵的值越大。
[0055] 在第一步排列熵檢測(cè)階段(步驟3):
[0056] (3. 1)對(duì)語(yǔ)音信號(hào)進(jìn)行分幀,幀長(zhǎng)20ms,幀重疊間隔10ms。
[0057] (3. 2)利用排列熵計(jì)算公式(3)得到各幀語(yǔ)音信號(hào)的排列熵值。
[0058] (3. 2)預(yù)先設(shè)定值rip,計(jì)算每幀短時(shí)能量和排列熵的比值Tl。其中,計(jì)算各幀語(yǔ) 音信號(hào)的短時(shí)能量時(shí),短時(shí)能量的計(jì)算公式如下:
[0060] (3.4)比較Tl與Ilp的大小,如果Tl大于τι p,則判斷為語(yǔ)音信號(hào),反之,則判斷為 噪聲。
[0061] 在第二步排列熵檢測(cè)階段(步驟5):
[0062] (5. 1)計(jì)算相鄰幀之間的差值,差值為正時(shí)用"1"表示,為負(fù)時(shí)用"0"表示:
[0063] (5. 2)在步驟a的基礎(chǔ)上,重新構(gòu)建僅由"0"和"1"組成的新序列。
[0064] (5. 3)對(duì)步驟(5. 2)得到的新序列計(jì)算排列熵PE,具體步驟與步驟3相同。
[0065] (5. 4)預(yù)先設(shè)定ε和nuv,其中ε為排列熵的最大值的〇. 8倍,quv為η最大值 的〇. 2倍。
[0066] (5. 5)比較每幀語(yǔ)音信號(hào)的排列熵PE和ε,η和nuv的大小,如果PE > ε并且 η < nuv,則判斷各幀語(yǔ)音信號(hào)為清音,否則判斷為濁音。
[0067] 以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人 員來(lái)說(shuō),在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進(jìn)和變形,這些改進(jìn)和變形 也應(yīng)視為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,具體包括如下步驟: (1) 對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理,得到各幀語(yǔ)音信號(hào); (2) 計(jì)算各幀語(yǔ)音信號(hào)的短時(shí)能量; (3) 各幀語(yǔ)音信號(hào)進(jìn)行第一步排列熵計(jì)算; (4) 通過(guò)短時(shí)能量和排列熵,作第一步判斷,檢測(cè)噪聲和語(yǔ)音信號(hào); (5) 對(duì)檢測(cè)出的語(yǔ)音信號(hào)進(jìn)行第二步排列熵計(jì)算; (6) 判斷語(yǔ)音信號(hào)的清濁音。2. 根據(jù)權(quán)利要求1所述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟 (1) 中的分幀處理通過(guò)對(duì)語(yǔ)音信號(hào)進(jìn)行固定時(shí)長(zhǎng)的分幀,確定幀長(zhǎng)和幀移,得到各幀語(yǔ)音信 號(hào)。3. 根據(jù)權(quán)利要求1所述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟 (2) 根據(jù)短時(shí)能量計(jì)算公式得到語(yǔ)音信號(hào)的能量。4. 根據(jù)權(quán)利要求1所述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟 (3) 中的計(jì)算第一步排列熵的工作過(guò)程包括如下步驟: (3. 1)將語(yǔ)音信號(hào)數(shù)字化得到時(shí)間序列; (3. 2)利用排列熵的計(jì)算公式得到該時(shí)間序列的排列熵值。5. 根據(jù)權(quán)利要求1所述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟 (4) 具體包括如下步驟: (4. 1)預(yù)先設(shè)定值nP,計(jì)算每幀短時(shí)能量和排列熵的比值n。 (4.2)比較n與np的大小,如果n大于np,則判斷為語(yǔ)音信號(hào),反之,則判斷為噪 聲。6. 根據(jù)權(quán)利要求5所述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,所述步驟 (5) 中對(duì)檢測(cè)的語(yǔ)音信號(hào)進(jìn)行第二步排列熵計(jì)算包括如下步驟: (5. 1)通過(guò)計(jì)算相鄰幀之間的差值,差值為正時(shí)用" 1"表示,為負(fù)時(shí)用"0"表示; (5. 2)在上述步驟(5. 2)的基礎(chǔ)上,重新構(gòu)建僅由"0"和"1"組成的新序列; (5. 3)計(jì)算由步驟(5. 3)得到的新序列的排列熵、每幀短時(shí)能量和排列熵的比值n。7. 根據(jù)權(quán)利要求6所述的基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征在于:所述步 驟(6)中的判斷清濁音的方法包括如下步驟: (6. 1)預(yù)先設(shè)定e和nuv,其中e為排列熵的最大值的〇. 8倍,nuv為n最大值的 〇? 2 倍; (6. 2)比較每幀語(yǔ)音信號(hào)的排列熵PE和e,n和nuv的大小,如果PE>e并且n<nuv,則判斷該幀語(yǔ)音信號(hào)為清音,否則判斷為濁音。
【專利摘要】本發(fā)明公開了一種基于兩步排列熵的語(yǔ)音活動(dòng)檢測(cè)方法,其特征是,具體包括如下步驟:(1)對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理,得到各幀語(yǔ)音信號(hào);(2)計(jì)算各幀語(yǔ)音信號(hào)的短時(shí)能量;(3)各幀語(yǔ)音信號(hào)進(jìn)行第一步排列熵計(jì)算;(4)通過(guò)短時(shí)能量和排列熵,作第一步判斷,檢測(cè)噪聲和語(yǔ)音信號(hào);(5)對(duì)檢測(cè)出的語(yǔ)音信號(hào)進(jìn)行第二步排列熵計(jì)算;(6)判斷語(yǔ)音信號(hào)的清濁音。本發(fā)明所達(dá)到的有益效果:充分利用了語(yǔ)音信號(hào)幀數(shù)之間的準(zhǔn)周期性,利用排列熵作為語(yǔ)音信號(hào)復(fù)雜度的度量標(biāo)準(zhǔn),實(shí)現(xiàn)語(yǔ)音活動(dòng)檢測(cè)的目的。
【IPC分類】G10L25/21, G10L25/93, G10L25/84
【公開號(hào)】CN105185386
【申請(qǐng)?zhí)枴緾N201510629748
【發(fā)明人】徐寧, 李海燕, 鮑靜益, 蔣愛民, 劉小峰
【申請(qǐng)人】河海大學(xué)常州校區(qū)
【公開日】2015年12月23日
【申請(qǐng)日】2015年9月28日
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1