專利名稱:有聲無聲判定裝置和有聲無聲判定方法
技術(shù)領(lǐng)域:
本發(fā)明涉及有聲無聲判定裝置和有聲無聲判定方法。
背景技術(shù):
在便攜電話和因特網(wǎng)電話中,以消減發(fā)送功率和有效利用傳送頻帶為目的的所謂間歇發(fā)送的技術(shù)得到利用。所謂間歇發(fā)送是指這樣的技術(shù)在有聲音的有聲區(qū)間內(nèi)發(fā)送對(duì)聲音編碼后的信息,另一方面,在沒有聲音的無聲區(qū)間內(nèi)發(fā)送比聲音信息少的信息量的信息,或者停止發(fā)送信息。為了進(jìn)行這種間歇發(fā)送,利用有聲無聲判定裝置,判定輸入信號(hào)在包含聲音的有聲區(qū)間還是在不需要發(fā)送信息的無聲區(qū)間。
例如,下述專利文獻(xiàn)1中記載的有聲無聲判定裝置利用聲音信號(hào)是有周期性的特性,利用輸入信號(hào)的自相關(guān)值判定是有聲區(qū)間還是無聲區(qū)間。具體地說,有聲無聲判定裝置算出輸入信號(hào)的自相關(guān)值為最大的延遲,算出的延遲如果和聲音信號(hào)的周期一致,則判定為有聲區(qū)間,如果不一致,則判定為無聲區(qū)間。
下述非專利文獻(xiàn)1中記載的有聲無聲判定裝置根據(jù)輸入信號(hào)推定背景雜音,用推定的背景雜音和輸入信號(hào)的比(S/N比)判定是有聲區(qū)間還是無聲區(qū)間。更具體地說,有聲無聲判定裝置算出輸入信號(hào)的自相關(guān)值為最大的延遲以及帶加權(quán)的輸入信號(hào)的自相關(guān)值為最大的延遲,基于這些延遲的持續(xù)性(即延遲變動(dòng)小的狀態(tài)是否持續(xù)一定時(shí)間),一邊改變背景雜音的推定方法,一邊推定背景雜音,如果推定的背景雜音和輸入信號(hào)的S/N比大于等于閾值(根據(jù)推定的背景雜音來決定),則判定為有聲區(qū)間,如果比閾值小,則判定為無聲區(qū)間。
專利文獻(xiàn)1特開2002-162982號(hào)公報(bào)非專利文獻(xiàn)13GPP TS 26.094 V3.0.0(http//www.3gpp.org/ftp/Specs/html-info/26094.htm)發(fā)明內(nèi)容但是,在上述現(xiàn)有的有聲無聲判定裝置中,有以下問題。即,上述技術(shù)的有聲無聲判定裝置用最大自相關(guān)值或自相關(guān)值為最大的延遲來判定有聲區(qū)間或無聲區(qū)間。因此,對(duì)于非周期分量多的信號(hào)和多個(gè)不同周期分量混雜的輸入信號(hào),不能精確地判定有聲區(qū)間或無聲區(qū)間。
因此,本發(fā)明要解決上述問題,提供一種有聲無聲判定裝置和有聲無聲判定,即使對(duì)于非周期分量多的信號(hào)和多個(gè)不同周期分量混合的輸入信號(hào),也能精確地判定有聲區(qū)間或無聲區(qū)間。
為了解決上述課題,本發(fā)明的有聲無聲判定裝置,其特征在于,包括自相關(guān)計(jì)算單元,計(jì)算輸入信號(hào)的自相關(guān)值;延遲計(jì)算單元,計(jì)算使上述自相關(guān)計(jì)算單元計(jì)算出的上述自相關(guān)值為極大的多個(gè)延遲;性質(zhì)判定單元,基于由上述延遲計(jì)算單元計(jì)算出的上述多個(gè)延遲來判定上述輸入信號(hào)的性質(zhì);以及有聲無聲判定單元,基于上述性質(zhì)判定單元的判定結(jié)果,判定上述輸入信號(hào)有聲還是無聲。
為了解決上述課題,本發(fā)明的有聲無聲判定方法,其特征在于,包括以下步驟自相關(guān)計(jì)算步驟,算出輸入信號(hào)的自相關(guān)值;延遲計(jì)算步驟,計(jì)算使在上述自相關(guān)計(jì)算步驟中計(jì)算出的上述自相關(guān)值為極大的多個(gè)延遲;性質(zhì)判定步驟,基于在上述延遲計(jì)算步驟中計(jì)算出的上述多個(gè)延遲來判定上述輸入信號(hào)的性質(zhì);以及有聲無聲判定步驟,基于上述性質(zhì)判定步驟中的判定結(jié)果,判定上述輸入信號(hào)有聲還是無聲。
算出輸入信號(hào)的自相關(guān)值為極大的多個(gè)延遲,基于這些多個(gè)延遲判定輸入信號(hào)有聲或無聲,從而能考慮輸入信號(hào)中包含的多個(gè)周期分量并判定有聲或無聲。
在本發(fā)明的有聲無聲判定裝置中,上述有聲無聲判定裝置的特征在于基于上述性質(zhì)判定裝置的判定結(jié)果和上述輸入信號(hào)判定上述輸入信號(hào)有聲或無聲。
同樣地,在本發(fā)明的有聲無聲判定方法中,上述有聲無聲判定步驟的特征在于基于上述性質(zhì)判定步驟中的判定結(jié)果和上述輸入信號(hào)判定上述輸入信號(hào)有聲或無聲。
在性質(zhì)判定裝置或性質(zhì)判定步驟中,除了判定結(jié)果外,還利用輸入信號(hào)判定有聲或無聲,從而,能嵌入更細(xì)致的判定過程。即,例如,在性質(zhì)判定裝置或性質(zhì)判定步驟中,判定為雜音的,還可以基于輸入信號(hào)的歷史判定為有聲。
在本發(fā)明的有聲無聲判定裝置中,還具有雜音推定單元,根據(jù)上述輸入信號(hào)來推定雜音;其中上述有聲無聲判定單元基于上述性質(zhì)判定單元的判定結(jié)果、上述輸入信號(hào)以及上述雜音推定單元推定的雜音來判定上述輸入信號(hào)有聲或無聲。
除了性質(zhì)判定裝置的判定結(jié)果以外,還利用輸入信號(hào)和雜音信號(hào)判定有聲或無聲,從而,能基于S/N比判定有聲無聲。
在本發(fā)明的有聲無聲判定裝置中,上述雜音推定裝置基于上述有聲無聲判定裝置的判定結(jié)果改變雜音的推定方法。
通過基于有聲無聲判定裝置的判定結(jié)果改變雜音的推定方法,能嵌入更細(xì)致的雜音推定過程。即,例如,在有聲無聲判定裝置持續(xù)判定為有聲時(shí),則通過積極地降低由雜音推定裝置推定的雜音電平,相對(duì)于雜音,強(qiáng)調(diào)信號(hào)分量。
在本發(fā)明的有聲無聲判定裝置中,上述延遲計(jì)算裝置的特征在于,按照自相關(guān)值從大到小的順序算出上述多個(gè)延遲。
通過按自相關(guān)值從大到小的順序算出上述多個(gè)延遲,可以很容易地算出上述多個(gè)延遲。
在本發(fā)明的有聲無聲判定裝置中,上述延遲計(jì)算裝置的特征在于,將延遲觀測(cè)區(qū)間分割為多個(gè)區(qū)間,計(jì)算出在上述多個(gè)區(qū)間中的每個(gè)區(qū)間中自相關(guān)值為最大的延遲。
同樣地,在本發(fā)明的有聲無聲判定方法中,上述延遲計(jì)算步驟的特征在于,將延遲觀測(cè)區(qū)間分割為多個(gè)區(qū)間,在上述多個(gè)區(qū)間中的每個(gè)區(qū)間中算出自相關(guān)值為最大的延遲。
將延遲觀測(cè)區(qū)間分割為多個(gè)區(qū)間,算出每個(gè)區(qū)間內(nèi)自相關(guān)值為最大的延遲,從而,可以不偏向于例如依存于聲帶固有頻率及其整數(shù)倍波的延遲,一一算出依存于輸入信號(hào)中包含的種種周期分量的延遲。
在本發(fā)明的有聲無聲判定裝置中,上述多個(gè)區(qū)間將上述延遲觀測(cè)區(qū)間的起點(diǎn)作為min_t,用2i-1·min_t~2i·min_t(i是自然數(shù))來表示。
通過進(jìn)行這種區(qū)間分割,對(duì)于具有周期性的信號(hào),能更有效地檢測(cè)出與其2倍周期對(duì)應(yīng)的延遲,能精確度更高地進(jìn)行有聲無聲判定。
本發(fā)明的有聲無聲判定裝置和有聲無聲判定方法算出輸入信號(hào)的自相關(guān)值為極大的多個(gè)延遲,基于這些多個(gè)延遲判定輸入信號(hào)是有聲還是無聲。因此,能考慮輸入信號(hào)中包含的多個(gè)周期分量地判定有聲或無聲。結(jié)果,即使對(duì)于非周期分量多的信號(hào)和多個(gè)不同周期分量混合的輸入信號(hào),也能精確地判定有聲區(qū)間或無聲區(qū)間。
圖1是根據(jù)第一實(shí)施方式的有聲無聲判定裝置的結(jié)構(gòu)圖;圖2示出了延遲計(jì)算的具體例;圖3是根據(jù)第一實(shí)施方式的有聲無聲判定裝置的操作流程圖;圖4是根據(jù)第二實(shí)施方式的有聲無聲判定裝置的結(jié)構(gòu)圖;圖5是根據(jù)第二實(shí)施方式的有聲無聲判定裝置的操作流程圖;圖6是根據(jù)第三實(shí)施方式的有聲無聲判定裝置的結(jié)構(gòu)圖;圖7示出了延遲計(jì)算的具體例。
具體實(shí)施例方式
第一實(shí)施方式參考
根據(jù)本發(fā)明第一實(shí)施方式的有聲無聲判定裝置。
首先,說明根據(jù)本實(shí)施方式的有聲無聲判定裝置的結(jié)構(gòu)。圖1是根據(jù)本實(shí)施方式的有聲無聲判定裝置的結(jié)構(gòu)圖。
根據(jù)本實(shí)施方式的有聲無聲判定裝置1物理上作為計(jì)算機(jī)系統(tǒng)來構(gòu)成,具備CPU(中央處理器)、存儲(chǔ)器、鼠標(biāo)或鍵盤等輸入裝置、顯示器等顯示裝置、硬盤等存儲(chǔ)裝置、通過無線和外部設(shè)備進(jìn)行數(shù)據(jù)通信的無線通信單元等。在功能上,如圖1所示,有聲無聲判定裝置1具有自相關(guān)計(jì)算部11(自相關(guān)計(jì)算單元),延遲計(jì)算部12(延遲計(jì)算單元),雜音判定部13(性質(zhì)判定單元),有聲無聲判定部14(有聲無聲判定單元)。以下,詳細(xì)說明有聲無聲判定裝置1的各構(gòu)成要素。
自相關(guān)計(jì)算部11計(jì)算輸入信號(hào)的自相關(guān)值。具體地說,有聲無聲判定裝置1根據(jù)以下的式(1)算出輸入信號(hào)x(t)的自相關(guān)值c(t)。
c(t)=Σn=0N-1x(n)x(n-t)Σn=0N-1x2(n)Σn=0N-1x2(n-t)···(1)]]>這里,x(n)(n=0,1,...,N)是在經(jīng)過一定時(shí)間(例如20msec)后每隔一定時(shí)間間隔(例如1/8000sec)對(duì)x(t)采樣得到的第n個(gè)值。對(duì)于自相關(guān)值c(t),也是作為在一定時(shí)間(例如18msec)后每隔一定時(shí)間間隔(例如1/8000sec)的離散值而得到。
此外,自相關(guān)計(jì)算部11不一定嚴(yán)密地按上述式(1)算出自相關(guān)值。例如,自相關(guān)計(jì)算部11也可以基于廣泛用于聲音編碼過程中的帶聽覺加權(quán)的輸入信號(hào)而算出自相關(guān)值。自相關(guān)計(jì)算部11也可以對(duì)基于輸入信號(hào)算出的自相關(guān)值進(jìn)行加權(quán),輸出帶加權(quán)的自相關(guān)值。
延遲計(jì)算部12算出使由自相關(guān)計(jì)算部11計(jì)算的自相關(guān)值為極大的多個(gè)延遲。具體地說,延遲計(jì)算部12掃描預(yù)定的延遲觀測(cè)區(qū)間內(nèi)的自相關(guān)值,按照從大到小的順序算出M個(gè)自相關(guān)值為極大的延遲。即,如圖2所示,在延遲觀測(cè)區(qū)間min_t~max_t(例如AMR時(shí)為18~143)內(nèi),依次算出使自相關(guān)值為極大的延遲中的自相關(guān)值最大的延遲t_max1,使自相關(guān)值為極大的延遲中自相關(guān)值第二大的延遲t_max2,使自相關(guān)值為極大的延遲中自相關(guān)值第三大的延遲t_max3(這里,以M=3進(jìn)行說明)。
返回圖1,雜音判定部13基于延遲計(jì)算部12算出的多個(gè)延遲判定輸入信號(hào)是否為雜音(輸入信號(hào)的性質(zhì))。例如,雜音判定部13利用延遲計(jì)算部12算出的多個(gè)延遲t_maxi(1≤i≤M)的時(shí)間變動(dòng)t_maxi(k)(1≤i≤M,1≤k≤K)判定輸入信號(hào)是否為雜音。這里,k是表示時(shí)間的從屬變量。更具體地說,在滿足式(2)所示條件的狀態(tài)持續(xù)一定時(shí)間的情況下(如果定性地說,是延遲變動(dòng)小的狀態(tài)持續(xù)一定時(shí)間時(shí)),雜音判定部13判定輸入信號(hào)不是雜音。相反,在滿足式(2)所示條件的狀態(tài)不持續(xù)一定時(shí)間的情況下雜音判定部13判定輸入信號(hào)是雜音。
Mini=1~Mj=1~M{|t_maxi(k)-t_maxj(k-1)|}≤d···(2)]]>此外,式(2)中,d是預(yù)定的閾值。這里,雜音判定部13也可以以基于多個(gè)延遲判定輸入信號(hào)是否為雜音為條件,用上述過程以外的過程判定輸入信號(hào)是否為雜音。
有聲無聲判定部14基于雜音判定部13的判定結(jié)果和輸入信號(hào)判定輸入信號(hào)有聲或無聲。例如,有聲無聲判定部14用雜音判定部13的判定結(jié)果和輸入信號(hào)的分析結(jié)果(功率,譜包絡(luò),過零數(shù)等),判定輸入信號(hào)有聲還是無聲。這里,作為用雜音判定部13的判定結(jié)果和輸入信號(hào)的分析結(jié)果判定輸入信號(hào)有聲或無聲的方法,可以采用廣為人知的種種方法。這里,所謂“無聲”是指作為信息沒有意義的聲音,相當(dāng)于背景雜音等。另一方面,所謂“有聲”是指作為信息有意義的聲音,相當(dāng)于人聲和音樂等。
接著,說明根據(jù)本實(shí)施方式的有聲無聲判定裝置的操作以及根據(jù)本發(fā)明實(shí)施方式的有聲無聲判定方法。圖3是根據(jù)本實(shí)施方式的有聲無聲判定裝置的操作流程圖。
當(dāng)在有聲無聲判定裝置1中輸入輸入信號(hào)時(shí),首先,通過自相關(guān)計(jì)算部11算出輸入信號(hào)的自相關(guān)值(S11)。具體地說,根據(jù)上述式(1),算出輸入信號(hào)x(t)的自相關(guān)值c(t)。
當(dāng)通過自相關(guān)計(jì)算部11算出輸入信號(hào)的自相關(guān)值時(shí),通過延遲計(jì)算部12算出使自相關(guān)計(jì)算部11計(jì)算出的自相關(guān)值為極大的多個(gè)延遲(S12)。具體地說,掃描預(yù)定的延遲觀測(cè)區(qū)間內(nèi)的自相關(guān)值,按照從大到小的順序算出M個(gè)自相關(guān)值為極大的M個(gè)延遲(延遲t_max1~t_maxM)。
當(dāng)通過延遲計(jì)算部12算出多個(gè)延遲時(shí),基于判定延遲計(jì)算部12算出的多個(gè)延遲,通過雜音判定部13判定輸入信號(hào)是否為雜音(輸入信號(hào)的性質(zhì))(S13)。具體地說,滿足上述式(2)所示條件的狀態(tài)持續(xù)一定時(shí)間時(shí),判定為輸入信號(hào)不是雜音。相反,滿足式(2)所示條件的狀態(tài)不持續(xù)一定時(shí)間時(shí),判定輸入信號(hào)是雜音。
當(dāng)雜音判定部13判定輸入信號(hào)是否為雜音時(shí),基于雜音判定部13的判定結(jié)果和輸入信號(hào),有聲無聲判定部14判定輸入信號(hào)是有聲或無聲(S14)。具體地說,例如,用雜音判定部13的判定結(jié)果和輸入信號(hào)的分析結(jié)果(功率,譜包絡(luò),過零數(shù)等),判定輸入信號(hào)是有聲還是無聲。
接著,說明根據(jù)本實(shí)施方式的有聲無聲判定裝置的作用和效果。根據(jù)本實(shí)施方式的有聲無聲判定裝置1的延遲計(jì)算部12算出自相關(guān)值為極大的多個(gè)延遲t_max1~t_maxM,雜音判定部13基于這多個(gè)延遲t_max1~t_maxM判定輸入信號(hào)是雜音還是非雜音,有聲無聲判定部14基于雜音判定部13的判定結(jié)果判定輸入信號(hào)是有聲還是無聲。因此,可以考慮輸入信號(hào)中包含的多個(gè)周期分量來判定有聲或無聲。結(jié)果,即使對(duì)于非周期分量多的信號(hào)和多個(gè)不同周期分量混合的輸入信號(hào),也能精確地判定有聲區(qū)間或無聲區(qū)間。
本實(shí)施方式的有聲無聲判定裝置1的有聲無聲判定部14不僅利用雜音判定部13的判定結(jié)果、還利用輸入信號(hào)來判定該輸入信號(hào)是有聲還是無聲。因此,和僅利用雜音判定部13的判定結(jié)果判定輸入信號(hào)有聲或無聲的情況相比,可以嵌入更細(xì)致的判定過程。即,例如,可以嵌入雜音判定部13判定為雜音但輸入信號(hào)的歷史滿足一定條件時(shí)判定為有聲的判定過程。此外,有聲無聲判定部14在不用輸入信號(hào)的分析結(jié)果的情況下,僅用雜音判定部13的判定結(jié)果也可以判定輸入信號(hào)是有聲還是無聲。這時(shí),雖然不能嵌入上述更細(xì)致的判定過程,但具有將有聲或無聲的判定過程變簡(jiǎn)單的效果。
在根據(jù)本實(shí)施方式的有聲無聲判定裝置1中,當(dāng)延遲計(jì)算部12算出多個(gè)延遲時(shí),按照自相關(guān)值從大到小的順序計(jì)算多個(gè)延遲。因此,和采用其他計(jì)算方法的情況相比,可以容易地算出多個(gè)延遲。
第二實(shí)施方式接著,參考
根據(jù)本發(fā)明第二實(shí)施方式的有聲無聲判定裝置。首先,說明根據(jù)本實(shí)施方式的有聲無聲判定裝置的構(gòu)成。圖4是根據(jù)本實(shí)施方式的有聲無聲判定裝置的構(gòu)成圖。根據(jù)本實(shí)施方式的有聲無聲判定裝置2和上述根據(jù)第一實(shí)施方式的有聲無聲判定裝置1的不同之處在于還具有從輸入信號(hào)中推定雜音的雜音推定部21(雜音推定裝置),有聲無聲判定部22利用該雜音推定部21推定的雜音判定輸入信號(hào)有聲或無聲。
在功能上,如圖4所示,有聲無聲判定裝置2具有自相關(guān)計(jì)算部11,延遲計(jì)算部12,雜音判定部13,雜音推定部21和有聲無聲判定部22。這里,自相關(guān)計(jì)算部11,延遲計(jì)算部12和雜音判定部13具有的功能分別和根據(jù)第一實(shí)施方式的有聲無聲判定裝置1中的自相關(guān)計(jì)算部11、延遲計(jì)算部12和雜音判定部13相同。
雜音推定部21從輸入信號(hào)中推定雜音。具體地說,雜音推定部21例如根據(jù)下述式(3)推定雜音。
noisem+1(n)=(1-α)·noisem(n)+α·inputm-1(n) ...(3)這里,noise是推定雜音,input是輸入信號(hào),n是表示頻帶的指數(shù),m是表示時(shí)刻(幀)的指數(shù),α是系數(shù)。即,noisem(n)表示第n個(gè)頻帶內(nèi)時(shí)刻(幀)m的推定雜音。這里,雜音推定部21根據(jù)雜音判定部13的判定結(jié)果改變上述式(3)的系數(shù)α。即,雜音判定部13判定輸入信號(hào)不是雜音時(shí),雜音推定部21使上述式(3)的系數(shù)α為0或者接近0的值α1,以便不增大推定雜音功率。另一方面,雜音判定部13判定輸入信號(hào)為雜音時(shí),雜音推定部21使上述式(3)的系數(shù)α為1或者接近1的值α2(α2>α1),以便使推定雜音接近輸入信號(hào)。此外,雜音推定部21也可以用上述過程以外的過程從輸入信號(hào)中推定雜音。
有聲無聲判定部22基于雜音判定部13的判定結(jié)果、輸入信號(hào)以及雜音推定部21推定的雜音,判定輸入信號(hào)有聲或無聲。具體地說,例如,有聲無聲判定部22根據(jù)雜音推定部21推定的雜音和輸入信號(hào)算出S/N比(更準(zhǔn)確地說是各頻帶的S/N比的累計(jì)值或平均值)。有聲無聲判定部22把算出的S/N比和預(yù)定的閾值相比較,S/N比大于閾值時(shí),判定為輸入信號(hào)是有聲的,S/N比小于或等于閾值時(shí),判定為輸入信號(hào)是無聲的。這里,上述閾值設(shè)定成隨雜音判定部13的判定結(jié)果的不同而不同。即,雜音判定部13判定為“非雜音”時(shí)的閾值設(shè)定得比雜音判定部13判定為“雜音”時(shí)的閾值低。這樣,雜音判定部13判定為“非雜音”時(shí),S/N比小的信號(hào)(即埋在雜音中的信號(hào))也作為“有聲”被提取出來的可能性高。此外,有聲無聲判定部22也可以用上述過程以外的過程判定有聲或無聲。即,例如,利用上述閾值,無論雜音判定部13的判定結(jié)果如何,有聲無聲判定部22一律基于輸入信號(hào)和雜音推定部21推定的雜音來判定輸入信號(hào)有聲或無聲。
接著,說明根據(jù)本實(shí)施方式的有聲無聲判定裝置的操作。圖5是根據(jù)本實(shí)施方式的有聲無聲判定裝置的操作流程圖。這里,自相關(guān)值的計(jì)算(S11)、延遲t_max1~t_maxM的計(jì)算(S12)和雜音、非雜音的判定(S13)與根據(jù)第一實(shí)施方式的有聲無聲判定裝置1的操作相同。
接著步驟S11~S13,通過雜音推定部21根據(jù)輸入信號(hào)推定雜音(S21)。具體地說,根據(jù)上述式(3),推定雜音。這里,上述式(3)的系數(shù)α隨雜音判定部13的判定結(jié)果來變化。即,雜音判定部13將輸入信號(hào)判定為不是雜音時(shí),將上述式(3)的系數(shù)α設(shè)定為0或者接近0的值α1,以便不增加推定雜音功率。另一方面,雜音判定部13將輸入信號(hào)判定為雜音時(shí),將上述式(3)的系數(shù)α設(shè)定為1或者接近1的值α2(α2>α1),以便使推定雜音接近輸入信號(hào)。此外,雜音的推定(S21)不限于步驟S11~S13結(jié)束后,和步驟S11~S13并行進(jìn)行也可以。
當(dāng)通過雜音推定部21推定雜音時(shí),有聲無聲判定部22基于雜音判定部13的判定結(jié)果、輸入信號(hào)以及雜音推定部21推定的雜音,判定輸入信號(hào)有聲或無聲(S22)。具體地說,例如,根據(jù)雜音推定部21推定的雜音和輸入信號(hào)算出S/N比,將算出的S/N比和預(yù)定的閾值相比較。這里,S/N比大于閾值時(shí),判定為輸入信號(hào)是有聲的,S/N比小于或等于閾值時(shí),判定為輸入信號(hào)是無聲的。
接著,說明根據(jù)本實(shí)施方式的有聲無聲判定裝置的效果。根據(jù)本實(shí)施方式的有聲無聲判定裝置2,除了具有根據(jù)上述實(shí)施方式的有聲無聲判定裝置1的效果之外,還具有以下效果。即,有聲無聲判定裝置2的雜音推定部21根據(jù)輸入信號(hào)推定雜音,有聲無聲判定部22基于雜音判定部13的判定結(jié)果、輸入信號(hào)以及雜音推定部21推定的雜音判定輸入信號(hào)是有聲還是無聲。因此,可以基于S/N比高精度地判定有聲無聲。雜音推定部21根據(jù)雜音判定部13的判定結(jié)果改變雜音推定式(上述式(3))的系數(shù)α,從而,能更高精度地判定有聲無聲。
第三實(shí)施方式接著,參考
根據(jù)本發(fā)明第三實(shí)施方式的有聲無聲判定裝置。圖6是根據(jù)本實(shí)施方式得有聲無聲判定裝置的構(gòu)成圖。根據(jù)本實(shí)施方式的有聲無聲判定裝置3和上述根據(jù)實(shí)施方式2的有聲無聲判定裝置2的不同之處在于雜音推定部31基于有聲無聲判定部22的判定結(jié)果來改變雜音的推定方法。
從功能上看,如圖6所示,有聲無聲判定裝置3包括自相關(guān)計(jì)算部11,延遲計(jì)算部12,雜音判定部13,雜音推定部31和有聲無聲判定部22。這里,自相關(guān)計(jì)算部11、延遲計(jì)算部12、雜音判定部13和有聲無聲判定部22具有的功能分別和根據(jù)第二實(shí)施方式的有聲無聲判定裝置2中的自相關(guān)計(jì)算部11、延遲計(jì)算部12、雜音判定部13和有聲無聲判定部22相同。
雜音推定部31和有聲無聲判定裝置2中的雜音推定部21一樣推定輸入信號(hào)的雜音。但是,特別地,雜音推定部31基于有聲無聲判定部22的判定結(jié)果改變雜音的推定方法。具體地說,雜音推定部31首先根據(jù)上述式(3)推定雜音。之后,雜音推定部31將根據(jù)式(3)算出的雜音乘上根據(jù)有聲無聲判定部22的判定結(jié)果履歷而決定的系數(shù)β后的值作為最終的雜音輸出。例如,雜音推定部31的有聲無聲判定部22連續(xù)輸出一定時(shí)間以上“有聲”的判定結(jié)果時(shí),將上述系數(shù)β作為小于1的值,產(chǎn)生信號(hào),此外的情況下,使系數(shù)β為1。此外,雜音推定部31也可以用上述過程以外的過程改變雜音的推定方法。
根據(jù)本實(shí)施方式的有聲無聲判定裝置3除了具有根據(jù)上述實(shí)施方式的有聲無聲判定裝置2的效果之外,還具有以下效果。即,有聲無聲判定裝置3基于有聲無聲判定部22的判定結(jié)果使雜音推定部31改變雜音的推定方法。因此,可以嵌入更細(xì)致的雜音推定過程。即,例如,有聲無聲判定部22連續(xù)判定為有聲時(shí),通過積極地降低雜音推定部31推定的雜音電平,相對(duì)于雜音來強(qiáng)調(diào)信號(hào)分量。
上述有聲無聲判定裝置1、2和3的延遲計(jì)算部12可以按照以下過程算出多個(gè)延遲。即,延遲計(jì)算部12將延遲觀測(cè)區(qū)間分割為多個(gè)區(qū)間,在這些區(qū)間中分別算出自相關(guān)值最大的延遲。這時(shí),例如,把上述延遲觀測(cè)區(qū)間的起點(diǎn)作為min_t,用2i-1·min_t~2i·min_t(i是自然數(shù))確定上述多個(gè)區(qū)間。
具體地說,如圖7所示,延遲計(jì)算部12首先依次按區(qū)間寬度成倍增長(zhǎng)而分割為多個(gè)區(qū)間,使得延遲觀測(cè)區(qū)間min_t~max_t為min_t~2·min_t,2·min_t~4·min_t,4·min_t~8·min_t。之后,順次算出區(qū)間min_t~2·min_t內(nèi)自相關(guān)值為最大的延遲t_max1,區(qū)間2·min_t~4·min_t內(nèi)自相關(guān)值為最大的延遲t_max2,區(qū)間4·min_t~8·min_t內(nèi)自相關(guān)值為最大的延遲t_max3(這里,以M=3來說明)。例如,AMR時(shí),根據(jù)min_t是18,求出[18,35]、[36,71]、[72,143]各區(qū)間內(nèi)自相關(guān)值為最大的延遲。
通過進(jìn)行這樣的區(qū)間分割,對(duì)于有周期性的信號(hào),可以更有效地檢測(cè)出與其2倍周期對(duì)應(yīng)的延遲,可以更高精度地進(jìn)行有聲無聲判定。
本發(fā)明例如在便攜電話和因特網(wǎng)電話的通信中,用作有聲無聲判定裝置,判定輸入信號(hào)是包含聲音的有聲區(qū)間還是不需要發(fā)送信息得無聲區(qū)間。
當(dāng)然,以上說明的本發(fā)明的實(shí)施方式可以采用各種變形方式。這些變形方式不脫離本發(fā)明的主題和目的,下述請(qǐng)求范圍旨在包含所有上述變形方式的技術(shù)內(nèi)容。
權(quán)利要求
1.一種有聲無聲判定裝置,其特征在于,包括自相關(guān)計(jì)算單元,計(jì)算輸入信號(hào)的自相關(guān)值;延遲計(jì)算單元,計(jì)算使上述自相關(guān)計(jì)算單元計(jì)算出的上述自相關(guān)值為極大的多個(gè)延遲;性質(zhì)判定單元,基于由上述延遲計(jì)算單元計(jì)算出的上述多個(gè)延遲來判定上述輸入信號(hào)的性質(zhì);以及有聲無聲判定單元,基于上述性質(zhì)判定單元的判定結(jié)果,判定上述輸入信號(hào)有聲還是無聲。
2.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,上述有聲無聲判定單元基于上述性質(zhì)判定單元的判定結(jié)果和上述輸入信號(hào)來判定上述輸入信號(hào)有聲還是無聲。
3.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,還具有雜音推定單元,根據(jù)上述輸入信號(hào)來推定雜音;其中上述有聲無聲判定單元基于上述性質(zhì)判定單元的判定結(jié)果、上述輸入信號(hào)以及上述雜音推定單元推定的雜音來判定上述輸入信號(hào)有聲或無聲。
4.根據(jù)權(quán)利要求3所述的有聲無聲判定裝置,其特征在于,上述雜音推定單元基于上述有聲無聲判定單元的判定結(jié)果來改變雜音的推定方法。
5.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,上述延遲計(jì)算單元按照自相關(guān)值從大到小的順序來計(jì)算上述多個(gè)延遲。
6.根據(jù)權(quán)利要求1所述的有聲無聲判定裝置,其特征在于,上述延遲計(jì)算單元將延遲觀測(cè)區(qū)間分割為多個(gè)區(qū)間,計(jì)算出在上述各個(gè)區(qū)間中使自相關(guān)值為最大的延遲。
7.根據(jù)權(quán)利要求6所述的有聲無聲判定裝置,其特征在于,上述多個(gè)區(qū)間把上述延遲觀測(cè)區(qū)間的起點(diǎn)作為min_t,用2i-1·min_t~2i·min_t來表示,其中i是自然數(shù)。
8.一種有聲無聲判定方法,其特征在于,包括以下步驟自相關(guān)計(jì)算步驟,算出輸入信號(hào)的自相關(guān)值;延遲計(jì)算步驟,計(jì)算使在上述自相關(guān)計(jì)算步驟中計(jì)算出的上述自相關(guān)值為極大的多個(gè)延遲;性質(zhì)判定步驟,基于在上述延遲計(jì)算步驟中計(jì)算出的上述多個(gè)延遲來判定上述輸入信號(hào)的性質(zhì);以及有聲無聲判定步驟,基于上述性質(zhì)判定步驟中的判定結(jié)果,判定上述輸入信號(hào)有聲還是無聲。
全文摘要
本發(fā)明提供一種有聲無聲判定裝置和有聲無聲判定方法,其中有聲無聲判定裝置1包括計(jì)算輸入信號(hào)的自相關(guān)值的自相關(guān)計(jì)算部11;延遲計(jì)算部12,計(jì)算自相關(guān)計(jì)算部11算出的自相關(guān)值為極大的多個(gè)延遲;雜音判定部13,基于延遲計(jì)算部12算出的多個(gè)延遲判定輸入信號(hào)是否為雜音;有聲無聲判定部14,基于雜音判定部13的判定結(jié)果和輸入信號(hào)判定輸入信號(hào)有聲或無聲。
文檔編號(hào)H03M7/30GK1637856SQ20041008186
公開日2005年7月13日 申請(qǐng)日期2004年12月24日 優(yōu)先權(quán)日2003年12月25日
發(fā)明者仲信彥, 大矢智之 申請(qǐng)人:株式會(huì)社Ntt都科摩