專利名稱:信息處理設(shè)備、信息處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本公開涉及一種信息處理設(shè)備、信息處理方法及程序,并且更具體地涉及一種快速抑制回聲分量的信息處理設(shè)備、信息處理方法及程序。
背景技術(shù):
在電視會(huì)議系統(tǒng)中,在第一設(shè)備和第二設(shè)備之間進(jìn)行通信。當(dāng)從第一設(shè)備中的揚(yáng)聲器發(fā)出另一方的聲音(即,從第二設(shè)備傳送的聲音)時(shí),該聲音可能被麥克風(fēng)米集并且可能被傳送到另一方(即,第二設(shè)備)。在此情況下,出現(xiàn)所謂的回聲現(xiàn)象。
為了抑制該回聲現(xiàn)象,已經(jīng)提出了多種提議(例如,JP-A-2004-56453)。在JP-A-2004-56453中公開的技術(shù)中,通過從麥克風(fēng)的輸出信號(hào)或者揚(yáng)聲器的輸出信號(hào)中減去線性回聲消除器的輸出信號(hào)而獲得的信號(hào)之一對(duì)應(yīng)于第一信號(hào),而線性回聲消除器的輸出信號(hào)對(duì)應(yīng)于第二信號(hào)?;谥甘臼欠翊嬖诮寺曇舻穆曇魴z測(cè)信號(hào),依據(jù)第一信號(hào)和第二信號(hào),對(duì)于第一信號(hào)和第二信號(hào)的每個(gè)頻率分量,計(jì)算回聲泄漏的估計(jì)值。然后,基于所計(jì)算的估計(jì)值來校正第一信號(hào),由此產(chǎn)生了近端信號(hào),在該近端信號(hào)中,從第一信號(hào)中移除了回聲分量。
發(fā)明內(nèi)容
然而,在所提出的技術(shù)中,在聲音的輸出電平(output level)改變的情況下,需要耗費(fèi)時(shí)間來充分地抑制回聲分量。相應(yīng)地,希望提供一種能夠快速抑制回聲分量的技術(shù)。本公開的實(shí)施例針對(duì)一種信息處理設(shè)備,包括估計(jì)部分,其依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù);產(chǎn)生部分,其依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及抑制部分,其從第二信號(hào)中抑制估計(jì)回聲信號(hào),其中,估計(jì)部分基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。在相關(guān)性高于預(yù)先確定的閾值的情況下,可以按照恒定值改變系數(shù)。在相關(guān)性低于閾值的情況下,可以不改變系數(shù)。第一信號(hào)可以是輸出到揚(yáng)聲器的信號(hào)在頻域中的信號(hào),第二信號(hào)可以是從麥克風(fēng)輸入的信號(hào)在頻域中的信號(hào)。信息處理設(shè)備還可以包括計(jì)算部分,其依據(jù)頻域中的第一信號(hào)和第二信號(hào)計(jì)算瞬時(shí)幅度頻率函數(shù),并且估計(jì)部分可以依據(jù)該瞬時(shí)幅度頻率函數(shù)來估計(jì)幅度頻率函數(shù)??梢詫㈩l域中的第二信號(hào)轉(zhuǎn)換為時(shí)域中的信號(hào),在所述頻域中的第二信號(hào)中抑制了估計(jì)回聲信號(hào)。本公開的另一實(shí)施例針對(duì)一種與根據(jù)本公開實(shí)施例的信息處理設(shè)備相對(duì)應(yīng)的方法和程序。在本公開實(shí)施例中,依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù);依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);從第二信號(hào)中抑制估計(jì)回聲信號(hào);以及基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。如上所述,根據(jù)本公開實(shí)施例,可以快速抑制回聲分量。
圖I是圖示根據(jù)本公開實(shí)施例的信息處理系統(tǒng)的配置的框圖;圖2是圖示自適應(yīng)回聲減法器的配置的框圖;圖3是圖示幅度頻率函數(shù)估計(jì)部分的配置的框圖;
圖4是圖示第一信息處理設(shè)備的輸出處理的流程圖;圖5是圖示第一信息處理設(shè)備的輸入處理的流程圖;圖6是圖示幅度頻率函數(shù)估計(jì)處理的流程圖;圖7是圖示更新系數(shù)的具體示例的圖;圖8是圖示信息處理系統(tǒng)的操作的概覽的圖;圖9是示意性地圖示信息處理系統(tǒng)的操作的圖;圖10是圖示幅度頻率函數(shù)估計(jì)部分的比較配置的框圖;圖11是示意性地圖示進(jìn)行比較的信息處理系統(tǒng)的操作的圖;以及圖12是圖示個(gè)人計(jì)算機(jī)的配置示例的框圖。
具體實(shí)施例方式下文中,將描述實(shí)施本公開的實(shí)施例,并且將按照以下順序進(jìn)行描述。I.信息處理系統(tǒng)的配置2.信息處理系統(tǒng)的操作3.關(guān)于操作的概念性描述4.本公開對(duì)于程序的應(yīng)用5.其它〈I.信息處理系統(tǒng)的配置>圖I是圖示根據(jù)本公開實(shí)施例的信息處理系統(tǒng)I的配置的框圖。例如,形成電視會(huì)議系統(tǒng)的信息處理系統(tǒng)I包括第一信息處理設(shè)備11、第二信息處理設(shè)備12、以及將第一信息處理設(shè)備11和第二信息處理設(shè)備12連接的通信線路13。通信線路13是可以通過其進(jìn)行數(shù)字通信的通信線路,例如諸如以太網(wǎng)(商標(biāo))。通信線路13可以包括諸如因特網(wǎng)等之類的網(wǎng)絡(luò)。在信息處理系統(tǒng)I中,省略與圖像信號(hào)處理有關(guān)的配置。第一信息處理設(shè)備11包括近端設(shè)備31、揚(yáng)聲器32、以及麥克風(fēng)33。近端設(shè)備31包括放大器51、A/D轉(zhuǎn)換器52、自適應(yīng)回聲減法器53、聲音編解碼部分54、通信部分55、D/A轉(zhuǎn)換器56、以及放大器57。麥克風(fēng)33接收第一信息處理設(shè)備11的用戶的聲音作為輸入。放大器51放大來自麥克風(fēng)33的輸入??梢噪S著用戶調(diào)節(jié)音量(未示出)而將放大器51的放大因子(amplification factor)設(shè)置和改變?yōu)槿我庵?。A/D轉(zhuǎn)換器52將來自放大器51的聲音信號(hào)從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)。自適應(yīng)回聲減法器53例如包括數(shù)字信號(hào)處理器(DSP),并且對(duì)從A/D轉(zhuǎn)換器52輸入的信號(hào)執(zhí)行抑制回聲分量的處理,所述回聲分量是由于從揚(yáng)聲器32輸出的聲音而引起的噪聲分量。聲音編解碼部分54執(zhí)行將從麥克風(fēng)33輸入的聲音信號(hào)轉(zhuǎn)換為在電視會(huì)議系統(tǒng)I中確定的碼的處理,也就是說,執(zhí)行編碼處理,從而將輸入的聲音信號(hào)通過通信線路13傳送到第二信息處理設(shè)備12。此外,聲音編解碼部分54執(zhí)行對(duì)通過通信線路13從第二信息處理設(shè)備12傳送到第一信息處理設(shè)備11的碼進(jìn)行解碼的處理。D/A轉(zhuǎn)換器56將從聲音編解碼部分54提供的聲音信號(hào)從數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)。放大器57放大從D/A轉(zhuǎn)換器56輸出的模擬聲音信號(hào)??梢噪S著用戶調(diào)節(jié)音量(未不出)而將放大器57的放大因子設(shè)置和改變?yōu)槿我庵?。揚(yáng)聲器32基于放大器57放大的聲音信號(hào)來輸出聲音。以與第一信息處理設(shè)備11相似的方式來配置第二信息處理設(shè)備12。也就 是說,第二信息處理設(shè)備12包括遠(yuǎn)端設(shè)備71、揚(yáng)聲器72、以及麥克風(fēng)73。此外,盡管未示出,以與近端設(shè)備31類似的方式,遠(yuǎn)端設(shè)備71包括放大器、A/D轉(zhuǎn)換器、自適應(yīng)回聲減法器、聲音編解碼部分、通信部分、D/A轉(zhuǎn)換器、以及放大器。圖2是圖示自適應(yīng)回聲減法器53的配置的框圖。自適應(yīng)回聲減法器53包括麥克風(fēng)輸入FFT (快速傅立葉變換)部分101、參考輸入FFT部分102、瞬時(shí)幅度頻率函數(shù)計(jì)算部分103、幅度頻率函數(shù)估計(jì)部分104、估計(jì)回聲產(chǎn)生部分105、回聲抑制部分106、以及逆FFT部分107。麥克風(fēng)輸入FFT部分101通過FFT將從A/D轉(zhuǎn)換器52輸入的聲音信號(hào)轉(zhuǎn)換為頻域中的信號(hào),并且然后以預(yù)定頻率為單位來執(zhí)行帶寬分割。參考輸入FFT部分102通過FFT將從聲音編解碼部分54輸入的聲音信號(hào)轉(zhuǎn)換為頻域中的信號(hào),并且然后以預(yù)定頻率為單位來執(zhí)行帶寬分割。瞬時(shí)幅度頻率函數(shù)計(jì)算部分103將來自麥克風(fēng)輸入FFT部分101的每個(gè)頻帶的瞬時(shí)麥克風(fēng)輸入信號(hào)除以來自參考輸入FFT部分102的每個(gè)頻帶的瞬時(shí)揚(yáng)聲器輸出信號(hào),來計(jì)算瞬時(shí)幅度頻率函數(shù)。該幅度頻率函數(shù)是指示每個(gè)頻率的信號(hào)幅度的大小的特征。幅度頻率函數(shù)估計(jì)部分104基于從瞬時(shí)幅度頻率函數(shù)計(jì)算部分103輸入的瞬時(shí)幅度頻率函數(shù)來估計(jì)幅度頻率函數(shù)。后面將參考圖3來描述幅度頻率函數(shù)估計(jì)部分104的細(xì)節(jié)。估計(jì)回聲產(chǎn)生部分105依據(jù)幅度頻率函數(shù)估計(jì)部分104產(chǎn)生的估計(jì)的幅度頻率函數(shù)以及被參考輸入FFT部分102轉(zhuǎn)換到頻域中的瞬時(shí)揚(yáng)聲器輸出信號(hào),來產(chǎn)生估計(jì)回聲信號(hào)?;芈曇种撇糠?06從自麥克風(fēng)輸入FFT部分101輸出的麥克風(fēng)輸入頻率數(shù)據(jù)中減去由估計(jì)回聲產(chǎn)生部分105產(chǎn)生的估計(jì)回聲信號(hào),以便產(chǎn)生其中抑制了回聲分量的回聲抑制后信號(hào)。逆FFT部分107將從回聲抑制部分106輸出的回聲抑制后信號(hào)轉(zhuǎn)換為時(shí)域中的回聲抑制后信號(hào),并且然后將該信號(hào)輸出到聲音編解碼部分54。圖3是圖示幅度頻率函數(shù)估計(jì)部分104的配置的框圖。幅度頻率函數(shù)估計(jì)部分104包括平均值計(jì)算部分151、方差計(jì)算部分152、更新系數(shù)計(jì)算部分153、更新系數(shù)改變部分154、存儲(chǔ)部分155以及相關(guān)性計(jì)算部分156。平均值計(jì)算部分151計(jì)算從瞬時(shí)幅度頻率函數(shù)計(jì)算部分103輸入的每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù)的平均值。方差計(jì)算部分152基于從瞬時(shí)幅度頻率函數(shù)計(jì)算部分103輸入的瞬時(shí)幅度頻率函數(shù)以及從平均值計(jì)算部分151輸入的平均值,計(jì)算每個(gè)頻帶的方差。更新系數(shù)計(jì)算部分153基于從方差計(jì)算部分152輸出的方差,計(jì)算每個(gè)頻帶的更新系數(shù)。更新系數(shù)改變部分154基于由相關(guān)性計(jì)算部分156計(jì)算的相關(guān)性來改變由更新系數(shù)計(jì)算部分153計(jì)算的每個(gè)頻帶的更新系數(shù),然后將結(jié)果輸出到存儲(chǔ)部分155。存儲(chǔ)部分155使用從更新系數(shù)改變部分154輸出的改變后的更新系數(shù)和從瞬時(shí)幅度頻率函數(shù)計(jì)算部分103輸入的每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù),計(jì)算并存儲(chǔ)每個(gè)頻帶的估計(jì)的幅度頻率函數(shù)。相關(guān)性計(jì)算部分156計(jì)算在從瞬時(shí)幅度頻率函數(shù)計(jì)算部分103輸入的整個(gè)頻帶中的瞬時(shí)幅度頻率函數(shù)和從存儲(chǔ)部分155提供的整個(gè)頻帶中的估計(jì)的幅度頻率函數(shù)之間的相關(guān)性。<2.信息處理系統(tǒng)的操作>
接下來,將參考圖4-6描述信息處理系統(tǒng)I的操作。首先,將參考圖4描述第一信息處理設(shè)備11的輸出處理。圖4是圖示第一信息處理設(shè)備的輸出處理的流程圖。在步驟SI,第一信息處理設(shè)備11的通信部分55從第二信息處理設(shè)備12的遠(yuǎn)端設(shè)備71接收聲音數(shù)據(jù)。也就是說,在第二信息處理設(shè)備12的用戶的聲音信號(hào)是通過麥克風(fēng)73獲得并且通過通信線路13傳送的情況下,通信部分55接收該聲音信號(hào)。在步驟S2,聲音編解碼部分54對(duì)該數(shù)據(jù)進(jìn)行解碼。也就是說,聲音編解碼部分54對(duì)在步驟SI中由通信部分55接收的聲音數(shù)據(jù)進(jìn)行解碼。解碼后的聲音數(shù)據(jù)被提供到D/A轉(zhuǎn)換器56并且被提供到自適應(yīng)回聲減法器53。在步驟S3,D/A轉(zhuǎn)換器56將聲音編解碼部分54解碼后的聲音數(shù)據(jù)轉(zhuǎn)換為模擬信號(hào)。在步驟S4,揚(yáng)聲器32輸出聲音。也就是說,D/A轉(zhuǎn)換器56進(jìn)行D/A轉(zhuǎn)換后的聲音信號(hào)被放大器57放大,并且然后對(duì)應(yīng)的聲音(即第二信息處理設(shè)備12的用戶的聲音)從揚(yáng)聲器32輸出。第一信息處理設(shè)備11的用戶聽到第二信息處理設(shè)備12的用戶的聲音并且發(fā)出聲音作為回應(yīng)。接下來,將描述輸入聲音的操作。圖5是圖示第一信息處理設(shè)備11的輸入處理的流程圖。在步驟S21,麥克風(fēng)33接收聲音作為輸入。也就是說,第一信息處理設(shè)備11的用戶響應(yīng)于第二信息處理設(shè)備12的用戶的聲音而發(fā)出的聲音被麥克風(fēng)33收集。這里,從揚(yáng)聲器32輸出的、從第二信息處理設(shè)備12傳送的聲音,即回聲分量可能被輸入到麥克風(fēng)33。如果回聲分量被照原樣傳送到第二信息處理設(shè)備12,則第二信息處理設(shè)備12的用戶聽到該用戶自己發(fā)出的帶有一些延遲的聲音作為來自該用戶自己的揚(yáng)聲器72的回聲,因此出現(xiàn)所謂的回聲現(xiàn)象。在步驟S22,A/D轉(zhuǎn)換器52對(duì)輸入的聲音信號(hào)進(jìn)行A/D轉(zhuǎn)換。也就是說,在步驟S21輸入到麥克風(fēng)33的聲音信號(hào)被放大器51放大,被A/D轉(zhuǎn)換器52從模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),并且然后被輸入到自適應(yīng)回聲減法器53。在步驟S23,參考輸入FFT部分102對(duì)參考輸入信號(hào)執(zhí)行FFT。也就是說,對(duì)在圖4的步驟S2中從聲音編解碼部分54輸入的第二信息處理設(shè)備12的用戶的聲音數(shù)據(jù)進(jìn)行FFT,并且然后對(duì)于每個(gè)頻帶被轉(zhuǎn)換為頻域中的聲音數(shù)據(jù)。在步驟S24,麥克風(fēng)輸入FFT部分101對(duì)麥克風(fēng)輸入信號(hào)執(zhí)行FFT。也就是說,在步驟S22,對(duì)從A/D轉(zhuǎn)換器52提供的第一信息處理設(shè)備11的用戶的聲音數(shù)據(jù)進(jìn)行FFT,然后對(duì)于每個(gè)頻帶被轉(zhuǎn)換為頻域中的聲音數(shù)據(jù)。在步驟S25,瞬時(shí)幅度頻率函數(shù)計(jì)算部分103計(jì)算瞬時(shí)幅度頻率函數(shù)。具體地,將在步驟S24中計(jì)算的瞬時(shí)麥克風(fēng)輸入信號(hào)除以在步驟S23中計(jì)算的瞬時(shí)揚(yáng)聲器輸出信號(hào),以由此計(jì)算瞬時(shí)幅度頻率函數(shù)。接下來,在步驟S26,幅度頻率函數(shù)估計(jì)部分104執(zhí)行幅度頻率函數(shù)估計(jì)處理。在圖6中示出了關(guān)于幅度頻率函數(shù)估計(jì)處理的細(xì)節(jié)。這里,將參考圖6描述幅度頻率函數(shù)估計(jì)處理。圖6是圖示幅度頻率函數(shù)估計(jì)處理的流程圖。在步驟S71,平均值計(jì)算部分151計(jì)算每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù)的平均值。例如,通過以下公式計(jì)算在時(shí)間t在頻帶n中的瞬時(shí)幅度頻率函數(shù)的值xn (t)的平均值A(chǔ)ve xn。 Ave xn = -rr 2 ^n(t-i) …(I)
IN在步驟S72,方差計(jì)算部分152基于在步驟S71由平均值計(jì)算部分151計(jì)算的平均值A(chǔ)ve Xn以及在時(shí)間t在頻帶n中的瞬時(shí)幅度頻率函數(shù)的值xn(t),來計(jì)算每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù)的方差。具體地,通過以下公式來計(jì)算在時(shí)間t在頻帶n中的瞬時(shí)幅度頻率函數(shù)的值Xn(t)的方差值o2n。aj = — 2 {xn (1-j) - Ave Xn I (2)在步驟S73,更新系數(shù)計(jì)算部分153依據(jù)在步驟S72中計(jì)算的方差,計(jì)算幅度頻率函數(shù)的每個(gè)頻帶的更新系數(shù)。通過以下公式來表示頻帶n的更新系數(shù)yn。U n=f ( O n) (3)圖I是圖示更新系數(shù)ii n的具體示例的圖。在該示例中,當(dāng)O n的值為0到a時(shí),更新系數(shù)y n為0 ;而當(dāng)On的值為b或更大時(shí)更新系數(shù)y n為0. 3。此外,當(dāng)O n的值為a到b時(shí),更新系數(shù)y n與O n的值成比例地從0線性地增加到0. 3。在步驟S74,相關(guān)性計(jì)算部分156依據(jù)在步驟S71中計(jì)算的每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù)的平均值,計(jì)算整個(gè)頻帶中的短時(shí)平均幅度頻率函數(shù)。在步驟S75,相關(guān)性計(jì)算部分156計(jì)算估計(jì)的幅度頻率函數(shù)和整個(gè)頻帶中的短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性。所述估計(jì)的幅度頻率函數(shù)是事先在步驟S77中計(jì)算的,所述整個(gè)頻帶中的短時(shí)平均幅度頻率函數(shù)是在步驟S74中計(jì)算的。在步驟S76,更新系數(shù)改變部分154改變每個(gè)頻帶的更新系數(shù)U n。改變后的更新系數(shù)被設(shè)置為U / n。在步驟S75中計(jì)算的相關(guān)性值具有等于或大于預(yù)先確定的預(yù)定閾值的大小的情況下,也就是說,在相關(guān)性高的情況下,每個(gè)頻帶的更新系數(shù)Un被改變?yōu)轭A(yù)先確定的改變后的更新系數(shù)a (恒定值)。另一方面,在相關(guān)性值具有小于該閾值的大小的情況下,也就是說,在相關(guān)性低的情況下,改變后的更新系數(shù)U / n被照原樣設(shè)置為更新系數(shù)U n ( U ' n=U n)。在步驟S77,存儲(chǔ)部分155基于每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù)和改變后的更新系數(shù),估計(jì)每個(gè)頻帶的幅度頻率函數(shù)。估計(jì)的幅度頻率函數(shù)被存儲(chǔ)在存儲(chǔ)部分155中。每個(gè)頻帶的瞬時(shí)幅度頻率函數(shù)是在圖5的步驟S25中計(jì)算的值,改變后的更新系數(shù)是在步驟S76中改變的值U ' n (=a或UnX通過以下公式表示頻帶n的估計(jì)的幅度頻率函數(shù)zn(t)。
Zn(t) = (1-Un) XZn(t-l) + unXXn(t) (4)公式(4)中的zn(t_l)是在之前的處理中存儲(chǔ)在存儲(chǔ)部分155中的估計(jì)的幅度頻
率函數(shù)。返回圖5,在步驟S26中如上所述地執(zhí)行來幅度頻率函數(shù)估計(jì)處理之后,估計(jì)回聲產(chǎn)生部分105在步驟S27中產(chǎn)生估計(jì)回聲信號(hào)。具體地,將在步驟S77中產(chǎn)生的估計(jì)的幅度頻率函數(shù)乘以從參考輸入FFT部分102輸出的瞬時(shí)揚(yáng)聲器輸出信號(hào),以由此產(chǎn)生與回聲信號(hào)對(duì)應(yīng)的估計(jì)回聲信號(hào)。在步驟S28中,回聲抑制部分106產(chǎn)生回聲抑制后信號(hào)。也就是說,從自麥克風(fēng)輸入FFT部分101輸出的瞬時(shí)麥克風(fēng)輸入信號(hào)中減去由估計(jì)回聲產(chǎn)生部分105在步驟S27中產(chǎn)生的估計(jì)回聲信號(hào)。由于從瞬時(shí)麥克風(fēng)輸入信號(hào)中減去了與回聲信號(hào)對(duì)應(yīng)的估計(jì)回聲信號(hào),因此獲得了在其中抑制了回聲分量的信號(hào)?!?br>
在步驟S29,逆FFT部分107對(duì)回聲抑制后信號(hào)執(zhí)行逆FFT。因此,獲得了時(shí)域中的回聲抑制后信號(hào)。回聲抑制后信號(hào)被提供到聲音編解碼部分54。在步驟S30,聲音編解碼部分54對(duì)回聲抑制后信號(hào)進(jìn)行編碼。在步驟S31,通信部分55將數(shù)據(jù)傳送到遠(yuǎn)端設(shè)備71。也就是說,通過通信線路13將編碼后的回聲抑制后數(shù)據(jù)傳送到第二信息處理設(shè)備12。在第二信息處理設(shè)備12中,執(zhí)行與上述的第一信息處理設(shè)備11中的輸出處理和輸入處理相同的處理。<3.關(guān)于操作的概念性描述〉接下來,將描述上述操作的概念。圖8是示意性地圖示信息處理系統(tǒng)I的操作的圖。如圖中所示,在與瞬時(shí)幅度頻率函數(shù)計(jì)算部分103相對(duì)應(yīng)的除法器191中,將從A/D轉(zhuǎn)換器52輸出的瞬時(shí)麥克風(fēng)輸入信號(hào)除以從聲音編解碼部分54輸出的瞬時(shí)揚(yáng)聲器輸出信號(hào)。由此,獲得瞬時(shí)幅度頻率函數(shù)。幅度頻率函數(shù)估計(jì)部分104依據(jù)瞬時(shí)幅度頻率函數(shù)估計(jì)出估計(jì)的幅度頻率函數(shù)。形成估計(jì)回聲產(chǎn)生部分105的乘法器192將揚(yáng)聲器輸出信號(hào)與估計(jì)的幅度頻率函數(shù)相乘在一起,以由此產(chǎn)生估計(jì)回聲信號(hào)。形成回聲抑制部分106的減法器193從瞬時(shí)麥克風(fēng)輸入信號(hào)中減去估計(jì)回聲信號(hào),以由此產(chǎn)生回聲抑制后信號(hào)。由于回聲抑制后信號(hào)被以此方式傳送到另一方的設(shè)備,另一方的設(shè)備的用戶可以可靠地聽到對(duì)方的發(fā)聲,而沒有受到該用戶自己的發(fā)聲的干擾。例如,在用戶調(diào)節(jié)放大器57或放大器51的音量(volume)以改變放大因子的情況下,瞬時(shí)幅度頻率函數(shù)改變。這里,由于上述處理被實(shí)時(shí)地重復(fù),因此學(xué)習(xí)到新的系數(shù),并且設(shè)置所學(xué)習(xí)到的系數(shù)。相應(yīng)地,即使放大因子改變,也可以抑制回聲分量。圖9是示意性地圖示信息處理系統(tǒng)I的操作的圖。如圖所示,假設(shè)存在以下特性將音量改變之前的估計(jì)的幅度頻率函數(shù)表示為gl。通過改變放大因子,假設(shè)將被表示為g3的特性設(shè)置為音量改變之后的目標(biāo)幅度頻率函數(shù)。在此情況下,如果估計(jì)的幅度頻率函數(shù)gl和目標(biāo)幅度頻率函數(shù)g3之間的相關(guān)性為高,如上所述,改變后的更新系數(shù)U , n被設(shè)置為恒定值a。結(jié)果,當(dāng)特性逐漸從估計(jì)的幅度頻率函數(shù)gi改變?yōu)槟繕?biāo)幅度頻率函數(shù)g3時(shí),轉(zhuǎn)變期間在整個(gè)頻帶中的短時(shí)平均幅度頻率函數(shù)g2在每個(gè)頻帶中具有被改變了相同值的增益,由此在目標(biāo)幅度頻率函數(shù)g3的特性上快速收斂。
這里,對(duì)于比較,可以考慮不同的配置作為幅度頻率函數(shù)估計(jì)部分104。圖10是圖示幅度頻率函數(shù)估計(jì)部分104的比較配置的框圖。在配置示例中,與圖3所示的平均值計(jì)算部分151、方差計(jì)算部分152、更新系數(shù)計(jì)算部分153和存儲(chǔ)部分155相對(duì)應(yīng),提供平均值計(jì)算部分251、方差計(jì)算部分252、更新系數(shù)計(jì)算部分253和存儲(chǔ)部分254。然而,未提供與更新系數(shù)改變部分154和相關(guān)性計(jì)算部分156相對(duì)應(yīng)的配置。也就是說,在該配置中,未基于相關(guān)性更新系數(shù)。結(jié)果,在放大因子改變的情況下,轉(zhuǎn)變期間的幅度頻率函數(shù)如圖11所
/Jn o圖11是示意性地圖示進(jìn)行比較的信息處理系統(tǒng)I的操作的圖。如圖所示,假設(shè)存在以下特性將音量改變之前的估計(jì)的幅度頻率函數(shù)表示為gll。通過改變放大因子,假設(shè)將被表示為g13的特性設(shè)置為音量改變之后的目標(biāo)幅度頻率函數(shù)。在此情況下,當(dāng)特性從估計(jì)的幅度頻率函數(shù)gn改變?yōu)槟繕?biāo)幅度頻率函數(shù)g13時(shí),轉(zhuǎn)變期間在整個(gè)頻帶中的短時(shí)平均幅度頻率函數(shù)g12在每個(gè)頻帶中具有被改變了不同值的增益。結(jié)果,耗費(fèi)很長(zhǎng)時(shí)間來收斂目 標(biāo)幅度頻率函數(shù)g13的特性。信息處理系統(tǒng)I不限于電視會(huì)議系統(tǒng)1,并且可以應(yīng)用于諸如免提電話系統(tǒng)或監(jiān)控照相機(jī)系統(tǒng)之類的系統(tǒng)、或者在再現(xiàn)汽車音響的同時(shí)執(zhí)行聲音辨別的設(shè)備。<4.本公開對(duì)于程序的應(yīng)用>可以通過硬件或軟件執(zhí)行上述處理系列。在通過軟件執(zhí)行處理系列的情況下,在計(jì)算機(jī)中安裝形成該軟件的程序。這里,計(jì)算機(jī)包括在專用硬件中安裝的計(jì)算機(jī)、或者通過例如安裝各種程序而能夠執(zhí)行各種功能的通用個(gè)人計(jì)算機(jī)。圖12是圖示通過程序執(zhí)行上述處理系列的計(jì)算機(jī)300的硬件的配置示例的框圖。在計(jì)算機(jī)300中,CPU (中央處理單元)301、ROM (只讀存儲(chǔ)器)302、和RAM (隨機(jī)存取存儲(chǔ)器)303通過總線304彼此連接。輸入和輸出接口 305與總線304連接。輸入部分306、輸出部分307、存儲(chǔ)部分308、通信部分309和驅(qū)動(dòng)器310與輸入和輸出接口 305連接。輸入部分306包括鍵盤、鼠標(biāo)、麥克風(fēng)等。輸出部分307包括顯示器、揚(yáng)聲器等。存儲(chǔ)部分308包括硬盤、非易失性存儲(chǔ)器等。通信部分309包括網(wǎng)絡(luò)接口等。驅(qū)動(dòng)器310驅(qū)動(dòng)諸如磁盤、光盤、磁光盤或半導(dǎo)體存儲(chǔ)器之類的可移動(dòng)介質(zhì)311。在具有如此配置的計(jì)算機(jī)中,例如,CPU 301通過輸入和輸出接口 305和總線304將存儲(chǔ)在存儲(chǔ)部分308中的程序加載到RAM 303上以便被運(yùn)行,并且由此執(zhí)行上述處理系列。在計(jì)算機(jī)中,例如,可以通過在驅(qū)動(dòng)器310中安裝可移動(dòng)介質(zhì)311 (其為打包介質(zhì)(package medium)等),經(jīng)由輸入和輸出接口 305在存儲(chǔ)部分308中安裝所述程序。此外,可以由通信部分309通過有線或無線傳送介質(zhì)接收所述程序,并且可以將所述程序安裝在存儲(chǔ)部分308中。此外,可以預(yù)先在ROM 302或存儲(chǔ)部分308中安裝所述程序。由計(jì)算機(jī)執(zhí)行的程序可以是按照在此說明書中描述的順序以時(shí)序方式執(zhí)行其處理的程序,或者可以是并行地或者在諸如打電話之類的必要定時(shí)執(zhí)行其處理的程序。此外,在該說明書中,系統(tǒng)表示包括多個(gè)設(shè)備的整個(gè)配置。本公開的實(shí)施例不限于上述實(shí)施例,可以在不偏離本公開的精神的情況下在范圍內(nèi)做出各種修改。
<5.其它 >可以將本公開實(shí)現(xiàn)為以下配置( I) 一種信息處理設(shè)備,包括估計(jì)部分,其依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù);產(chǎn)生部分,其依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及抑制部分,其從第二信號(hào)中抑制所述估計(jì)回聲信號(hào),其中,估計(jì)部分基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。 (2)如(I)所述的信息處理設(shè)備,其中,在相關(guān)性高于預(yù)先確定的閾值的情況下,按照恒定值來改變系數(shù)。(3)如(2)所述的信息處理設(shè)備,其中,在相關(guān)性低于閾值的情況下,不改變系數(shù)。( 4 )如(I)、( 2 )或(3 )所述的信息處理設(shè)備,其中,第一信號(hào)是輸出到揚(yáng)聲器的信號(hào)在頻域中的信號(hào),第二信號(hào)是從麥克風(fēng)輸入的信號(hào)在頻域中的信號(hào)。(5)如(I)到(4)中的任一項(xiàng)所述的信息處理設(shè)備,還包括計(jì)算部分,其依據(jù)頻域中的第一信號(hào)和第二信號(hào)計(jì)算瞬時(shí)幅度頻率函數(shù),其中,估計(jì)部分依據(jù)該瞬時(shí)幅度頻率函數(shù)來估計(jì)所述幅度頻率函數(shù)。(6)如(I)到(5)中任一項(xiàng)所述的信息處理設(shè)備,其中,將頻域中的第二信號(hào)轉(zhuǎn)換為時(shí)域中的信號(hào),在所述頻域中的第二信號(hào)中抑制了估計(jì)回聲信號(hào)。(7) 一種信息處理方法,包括依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù);依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及從第二信號(hào)中抑制估計(jì)回聲信號(hào),其中,在估計(jì)幅度頻率函數(shù)時(shí),基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。(8) 一種程序,其使得計(jì)算機(jī)運(yùn)行包括以下步驟的例程依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù);依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及從第二信號(hào)中抑制估計(jì)回聲信號(hào),其中,在估計(jì)幅度頻率函數(shù)時(shí),基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。本公開包含與在2011年8月15日向日本專利局提交的日本優(yōu)先權(quán)專利申請(qǐng)JP2011-177568中公開的主題相關(guān)的主題,通過引用將其全部?jī)?nèi)容并入這里。本領(lǐng)域技術(shù)人員應(yīng)了解,根據(jù)設(shè)計(jì)需要和其他因素,可以進(jìn)行各種修改、組合、子組合和變化,只要它們?cè)谒綑?quán)利要求或等同 物的范圍內(nèi)即可。
權(quán)利要求
1.一種信息處理設(shè)備,包括 估計(jì)部分,其依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù); 產(chǎn)生部分,其依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及 抑制部分,其從第二信號(hào)中抑制估計(jì)回聲信號(hào), 其中,估計(jì)部分基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。
2.如權(quán)利要求I所述的信息處理設(shè)備, 其中,在相關(guān)性高于預(yù)先確定的閾值的情況下,按照恒定值來改變系數(shù)。
3.如權(quán)利要求2所述的信息處理設(shè)備, 其中,在所述相關(guān)性低于閾值的情況下,不改變系數(shù)。
4.如權(quán)利要求3所述的信息處理設(shè)備, 其中,第一信號(hào)是輸出到揚(yáng)聲器的信號(hào)在頻域中的信號(hào),第二信號(hào)是從麥克風(fēng)輸入的信號(hào)在頻域中的信號(hào)。
5.如權(quán)利要求4所述的信息處理設(shè)備,還包括 計(jì)算部分,其依據(jù)頻域中的第一信號(hào)和第二信號(hào)計(jì)算瞬時(shí)幅度頻率函數(shù), 其中,估計(jì)部分依據(jù)該瞬時(shí)幅度頻率函數(shù)來估計(jì)幅度頻率函數(shù)。
6.如權(quán)利要求5所述的信息處理設(shè)備, 其中,將頻域中的第二信號(hào)轉(zhuǎn)換為時(shí)域中的信號(hào),在所述頻域中的第二信號(hào)中抑制了所述估計(jì)回聲信號(hào)。
7.—種信息處理方法,包括 依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù); 依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及 從第二信號(hào)中抑制估計(jì)回聲信號(hào), 其中,在估計(jì)幅度頻率函數(shù)時(shí),基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。
8.一種程序,其使得計(jì)算機(jī)執(zhí)行包括以下步驟的處理 依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù); 依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及 從第二信號(hào)中抑制估計(jì)回聲信號(hào), 其中,在估計(jì)幅度頻率函數(shù)時(shí),基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。
全文摘要
一種信息處理設(shè)備,包括估計(jì)部分,其依據(jù)輸出到揚(yáng)聲器的第一信號(hào)和從麥克風(fēng)輸入的第二信號(hào)來估計(jì)幅度頻率函數(shù);產(chǎn)生部分,其依據(jù)第一信號(hào)和幅度頻率函數(shù)來產(chǎn)生估計(jì)回聲信號(hào);以及抑制部分,其從第二信號(hào)中抑制估計(jì)回聲信號(hào),其中,估計(jì)部分基于估計(jì)的幅度頻率函數(shù)和短時(shí)平均幅度頻率函數(shù)之間的相關(guān)性來改變幅度頻率函數(shù)的系數(shù)。
文檔編號(hào)G10L21/0232GK102956236SQ20121027993
公開日2013年3月6日 申請(qǐng)日期2012年8月8日 優(yōu)先權(quán)日2011年8月15日
發(fā)明者木原信之, 櫻庭洋平 申請(qǐng)人:索尼公司