專利名稱:基于分組的回音取消和抑制的制作方法
技術(shù)領(lǐng)域:
背景技術(shù):
在傳統(tǒng)通信系統(tǒng)中,編碼器產(chǎn)生表示語(yǔ)音或數(shù)據(jù)通信量的信息比 特流。這種比特流被進(jìn)行再分和分組、與各種控制比特級(jí)聯(lián)并包裝成 合適格式以供傳輸??捎貌鹏迵?jù)適當(dāng)通信機(jī)制的例如幀、分組、子分組 等的各種格式來(lái)傳輸語(yǔ)音和數(shù)據(jù)通信量。為清晰起見(jiàn),本文將使用術(shù) 語(yǔ)"傳輸幀"來(lái)描述實(shí)際傳輸通信量所用的傳輸格式。將使用術(shù)語(yǔ)"分 組"來(lái)描述話音編碼器的輸出。話音編碼器還被稱為語(yǔ)音編碼器或"語(yǔ)
音合成器(vocoder)",且在本文中這些術(shù)語(yǔ)可互換使用。
語(yǔ)音合成器提取與語(yǔ)音信息(例如人類說(shuō)話)生成的模型有關(guān)的 參數(shù),并使用所提取的參數(shù)來(lái)壓縮語(yǔ)音信息,以供傳輸。語(yǔ)音合成器 一般包括編碼器和解碼器。語(yǔ)音合成器將到來(lái)的語(yǔ)音信息(例如模擬 語(yǔ)音信號(hào))分割成塊,對(duì)到來(lái)的語(yǔ)音塊進(jìn)行分析以提取某些相關(guān)參數(shù), 并將所述參數(shù)量化成二進(jìn)制或比特表示。比特表示纟皮包裝成分組,分 組被;f各式化成傳輸幀,并通過(guò)通信信道將傳輸幀傳送到具有解碼器的 接收機(jī)。在接收機(jī),從傳輸幀提取分組,且解碼器對(duì)分組中攜帶的比 特表示進(jìn)行非量化(unquantize)以產(chǎn)生編碼參數(shù)集合。然后,解碼器 使用非量化的參數(shù)重新合成語(yǔ)音段以及隨后的原始語(yǔ)音信息。
通常使用各種壓縮技術(shù)將不同類型的語(yǔ)音合成器配置在各種現(xiàn) 有的無(wú)線及有線通信系統(tǒng)中。此外,由某一特定標(biāo)準(zhǔn)所定義的傳輸幀 格式和處理可與其它標(biāo)準(zhǔn)的傳輸幀格式和處理明顯不同。例如, CDMA標(biāo)準(zhǔn)支持變速率語(yǔ)音合成器幀在擴(kuò)頻環(huán)境中的使用,而GSM 標(biāo)準(zhǔn)支持固定速率語(yǔ)音合成器幀及多速率語(yǔ)音合成器幀的使用。類似地,通用移動(dòng)遠(yuǎn)程通信系統(tǒng)(UMTS)標(biāo)準(zhǔn)也支持固定速率和多速率 語(yǔ)音合成器,但不支持變速率語(yǔ)音合成器。為了這些通信系統(tǒng)之間的
兼容性與互操作性,實(shí)現(xiàn)在GSM和UMTS之內(nèi)對(duì)變速率語(yǔ)音合成器 幀的支持以及在CDMA系統(tǒng)之內(nèi)對(duì)非變速率語(yǔ)音合成器幀的支持是 合乎需要的。幾乎所有通信系統(tǒng)的一個(gè)共同事件是回音(echo)的出 現(xiàn)。聲回音和電回音是回音的示例類型。
聲回音因手持機(jī)和/或自動(dòng)(hand-free)裝置的聽筒與麥克風(fēng)之間 低質(zhì)語(yǔ)音耦合而產(chǎn)生。電回音由PSTN網(wǎng)絡(luò)內(nèi)的4-至-2線耦合產(chǎn)生。 語(yǔ)音壓縮語(yǔ)音合成器處理包括在手持機(jī)內(nèi)及在無(wú)線網(wǎng)絡(luò)中的回音的 語(yǔ)音,所述回音導(dǎo)致具有高度可變屬性的所返回回音信號(hào)。所述反射 的信號(hào)降低了語(yǔ)音通話質(zhì)量。
在聲回音的一種示例中,需要時(shí),來(lái)自揚(yáng)聲器的聲音被在近端的
聽眾收聽。但是,這種在近端的相同聲音在被反射之后還被麥克風(fēng)直 接及間接拾取。這種反射的結(jié)果是生成了回音,除非將其消除否則回 音將被傳回遠(yuǎn)端并作為回音被在遠(yuǎn)端的說(shuō)話者聽見(jiàn)。
圖1示出了包括用于取消反射的信號(hào)的常規(guī)回音取消器和/或抑 制器的分組網(wǎng)絡(luò)上語(yǔ)音示圖。
如果將常規(guī)回音取消器和/或抑制器100用于分組交換網(wǎng)絡(luò),則常 規(guī)回音取消器必須對(duì)與雙向傳輸?shù)恼Z(yǔ)音信號(hào)相關(guān)聯(lián)的語(yǔ)音合成器分 組進(jìn)行完全解碼,以便獲得回音取消參數(shù),因?yàn)樗谐R?guī)回音取消操 作與線性非壓縮話音配合起作用。即,常規(guī)回音取消器和/或抑制器 100必須從傳輸幀提取分組,對(duì)在分組中攜帶的比特表示非量化以產(chǎn) 生編碼參數(shù)集合,并在取消回音之前重新合成語(yǔ)音段。然后,常規(guī)取 消器和/或抑制器使用重新合成的語(yǔ)音段來(lái)取消回音。
因?yàn)閭鬏數(shù)恼Z(yǔ)音信息在傳輸之前被編碼成參數(shù)(例如在參量域 中),且常規(guī)回音:f又消器和/或抑制器工作于非線性話音域,分組交換 網(wǎng)絡(luò)中的常規(guī)回音取消和/或抑制變得相對(duì)困難、復(fù)雜,可由于例如所 涉及的附加串聯(lián)(tandeming)編碼而增加編碼和/或解碼延遲和/或降低語(yǔ)音質(zhì)量。
發(fā)明內(nèi)容
示例實(shí)施例定位于用于基于分組的回音取消和/或抑制的方法和 裝置。 一種示例實(shí)施例提供用于抑制和/或取消回音的方法。在該示例 實(shí)施例中,基于與多個(gè)參考語(yǔ)音分組中每個(gè)參考語(yǔ)音分組及目標(biāo)語(yǔ)音 分組相關(guān)聯(lián)的至少一個(gè)編碼語(yǔ)音參數(shù),從所述多個(gè)參考語(yǔ)音分組選擇 參考語(yǔ)音分組?;谒x參考語(yǔ)音分組抑制/取消所述目標(biāo)語(yǔ)音分組中 的回音。
從下文給出的詳細(xì)描述以及附圖,將可更充分理解本發(fā)明,其中, 相同單元用相同參考標(biāo)號(hào)表示,所述附圖只以示例方式給出因此不是 對(duì)本發(fā)明的限制,其中
圖1是包括常規(guī)回音取消器和/或抑制器的分組網(wǎng)絡(luò)上語(yǔ)音的示
圖2示出依照示例實(shí)施例的回音取消器和/或抑制器;
具體實(shí)施例方式
依照示例實(shí)施例的方法和裝置可根據(jù)例如分組交換通信系統(tǒng)中 的特定應(yīng)用執(zhí)行回音取消和/或抑制。本文將以回音取消和/或抑制、 回音取消器和/或抑制器等描述示例實(shí)施例。
此后,出于示例目的,疑為攜帶了反射的語(yǔ)音信息(例如,在近 端所接收到的且被反射回遠(yuǎn)端的語(yǔ)音信息)的聲音合成器分組將被稱 為目標(biāo)分組,與這些目標(biāo)分組相關(guān)聯(lián)的編碼參數(shù)將被稱為目標(biāo)分組參 數(shù)。與從遠(yuǎn)端原始傳送的語(yǔ)音信息(例如,可能反射的語(yǔ)音信息)相 關(guān)聯(lián)的、用于確定目標(biāo)分組是否包含反射的語(yǔ)音信息的語(yǔ)音合成器分 組或參數(shù)分組將被稱為參考分組。與參考分組相關(guān)聯(lián)的編碼參數(shù)將被稱為參考分組參數(shù)。
如上所述,圖1示出分組網(wǎng)絡(luò)上語(yǔ)音的示圖,包括常規(guī)回音取消 器和/或抑制器。依照示例實(shí)施例的方法可在現(xiàn)有回音取消器和/或抑
制器、例如圖1中示出的回音取消器和/或抑制器100實(shí)現(xiàn)。例如,示 例實(shí)施例可在現(xiàn)有數(shù)字信號(hào)處理器(DSP )、現(xiàn)場(chǎng)可編程門陣列(FPGA) 等上實(shí)現(xiàn)。另夕卜,示例實(shí)施例可與例如VoIP網(wǎng)絡(luò)、VoATM網(wǎng)絡(luò)、TrFo 網(wǎng)絡(luò)等的任意類型陸地或無(wú)線分組交換網(wǎng)絡(luò)結(jié)合使用。
一種用于對(duì)語(yǔ)音信息進(jìn)行編碼的示例語(yǔ)音合成器是基于碼激勵(lì) 線性預(yù)測(cè)(Code Excited Linear Prediction: CELP )的語(yǔ)音合成器?;?于CELP的語(yǔ)音合成器將數(shù)字語(yǔ)音信息編碼成編碼參數(shù)的集合。這些 參數(shù)包括例如自適應(yīng)碼本(codebook)和固定碼本增益、基音(pitch) /自適應(yīng)碼本、線性頻譜對(duì)(linear spectrum pair: LSP )和固定碼本。 這些參數(shù)的每個(gè)參數(shù)可用若干比特來(lái)表示。例如,對(duì)于作為眾所周知 的語(yǔ)音合成器的增強(qiáng)型變速率編解碼(Enhanced Variable Rate CODEC: EVRC)語(yǔ)音合成器的全速率分組,LSP用28個(gè)比特表示,基音及其 對(duì)應(yīng)△用12個(gè)比特表示,自適應(yīng)碼本增益用9個(gè)比特表示,而固定 碼本增益用15個(gè)比特表示。固定碼本用120個(gè)比特表示。
還參考圖1,如果在近端的CELP語(yǔ)音合成器進(jìn)行語(yǔ)音信息的編 碼期間出現(xiàn)了反射的聲音信號(hào),則所傳輸?shù)恼Z(yǔ)音合成器分組的至少一 部分可包括反射的語(yǔ)音信息。所述反射的語(yǔ)音信息可與原始傳送的語(yǔ) 音信息相同或類似,因此攜帶從近端傳送到遠(yuǎn)端的語(yǔ)音信息的語(yǔ)音合 成器分組可與攜帶從遠(yuǎn)端到近端的原始已編碼語(yǔ)音信息的語(yǔ)音合成 器分組類似或基本類似或相同。即,例如在原始語(yǔ)音合成器分組中的 比特可與攜帶反射的語(yǔ)音信息的對(duì)應(yīng)語(yǔ)音合成器分組中的比特類似 或基本類似或相同。
依照示例實(shí)施例的分組域回音取消器和/或抑制器和/或其方法利 用這種相似性來(lái)通過(guò)自適應(yīng)地調(diào)整與所傳輸分組相關(guān)聯(lián)的編碼參數(shù) 取消和/或抑制所傳輸信號(hào)中的回音。出于示例目的,將針對(duì)基于CELP的語(yǔ)音合成器、例如EVRC語(yǔ) 音合成器描述示例實(shí)施例。但是,依照示例實(shí)施例的方法和/或裝置可 結(jié)合和/或適合結(jié)合任意適合語(yǔ)音合成器使用。
圖2示出依照示例實(shí)施例的回音取消器和/或抑制器。如圖所示, 圖2的回音取消器和/或抑制器可將從遠(yuǎn)端收到的原始語(yǔ)音合成器分 組(參考分組)緩存在參考分組緩沖存儲(chǔ)器202中?;匾羧∠骱? 或抑制器可將來(lái)自近端的目標(biāo)分組緩存在目標(biāo)分組緩沖存儲(chǔ)器204 中。圖2的回音取消器和/或抑制器還可包括回音取消和/或抑制模塊 206以及存儲(chǔ)器208。
回音取消和/或抑制模塊206可基于與存儲(chǔ)在參考分組緩沖存儲(chǔ) 器202中的至少一個(gè)參考分組以及存儲(chǔ)在目標(biāo)分組緩存204中的至少 一個(gè)目標(biāo)分組相關(guān)聯(lián)的至少一個(gè)已編碼語(yǔ)音參數(shù)取消和/或抑制來(lái)自 信號(hào)(例如發(fā)送和/或接收信號(hào))的回音。下面更詳細(xì)地i侖述回音取消 和/或抑制模塊206及在其中所執(zhí)行的方法。
存儲(chǔ)器208可存儲(chǔ)例如語(yǔ)音分組相似性度量、對(duì)應(yīng)參考語(yǔ)音分組、 目標(biāo)語(yǔ)音分組等的中間值和/或語(yǔ)音分組。在至少一種示例實(shí)施例中, 存儲(chǔ)器208可存儲(chǔ)各個(gè)相似性度量和/或總相似性度量。下面將更詳細(xì) 地描述存儲(chǔ)器208。
回到圖2,可基于軌跡(trajectory)搜索/匹配操作的軌跡匹配長(zhǎng) 度確定緩沖存儲(chǔ)器204的長(zhǎng)度,下面對(duì)其進(jìn)行更詳細(xì)描述。例如,如 果各語(yǔ)音合成器分組攜帶20ms語(yǔ)音段且軌跡匹配長(zhǎng)度為120ms,則 緩沖存儲(chǔ)器204可保存6個(gè)目標(biāo)分組。
可基于回音尾部的長(zhǎng)度、網(wǎng)絡(luò)延遲以及軌跡匹配長(zhǎng)度確定緩沖存 儲(chǔ)器202的長(zhǎng)度。例如,如果各語(yǔ)音合成器分組攜帶20ms語(yǔ)音段, 回音尾部長(zhǎng)度等于180ms且軌跡匹配長(zhǎng)度為120ms(例如6個(gè)分組), 則緩沖存儲(chǔ)器202可保存15個(gè)參考分組。可用m表示可在用于參考 分組的緩沖器202中存儲(chǔ)的分組的最大數(shù)目。
盡管圖2示出了兩個(gè)緩沖器202和204,但是這些緩沖器可合并成單個(gè)存儲(chǔ)器。
在至少 一種實(shí)施例中,回音尾部的長(zhǎng)度可由回音路徑的已知網(wǎng)絡(luò) 參數(shù)確定和/或定義,或者使用實(shí)際搜索過(guò)程來(lái)獲得。確定回音尾部的 長(zhǎng)度的方法在本領(lǐng)域是眾所周知的。在確定了回音尾部的長(zhǎng)度之后, 依照至少某些示例實(shí)施例的方法可在等于回音尾部長(zhǎng)度的時(shí)間窗內(nèi) 執(zhí)行。時(shí)間窗寬度可等于例如一個(gè)或幾個(gè)傳輸幀的長(zhǎng)度、或者一個(gè)或 幾個(gè)分組的長(zhǎng)度。出于示例目的,將通過(guò)假設(shè)回音尾部的長(zhǎng)度等于單 個(gè)傳輸幀中所傳送的聲音信號(hào)的長(zhǎng)度來(lái)描述示例實(shí)施例。
通過(guò)將存儲(chǔ)在緩沖器202中的參考分組與攜帶反射的語(yǔ)音信息的 目標(biāo)分組匹配,示例實(shí)施例可應(yīng)用于任意回音尾部長(zhǎng)度。通過(guò)將目標(biāo)
分組與存儲(chǔ)在緩沖器202中的m個(gè)參考分組的每個(gè)參考分組進(jìn)行比 較,確定目標(biāo)分組是否包含反射的語(yǔ)音信息。
圖3是依照示例實(shí)施例示出用于回音取消和/或抑制的方法的流 程圖。圖3中示出的方法可由圖2中示出的回音取消和/或抑制模塊 206執(zhí)行。
參考圖3,在S302,計(jì)數(shù)器值j可被初始化到1。在S304,可從 緩沖器202檢索參考分組Rj。在S306,回音取消和/或抑制才莫塊206 可將計(jì)算器值j與閣值m進(jìn)行比較。如上所述,m可等于存儲(chǔ)在緩沖 器202中的參考分組的數(shù)量。在該示例中,因?yàn)榇鎯?chǔ)在緩沖器202中 的參考分組的數(shù)量m等于在單個(gè)傳輸幀中所傳送的參考分組的數(shù)量, 所以閾值m可等于在單個(gè)傳輸幀中所傳送的分組的數(shù)量。這種情況 下,值m可從包含在傳輸幀中的傳輸幀報(bào)頭提取,這在本領(lǐng)域是眾所 周知的。
在S306,如果計(jì)數(shù)器值j小于或等于闊值m,則在S308回音取 消和/或抑制模塊206從參考分組Rj提取已編碼參數(shù)。同時(shí),在S308, 回音取消和/或抑制模塊206從目標(biāo)分組T提取已編碼編碼參數(shù) (encoded coding parameter)。用于提取這些參數(shù)的方法在本領(lǐng)域是 眾所周知的。因此,為簡(jiǎn)潔而省略了詳細(xì)論述。如上所述,本文針對(duì)基于CELP的語(yǔ)音合成器描述示例實(shí)施例。對(duì)于基于CELP的語(yǔ)音合 成器,參考分組參數(shù)和目標(biāo)分組參數(shù)可包含固定碼本增益Gf、自適應(yīng) 碼本增益Ga、基音P和LSP。
還參考圖3,在S309,回音取消和/或抑制模塊206可基于從目標(biāo) 分組T和參考分組Rj所提取的已編碼編碼參數(shù)的部分執(zhí)行雙端通話 (double talk)檢測(cè),以便確定雙端通話是否存在于參考分組Rj中。 在包括雙端通話的語(yǔ)音段期間,不需要執(zhí)行回音取消和/或抑制,因?yàn)?反射的遠(yuǎn)端語(yǔ)音信息淹沒(méi)在近端語(yǔ)音信息中,因此在遠(yuǎn)端是覺(jué)察不到 的。
雙端通話檢測(cè)可用于確定參考分組Rj是否包含雙端通話。在示例
Rj所提取的已編碼參數(shù)進(jìn)4亍比較來(lái)檢測(cè)雙端通話。在上述CELP語(yǔ)音 合成器示例中,所述已編碼參數(shù)可為固定碼本增益&和自適應(yīng)碼本增 益G。。
回音取消和/或抑制模塊206可根據(jù)式(l)中示出的條件確定雙端 通話是否存在
'"r-l,如果G漢一Gfr〈Af;
^Z)r二l,如果GaR—GaT<Aa; (1) 、 Z)T-0,否則
才艮據(jù)式(l),如果參考分組Rj的固定碼本增益GfR與目標(biāo)分組T的 固定碼本增益Gfp之差小于固定碼本增益閾值A(chǔ)f ,則在參考分組Rj中 存在雙端通話且可將雙端通話檢測(cè)標(biāo)記DT設(shè)置為1 (例如DT-1)。 同樣,如果參考分組Rj的自適應(yīng)碼本增益Gw和目標(biāo)分組T的自適應(yīng) 碼本增益Ga之差小于自適應(yīng)碼本增益闊值A(chǔ)a ,則在參考分組Rj中存 在雙端通話且可將雙端通話檢測(cè)標(biāo)記DT設(shè)置為1 (例如DTO 。否 則,在參考分組Rj中不存在雙端通話且不設(shè)置雙端通話檢測(cè)標(biāo)記DT (4列長(zhǎng)口DT:0)。
參考圖3,如果在S310不設(shè)置雙端通話檢測(cè)標(biāo)記DT(例如DT-0 ),則可在S312執(zhí)行從目標(biāo)分組T所提取的已編碼參數(shù)與從參考分組Rj 所提取的已編碼參數(shù)之間的相似性估計(jì)。該相似性估計(jì)可用于確定是 否要基于從目標(biāo)分組T所提取的已編碼參數(shù)、從參考分組Rj所提取的 已編碼參數(shù)以及相似性閾值設(shè)置多個(gè)相似性標(biāo)記的每個(gè)標(biāo)記。
相似性標(biāo)記可被稱為相似性指示符。相似性標(biāo)記或相似性指示符 可包含例如基音相似性標(biāo)記(或指示符)PM以及多個(gè)LSP相似性標(biāo) 記(或指示符)。多個(gè)LSP相似性標(biāo)記可包括多個(gè)帶寬相似性標(biāo)記 BM,.和多個(gè)頻率相似性匹配標(biāo)記FM,.。
又參考圖3的S312,回音取消和/或抑制模塊206可確定是否要 依照式(2)設(shè)置參考分組Rj的基音相似性標(biāo)記PM:
'尸M^1,如果
如式(2)所示,/V為與目標(biāo)分組相關(guān)聯(lián)的基音,A是與參考分組 Rj相關(guān)聯(lián)的基音且Ap是基音閾值??苫谝勒账锰囟愋偷恼Z(yǔ)音合 成器所獲得的試驗(yàn)性數(shù)據(jù)確定基音閾值A(chǔ)p。如式(2)所示,如果基音 尸r和基音A之差的絕對(duì)值小于或等于閾值A(chǔ)p,則基音尸r與基音& 相似,且基音相似性標(biāo)記PM可i殳為1。否則,基音相似性標(biāo)記PM 可i殳為0。
繼續(xù)參考圖3的S312,與上述基音相似性估計(jì)方法類似,LSP相 似性估計(jì)可用于確定參考分組Rj與目標(biāo)分組T是否相似。
通常,CELP語(yǔ)音合成器使用10階線性可預(yù)測(cè)編碼(Linear Predictive Coding: LPC)可預(yù)測(cè)濾波器,該濾波器使用矢量量化對(duì)10 個(gè)LSP值進(jìn)行編碼。另外,各LSP對(duì)定義相應(yīng)語(yǔ)音頻譜共振峰 (formant)。共振峰是由任意聲音系統(tǒng)的共振頻率產(chǎn)生的聲頻頻譜的 峰值。各特定共振峰可用由式(3)給出的帶寬A表示
S,ZS尸2廣丄5Pn,Z = U,.."5; (3) 且由式(4)給出中心頻率Fi:<formula>formula see original document page 12</formula>; (4)
如式(3)和(4)中所示,A是第i個(gè)共振峰的帶寬,F(xiàn),.是第i個(gè)共振 峰的中心頻率,且LSP2,和是第i對(duì)LSP值。
在該示例中,對(duì)于IO階LPC可預(yù)測(cè)濾波器,可生成5對(duì)LSP值。
前3個(gè)共振峰中的每個(gè)共振峰可包括信息語(yǔ)音段的重要或比較重 要的頻譜包絡(luò)信息。所以,可基于所述前3個(gè)共振峰片1,2和3執(zhí)行 LSP相似性估計(jì)。
對(duì)于各共振峰/ (片1,2,3 ),指示與目標(biāo)分組T相關(guān)聯(lián)的帶寬5".
是否和與參考分組Rj相關(guān)聯(lián)的帶寬S;e,相似的帶寬相似性標(biāo)記萬(wàn)M,可
根據(jù)式(5)設(shè)置
SM,1,如果IBt廣BJAbJ;
<formula>formula see original document page 12</formula>
如式(5)中所示,5力是與目標(biāo)分組T相關(guān)聯(lián)的第i個(gè)帶寬,5&是 與參考分組Rj相關(guān)聯(lián)的第i個(gè)帶寬,且ABi是用于確定帶寬^r,和
是否相似的第i個(gè)帶寬閾值。如果SM產(chǎn)1,則第i個(gè)帶寬5r,和A,均 處于相互的某個(gè)范圍內(nèi),且可被認(rèn)為相似。否則,在SM產(chǎn)O時(shí),第i 個(gè)帶寬^77和A,.可被認(rèn)為不相似。與基音閾值相似,可基于根據(jù)所用 的特定類型語(yǔ)音合成器所獲得的實(shí)驗(yàn)性數(shù)據(jù)確定各帶寬闞值。
繼續(xù)參考圖3的S312,與目標(biāo)分組T相關(guān)聯(lián)的第i個(gè)頻率和與參 考分組Rj相關(guān)聯(lián)的對(duì)應(yīng)第i個(gè)頻率是否相似可通過(guò)頻率相似性標(biāo)記 FM,.來(lái)指示??梢勒帐?6)設(shè)置頻率相似性標(biāo)記
在式(6)中,F(xiàn)r,.是與目標(biāo)分組T相關(guān)聯(lián)的第i個(gè)中心頻率,&,.是 與參考分組Rj相關(guān)聯(lián)的第i個(gè)中心頻率,且AFi是第i個(gè)中心頻率閾值。 第i個(gè)中心頻率閾值A(chǔ)pi可指示第i個(gè)目標(biāo)和參考中心頻率尸r,.和 (i=l,2,3)之間的相似性。與基音闊值和帶寬閾值相似,可基于根據(jù)
/ = 1,2,3. (6)所用的特定類型語(yǔ)音合成器所獲得的實(shí)驗(yàn)性數(shù)據(jù)確定頻率閾值。
FM,是相應(yīng)LSP對(duì)的第i個(gè)帶寬的中心頻率相似性標(biāo)記。根據(jù)式
(6),尸M尸1表示尸tv和尸化相似,而FM尸O表示尸t7和尸a.不相似。
參考圖3,如果在S314確定多個(gè)參數(shù)相似性標(biāo)記尸M、和 中每個(gè)標(biāo)記被設(shè)置為等于l,則可認(rèn)為參考分組Rj與目標(biāo)分組T相似。 換句話說(shuō),如果參數(shù)相似性指示符PM、 SM'.和FM,中每個(gè)指示符這 樣指示,則參考分組Rj與目標(biāo)分組T相似。
接著在S316,回音取消和/或抑制模塊206可計(jì)算總語(yǔ)音分組相 似性度量。例如,總語(yǔ)音分組相似性度量可為總相似性度量《??傁?似性度量Sj可指示目標(biāo)分組T與參考分組Rj之間的總相似性。
在至少一種示例實(shí)施例中,可基于多個(gè)獨(dú)立語(yǔ)音分組相似性度量 計(jì)算與參考分組Rj相關(guān)聯(lián)的總相似性度量Sj。多個(gè)獨(dú)立語(yǔ)音分組相似
性度量可為獨(dú)立相似性度量。
所述多個(gè)獨(dú)立相似性度量可基于從目標(biāo)分組T與參考分組Rj所提 取的已編碼參數(shù)的至少一部分來(lái)計(jì)算。在該示例實(shí)施例中,多個(gè)獨(dú)立 相似性度量可包括基音相似性度量&、帶寬相似性度量&,. (/=1,2,3) 以及頻率相似性度量^ U=l,2,3)。可同時(shí)計(jì)算多個(gè)獨(dú)立相似性度量 中的每個(gè)相似性度量。
例如,可根據(jù)式(7)計(jì)算基音相似性度量&:
s -fe^ ry、
可根據(jù)式(8)計(jì)算i個(gè)共振峰中的每個(gè)共振峰的帶寬相似性度量
& ,,
如式(8)所示及如上所述,^n是目標(biāo)分組T的第i個(gè)共振峰的帶寬, 5化是參考分組Rj的第i個(gè)共振峰的帶寬。
同樣,可根據(jù)式(9)計(jì)算i個(gè)共振峰中的每個(gè)共振峰的中心頻率相<formula>formula see original document page 14</formula>
如式(9)所示及如上所述,尸打是目標(biāo)分組T的第i個(gè)共振峰的中心 頻率,i^.是參考分組Rj的第i個(gè)共振峰的中心頻率。
在獲得多個(gè)獨(dú)立相似性度量之后,可根據(jù)式(10)計(jì)算總相似性匹 配度量&
+ (10)
在式(10)中,各獨(dú)立相似性度量可由相應(yīng)權(quán)重函數(shù)進(jìn)行稱重。如 式所示, 為基音相似性度量&的相似性權(quán)重常數(shù),c^p為L(zhǎng)SP頻i普
相似性度量S&和Spi的總相似性權(quán)重常數(shù),A,.為帶寬相似性度量SBi 的獨(dú)立相似性權(quán)重常數(shù)且&為頻率相似性度量SFi的獨(dú)立相似性權(quán)重 常數(shù)。
可確定相似性權(quán)重常數(shù) 和a p以滿足下面所示的式(l 1):
同樣,可確定獨(dú)立相似性;f又重常it和&以滿足下面所示的式
(12):
<formula>formula see original document page 14</formula>依照至少某些示例實(shí)施例,可根據(jù)經(jīng)驗(yàn)數(shù)據(jù)確定和/或調(diào)整權(quán)重常
數(shù)使得式(11)和(12)滿足。
參考圖3,在S318,回音取消和/或抑制模塊206可將計(jì)算出的總
相似性度量S存儲(chǔ)在圖2的存儲(chǔ)器208中。存儲(chǔ)器208可為任意眾所
周知的存儲(chǔ)器,例如緩沖存儲(chǔ)器。在S320遞增計(jì)數(shù)器值j: j=j+l,該
方法返回S304。
回到圖3的S314,如果沒(méi)有設(shè)置任意參數(shù)相似性標(biāo)記,則回音取 消和/或抑制模塊206確定參考分組Rj與目標(biāo)分組T不相似,因此目標(biāo)分組T不攜帶與參考分組Rj所攜帶的原始語(yǔ)音信息對(duì)應(yīng)的反射的語(yǔ) 音信息。這種情況下,可遞增計(jì)數(shù)器值j (j=j+l),且該方法如上述 那樣繼續(xù)。
回到圖3的S310,如果在參考分組Rj中檢測(cè)到雙端通話,則可 在S311丟棄該參考分組Rj,可在S320遞增計(jì)數(shù)器值j: j=j+l,且在 S304回音取消和/或抑制模塊206從緩沖器202檢索下一參考分組Rj。 在從緩沖器202檢索到下一參考分組Rj之后,所述過(guò)程可繼續(xù)到S306 并重復(fù)。
回到S306,如果計(jì)數(shù)器值j大于閾值m,則可在S321執(zhí)行矢量 軌跡匹配操作。軌跡匹配可用于定位目標(biāo)分組的固定碼本增益與所存 儲(chǔ)參考分組的各固定碼本增益之間的相關(guān)。軌跡匹配還可用于定位目 標(biāo)分組的自適應(yīng)碼本增益與各參考分組矢量的自適應(yīng)碼本增益之間 的相關(guān)。依照至少一種示例實(shí)施例,可通過(guò)使用最小均方差(Least Mean Square: LMS )或交叉相關(guān)(cross-correlation)算法來(lái)4丸4亍矢量 軌跡匹配以便確定目標(biāo)分組與各相似參考分組之間的相關(guān)。因?yàn)長(zhǎng)MS 和交叉相關(guān)算法在本領(lǐng)域中是眾所周知的,因此為簡(jiǎn)潔起見(jiàn),省略了
對(duì)其的詳細(xì)論述。
在至少一種示例實(shí)施例中,矢量軌跡匹配可用來(lái)檢驗(yàn)?zāi)繕?biāo)分組與 每個(gè)所存儲(chǔ)相似參考分組之間的相似性。在至少一種示例實(shí)施例中, 在S321可用矢量軌跡匹配來(lái)過(guò)濾出不滿足(fail)相關(guān)閾值的相似參 考分組。可將與不滿足相關(guān)閾值的所存儲(chǔ)相似參考分組相關(guān)聯(lián)的總相 似性度量Sj從存儲(chǔ)器208中去除。可基于實(shí)驗(yàn)性數(shù)據(jù)確定相關(guān)閾值, 這在本領(lǐng)域中眾所周知的。
盡管圖3的方法在S321示出矢量軌跡匹配步驟,但是可如本領(lǐng) 域技術(shù)人員所期望那樣省略該步驟。
在S322,可搜索存儲(chǔ)器208中余下的所存儲(chǔ)總相似性度量》,以配。在示例實(shí)施例中,與目標(biāo)分組匹配的參考分組可為具有最小關(guān)聯(lián) 總相似性度量5)的參考分組。
如果在存儲(chǔ)器中通過(guò)目標(biāo)分組T與參考分組Rj對(duì)相似性度量Sj
進(jìn)行索引(用于這樣做的方法是眾所周知的,因此為了簡(jiǎn)潔而將其省
略),則總相似性度量可表示為S(T,Rj),其中j=l,2,3...m。
將總相似性度量表示為S(T,Rj),其中j^,2,3…m,可使用式(13) 獲得最小總相似性度量S一
=M/Aq^(r,^)j = 0,l,.."m] (13)
又回到圖3,在定位匹配參考分組之后,在S324,回音取消和/
消和/或抑制回音。例如,可通過(guò)調(diào)整(例如衰減)與目標(biāo)分組T相關(guān) 聯(lián)的增益取消和/或抑制回音??苫谂c匹配的參考分組相關(guān)聯(lián)的增 益、與匹配參考分組相關(guān)聯(lián)的總相似性度量以及增益權(quán)重常數(shù)執(zhí)行增 益調(diào)整。
例如,可通過(guò)衰減如式(14)中示出的自適應(yīng)碼本增益和/或如式(15) 中示出的固定碼本增益來(lái)取消和/或抑制回音
GW . (14)
&=^S*& (15) 如式(14)中所示,為與參考分組相關(guān)聯(lián)的固定碼本增益的調(diào)節(jié)
增益,^為固定碼本的增益權(quán)重。
如式(15)中所示,(4為與參考分組相關(guān)聯(lián)的自適應(yīng)碼本增益的調(diào)
節(jié)增益,R為自適應(yīng)碼本的增益權(quán)重。起初,『,和R均可等于l。但
是,可根據(jù)例如話音特征(例如,有聲的或無(wú)聲的)和/或目標(biāo)分組中 的回音相對(duì)于參考分組的比例自適應(yīng)地調(diào)整這些值。
依照示例實(shí)施例,對(duì)目標(biāo)分組的自適應(yīng)碼本增益和固定碼本增益 進(jìn)行衰減。例如,基于參考分組和目標(biāo)分組的相似性,可調(diào)整目標(biāo)分 組中自適應(yīng)和固定碼本的增益。依照示例實(shí)施例,可使用參量域中的所提取參數(shù)取消和/或抑制回 音,而不需要對(duì)目標(biāo)語(yǔ)音信號(hào)進(jìn)行解碼和重新編碼。
盡管上文只論述了圖3中示出的方法的單個(gè)重復(fù),但是,可對(duì)緩
沖器202中所存儲(chǔ)的各個(gè)參考分組Rj和緩沖器204中所存儲(chǔ)的各個(gè)目 標(biāo)分組T執(zhí)行圖3的方法。即,例如,可搜索存儲(chǔ)在緩沖器202中的 多個(gè)參考分組以查找與緩沖器204中的每個(gè)目標(biāo)分組匹配的參考分 組。
因此,描述了本發(fā)明,顯而易見(jiàn)可用多種方式改變本發(fā)明。此類 改變不應(yīng)視為本發(fā)明的脫離,所有此類改進(jìn)旨在被包含在本發(fā)明的范 圍內(nèi)。
權(quán)利要求
1.一種抑制回音的方法,所述方法包括基于與多個(gè)參考語(yǔ)音分組中每個(gè)參考語(yǔ)音分組和目標(biāo)語(yǔ)音分組相關(guān)聯(lián)的至少一個(gè)已編碼語(yǔ)音參數(shù),從所述多個(gè)參考語(yǔ)音分組選擇參考語(yǔ)音分組;基于所述所選參考語(yǔ)音分組抑制所述目標(biāo)語(yǔ)音分組中的回音。
2. 如權(quán)利要求l所述的方法,其中,通過(guò)基于與所述所選參考語(yǔ) 音分組相關(guān)聯(lián)的所述至少一個(gè)已編碼語(yǔ)音參數(shù)調(diào)整與所述目標(biāo)語(yǔ)音 分組相關(guān)聯(lián)的所述至少一個(gè)已編碼語(yǔ)音參數(shù),抑制所述回音。
3. 如權(quán)利要求2所述的方法,其中,通過(guò)基于與所述所選參考語(yǔ) 音分組相關(guān)聯(lián)的對(duì)應(yīng)多個(gè)已編碼語(yǔ)音參數(shù)調(diào)整與所述目標(biāo)語(yǔ)音分組 相關(guān)聯(lián)的多個(gè)已編碼語(yǔ)音參數(shù),抑制所述回音。
4. 如權(quán)利要求l所述的方法,其中,通過(guò)基于與所述所選參考語(yǔ) 音分組相關(guān)聯(lián)的對(duì)應(yīng)至少一個(gè)已編碼語(yǔ)音參數(shù)調(diào)整與所述目標(biāo)語(yǔ)音 分組相關(guān)聯(lián)的所述至少一個(gè)已編碼語(yǔ)音參數(shù)的增益,抑制所述回音。
5. 如權(quán)利要求l所述的方法,其中,所述選擇步驟包括 從所述目標(biāo)分組和所述多個(gè)參考語(yǔ)音分組中每個(gè)參考語(yǔ)音分組提取至少一個(gè)已編碼語(yǔ)音參數(shù);對(duì)所述多個(gè)參考語(yǔ)音分組之中的若干個(gè)參考語(yǔ)音分組的每個(gè)參 考語(yǔ)音分組,基于從所述參考語(yǔ)音分組和所述目標(biāo)分組所提取的所述 已編碼語(yǔ)音參數(shù)計(jì)算至少一個(gè)語(yǔ)音分組相似性度量;以及基于所述所計(jì)算的語(yǔ)音分組相似性度量選擇所述參考語(yǔ)音分組。
6. 如權(quán)利要求5所述的方法,還包括基于與各個(gè)參考語(yǔ)音分組和所述目標(biāo)語(yǔ)音分組相關(guān)聯(lián)的所述已 編碼語(yǔ)音參數(shù),確定所述多個(gè)參考語(yǔ)音分組中哪些參考語(yǔ)音分組與所述目標(biāo)語(yǔ)音分組相似,以^_生成所述若干個(gè)參考語(yǔ)音分組,對(duì)所述若 干個(gè)參考語(yǔ)音分組計(jì)算所述至少一個(gè)語(yǔ)音分組相似性度量。
7. 如權(quán)利要求l所述的方法,其中,所述選擇步驟包括基于與所述多個(gè)參考語(yǔ)音分組中每個(gè)參考語(yǔ)音分組和所述目標(biāo) 語(yǔ)音分組相關(guān)聯(lián)的所述至少一個(gè)已編碼語(yǔ)音參數(shù),確定所述多個(gè)參考 語(yǔ)音分組中哪些參考語(yǔ)音分組與所述目標(biāo)語(yǔ)音分組相似,以便生成參考語(yǔ)音分組集合;以及從所述參考語(yǔ)音分組集合選擇所述參考語(yǔ)音分組。
8. 如權(quán)利要求7所述的方法,其中,所述確定步驟包括 對(duì)于每個(gè)參考語(yǔ)音分組,基于與所述目標(biāo)語(yǔ)音分組相關(guān)聯(lián)的所述至少一個(gè)已編碼語(yǔ) 音參數(shù)以及與所述參考語(yǔ)音分組相關(guān)聯(lián)的所述至少一個(gè)已編碼 語(yǔ)音參數(shù),設(shè)置至少一個(gè)相似性指示符;以及基于所述相似性指示符確定所述參考語(yǔ)音分組與所述目標(biāo) 語(yǔ)音分組是否相似。
9. 如權(quán)利要求l所述的方法,其中,所述選擇步驟包括 從所述目標(biāo)語(yǔ)音分組和所述參考語(yǔ)音分組中每個(gè)參考語(yǔ)音分組提取多個(gè)已編碼語(yǔ)音參數(shù);對(duì)于與每個(gè)參考語(yǔ)音分組相關(guān)聯(lián)的各個(gè)已編碼語(yǔ)音參數(shù),基于所述參考語(yǔ)音分組和所述目標(biāo)語(yǔ)音分組的所述已編碼 語(yǔ)音參數(shù),確定獨(dú)立相似性度量; 對(duì)于每個(gè)參考語(yǔ)音分組,基于與所述參考語(yǔ)音分組相關(guān)聯(lián)的所述獨(dú)立相似性度量確 定總相似性度量;以及基于與每個(gè)參考語(yǔ)音分組相關(guān)聯(lián)的所述總相似性度量選擇所述 參考語(yǔ)音分組。
10. 如權(quán)利要求9所述的方法,其中,所述選擇步驟還包括 比較所述總相似性度量以確定最小總相似性度量;以及 選擇與所述最小總相似性度量相關(guān)聯(lián)的參考語(yǔ)音分組。
全文摘要
在用于回音抑制或取消的方法中,基于與多個(gè)參考語(yǔ)音分組中每個(gè)參考語(yǔ)音分組及目標(biāo)語(yǔ)音分組相關(guān)聯(lián)的至少一個(gè)已編碼語(yǔ)音參數(shù)從所述多個(gè)參考語(yǔ)音分組選擇參考語(yǔ)音分組。基于所選參考語(yǔ)音分組抑制或取消所述目標(biāo)語(yǔ)音分組中的回音。
文檔編號(hào)G10L21/00GK101542600SQ200780034439
公開日2009年9月23日 申請(qǐng)日期2007年9月18日 優(yōu)先權(quán)日2006年9月19日
發(fā)明者A·A·塔拉夫, D·J·尤特庫(kù)斯, D·-S·金, 曹彬石 申請(qǐng)人:盧森特技術(shù)有限公司