一種用于分組聲學(xué)回聲消除的方法與設(shè)備的制作方法
【專利摘要】本發(fā)明的目的是提供一種用于分組聲學(xué)回聲消除的方法與設(shè)備?;芈曄O(shè)備獲取待進(jìn)行PAEC的通話兩端的源語音分組流;根據(jù)源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)通話兩端的目標(biāo)分組流;根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合目標(biāo)分組流與參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組流進(jìn)行PAEC,以獲得已消除回聲分組流并將其發(fā)送至通話兩端中的對(duì)應(yīng)端。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)現(xiàn)了雙向分組聲學(xué)回聲消除,成倍地提高PAEC信道的性能,減少了硬件數(shù)量以及相應(yīng)維護(hù)成本,同時(shí)也減少了呼叫處理和相關(guān)信令開銷,進(jìn)而不需任何信令支持,提供透明的PAEC功能。
【專利說明】-種用于分組聲學(xué)回聲消除的方法與設(shè)備
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信領(lǐng)域,尤其涉及一種用于分組聲學(xué)回聲消除的技術(shù)。
【背景技術(shù)】
[0002] 移動(dòng)網(wǎng)絡(luò)中的聲學(xué)回聲是由于手機(jī)或者其他免提設(shè)備的設(shè)計(jì)不佳,語音接收方 揚(yáng)聲器發(fā)出的聲音送到接收方麥克風(fēng)(進(jìn)而送回語音發(fā)送方)而引起的。聲學(xué)回聲消除 (Acoustic Echo Cancellation, AEC)能夠移除通信信號(hào)中的回聲。聲學(xué)回聲消除是保證 通信中聲音質(zhì)量的核心性能。
[0003] 在電路交換網(wǎng)絡(luò)中,傳統(tǒng)的AEC技術(shù)在波形域?qū)β晫W(xué)回聲進(jìn)行移除已經(jīng)做得很 好。然而,在分組網(wǎng)絡(luò)中(例如IP網(wǎng)絡(luò)上的語音,VoIP),還沒有被認(rèn)可的用于執(zhí)行AEC的 方式。一些供應(yīng)商(如Broadcom (參考US7333447),Samsung, 3Com等)發(fā)明了用于分組網(wǎng) 絡(luò)的AEC,但是這類AEC需要先把分組流解碼成模擬或數(shù)字信號(hào)(S卩,轉(zhuǎn)換到波形域),使用 傳統(tǒng)技術(shù)消除信號(hào)中的回聲,然后將消除了回聲的信號(hào)重新編碼回分組中(即,轉(zhuǎn)換回分組 域)。由于多次的編碼/解碼,導(dǎo)致了聲音質(zhì)量(voice quality,VQ)的下降,從而抵消了編 碼轉(zhuǎn)換免除操作(Transcoder Free Operation, TrFO)在排除多次編碼和解碼上取得的優(yōu) 勢(shì)。此外,由于計(jì)算復(fù)雜度和巨大的緩沖需求,傳統(tǒng)的AEC僅支持受限的尾長(zhǎng)延遲,因此,傳 統(tǒng)的AEC用于VoIP網(wǎng)絡(luò)時(shí)效率很低。
[0004] 阿爾卡特-朗訊/貝爾實(shí)驗(yàn)室(Alcatel-Lucent/Bell Labs)發(fā)明了一種真正的 分組域聲學(xué)回聲消除(Packet Acoustic Echo Cancellation,PAEC)技術(shù),(例如)只需使用 EVRC或EVRC-B分組中描述波形的參數(shù),就能夠探測(cè)抑制分組流中的聲學(xué)回聲。貝爾實(shí)驗(yàn)室 在PAEC領(lǐng)域有3個(gè)相關(guān)的專利或?qū)@暾?qǐng):
[0005] -US7852792Packet Based Echo Cancellation and Suppression (granted onl2/14/2010)by Binshi Cao et al.
[0006] -US008144862method and Apparatus for the Detection and Suppression of Echo in Packet based Communication Networks Using Frame Energy Estimation(granted on3/27/2012)by Binshi Cao et al.
[0007] -US2009/0168673Method and Apparatus for Detecting and Suppressing Echo in Packet Networks(published on7/2/2009)by Lampros Kalampoukas and Semyon Sosin.
[0008] 在上述專利或?qū)@暾?qǐng)中,通過利用分組的波形描述參數(shù)進(jìn)行比較與預(yù)測(cè),將參 考流分組與目標(biāo)流分組在PAEC信道里相對(duì)比,從而移除(目標(biāo)流中的)相似分組(被認(rèn)定為 回聲),實(shí)現(xiàn)了在分組網(wǎng)絡(luò)中消除/抑制分組聲學(xué)回聲的基本方法。
[0009] 然而,這些專利或?qū)@暾?qǐng)中所提供的方法僅僅針對(duì)單向PAEC,而無法提供雙向 的PAEC。一個(gè)語音呼叫涉及兩個(gè)或多個(gè)通話方,要消除每個(gè)通話方產(chǎn)生的回聲,就要部署多 個(gè)單向PAEC設(shè)備或者單個(gè)PAEC設(shè)備上的多個(gè)單向PAEC信道。從分組交換性能以及容量 分析,尤其是在分組交換網(wǎng)內(nèi)部交換場(chǎng)景中,單向PAEC的性能有限,并且可能達(dá)不到工業(yè) 質(zhì)量與性能標(biāo)準(zhǔn)。帶有單向分組回聲消除的PAEC產(chǎn)品可能不會(huì)很好地滿足分組交換中的 用戶需求。因此,對(duì)于實(shí)際行業(yè)部署來說,這些單向PAEC方法都具有缺點(diǎn)與限制。
[0010] 例如,圖1展示了一種在US2009/0168673中有所描述的單向分組聲學(xué)回聲消除結(jié) 構(gòu)。一個(gè)單向PAEC信道只能分配給一個(gè)通話方,它需要區(qū)分語音流的方向是"去到"還是 "來自"該通話方。如果是去到該通話方,該語音流是一個(gè)參考流。如果來自該通話方,該語 音流是一個(gè)目標(biāo)流。所述語音流要么作為參考分組處理運(yùn)行,要么作為目標(biāo)分組處理運(yùn)行。 關(guān)鍵是參考流處理部分和目標(biāo)流處理部分不同時(shí)并行運(yùn)行。
[0011] 這種單向分組聲學(xué)回聲消除方法的明顯的缺點(diǎn)是效率低成本高。雖然擁有參考分 組處理模塊可以緩沖另一方向的語音流,但它與目標(biāo)分組處理模塊并不并行運(yùn)行,也不消 除參考分組中的回聲。要實(shí)現(xiàn)雙向分組回聲消除,仍需提供兩個(gè)PAEC信道以及加倍的信令 和管理維護(hù)開銷。在一個(gè)分組交換網(wǎng)內(nèi)部交換場(chǎng)景中,這無疑是對(duì)資源的浪費(fèi)。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的目的是提供一種用于分組聲學(xué)回聲消除的方法與設(shè)備。
[0013] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于分組聲學(xué)回聲消除的方法,其中,該方法 包括以下步驟:
[0014] a獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流,其中,所述源語音分 組流包含一個(gè)或多個(gè)分組數(shù)據(jù)包;
[0015] b根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,其 中,所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息;
[0016] C根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目標(biāo)分組流 與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組流進(jìn)行回 聲消除,以獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流;
[0017] d根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,將所述已消除回聲分組流 發(fā)送至所述通話兩端中的對(duì)應(yīng)端。
[0018] 根據(jù)本發(fā)明的另一方面,還提供了一種用于分組聲學(xué)回聲消除的回聲消除設(shè)備, 其中,該設(shè)備包括:
[0019] 獲取裝置,用于獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流,其中, 所述源語音分組流包含一個(gè)或多個(gè)分組數(shù)據(jù)包;
[0020] 目標(biāo)更新裝置,用于根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩 端的目標(biāo)分組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng) 的傳送方向信息;
[0021] 消除裝置,用于根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所 述目標(biāo)分組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo) 分組流進(jìn)行回聲消除,以獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流;
[0022] 發(fā)送裝置,用于根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,將所述已消 除回聲分組流發(fā)送至所述通話兩端中的對(duì)應(yīng)端。
[0023] 與現(xiàn)有技術(shù)相比,本發(fā)明通過在回聲消除設(shè)備中獲取待進(jìn)行分組聲學(xué)回聲消除的 通話兩端的源語音分組流,根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端 的目標(biāo)分組流,根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目標(biāo)分 組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組流進(jìn) 行回聲消除,以獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流,最后根據(jù)所述已消除 回聲分組流所對(duì)應(yīng)的傳送方向信息,將所述已消除回聲分組流發(fā)送至所述通話兩端中的對(duì) 應(yīng)端;從而實(shí)現(xiàn)了雙向分組聲學(xué)回聲消除,成倍地提高PAEC信道的性能,減少了硬件數(shù)量 以及相應(yīng)維護(hù)成本,同時(shí)也減少了呼叫處理和相關(guān)信令開銷,進(jìn)而不需任何信令支持,提供 透明的PAEC功能。
【專利附圖】
【附圖說明】
[0024] 通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0025] 圖1示出根據(jù)本發(fā)明一個(gè)方面的一種在US2009/0168673中有所描述的單向分組 聲學(xué)回聲消除結(jié)構(gòu)示意圖;
[0026] 圖2示出根據(jù)本發(fā)明一個(gè)方面的一種用于分組聲學(xué)回聲消除的回聲消除設(shè)備示 意圖;
[0027] 圖3示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的一種用于分組聲學(xué)回聲消除的回聲消除 設(shè)備不意圖;
[0028] 圖4示出根據(jù)本發(fā)明另一個(gè)方面的一種用于分組聲學(xué)回聲消除的方法流程圖;
[0029] 圖5示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的一種用于分組聲學(xué)回聲消除的方法流程 圖;
[0030] 圖6示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種雙向分組聲學(xué)回聲消除參考示意 圖,其中,每個(gè)方向的分組數(shù)據(jù)包都作為另一個(gè)方向分組數(shù)據(jù)包的參考;
[0031] 圖7示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種雙向分組聲學(xué)回聲消除參考示意 圖,其中,每個(gè)方向的消除了回聲的分組數(shù)據(jù)包都作為另一個(gè)方向的分組數(shù)據(jù)包的參考;
[0032] 圖8示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種利用非回聲消除分組數(shù)據(jù)包作為 參考的雙向分組聲學(xué)回聲消除的緩沖與比較示意圖;
[0033] 圖9示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種利用回聲消除分組數(shù)據(jù)包作為參 考的雙向分組聲學(xué)回聲消除的緩沖與比較示意圖;
[0034] 圖10示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種對(duì)于A端的回聲幀的比較與移除 算法;
[0035] 圖11示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種對(duì)于B端的回聲幀的比較與移除 算法。
[0036] 附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0037] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0038] 圖2示出根據(jù)本發(fā)明一個(gè)方面的一種用于分組聲學(xué)回聲消除的回聲消除設(shè)備示 意圖;其中,所述回聲消除設(shè)備包括獲取裝置1、目標(biāo)更新裝置2、消除裝置3、發(fā)送裝置4。 具體地,獲取裝置1獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流,其中,所述 源語音分組流包含一個(gè)或多個(gè)分組數(shù)據(jù)包;目標(biāo)更新裝置2根據(jù)所述源語音分組流,更新 目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組 流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息;消除裝置3根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所 述通話兩端的參考分組流,結(jié)合所述目標(biāo)分組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所 對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組流進(jìn)行回聲消除,以獲得與所述目標(biāo)分組流相對(duì)應(yīng) 的已消除回聲分組流;發(fā)送裝置4根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,將 所述已消除回聲分組流發(fā)送至所述通話兩端中的對(duì)應(yīng)端。
[0039] 在此,所述回聲消除設(shè)備包括但不限于能夠按照事先設(shè)定或存儲(chǔ)的指令,自動(dòng)進(jìn) 行數(shù)值計(jì)算和信息處理的電子硬件設(shè)備或軟件設(shè)備;其中,所述硬件設(shè)備包括但不限于微 處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。本 領(lǐng)域技術(shù)人員應(yīng)能理解,其他的回聲消除設(shè)備同樣適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù) 范圍以內(nèi),并在此以引用方式包含于此。
[0040] 所述回聲消除設(shè)備可以被應(yīng)用在任何的V0IP網(wǎng)絡(luò)、實(shí)時(shí)通信網(wǎng)絡(luò)RTC以及LTE/ EPC網(wǎng)絡(luò)中,上述網(wǎng)絡(luò)在當(dāng)前還沒有有效并且公認(rèn)的分組聲學(xué)回聲消除設(shè)備。
[0041] 上述各裝置之間是持續(xù)不斷工作的,在此,本領(lǐng)域技術(shù)人員應(yīng)理解"持續(xù)"是指上 述各裝置分別實(shí)時(shí)地,或者按照設(shè)定的或?qū)崟r(shí)調(diào)整的工作模式要求,進(jìn)行通話兩端的源語 音分組流的獲取、目標(biāo)分組流的更新、已消除回聲分組流的獲取、已消除回聲分組流的發(fā) 送等,直至所述回聲消除設(shè)備停止獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組 流。
[0042] 獲取裝置1獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流,其中,所 述源語音分組流包含一個(gè)或多個(gè)分組數(shù)據(jù)包。
[0043] 具體地,所述獲取裝置1從進(jìn)行通話的通話兩端(以通話端A與通話端B為例),獲 取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流;其中,所述源語音分組流包括從 通話端A至通話端B的源語音分組流,也包括從通話端B至通話端A的源語音分組流。其 中,所述源語音分組流中包含一個(gè)或多個(gè)分組數(shù)據(jù)包(packet),且所述源語音分組流的分 組數(shù)據(jù)包中可能包含回聲包。
[0044] 目標(biāo)更新裝置2根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的 目標(biāo)分組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳 送方向信息。
[0045] 具體地,所述目標(biāo)更新裝置2根據(jù)所述獲取裝置1中所獲取的源語音分組流,通過 將源語音分組流發(fā)送至目標(biāo)緩沖區(qū),從而利用所述源語音分組流對(duì)目標(biāo)緩沖區(qū)中的目標(biāo)分 組流進(jìn)行更新,其中,由于源語音分組流是待進(jìn)行分組聲學(xué)回聲消除的通話兩端的語音分 組流,因此,所述目標(biāo)分組流中也包括對(duì)應(yīng)于所述通話兩端的語音分組流。在此,所述目標(biāo) 分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
[0046] 優(yōu)選地,所述目標(biāo)更新裝置2可以根據(jù)所述源語音分組流,確定所述源語音分組 流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息;根據(jù)所述源語音分組流,結(jié)合所述源語音 分組流中的分組數(shù)據(jù)包的傳送方向信息,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組 流。
[0047] 具體地,所述目標(biāo)更新裝置2可以根據(jù)所述源語音分組流,通過根據(jù)所述源語音 分組流中各個(gè)數(shù)據(jù)包的包頭信息中的源地址和目的地址,計(jì)算確定出每個(gè)分組數(shù)據(jù)包所對(duì) 應(yīng)的傳送方向信息。
[0048] 例如,以通話端A與通話端B為例來說明通話兩端,則所述傳送方向信息包括從A 至B或者從B至A,若已知通話端A的地址和/或通話端B的地址,則根據(jù)所述數(shù)據(jù)包的包 頭信息中的源地址和目的地址,可以直接確定所述數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息;
[0049] 或者,例如,通過利用預(yù)定的計(jì)算函數(shù),將所述數(shù)據(jù)包的包頭信息中的源地址與目 的地址進(jìn)行比較,若源地址大于目的地址,則確定所述數(shù)據(jù)包的傳送方向?yàn)閺腁到B,反之, 若源地址小于目的地址,則確定所述數(shù)據(jù)包的傳送方向?yàn)閺腂到A,若存在其他情況,則出 現(xiàn)錯(cuò)誤,該數(shù)據(jù)包被丟棄。
[0050] 所述目標(biāo)更新裝置2根據(jù)所述源語音分組流,結(jié)合所述源語音分組流中的分組數(shù) 據(jù)包的傳送方向信息,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,因此,所述目標(biāo) 分組流中包括從A至B的目標(biāo)分組流以及從B至A的目標(biāo)分組流。
[0051] 優(yōu)選地,所述目標(biāo)更新裝置2可以根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì) 應(yīng)所述通話兩端的目標(biāo)分組流;根據(jù)所述目標(biāo)分組流,確定所述目標(biāo)分組流中的每個(gè)分組 數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
[0052] 具體地,所述目標(biāo)更新裝置2可以根據(jù)所述源語音分組流,先對(duì)目標(biāo)緩沖區(qū)中對(duì) 應(yīng)所述通話兩端的目標(biāo)分組流進(jìn)行更新;然后再根據(jù)所述目標(biāo)分組流,通過根據(jù)所述目標(biāo) 分組流中各個(gè)數(shù)據(jù)包的包頭信息中的源地址和目的地址,計(jì)算確定出所述目標(biāo)分組流中的 每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。在此,所述計(jì)算方法與所述目標(biāo)更新裝置2根據(jù) 所述源語音分組流,確定所述源語音分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息的 方法相同或相似,故在此不再贅述,并通過引用的方式包含于此。
[0053] 消除裝置3根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目 標(biāo)分組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組 流進(jìn)行回聲消除,以獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流。
[0054] 具體地,所述消除裝置3獲取與所述目標(biāo)緩沖區(qū)對(duì)應(yīng)的參考緩沖區(qū)中對(duì)應(yīng)所述通 話兩端的參考分組流,其中,所述參考分組流可以根據(jù)源語音分組流的帶有回聲包的語音 分組流所確定,或者,可以根據(jù)所述源語音分組流進(jìn)行分組聲學(xué)回聲消除后的不包含回聲 包的語音分組流所確定;所述消除裝置3根據(jù)所述目標(biāo)分組流與所述參考分組流中的每個(gè) 分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,將不同方向的所述目標(biāo)分組流與所述參考分組流進(jìn)行 對(duì)比,例如,將從A端至B端的目標(biāo)分組流與從B端至A端的參考分組流進(jìn)行對(duì)比,或者將 從B端至A端的目標(biāo)分組流與從A端至B端的參考分組流進(jìn)行對(duì)比,基于分組聲學(xué)回聲消 除算法(PAEC算法)來檢測(cè)所述目標(biāo)分組流中是否包含回聲包,若包含回聲包,則通過刪除 所述回聲包或者利用替換包對(duì)所檢測(cè)出的回聲包進(jìn)行替換等方式對(duì)所述目標(biāo)分組流進(jìn)行 回聲消除。具體地,例如,利用替換包對(duì)所檢測(cè)出的回聲包進(jìn)行替換,以獲得與所述目標(biāo)分 組流相對(duì)應(yīng)的已消除回聲分組流。其中,所述替換包包括但不限于噪聲包(例如,包含一定 類型的噪聲的分組,例如白噪聲、舒適噪聲等)、無聲包(例如,空分組)、在目標(biāo)分組流中最 后緩存的八分之一速率分組等,及其混合。
[0055] 在此,所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息的確定方法, 與確定所述源語音分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息的方法相同或相似, 故在此不再贅述,并通過引用的方式包含于此。
[0056] 發(fā)送裝置4根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,將所述已消除回 聲分組流發(fā)送至所述通話兩端中的對(duì)應(yīng)端。
[0057] 具體地,所述發(fā)送裝置4根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,例 如根據(jù)所述已消除回聲分組流的目的地址信息,或者根據(jù)所述傳送方向信息中相對(duì)應(yīng)的通 話端信息,將所述已消除回聲分組流發(fā)送至與所述已消除回聲分組流的源端所對(duì)應(yīng)的對(duì)應(yīng) 端。
[0058] 例如,若所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息為A端至B端,則將所述已 消除回聲分組流發(fā)送至B端,在此,B端為A端的對(duì)應(yīng)端。
[0059] 從而,本發(fā)明實(shí)現(xiàn)了一種雙向分組聲學(xué)回聲消除方法,該方法:
[0060] -減少硬件數(shù)量以及相應(yīng)維護(hù)成本:與單向PAEC相比,雙向PAEC硬件需求減半并 節(jié)約了相關(guān)的維護(hù);
[0061] -減少了呼叫處理與信令開銷:對(duì)于基本通話來說只需要分配一個(gè)PAEC信道;
[0062] -實(shí)現(xiàn)沒有任何信令支持的隱式/透明的PAEC :在分組語音(傳送)路徑中的網(wǎng)關(guān) 能夠整合雙向PAEC,以為A端和B端提供隱式/透明的PAEC。
[0063] 優(yōu)選地,所述目標(biāo)更新裝置2可以將所述源語音分組流分別發(fā)送至所述目標(biāo)緩沖 區(qū)與參考緩沖區(qū),以更新所述標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,以及所述參考 緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組流中 的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,所述參考分組流包含所述參考分組流中的每個(gè) 分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
[0064] 具體地,所述目標(biāo)更新裝置2根據(jù)所述獲取裝置1中所獲取的源語音分組流,將所 述源語音分組流分別發(fā)送至所述目標(biāo)緩沖區(qū)與參考緩沖區(qū),利用所述源語音分組流,對(duì)所 述目標(biāo)緩沖區(qū)中的目標(biāo)分組流以及參考緩沖區(qū)中的參考分組流進(jìn)行更新;其中,由于源語 音分組流是待進(jìn)行分組聲學(xué)回聲消除的通話兩端的語音分組流,因此,所述目標(biāo)分組流與 參考分組流中均包括對(duì)應(yīng)于所述通話兩端的語音分組流。在此,所述目標(biāo)分組流包含所述 目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,所述參考分組流包含所述參考分 組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
[0065] 在此,所述目標(biāo)分組流與參考分組流中的分組數(shù)據(jù)包的傳送方向信息的確定方 法,與確定所述源語音分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息的方法相同或相 似,故在此不再贅述,并通過引用的方式包含于此。
[0066] 例如,圖6不出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種雙向分組聲學(xué)回聲消除參考 示意圖,其中,每個(gè)方向的分組數(shù)據(jù)包都作為另一個(gè)方向分組數(shù)據(jù)包的參考。
[0067] 具體地,RTP解析器將從A端和/或B端來的源語音分組流全部發(fā)送到參考分組 處理以及目標(biāo)分組處理中,在分離的緩沖區(qū)(目標(biāo)緩沖區(qū)與參考緩沖區(qū))中緩沖目標(biāo)分組流 與參考分組流。在此,RTP解析器所發(fā)送的源語音分組流中包括所述源語音分組流的分組 數(shù)據(jù)包的負(fù)載與頭。其中,從A端發(fā)送來的源語音分組流中或者帶有B端回聲、或者不包含 回聲,從B端發(fā)送來的源語音分組流中或者帶有A端回聲、或者不包含回聲。由于所述目標(biāo) 分組流是通過緩存所述源語音分組流所確定,因此,若所述源語音分組流中包含回聲,則所 述目標(biāo)分組流中也包含相應(yīng)的回聲;若所述源語音分組中不包含回聲,則所述目標(biāo)分組流 中也不包含相應(yīng)的回聲。
[0068] 在所述目標(biāo)緩沖區(qū)與所述參考緩沖區(qū)中,所述目標(biāo)分組流包含所述目標(biāo)分組流中 的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,所述參考分組流包含所述參考分組流中的每個(gè) 分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
[0069] 在所述PAEC算法模塊中,所述目標(biāo)緩沖區(qū)中一個(gè)方向的目標(biāo)分組流,與所述參考 緩沖區(qū)中預(yù)先存儲(chǔ)的另一方向的參考分組流進(jìn)行對(duì)比,如圖8所示,目標(biāo)分組流中數(shù)據(jù)包 集合(數(shù)據(jù)包j至數(shù)據(jù)包j+M,即B端至A端方向的目標(biāo)分組流)分別與參考分組流中對(duì)應(yīng) 的集合1、集合2、…、集合K (即A端至B端的語音分組流,以用于進(jìn)行B端至A端方向的 參考)進(jìn)行對(duì)比,目標(biāo)分組流中數(shù)據(jù)包集合(數(shù)據(jù)包i至數(shù)據(jù)包i+N,即A端至B端方向的目 標(biāo)分組流)分別與參考分組流中對(duì)應(yīng)的集合1、集合2、…、集合Q (即B端至A端的語音分 組流,以用于進(jìn)行A端至B端方向的參考)進(jìn)行對(duì)比,以確定不同方向的所述目標(biāo)分組流中 是否具有回聲包。其中,所述參考分組流中包含對(duì)應(yīng)的回聲包。
[0070] 若所述目標(biāo)分組流中存在回聲包,則所述PAEC算法模塊對(duì)其進(jìn)行分組聲學(xué)回聲 消除計(jì)算,將消除回聲后的已消除回聲分組流分別發(fā)送至A端與B端。
[0071] 優(yōu)選地,所述回聲消除設(shè)備還包括參考更新裝置(未示出),其中,所述參考更新裝 置可以根據(jù)所述已消除回聲分組流,更新所述參考緩沖區(qū)中的參考分組流。
[0072] 具體地,所述參考更新裝置可以與所述消除裝置3相交互,以獲取所述已消除回 聲分組流;然后,所述參考更新裝置根據(jù)所述已消除回聲分組流,對(duì)所述參考緩沖區(qū)中的參 考分組流進(jìn)行更新;從而利用所述已消除回聲分組流來作為與所述目標(biāo)分組流進(jìn)行比較的 參考分組流,減少了對(duì)緩沖區(qū)的使用,具有更好的參考效果,從而進(jìn)一步提高了 PAEC的準(zhǔn) 確率。
[0073] 例如,圖7示出根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例的一種雙向分組聲學(xué)回聲消除參考 示意圖,其中,每個(gè)方向的消除了回聲的分組數(shù)據(jù)包都作為另一個(gè)方向的分組數(shù)據(jù)包的參 考。
[0074] 具體地,RTP解析器將從A端和/或B端來的源語音分組流全部發(fā)送到目標(biāo)分組 處理中,所述目標(biāo)分組流是通過緩存所述源語音分組流所確定,因此,所述目標(biāo)分組流中也 包含相應(yīng)的回聲。在此,RTP解析器所發(fā)送的源語音分組流中包括所述源語音分組流的分 組數(shù)據(jù)包的負(fù)載與頭。其中,從A端發(fā)送來的源語音分組流中或者帶有B端回聲、或者不包 含回聲,從B端發(fā)送來的源語音分組流中或者帶有A端回聲、或者不包含回聲。
[0075] 參考分組處理與PAEC算法模塊相交互,以獲取所述PAEC算法模塊所確定的已消 除回聲分組流,并將所述已消除回聲分組流緩沖至所述參考緩沖區(qū),以作為所述參考分組 流。
[0076] 在此,所述目標(biāo)分組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包都包含其所對(duì)應(yīng)的 傳送方向信息。
[0077] 在所述PAEC算法模塊中,所述目標(biāo)緩沖區(qū)中一個(gè)方向的目標(biāo)分組流,與所述參考 緩沖區(qū)中預(yù)先存儲(chǔ)的另一方向的參考分組流進(jìn)行對(duì)比,如圖9所示,目標(biāo)分組流中數(shù)據(jù)包 集合(數(shù)據(jù)包j至數(shù)據(jù)包j+M,即B端至A端方向的目標(biāo)分組流)分別與參考分組流中對(duì)應(yīng)的 集合1、集合2、…、集合K (即A端至B端的語音分組流,以用于進(jìn)行B端至A端方向的參 考)進(jìn)行對(duì)比,目標(biāo)分組流中數(shù)據(jù)包集合(數(shù)據(jù)包i至數(shù)據(jù)包i+N,即A端至B端方向的目標(biāo) 分組流)分別與參考分組流中對(duì)應(yīng)的集合1、集合2、…、集合Q (即B端至A端的語音分組 流,以用于進(jìn)行A端至B端方向的參考)進(jìn)行對(duì)比,以確定不同方向的所述目標(biāo)分組流中是 否具有回聲包。其中,所述參考分組流中不再包含對(duì)應(yīng)的回聲包,屬于已消除回聲分組流。
[0078] 若所述目標(biāo)分組流中存在回聲包,則所述PAEC算法模塊對(duì)其進(jìn)行分組聲學(xué)回聲 消除計(jì)算,將消除回聲后的已消除回聲分組流分別發(fā)送至A端與B端。
[0079] 在此,結(jié)合圖8或圖9,圖10和圖11分別示出了一種對(duì)于A端與B端的回聲幀的 比較與移除算法。
[0080] 具體地,在圖10中,"N+1"是用于方向A到B的目標(biāo)窗口大小,"N+Q"是對(duì)應(yīng)的參 考窗口大小。"Q"通過根據(jù)B端的回聲路徑延遲所決定。
【權(quán)利要求】
1. 一種用于分組聲學(xué)回聲消除的方法,其中,該方法包括w下步驟: a獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流,其中,所述源語音分組流 包含一個(gè)或多個(gè)分組數(shù)據(jù)包; b根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,其中, 所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息; C根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目標(biāo)分組流與所 述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組流進(jìn)行回聲消 除,W獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流; d根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,將所述已消除回聲分組流發(fā)送 至所述通話兩端中的對(duì)應(yīng)端。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述步驟b包括W下任一項(xiàng): -根據(jù)所述源語音分組流,確定所述源語音分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送 方向信息;根據(jù)所述源語音分組流,結(jié)合所述源語音分組流中的分組數(shù)據(jù)包的傳送方向信 息,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流; -根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流;根據(jù) 所述目標(biāo)分組流,確定所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
3. 根據(jù)權(quán)利要求1或2所述的方法,其中,該方法還包括: -根據(jù)所述已消除回聲分組流,更新所述參考緩沖區(qū)中的參考分組流。
4. 根據(jù)權(quán)利要求1所述的方法,其中,所述步驟b包括: -將所述源語音分組流分別發(fā)送至所述目標(biāo)緩沖區(qū)與參考緩沖區(qū),W更新所述標(biāo)緩沖 區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,W及所述參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分 組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向 信息,所述參考分組流包含所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,所述步驟C包括: cl根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目標(biāo)分組流與所 述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,確定所述目標(biāo)分組流中是否包 含回聲包; c2當(dāng)所述目標(biāo)分組流中包含回聲包,對(duì)所述目標(biāo)分組流進(jìn)行回聲消除,W獲得與所述 目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流。
6. 根據(jù)權(quán)利要求5所述的方法,其中,所述步驟cl包括: -根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目標(biāo)分組流與所 述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,W及與所述目標(biāo)分組流與所述 參考分組流中所對(duì)應(yīng)的多個(gè)相連續(xù)的分組數(shù)據(jù)包相對(duì)應(yīng)的能量層級(jí)信息,確定所述目標(biāo)分 組流中是否包含回聲包。
7. 根據(jù)權(quán)利要求5或6所述的方法,其中,所述步驟c2包括: -當(dāng)所述目標(biāo)分組流中包含回聲包,利用替換數(shù)據(jù)包,對(duì)所述目標(biāo)分組流進(jìn)行回聲消 除,W獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流。
8. -種用于分組聲學(xué)回聲消除的回聲消除設(shè)備,其中,該設(shè)備包括: 獲取裝置,用于獲取待進(jìn)行分組聲學(xué)回聲消除的通話兩端的源語音分組流,其中,所述 源語音分組流包含一個(gè)或多個(gè)分組數(shù)據(jù)包; 目標(biāo)更新裝置,用于根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的 目標(biāo)分組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳 送方向信息; 消除裝置,用于根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目 標(biāo)分組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,對(duì)所述目標(biāo)分組 流進(jìn)行回聲消除,W獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流; 發(fā)送裝置,用于根據(jù)所述已消除回聲分組流所對(duì)應(yīng)的傳送方向信息,將所述已消除回 聲分組流發(fā)送至所述通話兩端中的對(duì)應(yīng)端。
9.根據(jù)權(quán)利要求8所述的回聲消除設(shè)備,其中,所述目標(biāo)更新裝置用于W下任一項(xiàng): -根據(jù)所述源語音分組流,確定所述源語音分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送 方向信息;根據(jù)所述源語音分組流,結(jié)合所述源語音分組流中的分組數(shù)據(jù)包的傳送方向信 息,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流; -根據(jù)所述源語音分組流,更新目標(biāo)緩沖區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流;根據(jù) 所述目標(biāo)分組流,確定所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
10. 根據(jù)權(quán)利要求8或9所述的回聲消除設(shè)備,其中,該設(shè)備還包括: 參考更新裝置,用于根據(jù)所述已消除回聲分組流,更新所述參考緩沖區(qū)中的參考分組 流。
11. 根據(jù)權(quán)利要求8所述的回聲消除設(shè)備,其中,所述目標(biāo)更新裝置用于: -將所述源語音分組流分別發(fā)送至所述目標(biāo)緩沖區(qū)與參考緩沖區(qū),W更新所述標(biāo)緩沖 區(qū)中對(duì)應(yīng)所述通話兩端的目標(biāo)分組流,W及所述參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分 組流,其中,所述目標(biāo)分組流包含所述目標(biāo)分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向 信息,所述參考分組流包含所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息。
12. 根據(jù)權(quán)利要求8至11中任一項(xiàng)所述的回聲消除設(shè)備,其中,所述消除裝置包括: 回聲確定單元,用于根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所 述目標(biāo)分組流與所述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,確定所述目 標(biāo)分組流中是否包含回聲包; 回聲消除單元,用于當(dāng)所述目標(biāo)分組流中包含回聲包,對(duì)所述目標(biāo)分組流進(jìn)行回聲消 除,W獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流。
13.根據(jù)權(quán)利要求12所述的回聲消除設(shè)備,其中,所述回聲確定單元用于: -根據(jù)對(duì)應(yīng)參考緩沖區(qū)中對(duì)應(yīng)所述通話兩端的參考分組流,結(jié)合所述目標(biāo)分組流與所 述參考分組流中的每個(gè)分組數(shù)據(jù)包所對(duì)應(yīng)的傳送方向信息,W及與所述目標(biāo)分組流與所述 參考分組流中所對(duì)應(yīng)的多個(gè)相連續(xù)的分組數(shù)據(jù)包相對(duì)應(yīng)的能量層級(jí)信息,確定所述目標(biāo)分 組流中是否包含回聲包。
14.根據(jù)權(quán)利要求12或13所述的回聲消除設(shè)備,其中,所述回聲消除單元用于: -當(dāng)所述目標(biāo)分組流中包含回聲包,利用替換數(shù)據(jù)包,對(duì)所述目標(biāo)分組流進(jìn)行回聲消 除,W獲得與所述目標(biāo)分組流相對(duì)應(yīng)的已消除回聲分組流。
【文檔編號(hào)】G10L21/0208GK104468471SQ201310419143
【公開日】2015年3月25日 申請(qǐng)日期:2013年9月13日 優(yōu)先權(quán)日:2013年9月13日
【發(fā)明者】李舟洲, 蔡亦鋼 申請(qǐng)人:阿爾卡特朗訊