專利名稱:用于語(yǔ)音/音頻發(fā)送器和接收器的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音/音頻發(fā)送器和接收器。特別地,本發(fā)明涉及提供了
改進(jìn)編碼效率的改進(jìn)語(yǔ)音/音頻編解碼器(codec)。
背景技術(shù):
傳統(tǒng)的語(yǔ)音/音頻編碼由核心編解碼器執(zhí)行。編解碼器的意思是編碼 器和解碼器。核心編解碼器適于對(duì)信號(hào)頻帶的核心頻帶進(jìn)行編碼/解碼, 由此,核心頻帶包括信號(hào)的上至(upto)截止頻率的必要頻率,例如, 在窄帶語(yǔ)音的情況下截止頻率為3400 Hz。核心編解碼器能夠與帶寬擴(kuò) 展(BWE)相結(jié)合,后者處理核心頻帶之上且超出截止頻率的高頻。BWE 指的是一種在核心帶寬的頻鐠上增加接收器處頻語(yǔ)(帶寬)的方法。BWE 的好處是其通常能夠在除核心編解碼器比特率之外增加很少的額外比 特率或不增加比特率的情況下實(shí)現(xiàn)。標(biāo)明核心頻帶與帶寬擴(kuò)展所處理的 高頻之間的界限的頻點(diǎn)在本說(shuō)明書中被稱為交越頻率或截止頻率。
超頻(overclocking)是一種例如可用于以3GPP TS 26.290擴(kuò)展的 適應(yīng)性多速率寬帶(AMR-WB+)編解碼器形式的適應(yīng)性多速率寬帶+
(AMR-WB+)-音頻編解碼器中的方法;代碼轉(zhuǎn)換(transcoding)功能, 其允許以經(jīng)修改的內(nèi)部采樣頻率來(lái)操作編解碼器,即使其最初是針對(duì) 25.6 KHz的固定內(nèi)部采樣頻率而設(shè)計(jì)的。如下所述,改變內(nèi)部釆樣頻率 考慮到以超頻因數(shù)來(lái)縮放(scale)比特率、帶寬和復(fù)雜度。這考慮到根 據(jù)比特率、帶寬和復(fù)雜度方面的要求、以非常靈活的方式來(lái)操作編解碼 器。例如,如果需要非常低的比特率,則能夠使用低超頻因數(shù)(-降頻
(underclocking)),這同時(shí)意味著經(jīng)編碼的音頻帶寬和復(fù)雜度得以降 低。另一方面,如果需要非常高質(zhì)量的編碼,則使用高超頻因數(shù),從而 允許以增加比特率和復(fù)雜度為代價(jià)來(lái)對(duì)大音頻帶寬進(jìn)行編碼。
在編碼器側(cè)的超頻是通過(guò)在編碼器前端使用靈活的重采樣器
(resampler)來(lái)實(shí)現(xiàn)的,其將輸入信號(hào)的原始音頻采樣率(例如44.1 KHz)轉(zhuǎn)換為任意內(nèi)部采樣頻率,所述任意內(nèi)部采樣頻率偏離標(biāo)稱內(nèi)部 采樣頻率的程度為超頻因數(shù)。實(shí)際編碼算法通常對(duì)以內(nèi)部采樣頻率采樣
7的固定信號(hào)幀(包含預(yù)定義數(shù)目的樣本)進(jìn)行操作,因此,原則上其未 察覺(jué)任何超頻。盡管如此,以給定的超頻因數(shù)對(duì)各種編解碼器屬性進(jìn)行 縮放,例如比特率、復(fù)雜度、帶寬和交越頻率。
所期望的是使用上述超頻方法來(lái)獲得增加的編碼效率。這會(huì)引起在 相同比特率或更低比特率處的改進(jìn)的信號(hào)質(zhì)量且同時(shí)保持相同的質(zhì)量 水平。
專利US 7050972描述了一種用于音頻編碼系統(tǒng)的方法,該系統(tǒng)適 應(yīng)性地隨著時(shí)間而調(diào)整用于對(duì)較低頻帶進(jìn)行編碼的核心編解碼器與較 高頻帶的高頻再生系統(tǒng)(其在本說(shuō)明書中也被稱為帶寬擴(kuò)展)之間的交 越頻率。該專利還描述了能夠響應(yīng)于核心編解碼器的能力而進(jìn)行適配以 適當(dāng)?shù)貙?duì)低頻帶進(jìn)行編碼。
但是US 7050972沒(méi)有提供用于改進(jìn)核心編解碼器的編碼效率的手 段,即以較低采樣頻率操作之。該方法的目的僅在于通過(guò)對(duì)將被核心編 解碼器編碼的帶寬進(jìn)行適配以確保核心編解碼器能夠適當(dāng)?shù)貙?duì)其頻帶 進(jìn)行編碼、來(lái)改進(jìn)總體編碼系統(tǒng)的效率。因此,其目的是實(shí)現(xiàn)核心頻帶 和帶寬擴(kuò)展頻帶之間的最優(yōu)性能折衷,而不是嘗試著使核心解碼器更為 高效。
專利申請(qǐng)(WO-2005096508 )描述了另一種方法,該方法包括頻帶 擴(kuò)展模塊、重采樣模塊和包含心理聲學(xué)分析模塊的核心編解碼器、時(shí)頻 映射模塊、量化模塊、熵編碼模塊。頻帶擴(kuò)展模塊分析整個(gè)帶寬內(nèi)的原 始輸入音頻信號(hào),提取高頻部分的譜包絡(luò)和表征高低頻諳部分之間的依 賴性的參數(shù)。重采樣沖莫塊對(duì)輸入的音頻信號(hào)進(jìn)行重采樣,改變采樣頻率, 并將它們輸出至核心編解碼器。
盡管如此,專利申請(qǐng)(WO-2005096508)沒(méi)有包括考慮根據(jù)輸入信 號(hào)的某些分析對(duì)重采樣模塊的操作進(jìn)行適配的事項(xiàng)。此外,沒(méi)有預(yù)見(jiàn)原 始輸入信號(hào)的適應(yīng)性分割(segmentation)裝置,該裝置會(huì)允許在適應(yīng)性 重采樣之后將輸入片段(segment)映射到后續(xù)的核心碼的輸入幀上,所 述輸入幀包含預(yù)定義數(shù)目的樣本。其結(jié)果是,不能確保核心編解碼器對(duì) 最低可能的信號(hào)采樣率進(jìn)行操作,因此,總體編碼系統(tǒng)的效率不如希望 的那么高。
C.Shahabi 等人的出版物 A Comparison of different haptic compression techniques; ICME 2002描述了 一種用于對(duì)數(shù)據(jù)幀進(jìn)行操作的觸覺(jué)數(shù)據(jù)的適應(yīng)性采樣系統(tǒng),其周期性地識(shí)別用于數(shù)據(jù)窗的奈奎斯特 頻率,并且此后以該頻率對(duì)數(shù)據(jù)進(jìn)行重采樣。出于實(shí)際原因,根據(jù)截止 頻率來(lái)選擇采樣頻率,超出截止頻率的信號(hào)能量能被忽略。
C.Shahabi等人的上述出版物中所描述的方案的問(wèn)題在于其在語(yǔ) 音和音頻編碼的環(huán)境中沒(méi)有提供益處。對(duì)于觸覺(jué)數(shù)據(jù)的采樣而言,與超 出截止頻率(例如1%)的相對(duì)能含量相關(guān)的標(biāo)準(zhǔn)可能是合適的,其目 標(biāo)是以最低可能采樣率來(lái)保持對(duì)數(shù)據(jù)的準(zhǔn)確表示。盡管如此,在語(yǔ)音和 音頻編碼的環(huán)境中,在輸入或輸出采樣頻率方面通常存在固定限制,這 意味著首先以固定截止頻率對(duì)原始信號(hào)進(jìn)行低通濾波,并且此后下采樣 至所需的采樣率(例如8、 16、 32、 44.1或48 kHz)。因此,語(yǔ)音或音 頻信號(hào)的帶寬已經(jīng)被人為限制為固定的截止頻率。根據(jù)該出版物中的方 法對(duì)采樣頻率的后續(xù)適配通常不會(huì)奏效,原因在于由于人為固定的截止 頻率,其只會(huì)導(dǎo)致固定的采樣頻率而非適應(yīng)性的采樣頻率。
盡管如此,即使在帶寬被人為限制的情況下,依賴于音頻信號(hào)的本 地(在時(shí)間上)感知屬性,對(duì)固定帶寬限制的影響的感知未必總是相同 的。對(duì)于信號(hào)的某些部分(片段),其中很難感知到高頻,例如由于被 占優(yōu)勢(shì)的低頻含量所掩蔽,更為激進(jìn)的低通濾波和以相應(yīng)較低的采樣頻 率進(jìn)行采樣將是可能的。因此,與感知推動(dòng)的采樣頻率相比,傳統(tǒng)的語(yǔ) 音和音頻編碼系統(tǒng)對(duì)局部過(guò)高的采樣頻率進(jìn)行操作,因而損害了編碼效 率。
發(fā)明內(nèi)容
本發(fā)明的目的是提供用于改進(jìn)語(yǔ)音/音頻編解碼器中的編碼效率的 方法和設(shè)備。
根據(jù)本發(fā)明,通過(guò)在本地(在時(shí)間上)對(duì)采樣頻率進(jìn)行適配并確保 其不高于必要的采樣頻率來(lái)獲得增加的編碼效率。
根據(jù)第一方面,本發(fā)明涉及一種音頻/語(yǔ)音發(fā)送器,所述音頻/語(yǔ)音 發(fā)送器包括適于對(duì)輸入音頻/語(yǔ)音信號(hào)的核心頻帶進(jìn)行編碼的核心編碼 器。核心編碼器對(duì)包含預(yù)定數(shù)目樣本的輸入音頻/語(yǔ)音信號(hào)的幀進(jìn)行操 作。輸入音頻/語(yǔ)音信號(hào)具有第一采樣頻率,并且核心頻帶包含上至截止 頻率的頻率。根據(jù)本發(fā)明的音頻/語(yǔ)音發(fā)送器包括分割設(shè)備,其適于執(zhí) 行將輸入音頻/語(yǔ)音信號(hào)分割為多個(gè)片段,其中每個(gè)片段具有適應(yīng)性的片段長(zhǎng)度;截止頻率估計(jì)器,其適于為與適應(yīng)性片段長(zhǎng)度相關(guān)聯(lián)的每個(gè)片 段估計(jì)截止頻率,并且適于向解碼器傳送關(guān)于所估計(jì)的截止頻率的信 息;低通濾波器,其適于以所述估計(jì)的截止頻率對(duì)每個(gè)片段進(jìn)行濾波; 和重采樣器,其適于以與所述截止頻率相關(guān)的第二采樣頻率對(duì)經(jīng)濾波的 片段進(jìn)行重采樣,以便生成將被所述核心編碼器編碼的預(yù)定數(shù)目的樣本 的音頻/語(yǔ)音幀。
優(yōu)選地,截止頻率估計(jì)器適于根據(jù)感知標(biāo)準(zhǔn)來(lái)分析給定輸入片段的 屬性,以基于該分析來(lái)確定將被用于給定片段的截止頻率。此外,截止 頻率估計(jì)器還適于提供截止頻率的量化估計(jì),以使得根據(jù)所述截止頻率 估計(jì)來(lái)重新調(diào)整分段成為可能。
根據(jù)本發(fā)明的笫二方面,提供了一種適于對(duì)所接收的經(jīng)編碼的音頻 /語(yǔ)音信號(hào)進(jìn)行解碼的音頻/語(yǔ)音接收器。音頻/語(yǔ)音接收器包括重采樣器, 所述重采樣器適于通過(guò)使用截止頻率估計(jì)的信息對(duì)經(jīng)解碼的音頻/語(yǔ)音 幀進(jìn)行重采樣來(lái)生成輸出語(yǔ)音片段,其中所述信息接收自音頻/語(yǔ)音發(fā)送 器,所述音頻/語(yǔ)音發(fā)送器包括適于生成和傳送所述信息的截止頻率估計(jì) 器。
根據(jù)第三方面,本發(fā)明涉及音頻/語(yǔ)音發(fā)送器中的方法。該方法包括 以下步驟將輸入音頻/語(yǔ)音信號(hào)分割為多個(gè)片段,其中每個(gè)片段具有適 應(yīng)性片段長(zhǎng)度;為與適應(yīng)性片段長(zhǎng)度相關(guān)聯(lián)的每個(gè)片段估計(jì)截止頻率并 適于向解碼器傳送關(guān)于估計(jì)的截止頻率的信息;以所述估計(jì)的截止頻率
對(duì)每個(gè)片段進(jìn)行低通濾波;并且以與所迷截止頻率相關(guān)的第二采樣頻率 對(duì)經(jīng)濾波的片段進(jìn)行重采樣,以便生成將被所述核心編碼器編碼的預(yù)定 數(shù)目的樣本的音頻/語(yǔ)音幀。
根據(jù)第四方面,本發(fā)明涉及用于對(duì)所接收的經(jīng)編碼的音頻/語(yǔ)音信號(hào)
進(jìn)行解碼的音頻/語(yǔ)音接收器中的方法。該方法包括以下步驟通過(guò)使用 截止頻率估計(jì)的信息來(lái)對(duì)經(jīng)解碼的音頻/語(yǔ)音幀進(jìn)行重采樣,以生成輸出 音頻/語(yǔ)音片段,其中所述信息接收自音頻/語(yǔ)音發(fā)送器,該音頻/語(yǔ)音發(fā) 送器包括適于生成和傳送所述信息的截止頻率估計(jì)器。 因而,通過(guò)使用上述方法,增加編碼效率是可能的。 根據(jù)本發(fā)明的實(shí)施例,結(jié)合BWE實(shí)現(xiàn)了進(jìn)一步的效率增加。這允 許將核心編解碼器的帶寬和比特率保持在最小,并且同時(shí)確保核心編解 碼器利用臨界(奈奎斯特)采樣數(shù)據(jù)來(lái)操作。本發(fā)明的優(yōu)勢(shì)是,在使用IP/UDP/RTP的分組切換應(yīng)用中,所需截 止頻率的傳輸是免費(fèi)的,原因在于其能夠通過(guò)使用時(shí)間標(biāo)記字段而被間 接指示。這表現(xiàn)為優(yōu)選地進(jìn)行分組以使得一個(gè)IP/UDP/RTP分組對(duì)應(yīng)于 一個(gè)經(jīng)編碼的片段。
本發(fā)明的另一優(yōu)勢(shì)是,能夠結(jié)合現(xiàn)有語(yǔ)音編解碼器將其用于VoIP, 例如AMR作為核心編解碼器,原因是傳輸格式(例如RFC3267)未受 影響。
附圖簡(jiǎn)述
圖l示出了編解碼器,其示意性地闡釋了本發(fā)明的基本概念。
圖2示出了具有帶寬擴(kuò)展的
圖1中的編解碼器。
圖3示出了在LPC殘留域中具有帶寬擴(kuò)展的本發(fā)明的操作。
圖4圖示了用于本發(fā)明的一個(gè)實(shí)施例中的基音排列(pitch-aligned)分段。
圖5是根據(jù)本發(fā)明的方法的流程圖。 圖6圖示了閉環(huán)實(shí)施例。
詳細(xì)描述
在以下描述中,出于解釋而非限制的目的,闡述了特定細(xì)節(jié)(諸如 步驟的特定序列、信令協(xié)議和設(shè)備配置)以便提供對(duì)本發(fā)明的全面理解。 對(duì)于本領(lǐng)域內(nèi)的技術(shù)人員而言,4艮明顯的是可以在脫離這些特定細(xì)節(jié)的 其他實(shí)施例中實(shí)施本發(fā)明。
此外,本領(lǐng)域內(nèi)的技術(shù)人員將會(huì)意識(shí)到,可以結(jié)合經(jīng)編程的微處理 器或通用計(jì)算機(jī)使用軟件功能并且/或者使用專用集成電路(ASIC)來(lái) 實(shí)現(xiàn)本說(shuō)明書的下文中所解釋的功能。本領(lǐng)域內(nèi)的技術(shù)人員還將意識(shí) 到,盡管本發(fā)明主要是以方法和設(shè)備的形式描述的,本發(fā)明也可被包含 在計(jì)算機(jī)程序產(chǎn)品以及包含計(jì)算機(jī)處理器以及耦合至該處理器的存儲(chǔ) 器的系統(tǒng)中,其中存儲(chǔ)器是以可以執(zhí)行本說(shuō)明書中所公開(kāi)的功能的 一個(gè) 或多個(gè)程序進(jìn)行編碼的。
本發(fā)明的基本概念是將待傳送的語(yǔ)音/音頻信號(hào)劃分為特定長(zhǎng)度的 片段。對(duì)于每個(gè)片段,面向感知的(perceptually oriented)截止頻率估 計(jì)器得出本地(每片段)適用的截止頻率fc,其導(dǎo)致定義的感知質(zhì)量損耗。這意味著,截止頻率估計(jì)器適于選擇由于頻帶限制而造成信號(hào)失真 的截止頻率,以至于用戶會(huì)感覺(jué)它們例如可容忍、基本聽(tīng)不到或者聽(tīng)不 到。
圖1圖示了根據(jù)本發(fā)明的發(fā)送器105和接收器165。分割設(shè)備110 將進(jìn)入的語(yǔ)音信號(hào)劃分為多個(gè)片段,并且截止頻率估計(jì)器優(yōu)選地根據(jù)感 知標(biāo)準(zhǔn)為每個(gè)片段得出截止頻率。感知標(biāo)準(zhǔn)旨在模擬人類感知并且被頻 繁應(yīng)用在語(yǔ)音和音頻信號(hào)的編碼中。根據(jù)感知標(biāo)準(zhǔn)進(jìn)行編碼意味著通過(guò) 應(yīng)用聽(tīng)力的心理聲學(xué)模型來(lái)進(jìn)行編碼。該心理聲學(xué)模型確定目標(biāo)噪聲成 形輪廓(shaping profile ),其中根據(jù)目標(biāo)噪聲成形輪廓對(duì)編碼噪聲進(jìn)行 成形以使得量化(或編碼)誤差對(duì)于人耳而言更難被聽(tīng)到。 一種簡(jiǎn)單的 心理聲學(xué)模型是許多語(yǔ)音編碼器的一部分,其在確定LPC綜合濾波器的
激勵(lì)信號(hào)的過(guò)程中應(yīng)用感知加權(quán)濾波器。音頻編解碼器通常采用更為復(fù) 雜的心理聲學(xué)模型,所述心理聲學(xué)模型可以包含頻率掩蔽,其例如使得 接近高功率譜分量的低功率譜分量不能被聽(tīng)到。心理聲學(xué)建模對(duì)于語(yǔ)音 和音頻編碼領(lǐng)域內(nèi)的技術(shù)人員而言是公知的。此后,低通濾波器120根 據(jù)截止頻率對(duì)這些片段進(jìn)行低通濾波。重采樣器130此后以根據(jù)感知截 止頻率而選擇的頻率(例如2fc)對(duì)片段進(jìn)行重采樣,從而產(chǎn)生幀135。 該頻率被直接傳送至接收器165或借助片段長(zhǎng)度被間接傳送至接收器 165。片萃殳長(zhǎng)度繼而對(duì)應(yīng)于兩個(gè)連續(xù)分組之間的時(shí)間標(biāo)記差,^f艮設(shè)使用 了 IP/UDP/RTP傳輸協(xié)議或類似協(xié)議、并且每個(gè)分組的一個(gè)編碼片段被 傳送。能夠注意到,片段長(zhǎng)度L與f。之間的關(guān)系是ls = nf/2fc,其中nf 等于樣本中的幀長(zhǎng)度。所述幀是到編碼器的輸入樣本的向量,編碼器對(duì) 其進(jìn)行操作。因而任意語(yǔ)音或音頻編解碼器的編碼器140對(duì)所述幀進(jìn)行 編碼,并且在信道170上對(duì)其進(jìn)行傳送。在接收器165處,使用解碼器 150對(duì)經(jīng)編碼的幀進(jìn)行解碼。在重采樣器160處對(duì)經(jīng)解碼的幀重采樣至 原始采樣頻率,從而產(chǎn)生重建的片段175。為實(shí)現(xiàn)這一目的,已經(jīng)用于 重采樣的頻率(例如2fc)必須如上所迷的那樣在接收器165處是可用/ 已知的。
根據(jù)一個(gè)實(shí)施例,將所使用的采樣頻率作為輔助信息參數(shù)直接傳 送。通常,為了限制其所需的比特率,需要對(duì)該參數(shù)進(jìn)行量化和編碼。 因此,分割和截止頻率估計(jì)器塊還包括用于此的量化和編碼實(shí)體。 一個(gè) 典型實(shí)施例是使用標(biāo)量量化器,并且將可能的截止頻率數(shù)目限制為例如
122或4的小數(shù)字,在此種情況下,1比特編碼或2比特編碼是可能的。
根據(jù)替代性實(shí)施例,所使用的采樣頻率是借助分割通過(guò)間接信號(hào)傳 輸(signalling)而傳送的。 一種方式是用信號(hào)通知所選擇(和量化的) 片段長(zhǎng)度。通常,截止頻率是借助關(guān)系式fc - nf/21s而從片段長(zhǎng)度得到的, 其將片段長(zhǎng)度ls與截止頻率2fc以及樣本中的幀長(zhǎng)度nf相聯(lián)系。另 一 間 接的可能性是通過(guò)使用一個(gè)IP/UDP/RTP分組的第一樣本和后續(xù)分組的 第一樣本的時(shí)間標(biāo)記來(lái)間接傳送所使用的采樣頻率,其中,假設(shè)以每個(gè) 分組一個(gè)經(jīng)編碼的片段的形式來(lái)進(jìn)行分組。因而,截止頻率估計(jì)器110 或者還適于將關(guān)于所估計(jì)的截止頻率的信息作為輔助信息參數(shù)直接傳 送到解碼器150,或者還適于通過(guò)使用當(dāng)前片段的第一樣本和后續(xù)片段 的第一樣本的時(shí)刻來(lái)將關(guān)于所估計(jì)的截止頻率的信息間接傳送到解碼
器150。
間接信號(hào)傳輸?shù)牧硪环绞绞鞘褂门c用于信號(hào)傳輸?shù)拿總€(gè)片段相關(guān) 聯(lián)的比特率。假設(shè)其中恒定比特率就每個(gè)幀的編碼而言可用的配置,低 比特率(每個(gè)時(shí)間間隔)對(duì)應(yīng)于長(zhǎng)片段并且因此低截止頻率,反之亦然。
個(gè)片段的起二時(shí)刻關(guān)聯(lián)起來(lái)。例如,每個(gè)經(jīng)編碼;段是在其:^時(shí)二之 后的預(yù)定義時(shí)間傳送的。此后,假設(shè)傳輸沒(méi)有引入過(guò)強(qiáng)的延遲抖動(dòng),能 夠在接收器處根據(jù)編碼片段的到達(dá)時(shí)間來(lái)得到相應(yīng)片段長(zhǎng)度。
以下過(guò)程例示了感知截止頻率和原始輸入信號(hào)的適應(yīng)性分割的導(dǎo)出。
1. 以某個(gè)初始片段長(zhǎng)度lo開(kāi)始,其可以是預(yù)定義的值(例如20 ms), 或其可以基于先前片段的長(zhǎng)度。
2. 提取具有長(zhǎng)度lo的片段,并且將其饋入感知截止頻率估計(jì)器,該 片段跟在先前片段的末端之后、起始于第一樣本。
3. 截止頻率估計(jì)器對(duì)該片段進(jìn)行頻率分析,其可基于例如LPC分 析,諸如FFT的某種頻域變換或通過(guò)使用濾波器組。
4. 計(jì)算并應(yīng)用感知標(biāo)準(zhǔn),其給出輸入信號(hào)的頻帶限制的感知(聽(tīng)得 到的)影響的指示。優(yōu)選地,其考慮將由后續(xù)編碼(包括可能的BWE) 引入的編碼噪聲。特別地,在強(qiáng)編碼噪聲的情況下(例如,由于低比特 率),輸入信號(hào)的頻帶限制的感知影響會(huì)更低,因此更能容忍較強(qiáng)的頻 帶限制。5. 確定頻率f。,上至該頻率fe的鐠含量需要被保持以便根據(jù)所計(jì)算 出的感知標(biāo)準(zhǔn)滿足預(yù)定義質(zhì)量水平。
6. 根據(jù)截止頻率與片段長(zhǎng)度之間的關(guān)系基于f。來(lái)重新調(diào)整片段長(zhǎng)
度,該關(guān)系通常是lf-iif/2fc,其中nf是后續(xù)編解碼器的幀長(zhǎng)度。
7. 終止分割算法終止,并且將片段和所識(shí)別的截止頻率傳播至后
續(xù)的處理塊。替代性地,如果所發(fā)現(xiàn)的片段長(zhǎng)度lf偏離初始片段長(zhǎng)度lo
的程度超出預(yù)定義距離,則可以修改分割。在這種情況下,為了提高截 止頻率估計(jì)的準(zhǔn)確度,以新的初始分割長(zhǎng)度lo-lf在步驟2中重進(jìn)入算 法。
注意如果截止頻率被量化并編碼,則該過(guò)程優(yōu)選地限于僅考慮可 能并且取自在量化之后可能的截止頻率的離散集的片段長(zhǎng)度。假設(shè)在量
化之后,P截止頻率的離散集i^(fc(i》i-L.p能夠被用信號(hào)通知,則必須
修改步驟1 、6和7以使得片段長(zhǎng)度取自片段長(zhǎng)度(l(i)) w...p的離散集1。 借助片段長(zhǎng)度與截止頻率之間的關(guān)系,集l繼而對(duì)應(yīng)于集尺
注意,當(dāng)修改編解碼器操作于其上的采樣頻率時(shí),內(nèi)部編解碼器狀 態(tài)通常受到影響。這些狀態(tài)因此必須從先前所使用的采樣頻率轉(zhuǎn)換至經(jīng) 修改的采樣頻率。通常,在編解碼器必須具有時(shí)域狀態(tài)的情況下,狀態(tài) 的該采樣率轉(zhuǎn)換能夠通過(guò)將其重采樣至經(jīng)改變的釆樣頻率來(lái)完成。
圖2示出了結(jié)合了帶寬擴(kuò)展(BWE)設(shè)備l卯的本發(fā)明。結(jié)合核心 解碼器150使用帶寬擴(kuò)展設(shè)備190允許在一定程度上降低對(duì)核心編解碼 器而言有效的感知截止頻率,以使得接收器中的BWE設(shè)備仍能夠適當(dāng) 地重建已去除的高頻含量。盡管核心編解碼器對(duì)上至截止頻率fc的低頻 帶進(jìn)行編碼/解碼,但是WE設(shè)備l卯促成了對(duì)fc到fs/2范圍內(nèi)的上頻 帶的再生。如圖2所示,也可結(jié)合核心編碼器140來(lái)實(shí)施BWE編碼器 設(shè)備180。
與專利US7050972中的方法相比并且與之不同,本實(shí)施例執(zhí)行對(duì)核 心編解碼器采樣頻率的適配。因此,其確保以臨界采樣數(shù)據(jù)最高效地操
作核心編解碼器。此外,相較于US7050972,關(guān)于核心編解碼器操作于 其上的采樣頻率,本發(fā)明沒(méi)有改變BWE交越頻率或者對(duì)BWE交越頻率 進(jìn)行適配。盡管本發(fā)明假設(shè)核心編碼器操作于上至截止頻率的整個(gè)頻 帶,但是專利US7050972預(yù)見(jiàn)了具有可變交越頻率的核心編碼器。 本發(fā)明可實(shí)施在開(kāi)環(huán)實(shí)施例和閉環(huán)實(shí)施例中。
14在開(kāi)環(huán)實(shí)施例中,截止頻率估計(jì)器根據(jù)某個(gè)感知標(biāo)準(zhǔn)來(lái)分析給定輸
入片段的屬性。其根椐該分析并且可能根據(jù)核心編解碼器和BWE的性 能的某一預(yù)期來(lái)確定將用于給定片段的截止頻率。特別地,該分析是在 分割和截止頻率過(guò)程的步驟4中完成的。
在閉環(huán)實(shí)施例中,如圖6中所示,分割和截止頻率過(guò)程中的步驟4 涉及BWE602、上采樣器603、頻帶合成器(combiner)(求和點(diǎn))604 和核心解碼器601的本地版本,其對(duì)可由接收器生成的所接收信號(hào)執(zhí)行 完整重建605。此后,編碼失真計(jì)算器606根據(jù)某個(gè)保真度標(biāo)準(zhǔn)將重建 信號(hào)與原始輸入語(yǔ)音信號(hào)進(jìn)行比較,所述保真度標(biāo)準(zhǔn)通常還包含感知標(biāo) 準(zhǔn)。如果根據(jù)所述保真度標(biāo)準(zhǔn),重建信號(hào)不夠好,則截止頻率估計(jì)器607 適于向上調(diào)整截止頻率并因此向上調(diào)整每個(gè)時(shí)間間隔所消耗的比特率, 以使得由編碼失真計(jì)算單元606所確定的編碼失真保持在某些預(yù)定義限 制內(nèi)。另一方面,如果信號(hào)質(zhì)量過(guò)好,則這表明為該片段使用了過(guò)多的 比特率。因此,能夠增加與降低的截止頻率和比特率相對(duì)應(yīng)的片段長(zhǎng)度。 應(yīng)當(dāng)注意到,閉環(huán)方案同樣適用于上述另 一實(shí)施例,但是沒(méi)有使用BWE。
在類似的實(shí)施例中,可々£設(shè)主BWE方案為核心編解碼器的一部分。 在這種情況下,采用次BWE可能是合適的,這又將重建頻帶從fc擴(kuò)展 到fs/2,并且對(duì)應(yīng)于圖2中的BWE 190塊。
存在一些優(yōu)選地會(huì)影響分割和截止頻率選擇的一般因素
■源輸入信號(hào)
可以根據(jù)某個(gè)檢測(cè)器決策(例如包含音樂(lè)/語(yǔ)音活動(dòng)檢測(cè)器)或根據(jù) 待編碼的媒體的先驗(yàn)知識(shí)(得自于元數(shù)據(jù))而獲得的信號(hào)類別(語(yǔ)音、 音樂(lè)、混合、休止(inactivity))。
從某個(gè)檢測(cè)器獲得的輸入信號(hào)的噪聲情況。例如,在存在背景噪聲 的情況下,能夠向下調(diào)整截止頻率以便減少該不想要的信號(hào)分量的量、 并且從而提升總體質(zhì)量。此外,響應(yīng)于背景噪聲情況而降低截止頻率是 一種減少用于不想要的信號(hào)分量的傳輸資源(比特率)浪費(fèi)的手段。
■目標(biāo)比特率
截止頻率可取決于可用于編碼的(可能)時(shí)變目標(biāo)比特率。通常, 較低的目標(biāo)比特率會(huì)引起選擇較低的截止頻率,反之亦然。 ■來(lái)自于接收端的反饋
截止頻率可取決于對(duì)傳輸信道的屬性和接收端情況的了解,其通常是通過(guò)某個(gè)后向信號(hào)傳輸信道而獲得的。例如,惡劣傳輸信道的指示會(huì) SI起降低截止頻率以便減少會(huì)凈皮傳輸錯(cuò)誤影響的譜信號(hào)含量、并且因此 改善接收器處所感知的質(zhì)量.此外,截止頻率的降低可對(duì)應(yīng)于所消耗的 比特率的降低,其在傳輸網(wǎng)絡(luò)中擁塞條件的情況下具有積極效果。
另 一來(lái)自于接收端的反饋可以包含關(guān)于接收端終端性能和信號(hào)重 放情況的信息。例如接收器處的低質(zhì)量信號(hào)重建的指示會(huì)引起降低截止 頻率以便避免浪費(fèi)傳輸比特率。
根據(jù)另一實(shí)施例,如圖3中所示,本發(fā)明應(yīng)用了線性預(yù)測(cè)編碼 (LPC)。圖3圖示了結(jié)合圖2所描述的發(fā)送器和接收器。特別地,LPC 設(shè)備301執(zhí)行LPC分析,LPC設(shè)備3 01是去除冗余的適應(yīng)性預(yù)測(cè)器。LPC 設(shè)備301可位于低通濾波120之前并且位于分割和截止頻率估計(jì)IIO之 后,或者位于分割和截止頻率估計(jì)110之前,從而產(chǎn)生被饋入重采樣設(shè) 備(即低通濾波器和下采樣器)的LPC殘留。LPC殘留是經(jīng)LPC分析 濾波器濾波的(語(yǔ)音)輸入。其也被稱為L(zhǎng)PC預(yù)測(cè)錯(cuò)誤信號(hào)。通過(guò)逆 LPC對(duì)頻帶合成器(即求和點(diǎn))所獲得的信號(hào)進(jìn)行綜合濾波,接收器生 成最終的輸出信號(hào)。描述片段的譜包絡(luò)并且可能描述增益因數(shù)的LPC參 數(shù)303被作為附加輔助信息傳送至接收器以用于LPC綜合302。該方法 的益處是因?yàn)長(zhǎng)PC分析是以原始采樣率fs完成的并且是在重采樣之前 完成的,其為接收器提供了對(duì)上至f;/2而非僅f。(如果LPC僅為核心編 解碼器的一部分,則是這樣)的完整語(yǔ)包絡(luò)(即包括上述實(shí)施例的BWE
頻帶)的準(zhǔn)確描述。所描述的借助LPC的方法具有積極效果BWE甚 至可以與例如僅包含簡(jiǎn)單的低復(fù)白噪聲發(fā)生器、折謙器(spectral folder) 或頻移器(調(diào)制器)的方案一樣簡(jiǎn)單。
根椐另一實(shí)施例,截止頻率和相關(guān)的信號(hào)重采樣頻率2f。是根據(jù)基 音頻率估計(jì)而選擇的。該實(shí)施例利用了以下事實(shí)有聲語(yǔ)音在基音頻率 或基本頻率方面是高度周期性的,其來(lái)源于在生成人類有聲語(yǔ)音期間的 周期性聲門激勵(lì)。根據(jù)圖4,現(xiàn)在選擇分割以及因此截止頻率以使得每 個(gè)片段401包含語(yǔ)音信號(hào)的一個(gè)周期或者整數(shù)倍周期。更具體地,語(yǔ)音 的基本頻率通常處于約IOO到400 Hz的范圍內(nèi),這對(duì)應(yīng)于10 ms下至 2.5ms的周期。如果語(yǔ)音信號(hào)無(wú)聲,則其缺少具有基音頻率的周期性。 在那種情況下,能夠根據(jù)對(duì)重采樣頻率的固定選擇來(lái)進(jìn)行分割,或者優(yōu) 選地,根據(jù)本文件中的任一 實(shí)施例來(lái)進(jìn)行分割和截止頻率選擇 相應(yīng)的分割考慮了基音同步操作,所述基音同步操作能使編碼算法 更為高效,原因是能夠更容易地利用語(yǔ)音周期性,并且對(duì)語(yǔ)音信號(hào)的各
種統(tǒng)計(jì)參數(shù)(例如增益或LPC參數(shù))的估計(jì)變得更為一致。
如上所述,本發(fā)明涉及一種音頻/語(yǔ)音發(fā)送器,并且涉及一種音頻/
語(yǔ)音接收器。此外,本發(fā)明還涉及用于音頻/語(yǔ)音發(fā)送器和音頻/語(yǔ)音接
收器的方法。圖5a的流程圖中圖示了發(fā)送器中的方法的實(shí)施例,并且
其包含以下步驟
501執(zhí)行將輸入語(yǔ)音信號(hào)初始分割為多個(gè)片段。
502為每個(gè)片段估計(jì)截止頻率,并且適于向解碼器傳送關(guān)于所估計(jì)
的截止頻率的信息。
502a根據(jù)截止頻率估計(jì)來(lái)重新調(diào)整分割。如果新的分割偏離先前
分割的程度超過(guò)閾值,則返回步驟502。
503以所述估計(jì)的截止頻率對(duì)每個(gè)片段進(jìn)行低通濾波。
504以與所述截止頻率相關(guān)的第二采樣頻率對(duì)經(jīng)濾波的片段進(jìn)行
重采樣,以便生成將被所述核心編碼器編碼的語(yǔ)音幀。
圖5b的流程圖中圖示了接收器中的方法,并且其包含以下步驟 505通過(guò)使用截止頻率估計(jì)的信息對(duì)經(jīng)解碼的語(yǔ)音幀進(jìn)行重采樣,
以生成輸出語(yǔ)音片段,其中所述信息接收自音頻/語(yǔ)音發(fā)送器,所述發(fā)送
器包括適于估計(jì)和傳送所述信息的截止頻率估計(jì)器。
盡管已經(jīng)針對(duì)特定實(shí)施例(包括某些設(shè)備配置和各種方法內(nèi)的某些
步驟次序)描述了本發(fā)明,但是本領(lǐng)域內(nèi)的技術(shù)人員會(huì)意識(shí)到,本發(fā)明
并不限于本說(shuō)明書中所描述和闡釋的特定實(shí)施例。因此,應(yīng)當(dāng)理解,本
公開(kāi)僅僅是闡釋性的。因而,本發(fā)明旨在僅由所附權(quán)利要求的范圍限定。
權(quán)利要求
1. 一種音頻/語(yǔ)音發(fā)送器(105),包括適于對(duì)輸入音頻/語(yǔ)音信號(hào)的核心頻帶進(jìn)行編碼的核心編碼器,所述核心編碼器對(duì)包含預(yù)定數(shù)目樣本的輸入音頻/語(yǔ)音信號(hào)的幀進(jìn)行操作,所述輸入音頻/語(yǔ)音信號(hào)具有第一采樣頻率,并且核心頻帶包含上至截止頻率的頻率,其特征在于音頻/語(yǔ)音發(fā)送器(105)還包括-分割設(shè)備(110),適于執(zhí)行將輸入音頻/語(yǔ)音信號(hào)分割為多個(gè)片段,其中每個(gè)片段具有適應(yīng)性片段長(zhǎng)度,-截止頻率估計(jì)器(110),適于為與適應(yīng)性片段長(zhǎng)度相關(guān)聯(lián)的每個(gè)片段估計(jì)截止頻率,并且適于向解碼器傳送關(guān)于估計(jì)的截止頻率的信息,-低通濾波器(120),適于以所述估計(jì)的截止頻率對(duì)每個(gè)片段進(jìn)行濾波,以及-重采樣器(130),適于以與所述截止頻率相關(guān)的第二采樣頻率對(duì)經(jīng)濾波的片段進(jìn)行重采樣,以便生成將被所述核心編碼器(140)編碼的預(yù)定數(shù)目的樣本的音頻/語(yǔ)音幀。
2. 根據(jù)權(quán)利要求1所迷的音頻/語(yǔ)音發(fā)送器(105),其特征在于截 止頻率估計(jì)器(110)適于根據(jù)感知標(biāo)準(zhǔn)來(lái)分析給定輸入片段的屬性, 以基于所述分析來(lái)確定將被用于給定片段的截止頻率。
3. 根據(jù)權(quán)利要求1-2中任一權(quán)利要求所述的音頻/語(yǔ)音發(fā)送器(105 ), 其特征在于截止頻率估計(jì)器(110)還適于提供截止頻率的量化估計(jì)。
4. 根據(jù)權(quán)利要求1-3中任一權(quán)利要求所述的音頻/語(yǔ)音發(fā)送器(105 ), 其特征在于截止頻率估計(jì)器(110)還適于將關(guān)于估計(jì)的截止頻率的信 息作為輔助信息參數(shù)直接傳送到解碼器。
5. 根據(jù)權(quán)利要求1-3中任一權(quán)利要求所述的音頻/語(yǔ)音發(fā)送器(105 ), 其特征在于截止頻率估計(jì)器(110)還適于借助分割通過(guò)間接信號(hào)傳輸 來(lái)向解碼器傳送關(guān)于估計(jì)的截止頻率的信息。
6. 根據(jù)權(quán)利要求5所述的音頻/語(yǔ)音發(fā)送器(105),其特征在于截 止頻率估計(jì)器(110)還適于將每個(gè)片段的長(zhǎng)度用于間接信號(hào)傳輸。
7. 根椐權(quán)利要求5所述的音頻/語(yǔ)音發(fā)送器(105),其特征在于截 止頻率估計(jì)器(110)還適于將與每個(gè)片段相關(guān)聯(lián)的比特率用于間接信 號(hào)傳輸。
8. 根據(jù)權(quán)利要求5所迷的音頻/語(yǔ)音發(fā)送器(105),其特征在于截 止頻率估計(jì)器(110)還適于通過(guò)使用當(dāng)前片段的第一樣本和后續(xù)片段 的第一樣本的時(shí)刻來(lái)間接向解碼器傳送關(guān)于估計(jì)的截止頻率的信息。
9. 根據(jù)權(quán)利要求1-8中任一權(quán)利要求所述的音頻/語(yǔ)音發(fā)送器(105 ), 其特征在于其包括線性預(yù)測(cè)設(shè)備(301 ),所述線性預(yù)測(cè)設(shè)備位于低通 濾波器(120)之前且位于分割設(shè)備(110)和截止頻率估計(jì)器(110) 之后,并且適于產(chǎn)生被饋入重采樣器中的LPC殘留。
10. 根據(jù)權(quán)利要求1-8中任一權(quán)利要求所迷的音頻/語(yǔ)音發(fā)送器 (105),其特征在于其包括線性預(yù)測(cè)設(shè)備(301 ),所述線性預(yù)測(cè)設(shè)備位于分割設(shè)備和截止頻率估計(jì)器之前,并且適于產(chǎn)生被饋入分割設(shè)備 (110)中的LPC殘留。
11. 根據(jù)權(quán)利要求1-10中任一權(quán)利要求所述的音頻/語(yǔ)音發(fā)送器 (105),其特征在于截止頻率和第二釆樣頻率中的至少一個(gè)是根據(jù)基音頻率估計(jì)而選擇的。
12. 根據(jù)權(quán)利要求1所述的音頻/語(yǔ)音發(fā)送器(105),其特征在于 其包括用于生成與接收器(165)的輸出信號(hào)相關(guān)的信號(hào)的裝置。
13. 根據(jù)權(quán)利要求12所述的音頻/語(yǔ)音發(fā)送器(105 ),其特征在于 其包括上采樣器(603 )和核心解碼器(601)的本地版本,適于對(duì)所接 收的信號(hào)執(zhí)行完整重建,其還包括編碼失真計(jì)算器(606),所述編碼 失真計(jì)算器(606)適于根據(jù)某個(gè)保真度標(biāo)準(zhǔn)將重建信號(hào)與原始輸入語(yǔ) 音信號(hào)進(jìn)行比較,由此如果根據(jù)所述保真度標(biāo)準(zhǔn),重建信號(hào)不夠好,則 截止頻率估計(jì)器(110)適于向上調(diào)整截止頻率以及每個(gè)時(shí)間間隔所消 耗的比特率,以使得編碼失真保持在某些預(yù)定義限制內(nèi),并且如果信號(hào) 質(zhì)量過(guò)好,則截止頻率估計(jì)器(110)適于增加與降低的截止頻率和比 特率相對(duì)應(yīng)的片段的長(zhǎng)度。
14. 根據(jù)權(quán)利要求12所述的音頻/語(yǔ)音發(fā)送器(105 ),其特征在于 其還包括頻帶合成器(604)和帶寬擴(kuò)展設(shè)備(602)的本地版本,適于 對(duì)所接收的包括由BWE重建的高頻帶在內(nèi)的信號(hào)執(zhí)行完整重建。
15. —種適于對(duì)所接收的經(jīng)編碼的音頻/語(yǔ)音信號(hào)進(jìn)行解碼的音頻/ 語(yǔ)音接收器(165),其特征在于其包括重采樣器(160),所述重采樣 器適于通過(guò)使用截止頻率估計(jì)的信息(162)對(duì)經(jīng)解碼的音頻/語(yǔ)音幀進(jìn) 行重采樣以生成輸出語(yǔ)音片段,其中所述信息接收自音頻/語(yǔ)音發(fā)送器,所述音頻/語(yǔ)音發(fā)送器包括適于生成和傳送所述信息的截止頻率估計(jì)器。
16. 根據(jù)權(quán)利要求15所述的音頻/語(yǔ)音接收器(165),其特征在于 其包括適于重建估計(jì)的截止頻率之上的頻率的至少一個(gè)帶寬擴(kuò)展設(shè)備(190)。
17. 根據(jù)權(quán)利要求15-16中任一權(quán)利要求所述的音頻/語(yǔ)音接收器 (165),其特征在于其還適于將關(guān)于估計(jì)的截止頻率的信息作為輔助信息參數(shù)直接接收。
18. 根據(jù)權(quán)利要求15-17中任一權(quán)利要求所述的音頻/語(yǔ)音接收器 (165),其特征在于其適于借助分割通過(guò)間接信號(hào)傳輸來(lái)接收關(guān)于估計(jì)的截止頻率的信息。
19. 根據(jù)權(quán)利要求18所述的音頻/語(yǔ)音接收器(165),其特征在于 其適于接收所選擇的且量化的片段長(zhǎng)度。
20. 根據(jù)權(quán)利要求18所述的音頻/語(yǔ)音接收器(165),其特征在于 其適于接收與每個(gè)片段相關(guān)聯(lián)的比特率以用于間接信號(hào)傳輸。
21. 根據(jù)權(quán)利要求18所述的音頻/語(yǔ)音接收器(165 ),其特征在于 其還適于通過(guò)當(dāng)前片段的第一樣本和后續(xù)片段的第一樣本的時(shí)刻接收 關(guān)于估計(jì)的截止頻率的信息。
22. —種音頻/語(yǔ)音發(fā)送器中的方法,所述發(fā)送器包括適于對(duì)輸入音 頻/語(yǔ)音信號(hào)的核心頻帶進(jìn)行編碼的核心編碼器,所述核心編碼器對(duì)包含 預(yù)定數(shù)目樣本的輸入音頻/語(yǔ)音信號(hào)的幀進(jìn)行操作,所述輸入音頻/語(yǔ)音 信號(hào)具有第一采樣頻率,并且核心頻帶包含上至截止頻率的頻率,其特征在于-將輸入音頻/語(yǔ)音信號(hào)分割(501)為多個(gè)片段,其中每個(gè)片段具 有適應(yīng)性片段長(zhǎng)度,-為與適應(yīng)性片段長(zhǎng)度相關(guān)聯(lián)的每個(gè)片段估計(jì)(502 )截止頻率并 適于向解碼器傳送關(guān)于估計(jì)的截止頻率的信息,-以所述估計(jì)的截止頻率對(duì)每個(gè)片段進(jìn)行低通濾波(503),以及 -以與所述截止頻率相關(guān)的笫二采樣頻率對(duì)經(jīng)濾波的片段進(jìn)行重采樣(504),以便生成將被所述核心編碼器(140)編碼的預(yù)定數(shù)目的樣本的音頻/語(yǔ)音幀。
23. 根據(jù)權(quán)利要求22所述的方法,其特征在于另外的步驟 -根據(jù)感知標(biāo)準(zhǔn)來(lái)分析給定輸入片段的屬性,以基于所述分析確定將被用于給定片段的截止頻率。
24. 根據(jù)權(quán)利要求22-23中任一權(quán)利要求所述的方法,其特征在于 另外的步驟-根據(jù)截止頻率估計(jì)來(lái)重新調(diào)整(502a)分段。
25. 根據(jù)權(quán)利要求22-24中任一權(quán)利要求所述的方法,其特征在于 另外的步驟-將關(guān)于估計(jì)的截止頻率的信息作為輔助信息參數(shù)直接傳送到解 碼器。
26. 根據(jù)權(quán)利要求22-25中任一權(quán)利要求所述的方法,其特征在于 另外的步驟-借助分割向解碼器間接傳送關(guān)于估計(jì)的截止頻率的信息。
27. 根據(jù)權(quán)利要求22-26中任一權(quán)利要求所述的方法,其特征在于 另外的步驟-在低通濾波之前且在分割和截止頻率估計(jì)之后,產(chǎn)生被饋入重采 樣器中的LPC殘留。
28. 根據(jù)權(quán)利要求22-27中任一權(quán)利要求所述的方法,其特征在于 另外的步驟-在分割和截止頻率估計(jì)之前,產(chǎn)生被饋入分割步驟的LPC殘留。
29. 根據(jù)權(quán)利要求22-28中任一權(quán)利要求所述的方法,其特征在于 截止頻率和第二采樣頻率中的至少一個(gè)是根據(jù)基音頻率估計(jì)而選擇的。
30. 根據(jù)權(quán)利要求22所述的方法,其特征在于另外的步驟生成 與接收器(165)的輸出信號(hào)相關(guān)的信號(hào)。
31. 根據(jù)權(quán)利要求30所述的方法,其特征在于另外的步驟 對(duì)所接收的信號(hào)執(zhí)行完整重建,根據(jù)某個(gè)保真度標(biāo)準(zhǔn)將重建信號(hào)與原始輸入語(yǔ)音信號(hào)進(jìn)行比較,由此如果根據(jù)所述保真度標(biāo)準(zhǔn),重建信號(hào) 不夠好,則向上調(diào)整截止頻率以及每個(gè)時(shí)間間隔所消耗的比特率,以使 得編碼失真保持在某些預(yù)定義限制內(nèi),并且如果信號(hào)質(zhì)量過(guò)好,則增加 與降低的截止頻率和比特率相對(duì)應(yīng)的片段的長(zhǎng)度。
32. 根據(jù)權(quán)利要求30所述的方法,其特征在于另外的步驟 對(duì)所接收的包括由BWE重建的高頻帶在內(nèi)的信號(hào)執(zhí)行完整重建。
33. —種用于對(duì)所接收的經(jīng)編碼的音頻/語(yǔ)音信號(hào)進(jìn)行解碼的音頻/ 語(yǔ)音接收器中的方法,其特征在于以下步驟-通過(guò)使用截止頻率估計(jì)的信息來(lái)對(duì)經(jīng)解碼的音頻/語(yǔ)音幀進(jìn)行重采樣(505 )以生成輸出音頻/語(yǔ)音片段,其中所述信息接收自音頻/語(yǔ)音 發(fā)送器,所述音頻/語(yǔ)音發(fā)送器包括適于生成和傳送所述信息的截止頻率 估計(jì)器。
34. 根據(jù)權(quán)利要求33所述的方法,其特征在于另外的步驟-通過(guò)至少一個(gè)帶寬擴(kuò)展設(shè)備對(duì)估計(jì)的截止頻率之上的頻率進(jìn)行 重建。
35. 根據(jù)權(quán)利要求33-34中任一權(quán)利要求所述的音頻/語(yǔ)音接收器 (165),其特征在于其還適于將關(guān)于估計(jì)的截止頻率的信息作為輔助信息參數(shù)直接接收。
36. 根據(jù)權(quán)利要求33-34中任一權(quán)利要求所述的音頻/語(yǔ)音接收器 (165),其特征在于其適于借助分割通過(guò)間接信號(hào)傳輸來(lái)接收關(guān)于估計(jì)的截止頻率的信息。
全文摘要
本發(fā)明涉及一種音頻/語(yǔ)音發(fā)送器和一種音頻/語(yǔ)音接收器及其方法。音頻/語(yǔ)音發(fā)送器包括核心編碼器,所述核心編碼器適于對(duì)具有第一采樣頻率的輸入音頻/語(yǔ)音信號(hào)的核心頻帶進(jìn)行編碼,其中核心頻帶包含上至截止頻率的頻率。音頻/語(yǔ)音發(fā)送器還包括分割設(shè)備,其適于執(zhí)行將輸入音頻/語(yǔ)音信號(hào)分割成多個(gè)片段;截止頻率估計(jì)器,其適于為每個(gè)片段估計(jì)截止頻率并且適于向解碼器傳送關(guān)于估計(jì)的截止頻率的信息;低通濾波器,其適于以所述估計(jì)的截止頻率對(duì)每個(gè)片段進(jìn)行濾波;以及重采樣器,其適于以與所述截止頻率相關(guān)的第二采樣頻率對(duì)經(jīng)濾波的片段進(jìn)行重采樣,以便生成將被所述核心編碼器編碼的音頻/語(yǔ)音幀。
文檔編號(hào)G10L19/24GK101512639SQ200680055842
公開(kāi)日2009年8月19日 申請(qǐng)日期2006年9月13日 優(yōu)先權(quán)日2006年9月13日
發(fā)明者S·布魯恩 申請(qǐng)人:艾利森電話股份有限公司