專利名稱:用于使用多個麥克風進行上下文處理的系統(tǒng)、方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及話音信號的處理。
背景技術(shù):
用于語音信號的通信及/或存儲的應(yīng)用通常使用麥克風來捕獲包括主揚聲器語 音的聲音的音頻信號。音頻信號的表示語音的部分稱為話音或話音分量。所捕獲的音頻信 號常常還將包括來自麥克風的周圍聲學(xué)環(huán)境的(例如背景聲音)的其它聲音。音頻信號的 此部分稱為上下文或上下文分量。例如話音及音樂的音頻信息通過數(shù)字技術(shù)的傳輸已變得廣泛,尤其是在長途電 話、例如基于IP的語音傳輸(還稱為VoIP,其中IP指示因特網(wǎng)協(xié)議)的包交換電話,及例 如蜂窩式電話的數(shù)字無線電電話中。此種增長已導(dǎo)致對減少用以經(jīng)由傳輸信道傳送語音通 信的信息的量且同時維持重建話音的所感知質(zhì)量的興趣。舉例來說,需要最佳地使用可用 無線系統(tǒng)帶寬。有效使用系統(tǒng)帶寬的一種方式為采用信號壓縮技術(shù)。對于攜載話音信號的 無線系統(tǒng)來說,出于此目的起見,通常采用話音壓縮(或“話音譯碼”)技術(shù)。經(jīng)配置以通過提取與人話音產(chǎn)生的模型有關(guān)的參數(shù)而壓縮話音的裝置常常稱為 語音譯碼器、編解碼器、聲碼器、“音頻譯碼器”或“話音譯碼器”,且以下描述可互換地使用 這些術(shù)語。話音譯碼器通常包括話音編碼器及話音解碼器。編碼器通常作為一系列稱為 “幀”的樣本塊接收數(shù)字音頻信號,分析每一幀以提取某些相關(guān)參數(shù),且將參數(shù)量化為經(jīng)編 碼幀。經(jīng)編碼幀經(jīng)由傳輸信道(即,有線或無線網(wǎng)絡(luò)連接)傳輸?shù)桨ń獯a器的接收器?;?者,經(jīng)編碼音頻信號可經(jīng)存儲以供在以后時間進行檢索及解碼。解碼器接收且處理經(jīng)編碼 幀、對其進行反量化以產(chǎn)生參數(shù),且使用反量化參數(shù)重新創(chuàng)建話音幀。在典型通話中,每一揚聲器靜默約百分之六十的時間。話音編碼器常常經(jīng)配置以 區(qū)分含有話音的音頻信號的幀(“活動幀”)與僅含有上下文或靜默的音頻信號的幀(“非 活動幀”)。所述編碼器可經(jīng)配置以使用不同譯碼模式及/或速率來編碼活動與非活動幀。 舉例來說,非活動幀通常感知為攜載極少或不攜載信息,且話音編碼器常常經(jīng)配置以使用 比編碼活動幀少的位(即,較低位速率)來編碼非活動幀。用以編碼活動幀的位速率的實例包括每幀171個位、每幀80個位及每幀40個位。 用以編碼非活動幀的位速率的實例包括每幀16個位。在蜂窩式電話系統(tǒng)(尤其是依照如 由電信工業(yè)協(xié)會(弗吉尼亞州,阿靈頓(Arlington,VA))發(fā)布的臨時標準(IS)_95(或類似 工業(yè)標準)的系統(tǒng))的上下文中,這四個位速率還分別稱為“全速率”、“半速率”、“四分之一速率”及“八分之一速率”。
發(fā)明內(nèi)容
此文件描述一種處理包括第一音頻上下文的數(shù)字音頻信號的方法。此方法包括抑 制來自所述數(shù)字音頻信號的第一音頻上下文,基于由第一麥克風產(chǎn)生的第一音頻信號來獲 得上下文受抑制信號。此方法還包括將第二音頻上下文與基于上下文受抑制信號的信號進 行混合以獲得上下文經(jīng)增強信號。在此方法中,數(shù)字音頻信號是基于由不同于第一麥克風 的第二麥克風產(chǎn)生的第二音頻信號。此文件還描述與此方法有關(guān)的設(shè)備、裝置的組合及計 算機可讀媒體。此文件還描述一種處理基于從第一轉(zhuǎn)變器接收的信號的數(shù)字音頻信號的方法。此 方法包括抑制來自數(shù)字音頻信號的第一音頻上下文以獲得上下文受抑制信號;將第二音頻 上下文與基于上下文受抑制信號的信號進行混合以獲得上下文經(jīng)增強信號;將基于(A)第 二音頻上下文及(B)上下文經(jīng)增強信號中的至少一者的信號轉(zhuǎn)換為模擬信號;及使用第二 轉(zhuǎn)變器來產(chǎn)生基于模擬信號的可聽信號(audible signal) 0在此方法中,第一轉(zhuǎn)變器及第 二轉(zhuǎn)變器兩者位于共同外殼內(nèi)。此文件還描述與此方法有關(guān)的設(shè)備、裝置的組合及計算機 可讀媒體。此文件還描述一種處理經(jīng)編碼音頻信號的方法。此方法包括根據(jù)第一譯碼方案 解碼經(jīng)編碼音頻信號的第一多個經(jīng)編碼幀以獲得包括話音分量及上下文分量的第一經(jīng)解 碼音頻信號;根據(jù)第二譯碼方案解碼經(jīng)編碼音頻信號的第二多個經(jīng)編碼幀以獲得第二經(jīng)解 碼音頻信號;及基于來自第二經(jīng)解碼音頻信號的信息,抑制來自基于第一經(jīng)解碼音頻信號 的第三信號的上下文分量以獲得上下文受抑制信號。此文件還描述與此方法有關(guān)的設(shè)備、 裝置的組合及計算機可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數(shù)字音頻信號的方法。此方 法包括抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號;對基于上下文受 抑制信號的信號進行編碼以獲得經(jīng)編碼音頻信號;選擇多個音頻上下文中的一者;及將與 所選音頻上下文有關(guān)的信息插入于基于經(jīng)編碼音頻信號的信號中。此文件還描述與此方法 有關(guān)的設(shè)備、裝置的組合及計算機可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數(shù)字音頻信號的方法。此方 法包括抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號;對基于上下文受抑 制信號的信號進行編碼以獲得經(jīng)編碼音頻信號;經(jīng)由第一邏輯信道將經(jīng)編碼音頻信號發(fā)送 到第一實體;及經(jīng)由不同于第一邏輯信道的第二邏輯信道向第二實體發(fā)送(A)音頻上下文 選擇信息及(B)識別第一實體的信息。此文件還描述與此方法有關(guān)的設(shè)備、裝置的組合及 計算機可讀媒體。此文件還描述一種處理經(jīng)編碼音頻信號的方法。此方法包括在移動用戶終端內(nèi)解 碼經(jīng)編碼音頻信號以獲得經(jīng)解碼音頻信號;在移動用戶終端內(nèi)產(chǎn)生音頻上下文信號;及在 移動用戶終端內(nèi),將基于音頻上下文信號的信號與基于經(jīng)解碼音頻信號的信號進行混合。 此文件還描述與此方法有關(guān)的設(shè)備、裝置的組合及計算機可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數(shù)字音頻信號的方法。此方 法包括抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號;產(chǎn)生基于第一濾波器及第一多個序列的音頻上下文信號,所述第一多個序列中的每一者具有不同的時間分 辨率;及將基于所產(chǎn)生音頻上下文信號的第一信號與基于上下文受抑制信號的第二信號進 行混合以獲得上下文經(jīng)增強信號。在此方法中,產(chǎn)生音頻上下文信號包括將第一濾波器應(yīng) 用到第一多個序列中的每一者。此文件還描述與此方法有關(guān)的設(shè)備、裝置的組合及計算機 可讀媒體。此文件還描述一種處理包括話音分量及上下文分量的數(shù)字音頻信號的方法。此方 法包括抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號;產(chǎn)生音頻上下文 信號;將基于所產(chǎn)生音頻上下文信號的第一信號與基于上下文受抑制信號的第二信號進行 混合以獲得上下文經(jīng)增強信號;及計算基于數(shù)字音頻信號的第三信號的電平。在此方法中, 產(chǎn)生及混合中的至少一者包括基于第三信號的所計算電平控制第一信號的電平。此文件還 描述與此方法有關(guān)的設(shè)備、裝置的組合及計算機可讀媒體。此文件還描述一種根據(jù)處理控制信號的狀態(tài)來處理數(shù)字音頻信號的方法,其中數(shù) 字音頻信號具有話音分量及上下文分量。此方法包括在處理控制信號具有第一狀態(tài)時以第 一位速率對缺少話音分量的數(shù)字音頻信號部分的幀進行編碼。此方法包括在處理控制信號 具有不同于第一狀態(tài)的第二狀態(tài)時抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受 抑制信號。此方法包括在處理控制信號具有第二狀態(tài)時將音頻上下文信號與基于上下文受 抑制信號的信號進行混合以獲得上下文經(jīng)增強信號。此方法包括在處理控制信號具有第二 狀態(tài)時以第二位速率對缺少話音分量的上下文經(jīng)增強信號部分的幀進行編碼,其中第二位 速率高于第一位速率。此文件還描述與此方法有關(guān)的設(shè)備、裝置的組合及計算機可讀媒體。
圖IA展示話音編碼器XlO的框圖。圖IB展示話音編碼器XlO的實施方案X20的框圖。
圖2展示決策樹的一個實例。圖3A展示根據(jù)一般配置的設(shè)備XlOO的框圖。圖3B展示上下文處理器100的實施方案102的框圖。圖3C-圖3F展示便攜式或免提式裝置中兩個麥克風KlO及K20的各種安裝配置, 且圖3G展示上下文處理器102的實施方案102A的框圖。圖4A展示設(shè)備XlOO的實施方案X102的框圖。圖4B展示上下文處理器104的實施方案106的框圖。圖5A說明音頻信號與編碼器選擇操作之間的各種可能的相關(guān)性。圖5B說明音頻信號與編碼器選擇操作之間的各種可能的相關(guān)性。圖6展示設(shè)備XlOO的實施方案XllO的框圖。圖7展示設(shè)備XlOO的實施方案X120的框圖。圖8展示設(shè)備XlOO的實施方案X130的框圖。圖9A展示上下文產(chǎn)生器120的實施方案122的框圖。圖9B展示上下文產(chǎn)生器122的實施方案124的框圖。圖9C展示上下文產(chǎn)生器122的另一實施方案126的框圖。圖9D展示用于產(chǎn)生所產(chǎn)生上下文信號S50的方法MlOO的流程圖。
圖10展示多分辨上下文合成的過程的圖。圖IlA展示上下文處理器102的實施方案108的框圖。圖IlB展示上下文處理器102的實施方案109的框圖。圖12A展示話音解碼器RlO的框圖。圖12B展示話音解碼器RlO的實施方案R20的框圖。圖13A展示上下文混合器190的實施方案192的框圖。圖13B展示根據(jù)一配置的設(shè)備RlOO的框圖。圖14A展示上下文處理器200的實施方案的框圖。圖14B展示設(shè)備RlOO的實施方案RllO的框圖。圖15展示根據(jù)一配置的設(shè)備R200的框圖。圖16展示設(shè)備XlOO的實施方案X200的框圖。圖17展示設(shè)備XlOO的實施方案X210的框圖。圖18展示設(shè)備XlOO的實施方案X220的框圖。圖19展示根據(jù)所揭示配置的設(shè)備X300的框圖。圖20展示設(shè)備X300的實施方案X310的框圖。圖21A展示從服務(wù)器下載上下文信息的實例。圖21B展示將上下文信息下載到解碼器的實例。圖22展示根據(jù)所揭示配置的設(shè)備R300的框圖。圖23展示設(shè)備R300的實施方案R310的框圖。圖24展示設(shè)備R300的實施方案R320的框圖。圖25A展示根據(jù)所揭示配置的方法AlOO的流程圖。圖25B展示根據(jù)所揭示配置的設(shè)備AM100的框圖。圖26A展示根據(jù)所揭示配置的方法BlOO的流程圖。圖26B展示根據(jù)所揭示配置的設(shè)備BM100的框圖。圖27A展示根據(jù)所揭示配置的方法ClOO的流程圖。圖27B展示根據(jù)所揭示配置的設(shè)備CM100的框圖。圖28A展示根據(jù)所揭示配置的方法DlOO的流程圖。圖28B展示根據(jù)所揭示配置的設(shè)備DM100的框圖。圖29A展示根據(jù)所揭示配置的方法ElOO的流程圖。圖29B展示根據(jù)所揭示配置的設(shè)備EM100的框圖。圖30A展示根據(jù)所揭示配置的方法E200的流程圖。圖30B展示根據(jù)所揭示配置的設(shè)備EM200的框圖。圖31A展示根據(jù)所揭示配置的方法FlOO的流程圖。圖3IB展示根據(jù)所揭示配置的設(shè)備FM100的框圖。圖32A展示根據(jù)所揭示配置的方法GlOO的流程圖。圖32B展示根據(jù)所揭示配置的設(shè)備GM100的框圖。圖33A展示根據(jù)所揭示配置的方法HlOO的流程圖。圖33B展示根據(jù)所揭示配置的設(shè)備HM100的框圖。在這些圖中,相同參考標號指代相同或類似元件。
具體實施例方式盡管音頻信號的話音分量通常攜載主要信息,但上下文分量也在例如電話的語音 通信應(yīng)用中起重要作用。由于上下文分量存在于活動及非活動幀兩者期間,所以其在非活 動幀期間的連續(xù)重現(xiàn)對于在接收器處提供連續(xù)性及連通性是重要的。上下文分量的重現(xiàn)質(zhì) 量可能對于逼真度及整體所感知質(zhì)量也是重要的,尤其對于嘈雜環(huán)境中使用的免提式終端 來說。例如蜂窩式電話的移動用戶終端允許語音通信應(yīng)用擴展到比先前更多的位置。結(jié) 果,可能遭遇的不同音頻上下文的數(shù)目增加?,F(xiàn)存語音通信應(yīng)用通常將上下文分量視作噪 聲,但一些上下文比其它上下文更結(jié)構(gòu)化,且可能更難可辨別地進行編碼。在一些情形下,可能需要抑制及/或掩蔽音頻信號的上下文分量。出于安全原因, 舉例來說,可能需要在傳輸或存儲之前從音頻信號移除上下文分量?;蛘?,可能需要向音頻 信號添加不同上下文。舉例來說,可能需要造成揚聲器在不同位置處及/或在不同環(huán)境中 的錯覺。本文揭示的配置包括可應(yīng)用于語音通信及/或存儲應(yīng)用中以移除、增強及/或取 代現(xiàn)存音頻上下文的系統(tǒng)、方法及設(shè)備。明確地預(yù)期且特此揭示,本文揭示的配置可適合用 于包交換式網(wǎng)絡(luò)(舉例來說,根據(jù)例如VoIP的協(xié)議布置以攜載語音傳輸?shù)挠芯€及/或無線 網(wǎng)絡(luò))及/或電路交換式網(wǎng)絡(luò)中。還死明確地預(yù)期且特此揭示,本文揭示的配置可適合用 于窄帶譯碼系統(tǒng)(例如,編碼約四千赫茲或五千赫茲的音頻頻率范圍的系統(tǒng))中及用于寬 帶譯碼系統(tǒng)(例如,編碼大于五千赫茲的音頻頻率的系統(tǒng))中,包括全頻帶譯碼系統(tǒng)及分離 頻帶譯碼系統(tǒng)。除非明確由其上下文限制,否則術(shù)語“信號”在本文中用來指示其普通意義中的任 一者,包括如導(dǎo)線、總線或其它傳輸媒體上表達的存儲器位置(或存儲器位置的集合)的狀 態(tài)。除非明確由其上下文限制,否則術(shù)語“產(chǎn)生”在本文用來指示其普通意義中的任一者, 例如計算或以其它方式產(chǎn)生。除非明確由其上下文限制,否則術(shù)語“計算”在本文用來指示 其普通意義中的任一者,例如計算、估計及/或從一組值進行選擇。除非明確由其上下文限 制,否則術(shù)語“獲得”用來指示其普通意義中的任一者,例如計算、導(dǎo)出、接收(例如,從外部 裝置)及/或檢索(例如,從存儲元件陣列)。在術(shù)語“包含”用于本發(fā)明描述及權(quán)利要求 書中時,其并不排除其它元件或操作。術(shù)語“基于”(如在“A基于B”中)用來指示其普通 意義中的任一者,包括以下情形(i) “至少基于”(例如,“Α至少基于B”),及(ii) “等同 于”(例如,"A等同于B”)(在特定上下文中適當?shù)那闆r下)。除非另外指示,否則具有特定特征的設(shè)備的操作的任何揭示內(nèi)容還明確地打算 揭示具有類似特征的方法(且反之亦然),且根據(jù)特定配置的設(shè)備的操作的任何揭示內(nèi)容 也明確地打算揭示根據(jù)類似配置的方法(且反之亦然)。除非另外指示,否則術(shù)語“上下 文”(或“音頻上下文”)用來指示音頻信號的不同于話音分量且傳達來自揚聲器的周圍環(huán) 境的音頻信息的分量,且術(shù)語“噪聲”用來指示音頻信號中并非話音分量的部分且不傳達來 自揚聲器的周圍環(huán)境的信息的任何其它假象。出于話音譯碼目的,話音信號通常經(jīng)數(shù)字化(或量化)以獲得樣本流。可根據(jù)此 項技術(shù)中已知的各種方法(包括,例如,脈碼調(diào)制(PCM)、壓擴μ律PCM及壓擴A律PCM)中 的任一者執(zhí)行數(shù)字化處理。窄帶話音編碼器通常使用8kHz的取樣速率,而寬帶話音編碼器通常使用更高的取樣速率(例如,12或16kHz)。將經(jīng)數(shù)字化的話音信號處理為一系列幀。此系列通常實施為非重疊系列,但處理 幀或幀片段(還稱為子幀)的操作還可包括其輸入中的一個或一個以上鄰近幀的片段。話 音信號的幀通常足夠短從而信號的頻譜包絡(luò)可預(yù)期在幀上保持相對固定。幀通常對應(yīng)于話 音信號的5與35毫秒(或約40到200個樣本)之間,其中10、20及30毫秒為常見的幀大 小。通常所有幀具有相同的長度,且在本文描述的特定實例中假定均勻幀長度。然而,還明 確地預(yù)期且特此揭示,可使用非均勻幀長度。20毫秒的幀長度在七千赫茲(kHz)的取樣速率下對應(yīng)于140個樣本,在8kHz的取 樣速率下對應(yīng)于160個樣本,且在16kHz的取樣速率下對應(yīng)于320個樣本,但可使用認為適 于特定應(yīng)用的任何取樣速率??捎糜谠捯糇g碼的取樣速率的另一實例為12. 8kHz,且另外的 實例包括從12. 8kHz到38. 4kHz的范圍中的其它速率。圖IA展示經(jīng)配置以接收音頻信號SlO (例如,作為一系列幀)且產(chǎn)生對應(yīng)經(jīng)編碼 音頻信號S20(例如,作為一系列經(jīng)編碼幀)的話音編碼器XlO的框圖。話音編碼器XlO包 括譯碼方案選擇器20、活動幀編碼器30及非活動幀編碼器40。音頻信號SlO為包括話音 分量(即,主揚聲器語音的聲音)及上下文分量(即,周圍環(huán)境或背景聲音)的數(shù)字音頻信 號。音頻信號SlO通常為如由麥克風捕獲的模擬信號的經(jīng)數(shù)字化版本。譯碼方案選擇器20經(jīng)配置以區(qū)分音頻信號SlO的活動幀與非活動幀。此種操作 還稱為“語音活動性檢測”或“話音活動性檢測”,且譯碼方案選擇器20可經(jīng)實施以包括語 音活動性檢測器或話音活動性檢測器。舉例來說,譯碼方案選擇器20可經(jīng)配置以輸出對于 活動幀為高且對于非活動幀為低的二進制值譯碼方案選擇信號。圖IA展示其中使用由譯 碼方案選擇器20產(chǎn)生的譯碼方案選擇信號來控制話音編碼器XlO的一對選擇器50a及50b 的實例。譯碼方案選擇器20可經(jīng)配置以基于幀的能量及/或頻譜內(nèi)容的一個或一個以上 特性(例如幀能量、信噪比(SNR)、周期性、頻譜分布(例如,頻譜傾斜)及/或過零率)將 幀分類為活動或非活動。此種分類可包括將此種特性的值或量值與閾值進行比較,及/或 將此種特性的改變的量值(例如,相對于先前幀)與閾值進行比較。舉例來說,譯碼方案選 擇器20可經(jīng)配置以估計當前幀的能量,且如果能量值小于(或者,不大于)閾值,則將幀分 類為非活動。此種選擇器可經(jīng)配置以將幀能量計算為幀樣本的平方和。譯碼方案選擇器20的另一實施方案經(jīng)配置以估計低頻帶(例如,300Hz到2kHz) 及高頻帶(例如,2kHz到4kHz)中的每一者中當前幀的能量,且在每一頻帶的能量值小于 (或者,不大于)相應(yīng)閾值的情況下指示幀為非活動的。此種選擇器可經(jīng)配置以通過將通 帶濾波器應(yīng)用到幀及計算經(jīng)濾波的幀的樣本的平方和而計算頻帶中的幀能量。此種語音 活動性檢測操作的一個實例描述于第三代合作伙伴計劃2 (3GPP2)標準文件C. S0014-C, vl. 0 (2007年1月)的章節(jié)4. 7中(以www. 3rpp2. org在線可得)。另外或在替代方案中,此種分類可基于來自一個或一個以上先前幀及/或一個或 一個以上隨后幀的信息。舉例來說,可能需要基于幀特性的關(guān)于兩個或兩個以上幀求平均 的值對幀進行分類。可能需要使用基于來自先前幀(例如,背景噪聲電平,SNR)的信息的 閾值對幀進行分類。還可能需要配置譯碼方案選擇器20以將音頻信號SlO中遵循從活動 幀到非活動幀的過渡的第一幀中的一者或一者以上分類為活動的。在過渡之后以此種方式繼續(xù)先前分類狀態(tài)的動作還稱為“釋放延遲(hangover) ”。活動幀編碼器30經(jīng)配置以編碼音頻信號的活動幀。編碼器30可經(jīng)配置以根據(jù)例 如全速率、半速率或四分之一速率的位速率來編碼活動幀。編碼器30可經(jīng)配置以根據(jù)例如 碼激勵線性預(yù)測(CELP)、原型波形內(nèi)插(PWI)或原型間距周期(PPP)的譯碼模式來編碼活 動幀?;顒訋幋a器30的典型實施方案經(jīng)配置以產(chǎn)生包括對頻譜信息的描述及對時間 信息的描述的經(jīng)編碼幀。對頻譜信息的描述可包括線性預(yù)測譯碼(LPC)系數(shù)值的一個或一 個以上向量,其指示經(jīng)編碼話音的共振(還稱為“共振峰”)。對頻譜信息的描述通常經(jīng)量 化,以使得LPC向量通常被轉(zhuǎn)換為可有效進行量化的形式,例如線頻譜頻率(LSF)、線頻譜 對(LSP)、導(dǎo)抗頻譜頻率(immittance spectral frequency,ISF)、導(dǎo)抗頻譜對(ISP)、倒頻 譜系數(shù)或?qū)?shù)面積比。對時間信息的描述可包括對也通常經(jīng)量化的激勵信號的描述。非活動幀編碼器40經(jīng)配置以編碼非活動幀。非活動幀編碼器40通常經(jīng)配置而以 比活動幀編碼器30使用的位速率低的位速率來編碼非活動幀。在一個實例中,非活動幀編 碼器40經(jīng)配置以使用噪聲激勵線性預(yù)測(NELP)譯碼方案以八分之一速率來編碼非活動 幀。非活動幀編碼器40還可經(jīng)配置以執(zhí)行不連續(xù)傳輸(DTX),以使得經(jīng)編碼幀(還稱為“靜 默描述”或SID幀)針對少于音頻信號SlO的所有非活動幀進行傳輸。非活動幀編碼器40的典型實施方案經(jīng)配置以產(chǎn)生包括對頻譜信息的描述及對時 間信息的描述的經(jīng)編碼幀。對頻譜信息的描述可包括線性預(yù)測譯碼(LPC)系數(shù)值的一個或 一個以上向量。對頻譜信息的描述通常經(jīng)量化,以使得LPC向量通常轉(zhuǎn)換為如上文實例中 的可有效進行量化的形式。非活動幀編碼器40可經(jīng)配置以執(zhí)行具有比活動幀編碼器30執(zhí) 行的LPC分析的階數(shù)低的階數(shù)的LPC分析,及/或非活動幀編碼器40可經(jīng)配置以將對頻譜 信息的描述量化為比話動幀編碼器30產(chǎn)生的頻譜信息的量化描述少的位。對時間信息的 描述可包括對也通常經(jīng)量化的時間包絡(luò)的描述(例如,包括幀的增益值及/或幀的一系列 子幀中的每一者的增益值)。注意,編碼器30及40可共享共同結(jié)構(gòu)。舉例來說,編碼器30及40可共享LPC系 數(shù)值的計算器(可能經(jīng)配置以產(chǎn)生針對活動幀與非活動幀具有不同階數(shù)的結(jié)果),但具有 分別不同的時間描述計算器。還注意,話音編碼器Xio的軟件或固件實施方案可使用譯碼 方案選擇器20的輸出以引導(dǎo)對幀編碼器中的一者或另一者的執(zhí)行的流程,且此種實施方 案可能不包括針對選擇器50a及/或針對選擇器50b的模擬??赡苄枰渲米g碼方案選擇器20以將音頻信號SlO的每一活動幀分類為若干不 同類型中的一者。這些不同類型可包括有聲話音(例如,表示元音聲的話音)的幀、過渡幀 (例如,表示詞的開始或結(jié)束的幀)及無聲話音(例如,表示摩擦聲的話音)的幀。幀分類 可基于當前幀及/或一個或一個以上先前幀的一個或一個以上特征,例如幀能量、兩個或 兩個以上不同頻帶中的每一者的幀能量、SNR、周期性、頻譜傾斜及/或過零率。此種分類可 包括將此種因數(shù)的值或量值與閾值進行比較及/或?qū)⒋朔N因數(shù)的改變的量值與閾值進行 比較??赡苄枰渲迷捯艟幋a器XlO以使用不同譯碼位速率來編碼不同類型的活動幀 (例如,以平衡網(wǎng)絡(luò)需求與容量)。此種操作稱為“可變速率譯碼”。舉例來說,可能需要配 置話音編碼器XlO來以較高位速率(例如,全速率)編碼過渡幀,以較低位速率(例如,四分之一速率)編碼無聲幀,且以中間位速率(例如,半速率)或以更高位速率(例如,全速 率)編碼有聲幀。圖2展示譯碼方案選擇器20的實施方案22可用以根據(jù)幀含有的話音的類型選擇 編碼特定幀的位速率的決策樹的一個實例。在其它情形下,針對特定幀所選擇的位速率還 可視例如所要平均位速率、在一系列幀上的所要位速率模式(其可用以支持所要平均位速 率)及/或針對先前幀所選擇的位速率等準則而定。另外或在替代方案中,可能需要配置話音編碼器XlO以使用不同譯碼模式來編碼 不同類型的話音幀。此種操作稱為“多模式譯碼”。舉例來說,有聲話音的幀傾向于具有長 期(即,持續(xù)一個以上的幀周期)的周期性結(jié)構(gòu)且與音高相關(guān),且使用對此長期頻譜特征的 描述進行編碼的譯碼模式來編碼有聲幀(或有聲幀的序列)通常是更加有效的。此類譯碼 模式的實例包括CELP、PWI及PPP。另一方面,無聲幀及非活動幀通常缺少任何顯著長期頻 譜特征,且話音編碼器可經(jīng)配置以使用例如NELP等不嘗試描述此特征的譯碼模式來編碼 這些幀??赡苄枰獙嵤┰捯艟幋a器XlO以使用多模式譯碼,以使得根據(jù)基于(例如)周期 性或發(fā)音的分類使用不同模式來編碼幀。還可能需要實施話音編碼器XlO以針對不同類 型的活動幀使用位速率與譯碼模式的不同組合(還稱為“譯碼方案”)。話音編碼器XlO的 此種實施方案的一個實例針對含有有聲話音的幀及過渡幀使用全速率CELP方案,針對含 有無聲話音的幀使用半速率NELP方案,且針對非活動幀使用八分之一速率NELP方案。話 音編碼器XlO的此類實施方案的其它實例支持針對一個或一個以上譯碼方案的多個譯碼 速率,例如全速率及半速率CELP方案及/或全速率及四分之一速率PPP方案。多方案編 碼器、解碼器及譯碼技術(shù)的實例描述于(例如)標題為“用于維持話音譯碼器中的目標位 速率的方法及設(shè)備(METHODS AND APPARATUS FOR MAINTAINING ATARGET BIT RATE IN A SPEECH CODER),,的美國專利第6,330, 532號中及標題為“可變速率話音譯碼(VARIABLE RATE SPEECH CODING) ”的美國專利第6,691,084號中;及標題為“閉環(huán)可變速率多模式 預(yù)測話音譯碼器(CLOSED-LOOPVARIABLE-RATE MULTIMODE PREDICTIVE SPEECH CODER) ” 的美國專利申請案第09/191,643號中及標題為“用于可變速率譯碼器的任意平均數(shù)據(jù)速 率(ARBITRARYAVERAGE DATA RATESF0R VARIABLE RATE CODERS) ” 的美國專利申請案第 11/625,788 號中。圖IB展示包括活動幀編碼器30的多個實施方案30a、30b的話音編碼器XlO的實 施方案X20的框圖。編碼器30a經(jīng)配置以使用第一譯碼方案(例如,全速率CELP)來編碼 第一類活動幀(例如,有聲幀),且編碼器30b經(jīng)配置以使用具有與第一譯碼方案不同的位 速率及/或譯碼模式的第二譯碼方案(例如,半速率NELP)來編碼第二類活動幀(例如,無 聲幀)。在此情形下,選擇器52a及52b經(jīng)配置以根據(jù)由譯碼方案選擇器22產(chǎn)生的具有兩 個以上可能狀態(tài)的譯碼方案選擇信號的狀態(tài)在各種幀編碼器中進行選擇。明確地揭示,話 音編碼器X20可以支持從活動幀編碼器30的兩個以上不同實施方案中進行選擇的方式進 行擴展。話音編碼器X20的幀編碼器中的一者或一者以上可共享共同結(jié)構(gòu)。舉例來說,此 類編碼器可共享LPC系數(shù)值的計算器(可能經(jīng)配置以針對不同類的幀產(chǎn)生具有不同階數(shù)的 結(jié)果),但具有分別不同的時間描述計算器。舉例來說,編碼器30a及30b可具有不同激勵
12信號計算器。如圖IB中所展示,話音編碼器XlO還可經(jīng)實施以包括噪聲抑制器10。噪聲抑制 器10經(jīng)配置及布置以對音頻信號SlO執(zhí)行噪聲抑制操作。此種操作可支持譯碼方案選擇 器20對活動與非活動幀之間的改進辨別及/或活動幀編碼器30及/或非活動幀編碼器 40的更佳編碼結(jié)果。噪聲抑制器10可經(jīng)配置以將不同相應(yīng)增益因數(shù)應(yīng)用到音頻信號的兩 個或兩個以上不同頻率信道中的每一者,其中每一信道的增益因數(shù)可基于信道的噪聲能量 或SNR的估計。如與時域相對,可能需要在頻域中執(zhí)行此種增益控制,且此種配置的一個實 例描述于上文提及的3GPP2標準文件C. S0014-C的章節(jié)4. 4. 3中?;蛘撸肼曇种破?0可 經(jīng)配置以可能在頻域中將自適應(yīng)濾波器應(yīng)用到音頻信號。歐洲電信標準協(xié)會(ETSI)文件 ES 2020505vl. 1. 5 (2007年1月,以www. etsi. org在線可得)的章節(jié)5. 1描述從非活動幀 估計噪聲頻譜且基于所計算的噪聲頻譜對音頻信號執(zhí)行兩階段梅爾彎曲維納(meliarped Wiener)濾波的此種配置的實例。圖3A展示根據(jù)一般配置的設(shè)備XlOO的框圖(還稱為編碼器、編碼設(shè)備或用于編 碼的設(shè)備)。設(shè)備XlOO經(jīng)配置以從音頻信號SlO移除現(xiàn)存上下文且將其取代為可能類似 或不同于現(xiàn)存上下文的所產(chǎn)生上下文。設(shè)備XlOO包括經(jīng)配置及布置以處理音頻信號SlO 以產(chǎn)生上下文經(jīng)增強音頻信號S15的上下文處理器100。設(shè)備XlOO還包括話音編碼器XlO 的實施方案(例如,話音編碼器X20),其經(jīng)布置以編碼上下文經(jīng)增強音頻信號S15以產(chǎn)生 經(jīng)編碼音頻信號S20。包括例如蜂窩式電話的設(shè)備XlOO的通信裝置可經(jīng)配置以在將經(jīng)編 碼音頻信號S20傳輸?shù)接芯€、無線或光學(xué)傳輸信道(例如,通過一個或一個以上載波的射頻 調(diào)制)中之前對經(jīng)編碼音頻信號S20執(zhí)行進一步處理操作,例如錯誤校正、冗余及/或協(xié)議 (例如,以太網(wǎng)絡(luò)、TCP/IP、CDMA2000)譯碼。圖3B展示上下文處理器100的實施方案102的框圖。上下文處理器102包括經(jīng)配 置及布置以抑制音頻信號SlO的上下文分量以產(chǎn)生上下文受抑制音頻信號S13的上下文抑 制器110。上下文處理器102還包括經(jīng)配置以根據(jù)上下文選擇信號S40的狀態(tài)產(chǎn)生所產(chǎn)生 上下文信號S50的上下文產(chǎn)生器120。上下文處理器102還包括經(jīng)配置及布置以將上下文 受抑制音頻信號S13與所產(chǎn)生上下文信號S50進行混合以產(chǎn)生上下文經(jīng)增強音頻信號S15 的上下文混合器190。如圖3B中所示,上下文抑制器110經(jīng)布置以在進行編碼之前從音頻信號抑制現(xiàn) 存上下文。上下文抑制器110可實施為如上文所描述的噪聲抑制器10的更加冒進的版本 (例如,通過使用一個或一個以上不同閾值)。替代地或另外,上下文抑制器110可經(jīng)實施 以使用來自兩個或兩個以上麥克風的音頻信號以抑制音頻信號SlO的上下文分量。圖3G 展示包括上下文抑制器110的此種實施方案IlOA的上下文處理器102的實施方案102A的 框圖。上下文抑制器IlOA經(jīng)配置以抑制音頻信號SlO的上下文分量,舉例來說,其基于由 第一麥克風產(chǎn)生的音頻信號。上下文抑制器IlOA經(jīng)配置以通過使用基于由第二麥克風產(chǎn) 生的音頻信號的音頻信號SAl (例如,另一數(shù)字音頻信號)而執(zhí)行此種操作。多麥克風上下 文抑制的合適實例揭示于(例如)代理人案號為061521的標題為“噪聲及回音減少的設(shè) 備及方法(APPARATUS AND METHOD OF NOISE AND ECHOREDUCTION) ” (超翼(Choy)等人) 的美國專利申請案第11/864,906號中,及代理人案號為080551的標題為“用于信號分離 的系統(tǒng)、方法及設(shè)備(SYSTEMS,METHODS,AND APPARATUS FOR SIGNAL SEPARATION)”(維瑟
13(Visser)等人)的美國專利申請案第12/037,928號中。上下文抑制器110的多麥克風實 施方案還可經(jīng)配置以向譯碼方案選擇器20的對應(yīng)實施方案提供信息,以用于根據(jù)(例如) 代理人案號為061497的標題為“多麥克風語音活動性檢測器(MULTIPLE MICROPHONE VOICE ACTIVITYDETECTOR) ”(超翼(Choy)等人)的美國專利申請案第11/864,897號中揭示的技 術(shù)而改進話音活動性檢測性能。圖3C到圖3F展示兩個麥克風KlO及K20在包括設(shè)備XlOO的此種實施方案的便 攜式裝置(例如蜂窩式電話或其它移動用戶終端)中或在經(jīng)配置以經(jīng)由到此種便攜式裝置 的有線或無線(例如,藍牙)連接進行通信的免提式裝置(例如耳機或頭戴式耳機)中的 各種安裝配置。在這些實例中,麥克風KlO經(jīng)布置以產(chǎn)生主要含有話音分量(例如,音頻信 號SlO的模擬前體(analog precursor))的音頻信號,且麥克風K20經(jīng)布置以產(chǎn)生主要含 有上下文分量(例如,音頻信號SAl的模擬前體)的音頻信號。圖3C展示其中麥克風KlO 安裝于裝置的正面之后且麥克風K20安裝于裝置的頂面之后的布置的一個實例。圖3D展 示其中麥克風KlO安裝于裝置的正面之后且麥克風K20安裝于裝置的側(cè)面之后的布置的一 個實例。圖3E展示其中麥克風KlO安裝于裝置的正面之后且麥克風K20安裝于裝置的底 面之后的布置的一個實例。圖3F展示其中麥克風KlO安裝于裝置的正面(或內(nèi)面)之后 且麥克風K20安裝于裝置的背面(或外面)之后的布置的一個實例。上下文抑制器110可經(jīng)配置以對音頻信號執(zhí)行頻譜相減操作。頻譜相減可預(yù)期 抑制具有固定統(tǒng)計量的上下文分量,但對于抑制非固定的上下文可能無效。頻譜相減可 用于具有一個麥克風的應(yīng)用中以及其中來自多個麥克風的信號可用的應(yīng)用中。在典型實 例中,上下文抑制器110的此種實施方案經(jīng)配置以分析音頻信號的非活動幀以導(dǎo)出對現(xiàn) 存上下文的統(tǒng)計學(xué)描述,例如若干頻率子帶(還稱為“頻率組(frequency bin)”)中的 每一者中的上下文分量的能量級,且將對應(yīng)頻率選擇性增益應(yīng)用到音頻信號(例如,以基 于對應(yīng)上下文能量級衰減頻率子帶中的每一者上的音頻信號)。頻譜相減操作的其它實 例描述于S. F.波爾(S. F. Boll)的“使用頻譜相減抑制話音中的聲學(xué)噪聲(Suppression ofAcoustic Noise in Speech Using Spectral Subtraction),,(IEEE 匯干丨J,聲學(xué)、話音及 信號處理(IEEE Trans. Acoustics, Speech and Signal Processing),27 (2) :112_120, 1979 年 4 月)中;R.穆凱(R. Mukai)、S.阿拉奇(S. Araki)、H.薩瓦達(H. Sawada)及 S.瑪奇諾(S. Makino)的“使用LMS濾波器移除盲源分離中的殘余串音分量(Removal of residualcrosstalk components in blind source separation using LMS filters)”(關(guān) 于用于信號處理的神經(jīng)網(wǎng)絡(luò)的第12屆IEEE專題討論會的會議記錄(Proc. of 12th IEEE Workshop on NeuralNetworks for Signal Processing),第 435-444 頁,瑞士,馬提尼 (Martigny, Switzerland),2002 年 9 月)中;及 R.穆凱(R. Mukai)、S.阿拉奇(S. Araki)、 H.薩瓦達(H. Sawada)及S.瑪奇諾(S. Makino)的“使用延時頻譜相減移除盲源分離中的殘 余串音分量(Removalof residual cross-talk components inblind source separation using time-delayed spectralsubtraction) "(ICASSP 2002 白勺Hi己i (Proc· of ICASSP 2002),第 1789-1792 頁,2002 年 5 月)中。另外或在替代實施方案中,上下文抑制器110可經(jīng)配置以對音頻信號執(zhí)行盲源分 離(BSS,還稱為獨立分量分析)操作。盲源分離可用于來自一個或一個以上麥克風(除 了用于捕獲音頻信號SlO的麥克風之外)的信號可用的應(yīng)用中。盲源分離可預(yù)期抑制固定的上下文以及具有非固定統(tǒng)計的上下文。描述于美國專利6,167,417(葩拉(Parra)等 人)中的BSS操作的一個實例使用梯度下降法來計算用以分離源信號的濾波器的系數(shù)。 BSS操作的其它實例描述于S.阿瑪里(S. Amari)、A.斯超奇(A. Cichocki)及H. H.楊 (H. H. Yang)的“用于盲信號分離的新學(xué)習算法(A new learning algorithm for blind signalseparation),,(神經(jīng)信息處理系統(tǒng) 8 的進步(Advances in Neural Information ProcessingSystems 8),MIT 出版社(MIT Press),1996 年)中;L.莫爾哥狄(L. Molgedey) 及H.G.斯庫斯特(H. G Schuster)的“使用延時相關(guān)分離獨立信號的混合(Separation of a mixtureof independent signals using time delayed correlations),,(物理評論快 報(Phys. Rev. Lett.), 72 (23) :3634_3637,1994 年)中;及 L.葩拉(L. Parra)及 C.斯奔 思(C. Spence)的“非固定源的卷積盲源分離(Convolutive blind source separation of non-stationarysources),,(IEEE、匯刊(IEEE Trans.),論話音及音頻處理(on Speech and AudioProcessing),8(3) :320_327,2000年5月)中。另外或在上文論述的實施方案的替 代方案中,上下文抑制器100可經(jīng)配置以執(zhí)行波束成形操作。波束成形操作的實例揭示于 (例如)上文提及的美國專利申請案第11/864,897號(代理人案號061497)中及H.塞盧瓦 塔里(H. Saruwatari)等人的“將獨立分量分析與波束成形組合的盲源分離(BlindSource Separation Combining Independent Component Analysis and Beamforming) ” (關(guān)于應(yīng) 用信號處理的 EURASIP 期刊(EURASIP Journal on Applied Signal Processing), 2003 11,1135-1146(2003 年))中。彼此靠近地定位的麥克風(例如安裝于例如蜂窩式電話或免提式裝置的護罩的 共同外殼內(nèi)的麥克風)可產(chǎn)生具有高瞬時相關(guān)的信號。所屬領(lǐng)域的技術(shù)人員還將認識到, 一個或一個以上麥克風可放置于共同外殼(即,整個裝置的護罩)內(nèi)的麥克風外殼中。此 種相關(guān)可降級BSS操作的性能,且在此類情形下可能需要在BSS操作之前解相關(guān)音頻信號。 解相關(guān)還通常對于回音消除為有效的。解相關(guān)器可實施為具有五個或更少的抽頭(tap)或 甚至三個或更少的抽頭的濾波器(可能為自適應(yīng)濾波器)。此種濾波器的抽頭權(quán)重可為固 定的,或可根據(jù)輸入音頻信號的相關(guān)特性進行選擇,且可能需要使用網(wǎng)格濾波器結(jié)構(gòu)來實 施解相關(guān)濾波器。上下文抑制器110的此種實施方案可經(jīng)配置以對音頻信號的兩個或兩個 以上不同頻率子帶中的每一者執(zhí)行分離的解相關(guān)操作。上下文抑制器110的實施方案可經(jīng)配置以在BSS操作之后至少對經(jīng)分離話音分量 執(zhí)行一個或一個以上額外處理操作。舉例來說,可能需要上下文抑制器110至少對經(jīng)分離 話音分量執(zhí)行解相關(guān)操作??蓡为毜貙?jīng)分離話音分量的兩個或兩個以上不同頻率子帶中 的每一者執(zhí)行此種操作。另外或在替代方案中,上下文抑制器110的實施方案可經(jīng)配置以基于經(jīng)分離上下 文分量對經(jīng)分離話音分量執(zhí)行非線性處理操作,例如頻譜相減。可進一步從話音分量抑制 現(xiàn)存上下文的頻譜相減可根據(jù)經(jīng)分離上下文分量的對應(yīng)頻率子帶的電平而實施為隨時間 推移而變化的頻率選擇性增益。另外或在替代方案中,上下文抑制器110的實施方案可經(jīng)配置以對經(jīng)分離話音分 量執(zhí)行中心削波操作。此種操作通常將增益應(yīng)用到與信號電平及/或話音活動性電平成比 例地隨時間推移而變化的信號。中心削波操作的一個實例可表達為y[n] = {對于|X[n] <(,0;否則,1[11]},其中1[11]為輸入樣本,y[n]為輸出樣本,且C為削波閾值的值。中心實例可表達為y [η] = {對于χ [η] | <C,0 ;否則,Sgn(X[n]) (|x[n] -C)}, 其中sgn(χ[η])指示χ[η]的正負號??赡苄枰渲蒙舷挛囊种破?10以大致上完全從音頻信號移除現(xiàn)存上下文分量。 舉例來說,可能需要設(shè)備XlOO用不同于現(xiàn)存上下文分量的所產(chǎn)生上下文信號S50取代現(xiàn)存 上下文分量。在此種情形下,現(xiàn)存上下文分量的大致上完全移除可能有助于減少經(jīng)解碼音 頻信號中現(xiàn)存上下文分量與取代上下文信號之間的可聽見的干擾。在另一實例中,可能需 要設(shè)備XlOO經(jīng)配置以隱藏現(xiàn)存上下文分量,不管是否還將所產(chǎn)生上下文信號S50相加到音 頻信號??赡苄枰獙⑸舷挛奶幚砥?00實施為可在兩個或兩個以上不同操作模式之間配 置。舉例來說,可能需要提供(A)第一操作模式,其中上下文處理器100經(jīng)配置以在現(xiàn)存 上下文分量大致上保持不變的情形下傳遞音頻信號;及(B)第二操作模式,其中上下文處 理器100經(jīng)配置以大致上完全移除現(xiàn)存上下文分量(可能將其取代為所產(chǎn)生上下文信號 S50)。對此種第一操作模式的支持(其可配置為默認模式)可能對允許包括設(shè)備XlOO的 裝置的向后兼容性有用。在第一操作模式中,上下文處理器100可經(jīng)配置以對音頻信號執(zhí) 行噪聲抑制操作(例如,如上文關(guān)于噪聲抑制器10所描述)以產(chǎn)生噪聲受抑制音頻信號。上下文處理器100的另外實施方案可類似地經(jīng)配置以支持兩個以上操作模式。舉 例來說,此另外實施方案可為可配置的以根據(jù)在從至少大致上無上下文抑制(例如,僅噪 聲抑制)到部分上下文抑制到至少大致上完全上下文抑制的范圍中的三個或三個以上模 式中的可選模式而改變現(xiàn)存上下文分量受抑制的程度。圖4Α展示包括上下文處理器100的實施方案104的設(shè)備XlOO的實施方案Χ102 的框圖。上下文處理器104經(jīng)配置以根據(jù)處理控制信號S30的狀態(tài)而以上文描述的兩個或 兩個以上模式中的一者進行操作。處理控制信號S30的狀態(tài)可由用戶控制(例如,經(jīng)由圖 形用戶接口、開關(guān)或其它控制接口),或者可由處理控制產(chǎn)生器340(如圖16中所說明)產(chǎn) 生處理控制信號S30,所述處理控制信號S30包括例如表等將一個或一個以上變量(例如, 物理位置、操作模式)的不同值與處理控制信號S30的不同狀態(tài)相關(guān)聯(lián)的加索引數(shù)據(jù)結(jié)構(gòu)。 在一個實例中,處理控制信號S30被實施為二進制值信號(即,旗標),其狀態(tài)指示將傳遞還 是抑制現(xiàn)存上下文分量。在此種情形下,上下文處理器104可以第一模式進行配置以通過 停用其元件中的一者或一者以上及/或從信號路徑中移除此類元件(即,允許音頻信號繞 過所述元件)而傳遞音頻信號S10,且可以第二模式進行配置以通過啟用此類元件及/或?qū)?其插入于信號路徑中而產(chǎn)生上下文經(jīng)增強音頻信號S15?;蛘?,上下文處理器104可以第一 模式進行配置以對音頻信號SlO執(zhí)行噪聲抑制操作(例如,如上文關(guān)于噪聲抑制器10所描 述),且可以第二模式進行配置以對音頻信號SlO執(zhí)行上下文取代操作。在另一實例中,處 理控制信號S30具有兩個以上可能狀態(tài),每一狀態(tài)對應(yīng)于上下文處理器的在從至少大致上 無上下文抑制(例如,僅噪聲抑制)到部分上下文抑制到至少大致上完全的上下文抑制的 范圍中的三個或三個以上操作模式中的一個不同模式。圖4Β展示上下文處理器104的實施方案106的框圖。上下文處理器106包括上下 文抑制器Iio的實施方案112,其經(jīng)配置以具有至少兩個操作模式第一操作模式,其中上 下文抑制器112經(jīng)配置以在現(xiàn)存上下文分量大致上保持不變的情形下傳遞音頻信號S10, 及第二操作模式,其中上下文抑制器112經(jīng)配置以大致上完全從音頻信號SlO移除現(xiàn)存上
16下文分量(即,以產(chǎn)生上下文受抑制音頻信號S13)??赡苄枰獙嵤┥舷挛囊种破?12以使 得第一操作模式為默認模式。可能需要實施上下文抑制器112以在第一操作模式中對音頻 信號執(zhí)行噪聲抑制操作(例如,如上文關(guān)于噪聲抑制器10所描述)以產(chǎn)生噪聲受抑制音頻信號。上下文抑制器112可經(jīng)實施以使得在其第一操作模式中,繞過經(jīng)配置以對音頻信 號執(zhí)行上下文抑制操作的一個或一個以上元件(例如,一個或一個以上軟件及/或固件例 行程序)。替代地或另外,上下文抑制器112可經(jīng)實施以通過改變此種上下文抑制操作(例 如,頻譜相減及/或BSS操作)的一個或一個以上閾值而以不同模式進行操作。舉例來說, 上下文抑制器112可以第一模式進行配置以應(yīng)用第一組閾值來執(zhí)行噪聲抑制操作,且可以 第二模式進行配置以應(yīng)用第二組閾值來執(zhí)行上下文抑制操作。處理控制信號S30可用以控制上下文處理器104的一個或一個以上其它元件。圖 4B展示經(jīng)配置以根據(jù)處理控制信號S30的狀態(tài)進行操作的上下文產(chǎn)生器120的實施方案 122的實例。舉例來說,可能需要根據(jù)處理控制信號S30的對應(yīng)狀態(tài)將上下文產(chǎn)生器122實 施為經(jīng)停用(例如,以減少功率消耗)或以其它方式防止上下文產(chǎn)生器122產(chǎn)生所產(chǎn)生的 上下文信號S50。另外或替代地,可能需要根據(jù)處理控制信號S30的對應(yīng)狀態(tài)將上下文混合 器190實施為經(jīng)停用或繞過,或以其它方式防止上下文混合器190將其輸入音頻信號與所 產(chǎn)生上下文信號S50進行混合。如上所述,話音編碼器XlO可經(jīng)配置以根據(jù)音頻信號SlO的一個或一個以上特性 從兩個或兩個以上幀編碼器中進行選擇。同樣,在設(shè)備Xioo的實施方案內(nèi),可不同地實施 譯碼方案選擇器20以根據(jù)音頻信號S10、上下文受抑制音頻信號S13及/或上下文經(jīng)增強 音頻信號S15的一個或一個以上特性產(chǎn)生編碼器選擇信號。圖5A說明這些信號與話音編 碼器XlO的編碼器選擇操作之間的各種可能的相關(guān)性。圖6展示設(shè)備XlOO的特定實施方 案Xl 10的框圖,其中譯碼方案選擇器20經(jīng)配置以基于上下文受抑制音頻信號S13 (如圖5A 中的點B所指示)的一個或一個以上特性(例如幀能量、兩個或兩個以上不同頻帶中的每 一者的幀能量、SNR、周期性、頻譜傾斜及/或過零率)產(chǎn)生編碼器選擇信號。明確地預(yù)期且 特此揭示,圖5A及圖6中建議的設(shè)備XlOO的各種實施方案中的任一者還可經(jīng)配置以包括 根據(jù)處理控制信號S30 (例如,如關(guān)于圖4A、圖4B所描述)的狀態(tài)及/或三個或三個以上幀 編碼器(例如,如關(guān)于圖IB所描述)中的一者的選擇來控制上下文抑制器110??赡苄枰獙嵤┰O(shè)備XlOO以將噪聲抑制及上下文抑制作為單獨操作而執(zhí)行。舉例 來說,可能需要將上下文處理器100的實施方案添加到具有話音編碼器X20的現(xiàn)存實施方 案的裝置,而不移除、停用或繞過噪聲抑制器10。圖5B說明在包括噪聲抑制器10的設(shè)備 XlOO的實施方案中在基于音頻信號SlO的信號與話音編碼器X20的編碼器選擇操作之間的 各種可能的相關(guān)性。圖7展示設(shè)備XlOO的特定實施方案X120的框圖,其中譯碼方案選擇 器20經(jīng)配置以基于噪聲受抑制音頻信號S12(如圖5B中的點A所指示)的一個或一個以 上特性(例如幀能量、兩個或兩個以上不同頻帶中的每一者的幀能量、SNR、周期性、頻譜傾 斜及/或過零率)產(chǎn)生編碼器選擇信號。明確地預(yù)期且特此揭示,圖5B及圖7中建議的設(shè) 備XlOO的各種實施方案中的任一者還可經(jīng)配置以包括根據(jù)處理控制信號S30 (例如,如關(guān) 于圖4A、圖4B所描述)的狀態(tài)及/或三個或三個以上幀編碼器(例如,如關(guān)于圖IB所描 述)中的一者的選擇來控制上下文抑制器110。
上下文抑制器110還可經(jīng)配置以包括噪聲抑制器10,或可以其它方式可選擇地進 行配置以對音頻信號SlO執(zhí)行噪聲抑制。舉例來說,可能需要設(shè)備XlOO根據(jù)處理控制信號 S30的狀態(tài)執(zhí)行上下文抑制(其中現(xiàn)存上下文大致上從音頻信號SlO完全移除)或者噪聲 抑制(其中現(xiàn)存上下文大致上保持不變)。一般來說,上下文抑制器110還可經(jīng)配置以在執(zhí) 行上下文抑制之前對音頻信號Sio及/或在執(zhí)行上下文抑制之后對所得音頻信號執(zhí)行一個 或一個以上其它處理操作(例如濾波操作)。如上所述,現(xiàn)存話音編碼器通常使用低位速率及/或DTX來編碼非活動幀。因此, 經(jīng)編碼非活動幀通常含有極少上下文的信息。視由上下文選擇信號S40指示的特定上下 文及/或上下文產(chǎn)生器120的特定實施方案而定,所產(chǎn)生上下文信號S50的聲音質(zhì)量及信 息內(nèi)容可能大于原始上下文的聲音質(zhì)量及信息內(nèi)容。在此種情形下,可能需要使用比用來 編碼僅包括原始上下文的非活動幀的位速率高的位速率來編碼包括所產(chǎn)生上下文信號S50 的非活動幀。圖8展示包括至少兩個活動幀編碼器30a、30b及譯碼方案選擇器20及選擇 器50a、50b的對應(yīng)實施方案的設(shè)備XlOO的實施方案X130的框圖。在此實例中,設(shè)備X130 經(jīng)配置以基于上下文經(jīng)增強信號(即,在將所產(chǎn)生上下文信號S50相加到上下文受抑制音 頻信號之后)執(zhí)行譯碼方案選擇。盡管此種布置可能導(dǎo)致語音活動性的錯誤檢測,但其在 使用較高位速率來編碼上下文經(jīng)增強靜默幀的系統(tǒng)中也可能是合意的。明確地指出,如關(guān)于圖8所描述的兩個或兩個以上活動幀編碼器及譯碼方案選擇 器20及選擇器50a、50b的對應(yīng)實施方案的特征還可包括于本文揭示的設(shè)備XlOO的其它實 施方案中。上下文產(chǎn)生器120經(jīng)配置以根據(jù)上下文選擇信號S40的狀態(tài)產(chǎn)生所產(chǎn)生上下文信 號S50。上下文混合器190經(jīng)配置及布置以將上下文受抑制音頻信號S13與所產(chǎn)生上下文 信號S50進行混合以產(chǎn)生上下文經(jīng)增強音頻信號S15。在一個實例中,上下文混合器190實 施為經(jīng)布置以將所產(chǎn)生上下文信號S50相加到上下文受抑制音頻信號S13的加法器??赡?需要上下文產(chǎn)生器120以可與上下文受抑制音頻信號兼容的形式產(chǎn)生所產(chǎn)生上下文信號 S50。在設(shè)備XlOO的典型實施方案中,舉例來說,所產(chǎn)生上下文信號S50及由上下文抑制器 110產(chǎn)生的音頻信號兩者均為PCM樣本的序列。在此種情形下,上下文混合器190可經(jīng)配 置以將所產(chǎn)生上下文信號S50與上下文受抑制音頻信號S13 (可能作為基于幀的操作)的 對應(yīng)樣本對相加,但還可能實施上下文混合器190以對具有不同取樣分辨率的信號進行相 加。音頻信號SlO通常還實施為PCM樣本的序列。在一些情形下,上下文混合器190經(jīng)配 置以對上下文經(jīng)增強信號執(zhí)行一個或一個以上其它處理操作(例如濾波操作)。上下文選擇信號S40指示兩個或兩個以上上下文中的至少一者的選擇。在一個實 例中,上下文選擇信號S40指示基于現(xiàn)存上下文的一個或一個以上特征的上下文選擇。舉 例來說,上下文選擇信號S40可基于與音頻信號SlO的一個或一個以上非活動幀的一個或 一個以上時間及/或頻率特性有關(guān)的信息。譯碼模式選擇器20可經(jīng)配置而以此種方式產(chǎn) 生上下文選擇信號S40。或者,設(shè)備XlOO可經(jīng)實施以包括經(jīng)配置而以此種方式產(chǎn)生上下 文選擇信號S40的上下文分類器320 (例如,如圖7中所展示)。舉例來說,上下文分類器 可經(jīng)配置以執(zhí)行基于現(xiàn)存上下文的線頻譜頻率(LSF)的上下文分類操作,例如埃爾-馬萊 赫(El-Maleh)等人的“移動環(huán)境中的幀級噪聲分類(Frame-level NoiseClassification in Mobile Environments),,(關(guān)于 ASSP 的 IEEE 國際會議的會議記錄(Proc. IEEE Int' 1
18Conf. ASSP),1999年,第I卷,第237-240頁);美國專利第6,782,361號(埃爾-馬 萊赫(El-Maleh)等人);及錢(Qian)等人的“用于有效聲音傳輸?shù)姆诸愂孢m噪聲產(chǎn)生 (Classified Comfort Noise Generation for Efficient Voice Transmission),,(國際 語音學(xué)學(xué)術(shù)會議2006(Interspeech 2006),賓夕法尼亞州,匹茲堡(Pittsburgh, PA),第 225-228頁)中描述的那些操作。在另一實例中,上下文選擇信號S40指示基于例如與包括設(shè)備X100的裝置的物理 位置有關(guān)的信息(例如,基于從全球定位衛(wèi)星(GPS)系統(tǒng)獲得,經(jīng)由三角測量或其它測距操 作計算,及/或從基站收發(fā)器或其它服務(wù)器接收的信息)的一個或一個以上其它準則的上 下文選擇、將不同時間或時間周期與對應(yīng)上下文相關(guān)聯(lián)的時間表,及用戶選擇的上下文模 式(例如商務(wù)模式、舒緩模式、聚會模式)。在此類情形下,設(shè)備X100可經(jīng)實施以包括上下 文選擇器330 (例如,如圖8中所展示)。上下文選擇器330可經(jīng)實施以包括將不同上下文 與例如上文提及的準則的一個或一個以上變量的對應(yīng)值相關(guān)聯(lián)的一個或一個以上加索引 數(shù)據(jù)結(jié)構(gòu)(例如,表)。在另一實例中,上下文選擇信號S40指示兩個或兩個以上上下文的 列表中的一者的用戶選擇(例如,從例如菜單的圖形用戶接口)。上下文選擇信號S40的另 外的實例包括基于上文實例的任何組合的信號。圖9A展示包括上下文數(shù)據(jù)庫130及上下文產(chǎn)生引擎140的上下文產(chǎn)生器120的 實施方案122的框圖。上下文數(shù)據(jù)庫120經(jīng)配置以存儲描述不同上下文的若干組參數(shù)值。 上下文產(chǎn)生引擎140經(jīng)配置以根據(jù)根據(jù)上下文選擇信號S40的狀態(tài)而選擇的一組所存儲的 參數(shù)值來產(chǎn)生上下文。圖9B展示上下文產(chǎn)生器122的實施方案124的框圖。在此實例中,上下文產(chǎn)生引 擎140的實施方案144經(jīng)配置以接收上下文選擇信號S40,且從上下文數(shù)據(jù)庫130的實施 方案134檢索對應(yīng)組的參數(shù)值。圖9C展示上下文產(chǎn)生器122的另一實施方案126的框圖。 在此實例中,上下文數(shù)據(jù)庫130的實施方案136經(jīng)配置以接收上下文選擇信號S40,且將對 應(yīng)組的參數(shù)值提供到上下文產(chǎn)生引擎140的實施方案146。上下文數(shù)據(jù)庫130經(jīng)配置以存儲兩個或兩個以上組的描述對應(yīng)上下文的參數(shù)值。 上下文產(chǎn)生器120的其它實施方案可包括上下文產(chǎn)生引擎140的實施方案,上下文產(chǎn)生引 擎140的所述實施方案經(jīng)配置以從例如服務(wù)器的內(nèi)容提供者(例如,使用會話起始協(xié)議 (SIP)的版本,如當前在RFC 3261中所描述,其以mm. ietf. org在線可得)或其它非本地 數(shù)據(jù)庫或從對等網(wǎng)絡(luò)下載對應(yīng)于所選上下文的一組參數(shù)值(例如,如程(Cheng)等人的“協(xié) 作性保密性經(jīng)增強的阿利必電話(A Collaborative Privacy-Enhanced AlibiPhone) ”, 關(guān)于網(wǎng)格和普適計算的國際會議的會議記錄(Proc. Int' 1 Conf. Grid andPervasive Computing),第 405-414 頁,臺灣,臺中(Taichung,Tff), 2006 年 5 月)中所描述)。上下文產(chǎn)生器120可經(jīng)配置而以經(jīng)取樣的數(shù)字信號形式(例如,如PCM樣本的序 列)檢索或下載上下文。然而,由于存儲及/或位速率限制,此種上下文可能將遠遠短于典 型通信會話(例如,電話呼叫),從而要求在呼叫期間反復(fù)不斷地重復(fù)相同上下文且導(dǎo)致對 于收聽者來說不可接受地分散注意力的結(jié)果?;蛘?,可能將需要大量存儲及/或高位速率 下載連接以避免過度重復(fù)的結(jié)果?;蛘?,上下文產(chǎn)生引擎140可經(jīng)配置以從例如一組頻譜及/或能量參數(shù)值的所檢 索或所下載參數(shù)表示而產(chǎn)生上下文。舉例來說,上下文產(chǎn)生引擎140可經(jīng)配置以基于如可包括于SID幀中的對頻譜包絡(luò)(例如,LSF值的向量)的描述及對激勵信號的描述而產(chǎn)生 上下文信號S50的多個幀。上下文產(chǎn)生引擎140的此種實施方案可經(jīng)配置以逐幀地隨機化 所述組參數(shù)值以減小對所產(chǎn)生上下文的重復(fù)的覺察??赡苄枰舷挛漠a(chǎn)生引擎140基于描述聲音紋理(sound texture)的模板產(chǎn)生所 產(chǎn)生上下文信號S50。在一個所述實例中,上下文產(chǎn)生引擎140經(jīng)配置以基于包括多個不同 長度的自然顆粒的模板執(zhí)行顆粒合成。在另一實例中,上下文產(chǎn)生引擎140經(jīng)配置以基于 包括級聯(lián)時間頻率線性預(yù)測(CTFLP)分析(在CTFLP分析中,原始信號在頻域中使用線性 預(yù)測進行模型化,且此分析的剩余部分接著在頻域中使用線性預(yù)測進行模型化)的時域及 頻域系數(shù)的模板執(zhí)行CTFLP合成。在另一實例中,上下文產(chǎn)生引擎140經(jīng)配置以基于包括 多分辨分析(MRA)樹的模板執(zhí)行多分辨合成,所述多分辨分析(MRA)樹描述至少一個基底 函數(shù)在不同時間及頻率標度處的系數(shù)(例如,例如多貝西(Daubechies)比例縮放函數(shù)的比 例縮放函數(shù)的系數(shù),及例如多貝西小波函數(shù)的小波函數(shù)的系數(shù))。圖10展示基于平均系數(shù) 及詳細系數(shù)的序列的所產(chǎn)生上下文信號S50的多分辨合成的一個實例??赡苄枰舷挛漠a(chǎn)生引擎140根據(jù)語音通信會話的預(yù)期長度產(chǎn)生所產(chǎn)生上下文 信號S50。在一個所述實例中,上下文產(chǎn)生引擎140經(jīng)配置以根據(jù)平均電話呼叫長度產(chǎn)生所 產(chǎn)生上下文信號S50。平均呼叫長度的典型值在一到四分鐘的范圍內(nèi),且上下文產(chǎn)生引擎 140可經(jīng)實施以使用可根據(jù)用戶選擇而變化的默認值(例如,兩分鐘)??赡苄枰舷挛漠a(chǎn)生引擎140產(chǎn)生所產(chǎn)生上下文信號S50以包括基于相同模板的 若干或許多不同上下文信號削波。所要數(shù)目的不同削波可設(shè)定為默認值或由設(shè)備XlOO的 用戶選擇,且此數(shù)目的典型范圍為五到二十。在一個所述實例中,上下文產(chǎn)生引擎140經(jīng)配 置以根據(jù)基于平均呼叫長度及不同削波的所要數(shù)目的削波長度計算不同削波中的每一者。 削波長度通常比幀長度大一、二或三個數(shù)量級。在一個實例中,平均呼叫長度值為兩分鐘, 不同削波的所要數(shù)目為十,且通過將兩分鐘除以十而計算削波長度為十二秒。在此類情形下,上下文產(chǎn)生引擎140可經(jīng)配置以產(chǎn)生所要數(shù)目的不同削波(各自 基于相同模板且具有所計算的削波長度),且級聯(lián)或以其它方式組合這些削波以產(chǎn)生所產(chǎn) 生上下文信號S50。上下文產(chǎn)生引擎140可經(jīng)配置以重復(fù)所產(chǎn)生上下文信號S50(如果必 要)(例如,假如通信的長度超過平均呼叫長度)??赡苄枰渲蒙舷挛漠a(chǎn)生引擎140以根 據(jù)音頻信號SlO從有聲到無聲幀的過渡產(chǎn)生新削波。圖9D展示用于產(chǎn)生所產(chǎn)生上下文信號S50的可由上下文產(chǎn)生引擎140的實施方 案執(zhí)行的方法MlOO的流程圖。任務(wù)TlOO基于平均呼叫長度值及不同削波的所要數(shù)目計算 削波長度。任務(wù)T200基于模板產(chǎn)生所要數(shù)目的不同削波。任務(wù)T300將削波進行組合以產(chǎn) 生所產(chǎn)生上下文信號S50。任務(wù)T200可經(jīng)配置以從包括MRA樹的模板產(chǎn)生上下文信號削波。舉例來說,任務(wù) T200可經(jīng)配置以通過產(chǎn)生統(tǒng)計學(xué)上類似于模板樹的新MRA樹且根據(jù)所述新樹合成上下文 信號削波而產(chǎn)生每一削波。在此種情形下,任務(wù)T200可經(jīng)配置以將新MRA樹產(chǎn)生為模板樹 的復(fù)本,其中一個或一個以上(可能全部)序列的一個或一個以上(可能全部)系數(shù)由具有 類似祖系體(ancestor)(即,在較低分辨率下的序列中)及/或前體(predecessor)(即, 在相同序列中)的模板樹的其它系數(shù)取代。在另一實例中,任務(wù)T200經(jīng)配置以根據(jù)通過向 一組模板系數(shù)值的復(fù)本的每一值加上小隨機值而計算的一組新系數(shù)值產(chǎn)生每一削波。
任務(wù)T200可經(jīng)配置以根據(jù)音頻信號SlO及/或基于其的信號(例如,信號S12及/ 或S 13)的一個或一個以上特征而按比例縮放上下文信號削波中的一者或一者以上(可能 全部)。所述特征可包括信號電平、幀能量、SNR、一個或一個以上梅爾頻率倒譜系數(shù)(MFCC) 及/或?qū)π盘柕恼Z音活動性檢測操作的一個或一個以上結(jié)果。對于任務(wù)T200經(jīng)配置以從 所產(chǎn)生的MRA樹合成削波的情形來說,任務(wù)T200可經(jīng)配置以對所產(chǎn)生MRA樹的系數(shù)執(zhí)行此 種按比例縮放。上下文產(chǎn)生器120的實施方案可經(jīng)配置以執(zhí)行任務(wù)T200的此種實施方案。 另外或在替代方案中,任務(wù)T300可經(jīng)配置以對經(jīng)組合的所產(chǎn)生上下文信號執(zhí)行此種按比 例縮放。上下文混合器190的實施方案可經(jīng)配置以執(zhí)行任務(wù)T300的此種實施方案。任務(wù)T300可經(jīng)配置以根據(jù)相似性的測量組合上下文信號削波。任務(wù)T300可經(jīng)配 置以級聯(lián)具有類似MFCC向量的削波(例如,根據(jù)候選削波組上的MFCC向量的相對相似性 級聯(lián)削波)。舉例來說,任務(wù)T200可經(jīng)配置以最小化相鄰削波的MFCC向量之間的在經(jīng)組合 削波串上計算的總距離。對于任務(wù)T200經(jīng)配置以執(zhí)行CTFLP合成的情形來說,任務(wù)T300 可經(jīng)配置以級聯(lián)或以其它方式組合從類似系數(shù)產(chǎn)生的削波。舉例來說,任務(wù)T200可經(jīng)配置 以最小化相鄰削波的LPC系數(shù)之間的在經(jīng)組合削波串上計算的總距離。任務(wù)T300還可經(jīng) 配置以串連具有類似邊界瞬變的削波(例如,避免從一個削波到下一削波的可聽見的不連 續(xù)性)。舉例來說,任務(wù)T200可經(jīng)配置以最小化相鄰削波的邊界區(qū)域上的能量之間的在經(jīng) 組合削波串上計算的總距離。在這些實例中的任一者中,任務(wù)T300可經(jīng)配置以使用疊加 (overlap-and-add)或交叉淡化(cross-fade)操作(而非級聯(lián))來組合相鄰削波。如上文所描述,上下文產(chǎn)生引擎140可經(jīng)配置以基于可以允許低存儲成本及擴 展非重復(fù)產(chǎn)生的緊密表示形式下載或檢索的對聲音紋理的描述而產(chǎn)生所產(chǎn)生上下文信號 S50。此等技術(shù)亦可應(yīng)用于視頻或視聽應(yīng)用。舉例來說,設(shè)備XlOO的具有視頻能力的實施 方案可經(jīng)配置以執(zhí)行多分辨合成操作以增強或取代視聽通信的視覺上下文(例如,背景及 /或照明特性)。上下文產(chǎn)生引擎140可經(jīng)配置以貫穿通信會話(例如,電話呼叫)重復(fù)地產(chǎn)生隨 機MRA樹。由于可預(yù)期較大樹需要較長時間產(chǎn)生,所以可基于對延遲的容許度選擇MRA樹 的深度。在另一實例中,上下文產(chǎn)生引擎140可經(jīng)配置以使用不同模板產(chǎn)生多個短MRA樹, 及/或選擇多個隨機MRA樹,且混合及/或級聯(lián)這些樹中的兩者或兩者以上以獲得樣本的 較長序列。可能需要配置設(shè)備XlOO以根據(jù)增益控制信號S90的狀態(tài)控制所產(chǎn)生上下文信號 S50的電平。舉例來說,上下文產(chǎn)生器120 (或其元件,例如上下文產(chǎn)生引擎140)可經(jīng)配置 以根據(jù)增益控制信號S90的狀態(tài)(可能通過對所產(chǎn)生上下文信號S50或?qū)π盘朣50的前體 執(zhí)行按比例縮放操作(例如,對模板樹或從模板樹產(chǎn)生的MRA樹的系數(shù)))以特定電平產(chǎn)生 所產(chǎn)生上下文信號S50。在另一實例中,圖13A展示包括按比例縮放器(例如,乘法器)的 上下文混合器190的實施方案192的框圖,所述按比例縮放器經(jīng)布置以根據(jù)增益控制信號 S90的狀態(tài)對所產(chǎn)生上下文信號S50執(zhí)行按比例縮放操作。上下文混合器192還包括經(jīng)配 置以將經(jīng)按比例縮放的上下文信號相加到上下文受抑制音頻信號S13的加法器。包括設(shè)備XlOO的裝置可經(jīng)配置以根據(jù)用戶選擇來設(shè)定增益控制信號S90的狀態(tài)。 舉例來說,此種裝置可裝備有音量控制(例如,開關(guān)或旋鈕,或提供此種功能性的圖形用戶 接口),裝置的用戶可通過所述音量控制選擇所產(chǎn)生上下文信號S50的所要電平。在此情形下,裝置可經(jīng)配置以根據(jù)所選電平設(shè)定增益控制信號S90的狀態(tài)。在另一實例中,此種音量 控制可經(jīng)配置以允許用戶選擇所產(chǎn)生上下文信號S50相對于話音分量的(例如,上下文受 抑制音頻信號S13的)電平的所要電平。圖IlA展示包括增益控制信號計算器195的上下文處理器102的實施方案108的 框圖。增益控制信號計算器195經(jīng)配置以根據(jù)可隨時間推移而改變的信號S13的電平計算 增益控制信號S90。舉例來說,增益控制信號計算器195可經(jīng)配置以基于信號S13的活動幀 的平均能量來設(shè)定增益控制信號S90的狀態(tài)。另外或在任一此種情形的替代方案中,包括 設(shè)備XlOO的裝置可裝備有音量控制,所述音量控制經(jīng)配置以允許用戶直接控制話音分量 (例如,信號S13)或上下文經(jīng)增強音頻信號S15的電平,或間接控制此種電平(例如,通過 控制前驅(qū)信號的電平)。設(shè)備XlOO可經(jīng)配置以控制所產(chǎn)生上下文信號S50相對于音頻信號S10、S12及S13 中的一者或一者以上的電平的電平,其可隨時間推移而變化。在一個實例中,設(shè)備Xioo經(jīng) 配置以根據(jù)音頻信號Sio的原始上下文的電平控制所產(chǎn)生上下文信號S50的電平。設(shè)備 Xioo的此種實施方案可包括經(jīng)配置以根據(jù)在活動幀期間上下文抑制器110的輸入電平與 輸出電平之間的關(guān)系(例如,差別)來計算增益控制信號S90的增益控制信號計算器195 的實施方案。舉例來說,此種增益控制計算器可經(jīng)配置以根據(jù)音頻信號SlO的電平與上下 文受抑制音頻信號S13的電平之間的關(guān)系(例如,差別)來計算增益控制信號S90。此種增 益控制計算器可經(jīng)配置以根據(jù)音頻信號SlO的可從信號SlO及S13的活動幀的電平而計算 的SNR來計算增益控制信號S90。此種增益控制信號計算器可經(jīng)配置以基于隨時間推移而 平滑化(例如,平均化)的輸入電平來計算增益控制信號S90,及/或可經(jīng)配置以輸出隨時 間推移而平滑化(例如,平均化)的增益控制信號S90。在另一實例中,設(shè)備XlOO經(jīng)配置以根據(jù)所要SNR控制所產(chǎn)生上下文信號S50的電 平??商卣骰癁樯舷挛慕?jīng)增強音頻信號S15的活動幀中的話音分量(例如,上下文受抑制音 頻信號S13)的電平與所產(chǎn)生上下文信號S50的電平之間的比率的SNR還可稱為“信號上下 文比(signal-to-context ratio)”。所要SNR值可為用戶選擇的,及/或在不同所產(chǎn)生上 下文中不同。舉例來說,不同所產(chǎn)生上下文信號S50可與不同對應(yīng)所要SNR值相關(guān)聯(lián)。所 要SNR值的典型范圍為20dB到25dB。在另一實例中,設(shè)備XlOO經(jīng)配置以控制所產(chǎn)生上下 文信號S50(例如,背景信號)的電平為小于上下文受抑制音頻信號S13(例如,前景信號) 的電平。圖IlB展示包括增益控制信號計算器195的實施方案197的上下文處理器102的 實施方案109的框圖。增益控制計算器197經(jīng)配置及布置以根據(jù)㈧所要SNR值與⑶信 號S13與S50的電平之間的比率之間的關(guān)系來計算增益控制信號S90。在一個實例中,如 果所述比率小于所要SNR值,則增益控制信號S90的對應(yīng)狀態(tài)致使上下文混合器192以較 高電平混合所產(chǎn)生上下文信號S50 (例如,以在將所產(chǎn)生上下文信號S50相加到上下文受抑 制信號S13之前提高所產(chǎn)生上下文信號S50的電平),且如果所述比率大于所要SNR值,則 增益控制信號S90的對應(yīng)狀態(tài)致使上下文混合器192以較低電平混合所產(chǎn)生上下文信號 S50 (例如,以在將信號S50相加到信號S13之前降低信號S50的電平)。如上文所描述,增益控制信號計算器195經(jīng)配置以根據(jù)一個或一個以上輸入信號 (例如,S10、S13、S50)中的每一者的電平來計算增益控制信號S90的狀態(tài)。增益控制信號
22計算器195可經(jīng)配置以將輸入信號的電平計算為在一個或一個以上活動幀上進行平均的 信號振幅。或者,增益控制信號計算器195可經(jīng)配置以將輸入信號的電平計算為在一個或 一個以上活動幀上進行平均的信號能量。通常,幀的能量計算為幀的平方樣本的和。可能 需要配置增益控制信號計算器195以對所計算電平及/或增益控制信號S90中的一者或一 者以上進行濾波(例如,平均化或平滑化)。舉例來說,可能需要配置增益控制信號計算器 195以計算例如SlO或S13的輸入信號的幀能量的運行平均值(例如,通過將一階或更高階 的有限脈沖響應(yīng)或無限脈沖響應(yīng)濾波器應(yīng)用到信號的經(jīng)計算的幀能量),且使用平均能量 來計算增益控制信號S90。同樣,可能需要配置增益控制信號計算器195以在將增益控制信 號S90輸出到上下文混合器192及/或上下文產(chǎn)生器120之前將此種濾波器應(yīng)用到增益控 制信號S90。音頻信號SlO的上下文分量的電平可能獨立于話音分量的電平而改變,且在此種 情形下,可能需要對應(yīng)地改變所產(chǎn)生上下文信號S50的電平。舉例來說,上下文產(chǎn)生器120 可經(jīng)配置以根據(jù)音頻信號SlO的SNR改變所產(chǎn)生上下文信號S50的電平。以此種方式,上 下文產(chǎn)生器120可經(jīng)配置以控制所產(chǎn)生上下文信號S50的電平從而接近音頻信號SlO中的 原始上下文的電平。為維持獨立于話音分量的上下文分量的錯覺,可能需要即使信號電平改變也要維 持恒定上下文電平。舉例來說,歸因于說話者的嘴對于麥克風的方位的改變或歸因于例如 音量調(diào)制或另一表達性效果的說話者語音的改變而可能發(fā)生信號電平的改變。在此種情形 下,可能需要所產(chǎn)生上下文信號S50的電平在通信會話(例如,電話呼叫)的持續(xù)時間內(nèi)保 持恒定。如本文描述的設(shè)備XlOO的實施方案可包括于經(jīng)配置用于語音通信或存儲的任何 類型的裝置中。此種裝置的實例可包括(但不限于)以下各物電話、蜂窩式電話、頭戴式 耳機(例如,經(jīng)配置以經(jīng)由Bluetooth 無線協(xié)議的版本與移動用戶終端全雙工地進行通 信的耳機)、個人數(shù)字助理(PDA)、膝上型計算機、語音記錄器、游戲機、音樂播放器、數(shù)字相 機。所述裝置還可配置為用于無線通信的移動用戶終端,以使得如本文所描述的設(shè)備XlOO 的實施方案可包括于其內(nèi),或可以其它方式經(jīng)配置以向裝置的發(fā)射器或收發(fā)器部分提供經(jīng) 編碼音頻信號S20。用于語音通信的系統(tǒng)(例如用于有線及/或無線電話的系統(tǒng))通常包括若干發(fā)射 器及接收器。發(fā)射器及接收器可經(jīng)集成或以其它方式作為收發(fā)器一起實施于共同外殼內(nèi)。 可能需要將設(shè)備XlOO實施為對發(fā)射器或收發(fā)器的具有足夠可用處理、存儲及可升級性的 升級。舉例來說,可通過將上下文處理器100的元件(例如,在固件更新中)添加到已包括 話音編碼器Xio的實施方案的裝置而實現(xiàn)設(shè)備XlOO的實施方案。在一些情形下,可執(zhí)行此 種升級而不改變通信系統(tǒng)的任何其它部分。舉例來說,可能需要升級通信系統(tǒng)中的發(fā)射器 中的一者或一者以上(例如,用于無線蜂窩式電話的系統(tǒng)中的一個或一個以上移動用戶終 端中的每一者的發(fā)射器部分)以包括設(shè)備Xioo的實施方案,而不對接收器作出任何對應(yīng)改 變。可能需要以使得所得裝置保持為向后可兼容(例如,以使得裝置保持為能夠執(zhí)行全部 或大致上全部的不涉及上下文處理器100的使用的其先前操作)的方式執(zhí)行升級。對于設(shè)備XlOO的實施方案用以將所產(chǎn)生上下文信號S50插入于經(jīng)編碼音頻信號 S20中的情形來說,可能需要說話者(S卩,包括設(shè)備XlOO的實施方案的裝置的用戶)能夠監(jiān)視傳輸。舉例來說,可能需要說話者能夠聽到所產(chǎn)生上下文信號S50及/或上下文經(jīng)增強 音頻信號S15。此種能力對于所產(chǎn)生上下文信號S50不同于現(xiàn)存上下文的情形來說可為尤 其需要的。因此,包括設(shè)備XlOO的實施方案的裝置可經(jīng)配置以將所產(chǎn)生上下文信號S50及上 下文經(jīng)增強音頻信號S15中的至少一者反饋到耳機、揚聲器或位于裝置的外殼內(nèi)的其它音 頻轉(zhuǎn)變器;到位于裝置的外殼內(nèi)的音頻輸出插口 ;及/或到位于裝置的外殼內(nèi)的短程無線 發(fā)射器(例如,如符合由藍牙技術(shù)聯(lián)盟(Bluetooth Special Interest Group)在華盛頓州 (WA)的貝爾維尤(Bellevue)發(fā)布的藍牙協(xié)議的版本及/或另一個人區(qū)域網(wǎng)絡(luò)協(xié)議的發(fā)射 器)。此種裝置可包括經(jīng)配置及布置以從所產(chǎn)生上下文信號S50或上下文經(jīng)增強音頻信號 S15產(chǎn)生模擬信號的數(shù)/模轉(zhuǎn)換器(DAC)。此種裝置還可經(jīng)配置以在將模擬信號應(yīng)用到插 口及/或轉(zhuǎn)變器之前對其執(zhí)行一個或一個以上模擬處理操作(例如,濾波、均等化及/或放 大)。設(shè)備XlOO可能(但不必)經(jīng)配置以包括此種DAC及/或模擬處理路徑。在語音通信的解碼器端處(例如,在接收器處或在檢索后),可能需要以類似于上 文描述的編碼器側(cè)技術(shù)的方式取代或增強現(xiàn)存上下文。還可能需要實施此種技術(shù)而不要求 改變對應(yīng)發(fā)射器或編碼設(shè)備。圖12A展示經(jīng)配置以接收經(jīng)編碼音頻信號S20且產(chǎn)生對應(yīng)經(jīng)解碼音頻信號SllO 的話音解碼器RlO的框圖。語音解碼器RlO包括譯碼方案檢測器60、活動幀解碼器70及非 活動幀解碼器80。經(jīng)編碼音頻信號S20為可由話音編碼器XlO產(chǎn)生的數(shù)字信號。解碼器70 及80可經(jīng)配置以對應(yīng)于如上文所描述的話音編碼器XlO的編碼器,以使得活動幀解碼器70 經(jīng)配置以解碼已由活動幀編碼器30進行編碼的幀,且非活動幀解碼器80經(jīng)配置以解碼已 由非活動幀編碼器40進行編碼的幀。語音解碼器RlO通常還包括經(jīng)配置以處理經(jīng)解碼音 頻信號SllO以減少量化噪聲(例如,通過強調(diào)共振峰頻率及/或衰減頻譜谷值)的后濾波 器(postfilter),且還可包括自適應(yīng)增益控制。包括解碼器RlO的裝置可包括經(jīng)配置及布 置以從經(jīng)解碼音頻信號SllO產(chǎn)生模擬信號以供輸出到耳機、揚聲器或其它音頻轉(zhuǎn)變器及/ 或位于裝置的外殼內(nèi)的音頻輸出插口的數(shù)/模轉(zhuǎn)換器(DAC)。此種裝置還可經(jīng)配置以在將 模擬信號應(yīng)用到插口及/或轉(zhuǎn)變器之前對其執(zhí)行一個或一個以上模擬處理操作(例如,濾 波、均等化及/或放大)。譯碼方案檢測器60經(jīng)配置以指示對應(yīng)于經(jīng)編碼音頻信號S20的當前幀的譯碼方 案。適當?shù)淖g碼位速率及/或譯碼模式可由幀的格式指示。譯碼方案檢測器60可經(jīng)配置以 執(zhí)行速率檢測或從設(shè)備(話音解碼器RlO嵌埋于其內(nèi))的另一部分(例如多路復(fù)用子層) 接收速率指示。舉例來說,譯碼方案檢測器60可經(jīng)配置以從多路復(fù)用子層接收指示位速率 的包類型指示符?;蛘?,譯碼方案檢測器60可經(jīng)配置以從例如幀能量的一個或一個以上參 數(shù)確定經(jīng)編碼幀的位速率。在一些應(yīng)用中,譯碼系統(tǒng)經(jīng)配置以針對特定位速率僅使用一個 譯碼模式,以使得經(jīng)編碼幀的位速率還指示譯碼模式。在其它情形下,經(jīng)編碼幀可包括例如 一組一個或一個以上位的識別對幀進行編碼所根據(jù)的譯碼模式的信息。此種信息(還稱為 “譯碼索引”)可明確地或隱含地指示譯碼模式(例如,通過指示對于其它可能的譯碼模式 來說無效的值)。圖12A展示由譯碼方案檢測器60產(chǎn)生的譯碼方案指示用以控制話音解碼器RlO 的一對選擇器90a及90b以選擇活動幀解碼器70及非活動幀解碼器80中的一者的實例。注意,話音解碼器RlO的軟件或固件實施方案可使用譯碼方案指示來引導(dǎo)對幀解碼器中的 一者或另一者的執(zhí)行的流程,且此種實施方案可能不包括針對選擇器90a及/或選擇器90b 的模擬。圖12B展示支持對以多個譯碼方案進行編碼的活動幀的解碼的話音解碼器RlO 的實施方案R20的實例,其特征可包括于本文描述的其它話音解碼器實施方案中的任一者 中。語音解碼器R20包括譯碼方案檢測器60的實施方案62 ;選擇器90a、90b的實施方案 92a、92b ;及活動幀解碼器70的實施方案70a、70b,其經(jīng)配置以使用不同譯碼方案(例如, 全速率CELP及半速率NELP)來解碼經(jīng)編碼的幀?;顒訋獯a器70或非活動幀解碼器80的典型實施方案經(jīng)配置以從經(jīng)編碼幀提取 LPC系數(shù)值(例如,經(jīng)由反量化,繼之以經(jīng)反量化向量向LPC系數(shù)值形式的轉(zhuǎn)換),且使用那 些值來配置合成濾波器。根據(jù)來自經(jīng)編碼幀的其它值及/或基于偽隨機噪聲信號計算或產(chǎn) 生的激勵信號用以激勵合成濾波器以再現(xiàn)對應(yīng)經(jīng)解碼幀。注意,兩個或兩個以上的幀解碼器可共享共同結(jié)構(gòu)。舉例來說,解碼器70及80 (或 解碼器70a、70b及80)可共享LPC系數(shù)值的計算器,其可能經(jīng)配置以產(chǎn)生針對活動幀與非 活動幀具有不同階數(shù)的結(jié)果,但具有分別不同的時間描述計算器。還注意,話音解碼器RlO 的軟件或固件實施方案可使用譯碼方案檢測器60的輸出來引導(dǎo)對幀解碼器中的一者或另 一者的執(zhí)行的流程,且此種實施方案可能不包括針對選擇器90a及/或選擇器90b的模擬。圖13B展示根據(jù)一般配置的設(shè)備RlOO (還稱為解碼器、解碼設(shè)備或用于解碼的設(shè) 備)的框圖。設(shè)備RlOO經(jīng)配置以從經(jīng)解碼音頻信號SllO移除現(xiàn)存上下文且將其取代為可 能類似于或不同于現(xiàn)存上下文的所產(chǎn)生上下文。除話音解碼器RlO的元件之外,設(shè)備RlOO 包括經(jīng)配置及布置以處理音頻信號SllO以產(chǎn)生上下文經(jīng)增強音頻信號Sl 15的上下文處理 器100的實施方案200。包括設(shè)備RlOO的例如蜂窩式電話的通信裝置可經(jīng)配置以對從有 線、無線或光學(xué)傳輸信道(例如,經(jīng)由一個或一個以上載波的射頻解調(diào)制)接收的信號執(zhí)行 處理操作,例如錯誤校正、冗余及/或協(xié)議(例如,以太網(wǎng)絡(luò)、TCP/IP、CDMA2000)譯碼,以獲 得經(jīng)編碼音頻信號S20。如圖14A中所展示,上下文處理器200可經(jīng)配置以包括上下文抑制器110的例子 210,上下文產(chǎn)生器120的例子220及上下文混合器190的例子290,其中所述例子根據(jù)上 文關(guān)于圖3B及圖4B描述的各種實施方案中的任一者進行配置(除上下文抑制器110的使 用來自如上文所描述的多個麥克風的信號的實施方案可能不適合用于設(shè)備RlOO中以外)。 舉例來說,上下文處理器200可包括經(jīng)配置以對音頻信號SllO執(zhí)行如上文關(guān)于噪聲抑制器 10所描述的噪聲抑制操作的冒進實施方案(例如維納(Wiener)濾波操作)以獲得上下文 受抑制音頻信號S113的上下文抑制器110的實施方案。在另一實例中,上下文處理器200 包括上下文抑制器110的實施方案,上下文抑制器110的所述實施方案經(jīng)配置以根據(jù)如上 文所描述的現(xiàn)存上下文(例如,音頻信號SllO的一個或一個以上非活動幀的)的統(tǒng)計學(xué)描 述對音頻信號SllO執(zhí)行頻譜相減操作以獲得上下文受抑制音頻信號S113。另外或在對于 任一此種情形的替代方案中,上下文處理器200可經(jīng)配置以對音頻信號SllO執(zhí)行如上文所 描述的中心削波操作。如上文關(guān)于上下文抑制器100所描述,可能需要將上下文抑制器200實施為可在 兩個或兩個以上不同操作模式中進行配置(例如,從無上下文抑制到大致上完全上下文抑 制的范圍)。圖14B展示包括經(jīng)配置以根據(jù)處理控制信號S30的例子S130的狀態(tài)進行操作
25的上下文抑制器112的例子212及上下文產(chǎn)生器122的例子222的設(shè)備RlOO的實施方案 RllO的框圖。上下文產(chǎn)生器220經(jīng)配置以根據(jù)上下文選擇信號S40的例子S140的狀態(tài)產(chǎn)生所 產(chǎn)生上下文信號S50的例子S150??刂苾蓚€或兩個以上上下文中的至少一者的選擇的上下 文選擇信號S140的狀態(tài)可能是基于一個或一個以上準則,例如與包括設(shè)備RlOO的裝置的 物理位置有關(guān)的信息(例如,基于GPS及/或上文論述的其它信息)、將不同時間或時間周 期與對應(yīng)上下文相關(guān)聯(lián)的時間表、呼叫者的身份(例如,如經(jīng)由呼叫號碼識別(CNID)進行 確定,還稱為“自動號碼識別”(ANI)或呼叫者ID信令)、用戶選擇的設(shè)定或模式(例如商 務(wù)模式、舒緩模式、聚會模式),及/或兩個或兩個以上上下文的列表中的一者的用戶選擇 (例如,經(jīng)由例如菜單的圖形用戶接口)。舉例來說,設(shè)備RlOO可經(jīng)實施以包括如上文所描 述的將此種準則的值與不同上下文相關(guān)聯(lián)的上下文選擇器330的例子。在另一實例中,設(shè) 備RlOO經(jīng)實施以包括如上文所描述的經(jīng)配置以基于音頻信號SllO的現(xiàn)存上下文的一個或 一個以上特性(例如,與音頻信號SllO的一個或一個以上非活動幀的一個或一個以上時間 及/或頻率特性有關(guān)的信息)產(chǎn)生上下文選擇信號S140的上下文分類器320的例子。上 下文產(chǎn)生器220可根據(jù)如上文所描述的上下文產(chǎn)生器120的各種實施方案中的任一者進行 配置。舉例來說,上下文產(chǎn)生器220可經(jīng)配置以從本地存儲裝置檢索描述所選上下文的參 數(shù)值,或從例如服務(wù)器的外部裝置下載所述參數(shù)值(例如,經(jīng)由SIP)。可能需要配置上下 文產(chǎn)生器220以分別使產(chǎn)生上下文選擇信號S50的起始及終止與通信會話(例如,電話呼 叫)的開始及結(jié)束同步。處理控制信號S130控制上下文抑制器212的操作以啟用或停用上下文抑制(即, 以輸出具有音頻信號Slio的現(xiàn)存上下文或者取代上下文的音頻信號)。如圖14B中所展 示,處理控制信號S130還可經(jīng)布置以啟用或停用上下文產(chǎn)生器222?;蛘?,上下文選擇信號 S140可經(jīng)配置以包括選擇上下文產(chǎn)生器220的空值輸出的狀態(tài),或者上下文混合器290可 經(jīng)配置以將處理控制信號S130接收為如上文關(guān)于上下文混合器190所描述的啟用/停用 控制輸入。處理控制信號S130可經(jīng)實施以具有一個以上狀態(tài),以使得其可用以改變由上下 文抑制器212執(zhí)行的抑制的電平。設(shè)備RlOO的另外的實施方案可經(jīng)配置以根據(jù)接收器處 周圍聲音的電平控制上下文抑制的電平及/或所產(chǎn)生上下文信號S150的電平。舉例來說, 此種實施方案可經(jīng)配置以控制音頻信號S115的SNR與周圍聲音的電平成反比關(guān)系(例如, 如使用來自包括設(shè)備RlOO的裝置的麥克風的信號進行感測)。還明確地指出,當選擇使用 人工上下文時可將非活動幀解碼器80斷電。一般來說,設(shè)備RlOO可經(jīng)配置以通過根據(jù)適當譯碼方案解碼每一幀、抑制現(xiàn)存上 下文(可能達可變的程度)及根據(jù)某一電平添加所產(chǎn)生上下文信號S150而處理活動幀。對 于非活動幀來說,設(shè)備RlOO可經(jīng)實施以解碼每一幀(或每一 SID幀)及添加所產(chǎn)生上下文 信號S150?;蛘?,設(shè)備RlOO可經(jīng)實施以忽略或丟棄非活動幀,且將其取代為所產(chǎn)生上下文 信號S150。舉例來說,圖15展示經(jīng)配置以在選擇上下文抑制時丟棄非活動幀解碼器80的 輸出的設(shè)備R200的實施方案。此實例包括經(jīng)配置以根據(jù)處理控制信號S 130的狀態(tài)選擇 所產(chǎn)生上下文信號S150及非活動幀解碼器80的輸出中的一者的選擇器250。設(shè)備RlOO的另外的實施方案可經(jīng)配置以使用來自經(jīng)解碼音頻信號的一個或一個 以上非活動幀的信息來改進由上下文抑制器210應(yīng)用的用于活動幀中的上下文抑制的噪聲模型。另外或在替代方案中,設(shè)備RlOO的所述另外的實施方案可經(jīng)配置以使用來自經(jīng)解 碼音頻信號的一個或一個以上非活動幀的信息來控制所產(chǎn)生上下文信號S150的電平(例 如,以控制上下文經(jīng)增強音頻信號S115的SNR)。設(shè)備RlOO還可經(jīng)實施以使用來自經(jīng)解 碼音頻信號的非活動幀的上下文信息來補充經(jīng)解碼音頻信號的一個或一個以上活動幀及/ 或經(jīng)解碼音頻信號的一個或一個以上其它非活動幀內(nèi)的現(xiàn)存上下文。舉例來說,此種實施 方案可用以取代已歸因于如發(fā)射器處的過度冒進噪聲抑制及/或不足的譯碼速率或SID傳 輸速率的因素而丟失的現(xiàn)存上下文。如上所述,設(shè)備RlOO可經(jīng)配置以在產(chǎn)生經(jīng)編碼音頻信號S20的編碼器不作用及/ 或不改變的情形下執(zhí)行上下文增強或取代。設(shè)備RlOO的此種實施方案可包括于經(jīng)配置以 在對應(yīng)發(fā)射器(從其處接收信號S20)不作用及/或不改變的情形下執(zhí)行上下文增強或取 代的接收器內(nèi)?;蛘撸O(shè)備RlOO可經(jīng)配置以獨立地或根據(jù)編碼器控制而下載上下文參數(shù)值 (例如,從SIP服務(wù)器),及/或此種接收器可經(jīng)配置以獨立地或根據(jù)發(fā)射器控制而下載上 下文參數(shù)值(例如,從SIP服務(wù)器)。在所述情形下,SIP服務(wù)器或其它參數(shù)值源可經(jīng)配置 以使得編碼器或發(fā)射器的上下文選擇優(yōu)先于解碼器或接收器的上下文選擇。可能需要根據(jù)本文描述的原理(例如,根據(jù)設(shè)備XlOO及RlOO的實施方案)實施在 上下文增強及/或取代的操作中進行協(xié)作的話音編碼器及解碼器。在此種系統(tǒng)內(nèi),可將指 示所要上下文的信息傳送到呈若干不同形式中的任一者的解碼器。在第一類實例中,將上 下文信息傳送為描述,所述描述包括一組參數(shù)值,例如LSF值及對應(yīng)能量值序列的向量(例 如,靜默描述符或SID),或例如平均序列及對應(yīng)組的詳細序列(如圖10的MRA樹實例中所 展示)。一組參數(shù)值(例如,向量)可經(jīng)量化以供傳輸為一個或一個以上碼簿索引。在第二類實例中,將上下文信息作為一個或一個以上上下文識別符(還稱為“上 下文選擇信息”)傳送到解碼器??蓪⑸舷挛淖R別符實施為對應(yīng)于兩個或兩個以上不同音 頻上下文的列表中的特定條目的索引。在所述情形下,加索引列表條目(其可存儲于本地 或存儲于解碼器外部)可包括包括一組參數(shù)值的對對應(yīng)上下文的描述。另外或在一個或一 個以上上下文識別符的替代方案中,音頻上下文選擇信息可包括指示編碼器的物理位置及 /或上下文模式的信息。在這些類別中的任一者中,可直接及/或間接地將上下文信息從編碼器傳送到解 碼器。在直接傳輸中,編碼器將上下文信息在經(jīng)編碼音頻信號S20內(nèi)(即,經(jīng)由相同邏輯信 道及經(jīng)由與話音分量相同的協(xié)議堆棧)及/或經(jīng)由單獨傳輸信道(例如,可使用不同協(xié)議 的數(shù)據(jù)信道或其它單獨邏輯信道)發(fā)送到解碼器。圖16展示經(jīng)配置以經(jīng)由不同邏輯信道 (例如,在相同無線信號內(nèi)或在不同信號內(nèi))傳輸所選音頻上下文的話音分量及經(jīng)編碼(例 如,經(jīng)量化)參數(shù)值的設(shè)備XlOO的實施方案X200的框圖。在此特定實例中,設(shè)備X200包 括如上文所描述的處理控制信號產(chǎn)生器340的例子。圖16中展示的設(shè)備X200的實施方案包括上下文編碼器150。在此實例中,上下文 編碼器150經(jīng)配置以產(chǎn)生基于上下文描述(例如,一組上下文參數(shù)值S70)的經(jīng)編碼上下文 信號S80。上下文編碼器150可經(jīng)配置以根據(jù)認為適于特定應(yīng)用的任何譯碼方案產(chǎn)生經(jīng)編 碼上下文信號S80。此種譯碼方案可包括例如霍夫曼(Huffman)譯碼、算術(shù)譯碼、范圍編碼 及游程長度編碼(rim-length-encoding)的一個或一個以上壓縮操作。此種譯碼方案可為 有損及/或無損的。此種譯碼方案可經(jīng)配置以產(chǎn)生具有固定長度的結(jié)果及/或具有可變長度的結(jié)果。此種譯碼方案可包括量化上下文描述的至少一部分。上下文編碼器150還可經(jīng)配置以執(zhí)行上下文信息的協(xié)議編碼(例如,在運輸層及 /或應(yīng)用層處)。在此種情形下,上下文編碼器150可經(jīng)配置以執(zhí)行例如包形成及/或信號 交換的一個或一個以上相關(guān)操作。甚至可能需要配置上下文編碼器150的此種實施方案以 發(fā)送上下文信息而不執(zhí)行任何其它編碼操作。圖17展示經(jīng)配置以將識別或描述所選上下文的信息編碼為經(jīng)編碼音頻信號S20 的對應(yīng)于音頻信號SlO的非活動幀的幀周期的設(shè)備XlOO的另一實施方案X210的框圖。所 述幀周期在本文還稱為“經(jīng)編碼音頻信號S20的非活動幀”。在一些情形下,可能在解碼器 處導(dǎo)致延遲,直到已針對上下文產(chǎn)生接收對所選上下文的足夠量的描述。在相關(guān)實例中,設(shè)備X210經(jīng)配置以發(fā)送對應(yīng)于本地地存儲于解碼器處及/或從例 如服務(wù)器的另一裝置下載的上下文描述(例如,在呼叫建立期間)的初始上下文識別符,且 還經(jīng)配置以發(fā)送對所述上下文描述的隨后更新(例如,經(jīng)由經(jīng)編碼音頻信號S20的非活動 幀)。圖18展示經(jīng)配置以將音頻上下文選擇信息(例如,所選上下文的識別符)編碼為經(jīng) 編碼音頻信號S20的非活動幀的設(shè)備XlOO的相關(guān)實施方案X220的框圖。在此種情形下, 設(shè)備X220可經(jīng)配置以在通信會話的過程期間(甚至從一個幀到下一幀)更新上下文識別 符。圖18中展示的設(shè)備X220的實施方案包括上下文編碼器150的實施方案152。上 下文編碼器152經(jīng)配置以產(chǎn)生基于音頻上下文選擇信息(例如,上下文選擇信號S40)的經(jīng) 編碼上下文信號S80的例子S82,其可包括一個或一個以上上下文識別符及/或其它例如物 理位置及/或上下文模式的指示的信息。如上文關(guān)于上下文編碼器150所描述,上下文編 碼器152可經(jīng)配置以根據(jù)認為適于特定應(yīng)用及/或可經(jīng)配置以執(zhí)行上下文選擇信息的協(xié)議 編碼的任何譯碼方案產(chǎn)生經(jīng)編碼上下文信號S82。經(jīng)配置以將上下文信息編碼為經(jīng)編碼音頻信號S20的非活動幀的設(shè)備XlOO的實 施方案可經(jīng)配置以編碼每一非活動幀內(nèi)的此種上下文信息或不連續(xù)地編碼此種上下文信 息。在不連續(xù)傳輸(DTX)的一個實例中,設(shè)備XlOO的此種實施方案經(jīng)配置以根據(jù)規(guī)則間隔 (例如每五秒或十秒,或每128或256個幀)將識別或描述所選上下文的信息編碼為經(jīng)編碼 音頻信號S20的一個或一個以上非活動幀的序列。在不連續(xù)傳輸(DTX)的另一實例中,設(shè) 備XlOO的此種實施方案經(jīng)配置以根據(jù)例如不同上下文的選擇的某一事件將此種信息編碼 為經(jīng)編碼音頻信號S20的一個或一個以上非活動幀的序列。設(shè)備X210及X220經(jīng)配置以根據(jù)處理控制信號S30的狀態(tài)執(zhí)行現(xiàn)存上下文的編碼 (即,遺留操作)或上下文取代。在這些情形下,經(jīng)編碼音頻信號S20可包括指示非活動幀 是否包括現(xiàn)存上下文或與取代上下文有關(guān)的信息的旗標(例如,可能包括于每一非活動幀 中的一個或一個以上位)。圖19及圖20展示配置為在非活動幀期間不支持現(xiàn)存上下文的 傳輸?shù)膶?yīng)設(shè)備(分別為設(shè)備X300及設(shè)備X300的實施方案X310)的框圖。在圖19的實 例中,活動幀編碼器30經(jīng)配置以產(chǎn)生第一經(jīng)編碼音頻信號S20a,且譯碼方案選擇器20經(jīng) 配置以控制選擇器50b將經(jīng)編碼上下文信號S80插入于第一經(jīng)編碼音頻信號S20a的非活 動幀中以產(chǎn)生第二經(jīng)編碼音頻信號S20b。在圖20的實例中,活動幀編碼器30經(jīng)配置以產(chǎn) 生第一經(jīng)編碼音頻信號S20a,且譯碼方案選擇器20經(jīng)配置以控制選擇器50b將經(jīng)編碼上 下文信號S82插入于第一經(jīng)編碼音頻信號S20a的非活動幀中以產(chǎn)生第二經(jīng)編碼音頻信號S20b。在所述實例中,可能需要配置活動幀編碼器30而以包化形式(例如,作為一系列經(jīng) 編碼幀)產(chǎn)生第一經(jīng)編碼音頻信號20a。在所述情形下,選擇器50b可經(jīng)配置以如譯碼方案 選擇器20所指示將經(jīng)編碼上下文信號插入于第一經(jīng)編碼音頻信號S20a的對應(yīng)于上下文受 抑制信號的非活動幀的包(例如,經(jīng)編碼幀)內(nèi)的適當位置處,或者選擇器50b可經(jīng)配置以 如譯碼方案選擇器20所指示將由上下文編碼器150或152產(chǎn)生的包(例如,經(jīng)編碼幀)插 入于第一經(jīng)編碼音頻信號S20a內(nèi)的適當位置處。如上所述,經(jīng)編碼上下文信號S80可包括 與經(jīng)編碼上下文信號S80有關(guān)的信息(例如描述所選音頻上下文的一組參數(shù)值),且經(jīng)編碼 上下文信號S82可包括與經(jīng)編碼上下文信號S80有關(guān)的信息(例如識別一組音頻上下文中 的所選一者的上下文識別符)。在間接傳輸中,解碼器不僅經(jīng)由與經(jīng)編碼音頻信號S20不同的邏輯信道而且還從 例如服務(wù)器的不同實體接收上下文信息。舉例來說,解碼器可經(jīng)配置以使用編碼器的識別 符(例如,統(tǒng)一資源識別符(URI)或統(tǒng)一資源定位符(URL) JnRFC 3986中所描述,以www. ietf. org在線可得)、解碼器的識別符(例如,URL)及/或特定通信會話的識別符來請求 來自服務(wù)器的上下文信息。圖21A展示解碼器根據(jù)經(jīng)由協(xié)議堆棧P20及經(jīng)由第一邏輯信道 從編碼器接收的信息而經(jīng)由協(xié)議堆棧PlO (例如,在上下文產(chǎn)生器220及/或上下文解碼器 252內(nèi))及經(jīng)由第二邏輯信道從服務(wù)器下載上下文信息的實例。堆棧PlO及P20可為分離 的或可共享一個或一個以上層(例如,物理層、媒體接入控制層及邏輯鏈路層中的一者或 一者以上)??墒褂美鏢IP的協(xié)議執(zhí)行可以類似于下載鈴聲或音樂文件或流的方式執(zhí)行 的上下文信息從服務(wù)器到解碼器的下載。在其它實例中,可通過直接與間接傳輸?shù)哪骋唤M合將上下文信息從編碼器傳送到 解碼器。在一個一般實例中,編碼器將上下文信息以一種形式(例如,如音頻上下文選擇 信息)發(fā)送到系統(tǒng)內(nèi)的例如服務(wù)器的另一裝置,且其它裝置將對應(yīng)上下文信息以另一形式 (例如,作為上下文描述)發(fā)送到解碼器。在此種傳送的特定實例中,服務(wù)器經(jīng)配置以將上 下文信息輸送到解碼器而不接收針對來自解碼器的信息的請求(還稱為“推送”)。舉例來 說,服務(wù)器可經(jīng)配置以在呼叫建立期間將上下文信息推送到解碼器。圖21B展示服務(wù)器根 據(jù)編碼器經(jīng)由協(xié)議堆棧P30(例如,在上下文編碼器152內(nèi))及經(jīng)由第三邏輯信道發(fā)送的可 包括解碼器的URL或其它識別符的信息將上下文信息經(jīng)由第二邏輯信道下載到解碼器的 實例。在此種情形下,可使用例如SIP的協(xié)議執(zhí)行從編碼器到服務(wù)器的傳送及/或從服務(wù) 器到解碼器的傳送。此實例還說明經(jīng)編碼音頻信號S20經(jīng)由協(xié)議堆棧P40及經(jīng)由第一邏輯 信道從編碼器到解碼器的傳輸。堆棧P30及P40可為分離的,或可共享一個或一個以上層 (例如,物理層、媒體接入控制層及邏輯鏈路層中的一者或一者以上)。如圖21B中所展示的編碼器可經(jīng)配置以通過在呼叫建立期間將INVITE消息發(fā)送 到服務(wù)器而起始SIP會話。在一個此種實例中,編碼器將例如上下文識別符或物理位置(例 如,作為一組GPS坐標)的音頻上下文選擇信息發(fā)送到服務(wù)器。編碼器還可將例如解碼器 的URI及/或編碼器的URI的實體識別信息發(fā)送到服務(wù)器。如果服務(wù)器支持所選音頻上下 文,則其將ACK消息發(fā)送到編碼器,且SIP會話結(jié)束。編碼器_解碼器系統(tǒng)可經(jīng)配置以通過抑制編碼器處的現(xiàn)存上下文或通過抑制解 碼器處的現(xiàn)存上下文而處理活動幀??赏ㄟ^在編碼器處(而非解碼器處)執(zhí)行上下文抑制 來實現(xiàn)一個或一個以上潛在優(yōu)點。舉例來說,活動幀編碼器30可預(yù)期實現(xiàn)對上下文受抑制
29音頻信號比對現(xiàn)存上下文未經(jīng)抑制的音頻信號的更好的譯碼結(jié)果。更好的抑制技術(shù)也可能 在編碼器處可用,例如使用來自多個麥克風的音頻信號的技術(shù)(例如,盲源分離)。還可能 需要說話者能夠聽到與收聽者將聽到的上下文受抑制話音分量相同的上下文受抑制話音 分量,且在編碼器處執(zhí)行上下文抑制可用以支持此種特征。當然,在編碼器及解碼器兩者處 實施上下文抑制也是可能的。可能需要在編碼器_解碼器系統(tǒng)內(nèi)所產(chǎn)生上下文信號S150在編碼器及解碼器兩 者處均可用。舉例來說,可能需要說話者能夠聽到與收聽者將聽到的上下文經(jīng)增強音頻信 號相同的上下文經(jīng)增強音頻信號。在此種情形下,對所選上下文的描述可存儲于及/或下 載到編碼器及解碼器兩者。此外,可能需要配置上下文產(chǎn)生器220以確定地產(chǎn)生所產(chǎn)生上 下文信號S150,以使得待在解碼器處執(zhí)行的上下文產(chǎn)生操作可在編碼器處進行復(fù)制。舉例 來說,上下文產(chǎn)生器220可經(jīng)配置以使用對于編碼器及解碼器兩者均已知的一個或一個以 上值(例如,經(jīng)編碼音頻信號S20的一個或一個以上值)以計算可用于產(chǎn)生操作中的任何 隨機值或信號(例如用于CTFLP合成的隨機激勵信號)。編碼器-解碼器系統(tǒng)可經(jīng)配置而以若干不同方式中的任一者處理非活動幀。舉例 來說,編碼器可經(jīng)配置以將現(xiàn)存上下文包括于經(jīng)編碼音頻信號S20內(nèi)。包括現(xiàn)存上下文對 于支持遺留操作可能為需要的。此外,如上文所論述,解碼器可經(jīng)配置以使用現(xiàn)存上下文來 支持上下文抑制操作。或者,編碼器可經(jīng)配置以使用經(jīng)編碼音頻信號S20的非活動幀中的一者或一者以 上來攜載與所選上下文有關(guān)的信息(例如一個或一個以上上下文識別符及/或描述)。如 圖19中所展示的設(shè)備X300為不傳輸現(xiàn)存上下文的編碼器的一個實例。如上所述,非活動 幀中的上下文識別符的編碼可用以在例如電話呼叫的通信會話期間支持更新所產(chǎn)生的上 下文信號S150。對應(yīng)解碼器可經(jīng)配置以快速且甚至可能逐幀地執(zhí)行此種更新。
在另一替代方案中,編碼器可經(jīng)配置以在非活動幀期間傳輸極少或不傳輸位,其 可允許編碼器針對活動幀使用較高譯碼速率而不增加平均位速率。視系統(tǒng)而定,編碼器可 能需要在每一非活動幀期間包括某一最小數(shù)目的位以便維持連接??赡苄枰缭O(shè)備XlOO的實施方案(例如,設(shè)備X200、X210或X220)或X300的 編碼器發(fā)送所選音頻上下文的電平隨時間推移的改變的指示。此種編碼器可經(jīng)配置以在經(jīng) 編碼上下文信號S80內(nèi)及/或經(jīng)由不同邏輯信道將此種信息發(fā)送為參數(shù)值(例如,增益參 數(shù)值)。在一個實例中,對所選上下文的描述包括描述上下文的頻譜分布的信息,且編碼器 經(jīng)配置以將與上下文的音頻電平隨時間推移的改變有關(guān)的信息發(fā)送為單獨時間描述(其 可以與頻譜描述不同的速率進行更新)。在另一實例中,對所選上下文的描述描述上下文在 第一時間標度(例如,在幀或類似長度的其它間隔上)上的頻譜及時間特性兩者,且編碼器 經(jīng)配置以將與上下文的音頻電平在第二時間標度(例如,例如從幀到幀的較長時間標度) 上的改變有關(guān)的信息發(fā)送為單獨時間描述??墒褂冒ㄡ槍γ恳粠纳舷挛脑鲆嬷档膯为?時間描述來實施此種實例。在可應(yīng)用到上文兩個實例中的任一者中的另一實例中,使用不連續(xù)傳輸(在經(jīng)編 碼音頻信號S20的非活動幀內(nèi)或經(jīng)由第二邏輯信道)發(fā)送對所選上下文的描述的更新,且 還使用不連續(xù)傳輸(在經(jīng)編碼音頻信號S20的非活動幀內(nèi),經(jīng)由第二邏輯信道,或經(jīng)由另一 邏輯信道)發(fā)送對單獨時間描述的更新,兩個描述以不同間隔及/或根據(jù)不同事件進行更
30新。舉例來說,此種編碼器可經(jīng)配置以比單獨時間描述更不頻繁地更新所選上下文的描述 (例如,每512、1024或2048個幀對每四個、八個或十六個幀)。此種編碼器的另一實例經(jīng) 配置以根據(jù)現(xiàn)存上下文的一個或一個以上頻率特性的改變(及/或根據(jù)用戶選擇)而更新 對所選上下文的描述,且經(jīng)配置以根據(jù)現(xiàn)存上下文的電平的改變而更新單獨時間描述。圖22、圖23及圖24說明經(jīng)配置以執(zhí)行上下文取代的用于解碼的設(shè)備的實例。圖 22展示包括經(jīng)配置以根據(jù)上下文選擇信號S140的狀態(tài)產(chǎn)生所產(chǎn)生上下文信號S150的上 下文產(chǎn)生器220的例子的設(shè)備R300的框圖。圖23展示包括上下文抑制器210的實施方案 218的設(shè)備R300的實施方案R310的框圖。上下文抑制器218經(jīng)配置以使用來自非活動幀 的現(xiàn)存上下文信息(例如,現(xiàn)存上下文的頻譜分布)來支持上下文抑制操作(例如,頻譜相 減)。圖22及圖23中展示的設(shè)備R300及R310的實施方案還包括上下文解碼器252。 上下文解碼器252經(jīng)配置以執(zhí)行經(jīng)編碼上下文信號S80的數(shù)據(jù)及/或協(xié)議解碼(例如,與 上文關(guān)于上下文編碼器152描述的編碼操作互補)以產(chǎn)生上下文選擇信號S140。替代地或 另外,設(shè)備R300及R310可經(jīng)實施以包括與如上文所描述的上下文編碼器150互補的上下 文解碼器250,其經(jīng)配置以基于經(jīng)編碼上下文信號S80的對應(yīng)例子產(chǎn)生上下文描述(例如, 一組上下文參數(shù)值)。圖24展示包括上下文產(chǎn)生器220的實施方案228的話音解碼器R300的實施方案 R320的框圖。上下文產(chǎn)生器228經(jīng)配置以使用來自非活動幀的現(xiàn)存上下文信息(例如,與 現(xiàn)存上下文的能量在時域及/或頻域中的分布有關(guān)的信息)來支持上下文產(chǎn)生操作。如本文描述的用于編碼的設(shè)備(例如,設(shè)備XlOO及X300)及用于解碼的設(shè)備(例 如,設(shè)備R100、R200及R300)的實施方案的各種元件可實施為駐留于(例如)同一芯片上 或芯片組中的兩個或兩個以上芯片中的電子及/或光學(xué)裝置,但還可預(yù)期沒有此種限制的 其它布置。此種設(shè)備的一個或一個以上元件可整個地或部分地實施為經(jīng)布置以在邏輯元 件(例如,晶體管、門)的一個或一個以上固定或可編程陣列上執(zhí)行的一個或一個以上指令 集,所述邏輯元件例如微處理器、嵌埋式處理器、IP核心、數(shù)字信號處理器、FPGA (現(xiàn)場可編 程門陣列)、ASSP (專用標準產(chǎn)品)及ASIC (專用集成電路)。此種設(shè)備的實施方案的一個或一個以上元件用以執(zhí)行任務(wù)或執(zhí)行與設(shè)備的操作 不直接有關(guān)的其它指令集(例如與設(shè)備所嵌埋于其中的裝置或系統(tǒng)的另一操作有關(guān)的任 務(wù))是可能的。此種設(shè)備的實施方案的一個或一個以上元件具有共同結(jié)構(gòu)(例如,用以執(zhí) 行在不同時間對應(yīng)于不同元件的代碼部分的處理器,經(jīng)執(zhí)行以執(zhí)行在不同時間對應(yīng)于不同 元件的任務(wù)的指令集,或在不同時間執(zhí)行不同元件的操作的電子及/或光學(xué)裝置的布置) 也是可能的。在一個實例中,上下文抑制器110、上下文產(chǎn)生器120及上下文混合器190實 施為經(jīng)布置以在同一處理器上執(zhí)行的指令集。在另一實例中,上下文處理器100及話音編 碼器XlO經(jīng)實施為經(jīng)布置以在同一處理器上執(zhí)行的指令集。在另一實例中,上下文處理器 200及話音解碼器RlO實施為經(jīng)布置以在同一處理器上執(zhí)行的指令集。在另一實例中,上下 文處理器100、話音編碼器XlO及話音解碼器RlO實施為經(jīng)布置以在同一處理器上執(zhí)行的指 令集。在另一實例中,活動幀編碼器30及非活動幀編碼器40經(jīng)實施以包括在不同時間執(zhí) 行的相同指令集。在另一實例中,活動幀解碼器70及非活動幀解碼器80經(jīng)實施以包括在 不同時間執(zhí)行的相同指令集。
用于無線通信的裝置(例如蜂窩式電話或具有此種通信能力的其它裝置)可經(jīng)配 置以包括編碼器(例如,設(shè)備XlOO或X300的實施方案)及解碼器(例如,設(shè)備R100、R200 或R300的實施方案)兩者。在此種情形下,編碼器及解碼器具有共同結(jié)構(gòu)是可能的。在一 個此種實例中,編碼器及解碼器經(jīng)實施以包括經(jīng)布置以在同一處理器上執(zhí)行的指令集。本文描述的各種編碼器及解碼器的操作還可視作信號處理方法的特定實例。此種 方法可實施為一組任務(wù),其一者或一者以上(可能全部)可由邏輯元件(例如,處理器、微 處理器、微控制器或其它有限狀態(tài)機)的一個或一個以上陣列執(zhí)行。任務(wù)中的一者或一者 以上(可能全部)還可實施為可由一個或一個以上邏輯元件陣列執(zhí)行的代碼(例如,一個 或一個以上指令集),代碼可有形地體現(xiàn)于數(shù)據(jù)存儲媒體中。圖25A展示根據(jù)所揭示配置的處理包括第一音頻上下文的數(shù)字音頻信號的方法 AlOO的流程圖。方法AlOO包括任務(wù)AllO及A120。基于第一麥克風產(chǎn)生的第一音頻信號, 任務(wù)Al 10抑制來自數(shù)字音頻信號的第一音頻上下文以獲得上下文受抑制信號。任務(wù)A120 將第二音頻上下文與基于上下文受抑制信號的信號進行混合以獲得上下文經(jīng)增強信號。在 此方法中,數(shù)字音頻信號是基于由不同于第一麥克風的第二麥克風產(chǎn)生的第二音頻信號。 舉例來說,可通過如本文描述的設(shè)備XlOO或X300的實施方案執(zhí)行方法A100。圖25B展示根據(jù)所揭示配置用于處理包括第一音頻上下文的數(shù)字音頻信號的設(shè) 備AM100的框圖。設(shè)備AM100包括用于執(zhí)行方法AlOO的各種任務(wù)的裝置。設(shè)備AM100包 括用于基于由第一麥克風產(chǎn)生的第一音頻信號抑制來自數(shù)字音頻信號的第一音頻上下文 以獲得上下文受抑制信號的裝置AM10。設(shè)備AM100包括用于將第二音頻上下文與基于上下 文受抑制信號的信號進行混合以獲得上下文經(jīng)增強信號的裝置AM20。在此設(shè)備中,數(shù)字音 頻信號是基于由不同于第一麥克風的第二麥克風產(chǎn)生的第二音頻信號。可使用能夠執(zhí)行所 述任務(wù)的任何結(jié)構(gòu)實施設(shè)備AM100的各種元件,所述結(jié)構(gòu)包括用于執(zhí)行本文揭示的所述任 務(wù)的結(jié)構(gòu)中的任一者(例如,一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。 設(shè)備AM100的各種元件的實例在本文中揭示于設(shè)備XlOO及X300的描述中。圖26A展示根據(jù)所揭示配置的根據(jù)處理控制信號的狀態(tài)處理數(shù)字音頻信號的方 法BlOO的流程圖,所述數(shù)字音頻信號具有話音分量及上下文分量。方法BlOO包括任務(wù) B110、B120、B130及B140。任務(wù)BlllO在處理控制信號具有第一狀態(tài)時以第一位速率編碼 缺少話音分量的數(shù)字音頻信號部分的幀。任務(wù)B120在處理控制信號具有不同于第一狀態(tài) 的第二狀態(tài)時抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號。任務(wù)B130 在處理控制信號具有第二狀態(tài)時將音頻上下文信號與基于上下文受抑制信號的信號進行 混合以獲得上下文經(jīng)增強信號。任務(wù)B140在處理控制信號具有第二狀態(tài)時以第二位速率 編碼缺少話音分量的上下文經(jīng)增強信號部分的幀,第二位速率高于第一位速率。舉例來說, 可通過如本文描述的設(shè)備XlOO的實施方案執(zhí)行方法B100。圖26B展示根據(jù)所揭示配置的用于根據(jù)處理控制信號的狀態(tài)處理數(shù)字音頻信號 的設(shè)備BM100的框圖,所述數(shù)字音頻信號具有話音分量及上下文分量。設(shè)備BM100包括用 于在處理控制信號具有第一狀態(tài)時以第一位速率編碼缺少話音分量的數(shù)字音頻信號部分 的幀的裝置BM10。設(shè)備BM100包括用于在處理控制信號具有不同于第一狀態(tài)的第二狀態(tài)時 抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號的裝置BM20。設(shè)備BM100包 括用于在處理控制信號具有第二狀態(tài)時將音頻上下文信號與基于上下文受抑制信號的信號進行混合以獲得上下文經(jīng)增強信號的裝置BM30。設(shè)備BM100包括用于在處理控制信號具 有第二狀態(tài)時以第二位速率編碼缺少話音分量的上下文經(jīng)增強信號部分的幀的裝置BM40, 第二位速率高于第一位速率??墒褂媚軌驁?zhí)行此類任務(wù)的任何結(jié)構(gòu)實施設(shè)備BM100的各種 元件,所述結(jié)構(gòu)包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例如,一個或一個 以上指令集、一個或一個以上邏輯元件陣列等)。設(shè)備BM100的各種元件的實例在本文中揭 示于設(shè)備XlOO的描述中。圖27A展示根據(jù)所揭示配置的處理基于從第一轉(zhuǎn)變器接收的信號的數(shù)字音頻信 號的方法ClOO的流程圖。方法ClOO包括任務(wù)Clio、C120、C130及C140。任務(wù)CllO抑制 來自數(shù)字音頻信號的第一音頻上下文以獲得上下文受抑制信號。任務(wù)C120將第二音頻上 下文與基于上下文受抑制信號的信號進行混合以獲得上下文經(jīng)增強信號。任務(wù)C130將基 于(A)第二音頻上下文與(B)上下文經(jīng)增強信號中的至少一者的信號轉(zhuǎn)換為模擬信號。任 務(wù)C140從第二轉(zhuǎn)變器產(chǎn)生基于所述模擬信號的可聽信號。在此方法中,第一轉(zhuǎn)變器及第二 轉(zhuǎn)變器兩者位于共同外殼內(nèi)。舉例來說,可通過如本文描述的設(shè)備XlOO或X300的實施方 案執(zhí)行方法ClOO。圖27B展示根據(jù)所揭示配置的用于處理基于從第一轉(zhuǎn)變器接收的信號的數(shù)字音 頻信號的設(shè)備CM100的框圖。設(shè)備CM100包括用于執(zhí)行方法ClOO的各種任務(wù)的裝置。設(shè)備 CM100包括用于抑制來自數(shù)字音頻信號的第一音頻上下文以獲得上下文受抑制信號的裝置 CMllO0設(shè)備CM100包括用于將第二音頻上下文與基于上下文受抑制信號的信號進行混合 以獲得上下文經(jīng)增強信號的裝置CM120。設(shè)備CM100包括用于將基于(A)第二音頻上下文 與(B)上下文經(jīng)增強信號中的至少一者的信號轉(zhuǎn)換為模擬信號的裝置CM130。設(shè)備CM100 包括用于從第二轉(zhuǎn)變器產(chǎn)生基于模擬信號的可聽信號的裝置CM140。在此設(shè)備中,第一轉(zhuǎn) 變器及第二轉(zhuǎn)變器兩者位于共同外殼內(nèi)。可使用能夠執(zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè)備 CM100的各種元件,所述結(jié)構(gòu)包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例如, 一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。設(shè)備CM100的各種元件的實例 在本文中揭示于設(shè)備XlOO及X300的描述中。圖28A展示根據(jù)所揭示配置的處理經(jīng)編碼音頻信號的方法DlOO的流程圖。方法 DlOO包括任務(wù)D110、D120及D130。任務(wù)DllO根據(jù)第一譯碼方案解碼經(jīng)編碼音頻信號的第 一多個經(jīng)編碼幀以獲得包括話音分量及上下文分量的第一經(jīng)解碼音頻信號。任務(wù)D120根 據(jù)第二譯碼方案解碼經(jīng)編碼音頻信號的第二多個經(jīng)編碼幀以獲得第二經(jīng)解碼音頻信號。基 于來自第二經(jīng)解碼音頻信號的信息,任務(wù)D130抑制來自基于第一經(jīng)解碼音頻信號的第三 信號的上下文分量以獲得上下文受抑制信號。舉例來說,可通過如本文描述的設(shè)備R100、 R200或R300的實施方案執(zhí)行方法DlOO。圖28B展示根據(jù)所揭示配置的用于處理經(jīng)編碼音頻信號的設(shè)備DM100的框圖。設(shè) 備DM100包括用于執(zhí)行方法DlOO的各種任務(wù)的裝置。設(shè)備DM100包括用于根據(jù)第一譯碼 方案解碼經(jīng)編碼音頻信號的第一多個經(jīng)編碼幀以獲得包括話音分量及上下文分量的第一 經(jīng)解碼音頻信號的裝置DMlO。設(shè)備DM100包括用于根據(jù)第二譯碼方案解碼經(jīng)編碼音頻信號 的第二多個經(jīng)編碼幀以獲得第二經(jīng)解碼音頻信號的裝置DM20。設(shè)備DM100包括用于基于 來自第二經(jīng)解碼音頻信號的信息抑制來自基于第一經(jīng)解碼音頻信號的第三信號的上下文 分量以獲得上下文受抑制信號的裝置DM30??墒褂媚軌驁?zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè)備DM100的各種元件,所述結(jié)構(gòu)包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例 如,一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。設(shè)備DM100的各種元件的 實例在本文中揭示于設(shè)備R100、R200及R300的描述中。圖29A展示根據(jù)所揭示配置的處理包括話音分量及上下文分量的數(shù)字音頻信號 的方法ElOO的流程圖。方法ElOO包括任務(wù)E110、E120、E130及E140。任務(wù)EllO抑制來自 數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號。任務(wù)E120編碼基于上下文受抑制 信號的信號以獲得經(jīng)編碼音頻信號。任務(wù)E130選擇多個音頻上下文中的一者。任務(wù)E140 將與所選音頻上下文有關(guān)的信息插入于基于所述經(jīng)編碼音頻信號的信號中。舉例來說,可 通過如本文描述的設(shè)備XlOO或X300的實施方案執(zhí)行方法ElOO。圖29B展示根據(jù)所揭示配置的用于處理包括話音分量及上下文分量的數(shù)字音頻 信號的設(shè)備EM100的框圖。設(shè)備EM100包括用于執(zhí)行方法ElOO的各種任務(wù)的裝置。設(shè) 備EM100包括用于抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號的裝置 EM10。設(shè)備EM100包括用于編碼基于上下文受抑制信號的信號以獲得經(jīng)編碼音頻信號的裝 置EM20。設(shè)備EM100包括用于選擇多個音頻上下文中的一者的裝置EM30。設(shè)備EM100包 括用于將與所選音頻上下文有關(guān)的信息插入于基于所述經(jīng)編碼音頻信號的信號中的裝置 EM40??墒褂媚軌驁?zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè)備EM100的各種元件,所述結(jié)構(gòu)包括用 于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例如,一個或一個以上指令集、一個或一 個以上邏輯元件陣列等)。設(shè)備EM100的各種元件的實例在本文中揭示于設(shè)備XlOO及X300 的描述中。圖30A展示根據(jù)所揭示配置的處理包括話音分量及上下文分量的數(shù)字音頻信號 的方法E200的流程圖。方法E200包括任務(wù)E110、E120、E150及E160。任務(wù)E150將經(jīng)編 碼音頻信號經(jīng)由第一邏輯信道發(fā)送到第一實體。任務(wù)E160向第二實體且經(jīng)由不同于第一 邏輯信道的第二邏輯信道發(fā)送(A)音頻上下文選擇信息及(B)識別第一實體的信息。舉例 來說,可通過如本文描述的設(shè)備XlOO或X300的實施方案執(zhí)行方法E200。圖30B展示根據(jù)所揭示配置的用于處理包括話音分量及上下文分量的數(shù)字音頻 信號的設(shè)備EM200的框圖。設(shè)備EM200包括用于執(zhí)行方法E200的各種任務(wù)的裝置。設(shè)備 EM200包括如上文所描述的裝置EMlO及EM20。設(shè)備EM100包括用于將編碼音頻信號經(jīng)由 第一邏輯信道發(fā)送到第一實體的裝置EM50。設(shè)備EM100包括用于向第二實體且經(jīng)由不同 于第一邏輯信道的第二邏輯信道發(fā)送(A)音頻上下文選擇信息及(B)識別第一實體的信息 的裝置EM60??墒褂媚軌驁?zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè)備EM200的各種元件,所述結(jié)構(gòu) 包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例如,一個或一個以上指令集、一 個或一個以上邏輯元件陣列等)。設(shè)備EM200的各種元件的實例在本文中揭示于設(shè)備XlOO 及X300的描述中。圖31A展示根據(jù)所揭示配置的處理經(jīng)編碼音頻信號的方法FlOO的流程圖。方法 FlOO包括任務(wù)F110、F120及F130。在移動用戶終端內(nèi),任務(wù)FllO解碼經(jīng)編碼音頻信號以 獲得經(jīng)解碼音頻信號。在移動用戶終端內(nèi),任務(wù)F120產(chǎn)生音頻上下文信號。在移動用戶終 端內(nèi),任務(wù)F130將基于音頻上下文信號的信號與基于經(jīng)解碼音頻信號的信號進行混合。舉 例來說,可通過如本文描述的設(shè)備R100、R200或R300的實施方案執(zhí)行方法F100。圖31B展示根據(jù)所揭示配置的用于處理經(jīng)編碼音頻信號且位于移動用戶終端內(nèi)的設(shè)備FM100的框圖。設(shè)備FM100包括用于執(zhí)行方法FlOO的各種任務(wù)的裝置。設(shè)備FM100 包括用于解碼經(jīng)編碼音頻信號以獲得經(jīng)解碼音頻信號的裝置FM10。設(shè)備FM100包括用于產(chǎn) 生音頻上下文信號的裝置FM20。設(shè)備FM100包括用于將基于音頻上下文信號的信號與基于 經(jīng)解碼音頻信號的信號進行混合的裝置FM30??墒褂媚軌驁?zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè) 備FM100的各種元件,所述結(jié)構(gòu)包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例 如,一個或一個以上指令集、一個或一個以上邏輯元件陣列等)。設(shè)備FM100的各種元件的 實例在本文中揭示于設(shè)備R100、R200及R300的描述中。圖32A展示根據(jù)所揭示配置的處理包括話音分量及上下文分量的數(shù)字音頻信號 的方法GlOO的流程圖。方法GlOO包括任務(wù)G110、G120及G130。任務(wù)GlOO抑制來自數(shù)字音 頻信號的上下文分量以獲得上下文受抑制信號。任務(wù)G120產(chǎn)生基于第一濾波器及第一多 個序列的音頻上下文信號,所述第一多個序列中的每一者具有不同時間分辨率。任務(wù)G120 包括將第一濾波器應(yīng)用到第一多個序列中的每一者。任務(wù)G130將基于所產(chǎn)生音頻上下文 信號的第一信號與基于上下文受抑制信號的第二信號進行混合以獲得上下文經(jīng)增強信號。 舉例來說,可通過如本文描述的設(shè)備X100、X300、R100、R200或R300的實施方案執(zhí)行方法 G100。圖32B展示根據(jù)所揭示配置的用于處理包括話音分量及上下文分量的數(shù)字音頻 信號的設(shè)備GM100的框圖。設(shè)備GM100包括用于執(zhí)行方法GlOO的各種任務(wù)的裝置。設(shè) 備GM100包括用于抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號的裝置 GM10。設(shè)備GM100包括用于產(chǎn)生基于第一濾波器及第一多個序列的音頻上下文信號的裝置 GM20,所述第一多個序列中的每一者具有不同時間分辨率。裝置GM20包括用于將第一濾波 器應(yīng)用到第一多個序列中的每一者的裝置。設(shè)備GM100包括用于將基于所產(chǎn)生音頻上下文 信號的第一信號與基于上下文受抑制信號的第二信號進行混合以獲得上下文經(jīng)增強信號 的裝置GM30??墒褂媚軌驁?zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè)備GM100的各種元件,所述結(jié)構(gòu) 包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例如,一個或一個以上指令集、一 個或一個以上邏輯元件陣列等)。設(shè)備GM100的各種元件的實例在本文中揭示于設(shè)備X100、 X300、R100、R200 及 R300 的描述中。圖33A展示根據(jù)所揭示配置的處理包括話音分量及上下文分量的數(shù)字音頻信號 的方法HlOO的流程圖。方法HlOO包括任務(wù)H110、H120、H130、H140及H150。任務(wù)HllO抑 制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號。任務(wù)H120產(chǎn)生音頻上下文 信號。任務(wù)H130將基于所產(chǎn)生音頻上下文信號的第一信號與基于上下文受抑制信號的第 二信號進行混合以獲得上下文經(jīng)增強信號。任務(wù)H140計算基于數(shù)字音頻信號的第三信號 的電平。任務(wù)H120及H130中的至少一者包括基于第三信號的所計算電平控制第一信號的 電平。舉例來說,可通過如本文描述的設(shè)備X100、X300、R100、R200或R300的實施方案執(zhí) 行方法HlOO。圖33B展示根據(jù)所揭示配置的用于處理包括話音分量及上下文分量的數(shù)字音頻 信號的設(shè)備HM100的框圖。設(shè)備HM100包括用于執(zhí)行方法HlOO的各種任務(wù)的裝置。設(shè) 備HM100包括用于抑制來自數(shù)字音頻信號的上下文分量以獲得上下文受抑制信號的裝置 HM10。設(shè)備HM100包括用于產(chǎn)生音頻上下文信號的裝置HM20。設(shè)備HM100包括用于將基于 所產(chǎn)生音頻上下文信號的第一信號與基于上下文受抑制信號的第二信號進行混合以獲得上下文經(jīng)增強信號的裝置HM30。設(shè)備HM100包括用于計算基于數(shù)字音頻信號的第三信號的 電平的裝置HM40。裝置HM20及HM30中的至少一者包括用于基于第三信號的所計算電平控 制第一信號的電平的裝置??墒褂媚軌驁?zhí)行所述任務(wù)的任何結(jié)構(gòu)實施設(shè)備HM100的各種元 件,所述結(jié)構(gòu)包括用于執(zhí)行本文揭示的所述任務(wù)的結(jié)構(gòu)中的任一者(例如,一個或一個以 上指令集、一個或一個以上邏輯元件陣列等)。設(shè)備HM100的各種元件的實例在本文中揭示 于設(shè)備X100、X300、R100、R200及R300的描述中。提供所描述配置的前文陳述以使得任何所屬領(lǐng)域的技術(shù)人員能夠制造或使用本 文揭示的方法及其它結(jié)構(gòu)。本文展示且描述的流程圖、框圖及其它結(jié)構(gòu)僅為實例,且這些結(jié) 構(gòu)的其它變體也在本發(fā)明的范圍內(nèi)。對這些配置的各種修改是可能的,且還可將本文呈現(xiàn) 的一般原理應(yīng)用到其它配置。舉例來說,強調(diào)本發(fā)明的范圍不限于所說明的配置。而是, 明確地預(yù)期且特此揭示,對于如本文描述的不同特定配置的特征彼此不矛盾的任何情形來 說,可組合所述特征以產(chǎn)生包括于本發(fā)明的范圍內(nèi)的其它配置。舉例來說,可組合上下文抑 制、上下文產(chǎn)生及上下文混合的各種配置中的任一者,只要此種組合與對本文中那些元件 的描述不矛盾即可。還明確地預(yù)期且特此揭示,在連接描述為在設(shè)備的兩個或兩個以上元 件之間的情況下,可能存在一個或一個以上介入元件(例如濾波器),且在連接描述為在方 法的兩個或兩個以上任務(wù)之間的情況下,可能存在一個或一個以上介入任務(wù)或操作(例如 濾波操作)??膳c如本文描述的編碼器及解碼器一起使用或適合于與所述編碼器及解碼器一 起使用的編解碼器的實例包括如描述于上文提及的3GPP2文件C. S0014-C中的經(jīng)增強可 變速率編解碼器(EVRC);如描述于ETSI文件TS 126092V6. 0. 0 (第6章,2004年12月)中 的自適應(yīng)多速率(AMR)話音編解碼器;及如描述于ETSI文件TS 126 192 V6. 0. 0.(第6章, 2004年12月)中的AMR寬帶話音編解碼器??膳c如本文描述的編碼器及解碼器一起使用 的無線電協(xié)議的實例包括臨時標準95 (IS-95)及CDMA2000 (如由電信產(chǎn)業(yè)協(xié)會((TIA),弗 吉尼亞州,阿靈頓(Arlington, VA))發(fā)布的規(guī)范中所描述)、AMR(如ETSI文件TS 26. 101 中所描述)、GSM(全球移動通信系統(tǒng),如ETSI發(fā)布的規(guī)范中所描述)、UMTS (全球移動電信 系統(tǒng),如ETSI發(fā)布的規(guī)范中所描述)及W-CDMA(寬帶碼分多址,如由國際電信聯(lián)盟發(fā)布的 規(guī)范中所描述)。本文描述的配置可部分或整體地實施為硬連線電路、制造于專用集成電路中的電 路配置,或加載于非易失性存儲裝置中的固件程序或作為機器可讀代碼從計算機可讀媒體 加載或加載于計算機可讀媒體中的軟件程序,此種代碼為可由例如微處理器或其它數(shù)字信 號處理單元的邏輯元件的陣列執(zhí)行的指令。計算機可讀媒體可為例如半導(dǎo)體存儲器(其 可包括(但不限于)動態(tài)或靜態(tài)RAM(隨機存取存儲器)、R0M(只讀存儲器)及/或快閃 RAM)或鐵電存儲器、磁電阻存儲器、雙向存儲器、聚合物存儲器或相變存儲器的存儲元件的 陣列;例如磁盤或光盤的盤片媒體;或用于數(shù)據(jù)存儲的任何其它計算機可讀媒體。術(shù)語“軟 件”應(yīng)理解為包括源代碼、匯編語言代碼、機器代碼、二進制代碼、固件、宏代碼、微代碼、可 由邏輯元件的陣列執(zhí)行的任何一個或一個以上指令集或序列,及所述實例的任何組合。本文揭示的方法中的每一者還可有形地體現(xiàn)為(舉例來說,在上文列舉的一個或 一個以上計算機可讀媒體中)可由包括邏輯元件的陣列的機器(例如,處理器、微處理器、 微控制器或其它有限狀態(tài)機)讀取及/或執(zhí)行的一個或一個以上指令集。因此,不希望本發(fā)明限于上文展示的配置,而應(yīng)賦予其與本文中以任何方式揭示的原理及新穎特征(包括 于形成原始揭示內(nèi)容的一部分的所申請的附加權(quán)利要求書中)相一致的最廣泛范圍。
權(quán)利要求
一種處理數(shù)字音頻信號的方法,所述數(shù)字音頻信號包括第一音頻上下文,所述方法包含基于由第一麥克風產(chǎn)生的第一音頻信號抑制來自所述數(shù)字音頻信號的所述第一音頻上下文以獲得上下文受抑制信號;以及將第二音頻上下文與基于所述上下文受抑制信號的信號進行混合以獲得上下文經(jīng)增強信號,其中所述數(shù)字音頻信號是基于由不同于所述第一麥克風的第二麥克風產(chǎn)生的第二音頻信號。
2.根據(jù)權(quán)利要求1所述的處理數(shù)字音頻信號的方法,其中所述第一及第二麥克風位于 共同外殼內(nèi)。
3.根據(jù)權(quán)利要求1所述的處理數(shù)字音頻信號的方法,其中所述抑制所述第一音頻上下 文包含基于來自所述第一音頻信號的信息對所述數(shù)字音頻信號執(zhí)行盲源分離操作。
4.根據(jù)權(quán)利要求1所述的處理數(shù)字音頻信號的方法,其中所述抑制所述第一音頻上下 文包含基于來自所述第一音頻信號的信息對基于所述數(shù)字音頻信號的信號執(zhí)行頻譜相減 操作。
5.根據(jù)權(quán)利要求1所述的處理數(shù)字音頻信號的方法,其中所述抑制所述第一音頻上下 文包含對基于所述數(shù)字音頻信號的信號執(zhí)行中心削波操作。
6.根據(jù)權(quán)利要求1所述的處理數(shù)字音頻信號的方法,其中所述方法包含對基于所述上 下文經(jīng)增強信號的第三音頻信號進行編碼以獲得一系列經(jīng)編碼幀,其中所述對所述第三音頻信號進行編碼包括對所述第三音頻信號執(zhí)行線性預(yù)測譯碼 分析。
7.一種用于處理數(shù)字音頻信號的設(shè)備,所述數(shù)字音頻信號包括第一音頻上下文,所述 設(shè)備包含上下文抑制器,其經(jīng)配置以基于由第一麥克風產(chǎn)生的第一音頻信號抑制來自所述數(shù)字 音頻信號的所述第一音頻上下文以獲得上下文受抑制信號;以及上下文混合器,其經(jīng)配置以將第二音頻上下文與基于所述上下文受抑制信號的信號進 行混合以獲得上下文經(jīng)增強信號,其中所述數(shù)字音頻信號是基于由不同于所述第一麥克風的第二麥克風產(chǎn)生的第二音 頻信號。
8.根據(jù)權(quán)利要求7所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述第一及第二麥克風 位于共同外殼內(nèi)。
9.根據(jù)權(quán)利要求7所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述上下文抑制器經(jīng)配 置以基于來自所述第一音頻信號的信息對所述數(shù)字音頻信號執(zhí)行盲源分離操作。
10.根據(jù)權(quán)利要求7所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述上下文抑制器經(jīng) 配置以基于來自所述第一音頻信號的信息對基于所述數(shù)字音頻信號的信號執(zhí)行頻譜相減 操作。
11.根據(jù)權(quán)利要求7所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述上下文抑制器經(jīng) 配置以對基于所述數(shù)字音頻信號的信號執(zhí)行中心削波操作。
12.根據(jù)權(quán)利要求7所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述設(shè)備包含經(jīng)配置以對基于所述上下文經(jīng)增強信號的第三音頻信號進行編碼以獲得一系列經(jīng)編碼幀的編碼 器,其中所述編碼器經(jīng)配置以對所述第三音頻信號執(zhí)行線性預(yù)測譯碼分析。
13.一種用于處理數(shù)字音頻信號的設(shè)備,所述數(shù)字音頻信號包括第一音頻上下文,所述 設(shè)備包含用于基于由第一麥克風產(chǎn)生的第一音頻信號抑制來自所述數(shù)字音頻信號的所述第一 音頻上下文以獲得上下文受抑制信號的裝置;以及用于將第二音頻上下文與基于所述上下文受抑制信號的信號進行混合以獲得上下文 經(jīng)增強信號的裝置,其中所述數(shù)字音頻信號是基于由不同于所述第一麥克風的第二麥克風產(chǎn)生的第二音 頻信號。
14.根據(jù)權(quán)利要求13所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述第一及第二麥克 風位于共同外殼內(nèi)。
15.根據(jù)權(quán)利要求13所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述用于抑制所述第 一音頻上下文的裝置包含用于基于來自所述第一音頻信號的信息對所述數(shù)字音頻信號執(zhí) 行盲源分離操作的裝置。
16.根據(jù)權(quán)利要求13所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述用于抑制所述第 一音頻上下文的裝置包含用于基于來自所述第一音頻信號的信息對基于所述數(shù)字音頻信 號的信號執(zhí)行頻譜相減操作的裝置。
17.根據(jù)權(quán)利要求13所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述用于抑制所述第 一音頻上下文的裝置包含用于對基于所述數(shù)字音頻信號的信號執(zhí)行中心削波操作的裝置。
18.根據(jù)權(quán)利要求13所述的用于處理數(shù)字音頻信號的設(shè)備,其中所述設(shè)備包含用于對 基于所述上下文經(jīng)增強信號的第三音頻信號進行編碼以獲得一系列經(jīng)編碼幀的裝置,其中所述用于對所述第三音頻信號進行編碼的裝置包括用于對所述第三音頻信號執(zhí) 行線性預(yù)測譯碼分析的裝置。
19.一種計算機可讀媒體,其包含用于處理包括話音分量及上下文分量的數(shù)字音頻信 號的指令,當由處理器執(zhí)行時所述指令致使所述處理器基于由第一麥克風產(chǎn)生的第一音頻信號抑制來自所述數(shù)字音頻信號的所述第一音頻 上下文以獲得上下文受抑制信號;以及將第二音頻上下文與基于所述上下文受抑制信號的信號進行混合以獲得上下文經(jīng)增 強信號,其中所述數(shù)字音頻信號是基于由不同于所述第一麥克風的第二麥克風產(chǎn)生的第二音 頻信號。
20.根據(jù)權(quán)利要求19所述的計算機可讀媒體,其中所述第一及第二麥克風位于共同外 殼內(nèi)。
21.根據(jù)權(quán)利要求19所述的計算機可讀媒體,其中所述當由處理器執(zhí)行時致使所述處 理器抑制所述第一音頻上下文的指令經(jīng)配置以致使所述處理器基于來自所述第一音頻信 號的信息對所述數(shù)字音頻信號執(zhí)行盲源分離操作。
22.根據(jù)權(quán)利要求19所述的計算機可讀媒體,其中所述當由處理器執(zhí)行時致使所述處理器抑制所述第一音頻上下文的指令經(jīng)配置以致使所述處理器基于來自所述第一音頻信 號的信息對基于所述數(shù)字音頻信號的信號執(zhí)行頻譜相減操作。
23.根據(jù)權(quán)利要求19所述的計算機可讀媒體,其中所述當由處理器執(zhí)行時致使所述處 理器抑制所述第一音頻上下文的指令經(jīng)配置以致使所述處理器對基于所述數(shù)字音頻信號 的信號執(zhí)行中心削波操作。
24.根據(jù)權(quán)利要求19所述的計算機可讀媒體,其中所述媒體包含當由處理器執(zhí)行時致 使所述處理器對基于所述上下文經(jīng)增強信號的第三音頻信號進行編碼以獲得一系列經(jīng)編 碼幀的指令,其中所述當由處理器執(zhí)行時致使所述處理器對所述第三音頻信號進行編碼的指令經(jīng) 配置以致使所述處理器對所述第三音頻信號執(zhí)行線性預(yù)測譯碼分析。
全文摘要
本發(fā)明揭示的配置包括可應(yīng)用于語音通信及/或存儲應(yīng)用中以移除、增強及/或取代現(xiàn)存上下文的系統(tǒng)、方法及設(shè)備。
文檔編號G10L21/02GK101896971SQ200880120608
公開日2010年11月24日 申請日期2008年9月30日 優(yōu)先權(quán)日2008年1月28日
發(fā)明者哈立德·希勒米·埃爾-馬勒, 埃迪·L·T·喬伊, 納根德拉·納加拉賈 申請人:高通股份有限公司