亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的系統(tǒng)及方法

文檔序號:2830524閱讀:240來源:國知局
專利名稱:用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的系統(tǒng)及方法
技術(shù)領(lǐng)域
本系統(tǒng)及方法大體來說涉及語音處理技術(shù)。更明確地說,本系統(tǒng)及方法涉及以與音 頻信號相關(guān)聯(lián)的幀修改窗門的系統(tǒng)及方法。
背景技術(shù)
通過數(shù)字技術(shù)來傳輸聲音已變得普遍,尤其是在長距離、數(shù)字無線電電話應(yīng)用、使 用計算機(jī)的視頻消息傳遞等等中。此又對確定可經(jīng)由信道發(fā)送的最少量信息月.同時保持 所重構(gòu)的語音的可察覺質(zhì)量產(chǎn)生了興趣。用于壓縮語音的裝置可用于許多電信領(lǐng)域中。 電信的一個實(shí)例為無線通信。另一實(shí)例為經(jīng)由計算機(jī)網(wǎng)絡(luò)(例如,因特網(wǎng))的通信。通 信領(lǐng)域具有許多應(yīng)用,包括(例如)計算機(jī)、膝上型計算機(jī)、個人數(shù)字助理(PDA)、 無繩電話、尋呼機(jī)、無線局域環(huán)路、無線電話(例如,蜂窩式及便攜式通信系統(tǒng)(PCS) 電話系統(tǒng))、移動因特網(wǎng)協(xié)議(IP)電話及衛(wèi)星通信系統(tǒng)。

發(fā)明內(nèi)容



圖1說明無線通信系統(tǒng)的一配置;
圖2為說明計算環(huán)境的一配置的框圖3為說明信號傳輸環(huán)境的一配置的框圖4A為說明一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的方法的一配置的流程
5圖4B為說明用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的編碼器及解碼器的配置的框
圖5為說明一種用于重構(gòu)音頻信號的經(jīng)編碼幀的方法的一配置的流程圖; 圖6為說明與多模式解碼器進(jìn)行通信的多模式編碼器的一配置的框圖; 圖7為說明一種音頻信號編碼方法的一實(shí)例的流程圖8為說明在將窗口函數(shù)應(yīng)用于每一幀之后的多個幀的一配置的框圖9為說明一種用于將窗口函數(shù)應(yīng)用于與非語音信號相關(guān)聯(lián)的幀的方法的一配置的 流程圖10為說明--種用于重構(gòu)已由窗口函數(shù)加以修改的幀的方法的一配置的流程圖

圖11為通信/計算裝置的一配置中的某些組件的框圖。
具體實(shí)施例方式
本發(fā)明描述一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的方法。接收信號。將所述 信號分割為多個幀。確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián)。如果確定所 述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改的離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述
幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域。編碼所述幀。
還描述一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的設(shè)備。所述設(shè)備包括處理器及 與所述處理器進(jìn)行電子通信的存儲器。指令存儲于所述存儲器中。所述指令可執(zhí)行以 接收信號;將所述信號分割為多個幀;確定所述多個幀內(nèi)的一個幀是否與非語音信號相 關(guān)聯(lián);如果確定所述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改的離散余弦變換(MDCT)窗 口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;及編碼所述幀。
還描述一種經(jīng)配置而以與音頻信號相關(guān)聯(lián)的幀修改窗口的系統(tǒng)。所述系統(tǒng)包括用于 處理的裝置及用于接收信號的裝置。所述系統(tǒng)還包括用于將所述信號分割為多個幀的裝 置及用于確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián)的裝置。所述系統(tǒng)進(jìn)一步 包括用于在確定所述幀與非語音信號相關(guān)聯(lián)的情況下將經(jīng)修改的離散余弦變換(MDCT)
窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域的裝置及用于編碼所 述幀的裝置。
還描述一種經(jīng)配置以存儲一組指令的計算機(jī)可讀媒體。所述指令可執(zhí)行以接收信 號;將所述信號分割為多個幀;確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián);
6如果確定所述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改的離散余弦變換(MDCT)窗口函數(shù) 應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;及編碼所述幀。
還描述一種用于選擇待用于計算幀的經(jīng)修改的離散余弦變換(MDCT)的窗口函數(shù) 的方法。提供用于選擇待用于計算幀的MDCT的窗口函數(shù)的算法。將所述所選擇的窗口 函數(shù)應(yīng)用于所述幀?;谟深~外編碼模式強(qiáng)加于MDCT編碼模式的約束而以所述MDCT 編碼模式來編碼所述幀,其中所述約束包含所述幀的長度、先行長度及延遲。
還描述一種用于重構(gòu)音頻幀的經(jīng)編碼幀的方法。接收包。分解所述包以檢索經(jīng)編碼 幀。合成所述幀的位于第一零填充區(qū)域與第一區(qū)域之間的樣本。向第一長度的重疊區(qū)域 添加先前幀的先行長度。存儲所述幀的所述第一長度的先行。輸出經(jīng)重構(gòu)的幀。
現(xiàn)參看附圖來描述所述系統(tǒng)及所述方法的各種配置,其中相同參考標(biāo)號指示相同或 功能類似的元件。如大致在本文中的各圖中所描述及說明,可以廣泛的多種不同配置來 布置及設(shè)計本系統(tǒng)及方法的特征。因此,下文的詳細(xì)描述并不希望限制如所主張的系統(tǒng) 及方法的范圍,而是僅表示所述系統(tǒng)及所述方法的配置。
可將本文中所揭示的配置的許多特征實(shí)施為計算機(jī)軟件、電子硬件或兩者的組合。 為清楚地說明硬件與軟件的此互換性,將大致就各種組件的功能性來描述所述組件。將 此功能性實(shí)施為硬件還是軟件視特定應(yīng)用及強(qiáng)加于整個系統(tǒng)的設(shè)計約束而定。所屬領(lǐng)域 的技術(shù)人員可以針對每-一特定應(yīng)用的變化的方式來實(shí)施所描述的功能性,但不應(yīng)將所述 實(shí)施方案決策解釋為導(dǎo)致脫離本系統(tǒng)及方法的范圍。
在將所描述的功能性實(shí)施為計算機(jī)軟件的情況下,此軟件可包括任何類型的位于存 儲器裝置內(nèi)及/或作為電子信號而經(jīng)由系統(tǒng)總線或網(wǎng)絡(luò)傳輸?shù)挠嬎銠C(jī)指令或計算機(jī)可執(zhí) 行碼。實(shí)施與本文中所描述的組件相關(guān)聯(lián)的功能性的軟件可包含單個指令或許多指令, 且可分布在若干不同碼段、分布于不同程序中及分布為跨越若干存儲器裝置。
如本文中所使用,術(shù)語"一配置"、"配置"、"若干配置""所述配置"、 "所述若干配置"、"一個或一個以上配置"、"一些配置"、"某些配置"、"一 個配置"、"另一配置"及其類似物意味著"所揭示的系統(tǒng)及方法的一個或一個以上 (但未必全部)配置",除非另外明確規(guī)定。
術(shù)語"確定"(及其語法變體)是以極為廣泛的意義來使用。術(shù)語"確定"包含 廣泛的多種動作且因此"確定"可包括核算、計算、處理、導(dǎo)出、調(diào)查、查找(例如, 在表格、數(shù)據(jù)庫或另一數(shù)據(jù)結(jié)構(gòu)中進(jìn)行查找)、査明及其類似物。并且,"確定"可包 括接收(例如,接收信息)、存取(例如,存取存儲器中的數(shù)據(jù))及其類似物。并且, "確定"可包括解析、選擇、挑選、建立及其類似物。短語"基于"并不意味著"僅基于",除非另外明確規(guī)定。換句話說,短語"基 于"描述"僅基于"與"至少基于"兩者。 一般來說,可使用短語"音頻信號"來 指可被聽到的信號。音頻信號的實(shí)例可包括表示人類語音、器樂及聲樂、音調(diào)聲音等等。
圖1說明碼分多址(CDMA)無線電話系統(tǒng)100,其可包括多個移動臺102、多個 基站104、基站控制器(BSC) 106及移動交換中心(MSC) 108。 MSC108可經(jīng)配置以 與公共交換電話網(wǎng)絡(luò)(PSTN) 110介接。MSC 108還可經(jīng)配置以與BSC 106介接。系統(tǒng) 100中可存在一個以上BSC 106。每一基站104可包括至少一個扇區(qū)(未圖示),其中每 一扇區(qū)可具有全向天線或指向徑向地遠(yuǎn)離基站104的特定方向的天線?;蛘?,每一扇區(qū) 可包括兩個用于分集接收的天線。每一基站104可經(jīng)設(shè)計以支持多個頻率指派。可將扇 區(qū)與頻率指派的相交部分稱作CDMA信道。移動臺102可包括蜂窩式或便攜式通信系 統(tǒng)(PCS)電話。
在蜂窩式電話系統(tǒng)IOO的操作期間,基站104可從若干組移動臺102接收若干組反 向鏈路信號。所述移動臺102可正進(jìn)行電話呼叫或其它通信。由給定基站104所接收的 每一反向鏈路信號可在所述基站104內(nèi)加以處理。可將所得數(shù)據(jù)轉(zhuǎn)發(fā)到BSC106。所述 BSC 106可提供呼叫資源分配及移動性管理功能性(包括對在基站104之間的軟越區(qū)切 換的編配)。BSC 106還可將所接收的數(shù)據(jù)路由到MSC 108,所述MSC 108提供額外的 路由服務(wù)以用于與PSTN 110介接。類似地,PSTN 110可與MSC 108介接,且所述MSC 108可與BSC 106介接,所述BSC 106又可控制基站104以將若干組轉(zhuǎn)發(fā)鏈路信號傳輸 到若干組移動臺102。
圖2描繪計算環(huán)境200的一配置,所述計算環(huán)境200包括源計算裝置202、接收計 算裝置204及接收移動計算裝置206。源計算裝置202可經(jīng)由網(wǎng)絡(luò)210而與接收計算裝 置204、 206進(jìn)行通信。網(wǎng)絡(luò)210可為一類型的計算網(wǎng)絡(luò),其包括(但不限于)因特網(wǎng)、 局域網(wǎng)絡(luò)(LAN)、校園局域網(wǎng)絡(luò)(CAN)、城域網(wǎng)絡(luò)(MAN)、廣域網(wǎng)絡(luò)(WAN)、環(huán) 狀網(wǎng)絡(luò)、星形網(wǎng)絡(luò)、權(quán)標(biāo)環(huán)狀M絡(luò)等等。
在一配置中,源計算裝置202可對音頻信號212進(jìn)行編碼且經(jīng)由網(wǎng)絡(luò)210而將其傳
輸?shù)浇邮沼嬎阊b置204、 206。音頻信號212可包括語音信號、音樂信號、音調(diào)、背景噪
聲信號等等。如本文中所使用,"語音信號"可指由人類語音系統(tǒng)所產(chǎn)生的信號且"非
語音信號"可指并非由人類語音系統(tǒng)所產(chǎn)生的信號(即,音樂、背景噪聲等等)。源計
算裝置202可為移動電話、個人數(shù)字助理(PDA)、膝上型計算機(jī)、個人計算機(jī)或任何
其它具有處理器的計算裝置。接收計算裝置204可為個人計算機(jī)、電話等等。接收移動
計算裝置206可為移動電話、PDA、膝上型計算機(jī)或任何其它具有處理器的移動計算裝置。
圖3描繪了信號傳輸環(huán)境300,其包括編碼器302、解碼器304及傳輸媒體306。可 在移動臺102或源計算裝置202內(nèi)實(shí)施編碼器302。可在基站104、移動臺102、接收計 算裝置204或接收移動計算裝置206中實(shí)施解碼器304。編碼器302可對音頻信號s (n) 310進(jìn)行編碼,從而形成經(jīng)編碼的音頻信號sene (n) 312。可跨越傳輸媒體306而將經(jīng)編 碼的音頻信號312傳輸?shù)浇獯a器304。傳輸媒體306可促進(jìn)編碼器302以無線方式將經(jīng) 編碼的音頻信號-312傳輸?shù)浇獯a器或其可促進(jìn)編碼器302經(jīng)由在編碼器302與解碼器304 之間的有線連接來傳輸經(jīng)編碼的信號312。解碼器304可解碼sene (n) 312,從而產(chǎn)生經(jīng) 合成的音頻信號§ (n) 316。
如本文中所使用,術(shù)語"編碼"可通常指包含編碼與解碼兩者的方法。通常,編 碼系統(tǒng)、編碼方法及編碼設(shè)備試圖使經(jīng)由傳輸媒體306所傳輸?shù)奈坏臄?shù)目(即,使Se。c (n) 312的帶寬最小化)最小化,同時保持可接受的信號再現(xiàn)(即,s(n)310 & § (n) 316)。經(jīng)編碼的音頻信號312的組成可根據(jù)由編碼器302所利用的特定音頻編碼模式而 變化。下文描述了各種編碼模式。
可將下文所描述的編碼器302及解碼器304的組件實(shí)施為電子硬件、計算機(jī)軟件或 兩者的組合。下文就這些組件的功能性而描述了所述組件。將功能性實(shí)施為硬件還是軟 件可視特定應(yīng)用及強(qiáng)加于整個系統(tǒng)的設(shè)計約束而定。傳輸媒體306可表示許多不同傳輸 媒體,其包括(但不限于)基于陸地的通信線、基站與衛(wèi)星之間的鏈路、蜂窩式電話與 基站之間的無線通信、移動電話與衛(wèi)星之間的無線通信或計算裝置之間的通信。
通信的每一方可傳輸數(shù)據(jù)以及接收數(shù)據(jù)。每一方可利用編碼器302及解碼器304。 然而,下文將把信號傳輸環(huán)境300描述為包括位于傳輸媒體306的一端處的編碼器302 及位于另一端處的解碼器304。
在---配置中,s (n) 310可包括在典型對話(包括不同有聲聲音及靜默周期)期間 所獲得的數(shù)字語音信號。可將所述語音信號s (n) 310分割為若千幀,且可將每一幀進(jìn) 一步分割為若干子幀。在執(zhí)行某一塊處理的情況下,可使用這些經(jīng)隨意選擇的幀/子幀邊 界。在此意義上,還可對子幀執(zhí)行被描述為對幀所執(zhí)行的操作本文中可互換使用幀及 子幀。并且,可將一個或一個以上幀包括于一窗口中,所述窗口可說明各種幀之間的放 置及時序。
在另一配置中,s (n) 310可包括一非語音信號,例如,音樂信號。可將所述非語
音信號分割為若干幀。可將一個或一個以上幀包括于一窗口中,所述窗口可說明各種幀
之間的放置及時序。窗口的選擇可視經(jīng)實(shí)施以對信號進(jìn)行編碼的編碼技術(shù)及可強(qiáng)加于系統(tǒng)的延遲約束而定。本系統(tǒng)及方法描述一種用于選擇窗口形狀的方法,所述窗口形狀用 于在能夠?qū)φZ音信號與非語音信號兩者進(jìn)行編碼的系統(tǒng)中以基于經(jīng)修改離散余弦變換 (MDCT)及逆經(jīng)修改離散余弦變換(IMDCT)的編碼技術(shù)來對非語音信號進(jìn)行編碼及 解碼。所述系統(tǒng)可強(qiáng)加約束于可由基于MDCT的編碼器使用多少幀延遲及先行而使得能 夠以均勻速率產(chǎn)生經(jīng)編碼信息。
在一配置中,編碼器302包括可格式化包括與非語音信號相關(guān)聯(lián)的幀的窗口的窗口 格式化模塊308??删幋a被包括于格式化窗口中的幀且解碼器可通過實(shí)施幀重構(gòu)模塊314 而重構(gòu)所述經(jīng)編碼幀。幀重構(gòu)模塊314可合成所述經(jīng)編碼幀以使得所述幀類似于語音信 號310的經(jīng)預(yù)編碼幀。
圖4為說明一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的方法400的一配置的流程 圖。所述方法400可由編碼器302實(shí)施。在一配置中,接收402 —信號。所述信號可為 如先前所描述的音頻信號??蓪⑺鲂盘柗指?04為多個幀??蓱?yīng)用408窗口函數(shù)以產(chǎn) 生窗口月.可產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域作為所述窗口的一部分以用于計算 經(jīng)修改離散余弦變換(MDCT)。換句話說,窗口的開始部分及結(jié)束部分的值可為零。在 一方面中,第一零填充區(qū)域的長度及第二零填充區(qū)域的長度可依據(jù)編碼器302的延遲約 束而變。
可將經(jīng)修改離散余弦變換(MDCT)函數(shù)用于若千音頻編碼標(biāo)準(zhǔn)中以將脈碼調(diào)制 (PCM)信號樣本或?qū)⑵浣?jīng)處理版本變換為其等效頻域表示。MDCT可類似于IV型離散 余弦變換(DCT),其中幀的額外特性彼此重疊。換句話說,信號的由MDCT所變換的 連續(xù)幀可彼此重疊50%。
另外,對于2M個樣本中的每一幀來說,MDCT可產(chǎn)生M個變換系數(shù)。MDCT可
為重要取樣完美重構(gòu)濾波器組。為提供完美重構(gòu),可由下式給出從信號W")(其中n=0、 1、 ...、 2M)的幀獲得的MDCT系數(shù)X(W (其中1< = 0、 1、…、
2M —I
(1)
其中
、(《) = vv(w)J— COS
(2 + M +1)(2& + 1>T-
4Af
(2)
10(其中1^=0、 1、…、M),且w (n)為可滿足普林森-布拉德利(Princen-Bradley) 條件的窗口,所述普林森-布拉德利(Princen-Bradley)條件陳述為
h>2(") + w20+ M) = 1 (3)
在解碼器處,可使用逆MDCT (IMDCT)而將M個經(jīng)編碼系數(shù)變換回到時域。如
果i"),(其中k=0、 1、 2、 ...、 M)為所接收的MDCT系數(shù),則對應(yīng)的IMDCT解碼 器通過根據(jù)下式而首先采用所接收的系數(shù)的IMDCT來獲得2M個樣本而產(chǎn)生經(jīng)重構(gòu)的 音頻信號
"o 其中n=0、 1、…、2M-1 (4)
其中& 由方程式(2)來界定,接著向當(dāng)前幀的最初M個樣本重疊及添加先 前幀的IMDCT輸出的M個最后樣本及來自下一幀的IMDCT輸出的最初M個樣本。因 此,如果對應(yīng)于下一幀的經(jīng)解碼MDCT系數(shù)在一給定時間不可用,則僅可完整地重構(gòu)當(dāng) 前幀的M個音頻樣本。
MDCT系統(tǒng)可利用M個樣本的先行。MDCT系統(tǒng)可包括編碼器,其使用預(yù)定窗 口而獲得音頻信號或其經(jīng)濾波版本的MDCT;及解碼器,其包括使用與編碼器所使用的 窗口相同的窗口的IMDCT函數(shù)。MDCT系統(tǒng)還可包括重疊及添加模塊。舉例來說,圖 4B說明了 MDCT編碼器401。由預(yù)處理器405接收輸入音頻信號403。所述預(yù)處理器 405實(shí)施預(yù)處理、線性預(yù)測編碼(LPC)濾波及其它類型的濾波。從預(yù)處理器405產(chǎn)生 經(jīng)處理的音頻信號407。將MDCT函數(shù)409應(yīng)用于已被適當(dāng)窗口化的2M個信號樣本。 在一配置中,量化器411量化及編碼M個系數(shù)413且將所述M個經(jīng)編碼系數(shù)傳輸?shù)?MDCT解碼器429。
解碼器429接收M個經(jīng)編碼系數(shù)413。使用與編碼器401中的窗口相同的窗口而將 IMDCT 415應(yīng)用于所述M個所接收系數(shù)413。可將2M個信號值417分類為最初M個 樣本選擇423且可保存最后M個樣本419??赏ㄟ^延遲421而將所述最后M個樣本419 進(jìn)一步延遲一個幀??赏ㄟ^求和器425來對最初M個樣本423及經(jīng)延遲的最后M個樣 本419求和??墒褂盟鼋?jīng)求和的樣本來產(chǎn)生音頻信號的經(jīng)重構(gòu)的M個樣本427。通常,在MDCT系統(tǒng)中,可從一當(dāng)前幀的M個樣本及一未來幀的M個樣本而導(dǎo)出 2M個信號。然而,如果僅來自未來幀的L個樣本為可用的,則可選擇實(shí)施未來幀的L 個樣本的窗口。
在經(jīng)由電路交換網(wǎng)絡(luò)而操作的實(shí)時聲音通信系統(tǒng)中,可由最大可允許編碼延遲來約 束先行樣本的長度??杉俣ㄏ刃虚L度L為可用的。L可小于或等于M。在此條件下,可 能仍然需要使用MDCT (其中連續(xù)幀之間的重疊為L個樣本),同時保持完美的重構(gòu)特 性。
本系統(tǒng)及方法可尤其與實(shí)時雙向通信系統(tǒng)有關(guān),其中預(yù)期一編碼器產(chǎn)生信息以用于 以規(guī)則的時間間隔進(jìn)行傳輸而不管對編碼模式的選擇。所述系統(tǒng)可能不能夠容忍在由編 碼器產(chǎn)生此信息時的抖動或在產(chǎn)生此信息時的此抖動可能不合需要。
在一配置中,將經(jīng)修改離散余弦變換(MDCT)函數(shù)應(yīng)用410于幀。應(yīng)用窗口函數(shù) 可為計算所述幀的MDCT中的一步驟。在一配置中,MDCT函數(shù)處理2M個輸入樣本以 產(chǎn)生M個可接著被量化及傳輸?shù)南禂?shù)。
在一配置中,可編碼412幀。在一方面中,可編碼412所述幀的系數(shù)??墒褂脤⒃?下文予以更完整地論述的各種編碼模式來編碼所述幀??蓪⑺鰩袷交?14于包中且 可傳輸416所述包。在一配置中,將所述包傳輸416到解碼器。
圖5為說明一種用于重構(gòu)音頻信號的經(jīng)編碼幀的方法500的一配置的流程圖。在一 配置中,可由解碼器304來實(shí)施方法500。可接收502包??蓮木幋a器302接收502所 述包??煞纸?04所述包以便檢索幀。在一配置中,可解碼506所述幀??芍貥?gòu)508所 述幀。在一實(shí)例中,幀重構(gòu)模塊314重構(gòu)所述幀以類似于音頻信號的經(jīng)預(yù)編碼幀??奢?出510所述經(jīng)重構(gòu)幀??蓪⑤敵龅膸c額外輸出的幀組合以再現(xiàn)音頻信號。
圖6為說明跨越通信信道606而與多模式解碼器604進(jìn)行通信的多模式編碼器602 的一配置的框圖。包括多模式編碼器602及多模式解碼器604的系統(tǒng)可為包括若干不同 編碼方案以編碼不同音頻信號類型的編碼系統(tǒng)。通信信道606可包括射頻(RF)接口。 編碼器602可包括相關(guān)聯(lián)的解碼器(未圖示)。編碼器602及其相關(guān)聯(lián)的解碼器可形成 第一編碼器。解碼器604可包括相關(guān)聯(lián)的編碼器(未圖示)。解碼器604及其相關(guān)的編
碼器可形成第二編碼器。
編碼器602可包括初始參數(shù)計算模塊618、模式分類模塊622、多個編碼模式624、 626、 628及包格式化模塊630。將編碼模式624、 626、 628的數(shù)目展示為N,其可表示 任何數(shù)目的編碼模式624、 626、 628。為簡單起見,展示了三種編碼模式624、 626、 628,
其中虛線指示存在其它編碼模式。
122007800
解碼器604可包括包分解器模塊632、多個解碼模式634、 636、 638、幀重構(gòu)模塊 640及后濾波器642。將解碼模式634、 636、 638的數(shù)目展示為N,其可表示任何數(shù)目 的解碼模式634、 636、 638。為簡單起見,展示三種解碼模式634、 636、 638,其中虛
線指示存在其它解碼模式。
可將音頻信號s(n) 610提供到初始參數(shù)計算模塊618及模式分類模塊622。可將 所述信號610劃分為若干樣本塊(稱作幀)。值n可表示幀數(shù)目或值n可表示幀中的樣 本數(shù)目。在替代配置中,可使用線性預(yù)測(LP)殘余誤差信號來替代音頻信號610???由語音編碼器(例如,碼激勵線性預(yù)測(CELP)編碼器)使用所述LP殘余誤差信號。
初始參數(shù)計算模塊618可基于當(dāng)前幀而導(dǎo)出各種參數(shù)。在一方面中,這些參數(shù)包括 以下各項中的至少一者線性預(yù)測編碼(LPC)濾波器系數(shù)、線譜對(LSP)系數(shù)、規(guī) 范化自相關(guān)函數(shù)(NACF)、開放環(huán)路滯后、零交叉速率、帶能量及共振峰殘余信號。在 另一方面中,初始參數(shù)計算模塊618可通過濾波信號610、計算音高等等來預(yù)處理信號 610。
可將初始參數(shù)計算模塊618耦接到模式分類模塊622。所述模式分類模塊622可在 編碼模式624、 626、 628之間進(jìn)行動態(tài)切換。初始參數(shù)計算模塊618可將關(guān)于當(dāng)前幀的 參數(shù)提供到模式分類模塊622。所述模式分類模塊622可經(jīng)耦接以逐幀地在編碼模式 624、 626、 628之間進(jìn)行動態(tài)切換以便選擇用于當(dāng)前幀的適當(dāng)編碼模式624、 626、 628。 模式分類模塊622可通過將所述參數(shù)與預(yù)界定閾值及/或最高值相比較而選擇用于當(dāng)前 幀的特定編碼模式624、 626、 628。舉例來說,可使用MDCT編碼方案來編碼與非語音 信號相關(guān)聯(lián)的幀。MDCT編碼方案可接收幀且將特定MDCT窗口格式應(yīng)用于所述幀。 下文關(guān)于圖8而描述特定MDCT窗口格式的實(shí)例。
模式分類模塊622可將語音幀分類為語音或非活動語音(例如,靜默、背景噪聲或 言語之間的暫停)?;趲闹芷谛裕J椒诸惸K622可將語音幀分類為特定類型的 語音(例如,有聲、無聲或瞬態(tài))。
有聲語音可包括展現(xiàn)出相對高程度的周期性的語音。音高周期可為語音幀的分量, 其可用于分析及重構(gòu)所述幀的內(nèi)容。無聲語音可包括輔音。瞬態(tài)語音幀可包括有聲語音 與無聲語音之間的過渡??蓪⒓任幢环诸悶橛新曊Z音又未被分類為無聲語音的幀分類為 瞬態(tài)語音。
將幀分類為語音還是非語音可允許使用不同編碼模式624、 626、 628來編碼不同類 型的幀,從而導(dǎo)致更有效地使用共享信道(例如,通信信道606)中的帶寬。
模式分類模塊622可基于幀的分類而選擇用于當(dāng)前幀的編碼模式624、 626、 628。可并聯(lián)耦接各種編碼模式624、 626、 628。所述編碼模式624、 626、 628中的一者或一 者以上可在任何給定時間均為操作的。在一配置中,根據(jù)當(dāng)前幀的分類來選擇一個編碼 模式624、 626、 628。
不同編碼模式624、 626、 628可根據(jù)不同編碼位速率、不同編碼方案或編碼位速率 與編碼方案的不同組合而操作。不同編碼模式624、 626、 628還可將一不同窗口函數(shù)應(yīng) 用于一個幀。所使用的各種編碼速率可為全速率、半速率、四分之一速率及/或八分之一 速率。所使用的各種編碼模式624、 626、 628可為MDCT編碼、碼激勵線性預(yù)測(CELP) 編碼、原型音高周期(PPP)編碼(或波形內(nèi)插(WI)編碼)及/或噪聲激勵線性預(yù)測(NELP) 編碼。因此,舉例來說,特定編碼模式624、 626、 628可為MDCT編碼方案,另一編碼 模式可為全速率CELP,另一編碼模式624、 626、 628可為半速率CELP,另一編碼模式 可為624、 626、 628可為全速率PPP,且另一編碼模式624、 626、 628可為NELP。
根據(jù)使用傳統(tǒng)窗口來編碼、傳輸、接收及在解碼器處重構(gòu)音頻信號的M個樣本的 MDCT編碼方案,所述MDCT編碼方案利用編碼器處的輸入信號的2M個樣本。換句話 說,除音頻信號的當(dāng)前幀的M個樣本之外,編碼器可在可開始編碼之前等待收集額外M 個樣本。在MDCT編碼方案與其它編碼模式(例如,CELP)共存的多模式編碼系統(tǒng)中, 使用用于MDCT計算的傳統(tǒng)窗口格式可影響整體幀大小及整個編碼系統(tǒng)的先行長度。本 系統(tǒng)及方法針對任何給定幀大小及先行長度而提供用于MDCT計算的窗口格式的設(shè)計 及選擇,使得MDCT編碼方案不會將約束強(qiáng)加于多模式編碼系統(tǒng)。
根據(jù)CELP編碼模式,可使用LP殘余信號的經(jīng)量化版本來激勵線性預(yù)測聲道模型。 在CELP編碼模式中,可量化當(dāng)前幀??墒褂肅ELP編碼模式來編碼被分類為瞬態(tài)語音 的幀。
根據(jù)NELP編碼模式,可使用經(jīng)濾波的偽隨機(jī)噪聲信號來模仿LP殘余信號。NELP 編碼模式可為實(shí)現(xiàn)低位速率的相對簡單的技術(shù)??墒褂肗ELP編碼模式來編碼被分類為 無聲語音的幀。
根據(jù)PPP編碼模式,可編碼每一幀內(nèi)的一子組音高周期??赏ㄟ^在這些原型周期之
間進(jìn)行內(nèi)插來重構(gòu)語音信號的剩余周期。在PPP編碼的時域?qū)嵤┓桨钢校捎嬎愕谝唤M
參數(shù),所述第一組參數(shù)描述如何將先前原型周期修改為近似于當(dāng)前原型周期??蛇x擇一
個或一個以上碼向量,當(dāng)對所述一個或一個以上碼向量求和時其近似于當(dāng)前原型周期與
經(jīng)修改的先前原型周期之間的差。第二組參數(shù)描述這些所選擇的碼向量。在PPP編碼的
頻域?qū)嵤┓桨钢?,可計算一組參數(shù)以描述原型的振幅及相位譜。根據(jù)PPP編碼的實(shí)施方
案,解碼器604可通過基于描述振幅及相位的若千組參數(shù)而重構(gòu)當(dāng)前原型來合成輸出音
14頻信號616??稍诋?dāng)前經(jīng)重構(gòu)原型周期與先前經(jīng)重構(gòu)原型周期之間的區(qū)域上內(nèi)插語音信 號。所述原型可包括當(dāng)前幀的一部分,所述部分將被線性地內(nèi)插有同樣位于所述幀內(nèi)的 來自先前幀的原型以便在解碼器604處重構(gòu)音頻信號610或LP殘余信號(即,將過去 的原型周期用作當(dāng)前原型周期的預(yù)測(predictor))。
編碼原型周期而非整個幀可降低編碼位速率。可以PPP編碼模式來編碼被分類為有 聲語音的幀。通過采用有聲語音的周期性,PPP編碼模式可實(shí)現(xiàn)比CELP編碼模式低的 位速率。
可將所選擇的編碼模式624、 626、 628耦接到包格式化模塊630。所述所選擇的編 碼模式624、 626、 628可編碼或量化當(dāng)前幀且將所述經(jīng)量化的幀參數(shù)612提供到包格式 化模塊630。在一配置中,所述經(jīng)量化的幀參數(shù)是從MDCT編碼方案所產(chǎn)生的編碼系數(shù)。 包格式化模塊630可將所述經(jīng)量化的幀參數(shù)612組合于經(jīng)格式化包613中。包格式化模 塊630可經(jīng)由通信信道606而將經(jīng)格式化包613提供到接收器(未圖示)。所述接收器 可接收、解調(diào)制及數(shù)字化所述經(jīng)格式化包613,且將包613提供到解碼器604。
在解碼器604中,包分解器模塊632可從接收器接收包613。包分解器模塊632可 拆開包63以便檢索經(jīng)編碼幀。包分解器模塊632還可經(jīng)配置以逐包地在解碼模式634、 636、 638之間進(jìn)行動態(tài)切換。解碼模式634、 636、 638的數(shù)目可與編碼模式624、 626、 628的數(shù)目相同。每一經(jīng)編號的編碼模式624、 626、 628可與經(jīng)配置以采用相同編碼位 速率及編碼方案的相應(yīng)經(jīng)類似編號的解碼模式634、 636、 638相關(guān)聯(lián)。
如果包分解器模塊632檢測到包613,則分解所述包613并將其提供到相關(guān)的解碼 模式634、 636、 638。相關(guān)的解碼模式634、 636、 638可基于包613內(nèi)的幀而實(shí)施MDCT、 CELP、 PPP或NELP解碼技術(shù)。如果包分解器模塊632并未檢測到包,則宣告包丟失且 擦除解碼器(未圖示)可執(zhí)行幀擦除處理??蓪⒔獯a模式634、 636、 638的并聯(lián)陣列耦 接到幀重構(gòu)模塊640。所述幀重構(gòu)模塊640可重構(gòu)或合成所述幀,從而輸出經(jīng)合成的幀。 可將所述經(jīng)合成的幀與其它經(jīng)合成的幀組合以產(chǎn)生類似于輸入音頻信號s (n) 610的 經(jīng)合成的音頻信號§ (n) 616。
圖7為說明音頻信號編碼方法700的一實(shí)例的流程圖。可計算702當(dāng)前幀的初始參
數(shù)。在一配置中,初始參數(shù)計算模塊618計算702所述參數(shù)。對于非語音幀來說,所述
參數(shù)可包括一個或一個以上系數(shù)以指示所述幀為非語音幀。語音幀可包括以下各項中的
一者或一者以上的參數(shù)線性預(yù)測編碼(LPC)濾波器系數(shù)、線譜對(LSP)系數(shù)、規(guī)
范化自相關(guān)函數(shù)(NACF)、開放環(huán)路滯后、帶能量、零交叉速率及共振峰殘余信號。非
語音幀還可包括例如線性預(yù)測編碼(LPC)濾波器參數(shù)的參數(shù)。
15可將當(dāng)前幀分類704為語音幀或非語音幀。如先前所提及,語音幀可與語音信號相 關(guān)聯(lián)且非語音幀可與非語音信號(即,音樂信號)相關(guān)聯(lián)。可基于步驟702及704中所 進(jìn)行的幀分類來選擇710編碼器/解碼器模式。如圖6中所示,可并聯(lián)連接各種編碼器/ 解碼器模式。不同編碼器/解碼器模式可根據(jù)不同編碼方案而操作。某些模式可在音頻信 號s (n) 610的展現(xiàn)某些特性的編碼部分處更為有效。
如先前所解釋,可選擇MDCT編碼方案以編碼被分類為非語音幀(例如,音樂)的 幀??蛇x擇CELP模式以編碼被分類為瞬態(tài)語音的幀??蛇x擇PPP模式以編碼被分類為 有聲語音的幀。可選擇NELP模式以編碼被分類為無聲語音的幀。可以變化的性能水平 以不同的位速率來頻繁地操作相同編碼技術(shù)。圖6中的不同編碼器/解碼器模式可表示不 同編碼技術(shù)或以不同位速率操作的相同編碼技術(shù)或上述的組合。所選擇的編碼器模式 710可將適當(dāng)?shù)拇翱诤瘮?shù)應(yīng)用于所述幀。舉例來說,如果所選擇的編碼模式為MDCT編 碼方案,則可應(yīng)用本系統(tǒng)及方法的特定MDCT窗口函數(shù)?;蛘?,如果所選擇的編碼模式 為CELP編碼方案,則可將與CELP編碼方案相關(guān)聯(lián)的窗口函數(shù)應(yīng)用于所述幀。所選擇 的編碼器模式可編碼712當(dāng)前幀且將所述經(jīng)編碼幀格式化714于包中??蓪⑺霭鼈鬏?716到解碼器。
圖8為說明在將特定MDCT窗口函數(shù)應(yīng)用于每一幀之后多個幀802、 804、 806的一 配置的框圖。在一配置中,先前幀802、當(dāng)前幀804及未來幀806可各自被分類為非語 音幀。可由2M來表示當(dāng)前幀804的長度820。先前幀802及未來幀806的長度還可為 2M。當(dāng)前幀804可包括第一零填充區(qū)域810及第二零填充區(qū)域818。換句話說,第一零 填充區(qū)域810及第二零填充區(qū)域818中的系數(shù)值可為零。
在一配置中,當(dāng)前幀804還包括重疊長度812及先行長度816??蓪⑺鲋丿B長度 812及所述先行長度816表示為L。重疊長度812可重疊先前幀802的先行長度。在一 配置中,值L小于值M。在另一配置中,值L等于值M。當(dāng)前幀還可包括單位長度814, 其中在此長度814中幀的每一值為一。如所說明,未來幀806可在當(dāng)前幀804的中途點(diǎn) 808處開始。換句話說,未來幀806可在當(dāng)前幀804的長度M處開始。類似地,先前幀 802可在當(dāng)前幀804的中途點(diǎn)808處結(jié)束。因而,在當(dāng)前幀804上存在先前幀802與未 來幀806的50%重疊。
如果量化器/MDCT系數(shù)模塊在解碼器處可靠地重構(gòu)MDCT系數(shù),則特定MDCT窗
口函數(shù)可促進(jìn)在解碼器處完美地重構(gòu)音頻信號。在一配置中,量化器/MDCT系數(shù)編碼模
塊在解碼器處可能并未可靠地重構(gòu)MDCT系數(shù)。在此狀況下,解碼器的重構(gòu)保真度可視
量化器/MDCT系數(shù)編碼模塊可靠地重構(gòu)所述系數(shù)的能力而定。如果當(dāng)前幀被先前幀與未來幀兩者重疊50%,則將MDCT窗口應(yīng)用于所述當(dāng)前幀可提供所述當(dāng)前幀的完美重構(gòu)。 另外,如果滿足普林森-布拉德利(Princen-Bradley)條件,則MDCT窗口可提供完美重 構(gòu)。如先前所提及,可將普林森-布拉德利(Princen-Bradley)條件表達(dá)為
w2(w) +w2(n + M) = 1 (3)
其中vv 6^可表示圖8中所說明的MDCT窗口。由方程式(3)所表達(dá)的條件可意 味著幀802、 804、 806上的被添加到不同幀802、 804、 806上的對應(yīng)點(diǎn)的一點(diǎn)將提供值 一。舉例來說,中途長度808中先前幀802的被添加到中途長度808中當(dāng)前幀804的對 應(yīng)點(diǎn)的一點(diǎn)產(chǎn)生值一。
圖9為說明一種用于將MDCT窗口函數(shù)應(yīng)用于與非語音信號相關(guān)聯(lián)的幀(例如,圖 8中所描述的當(dāng)前幀804)的方法900的一配置的流程圖。應(yīng)用MDCT窗口函數(shù)的過程 可為計算MDCT中的一步驟。換句話說,在不使用滿足兩個連續(xù)窗口之間的50%重疊 的條件及先前所解釋的普林森-布拉德利(Princen-Bradley)條件的窗口的情況下可不應(yīng) 用完美重構(gòu)MDCT??蓪⒎椒?00中所描述的窗口函數(shù)實(shí)施為將MDCT函數(shù)應(yīng)用于一 個幀的一部分。在-實(shí)例中,來自當(dāng)前幀804的M個樣本以及L個先行樣本為可用的。 L可為任意值。
可產(chǎn)生902當(dāng)前幀804的(M-L) /2個樣本的第一零填充區(qū)域。如先前所解釋,零 填充可意味著第一零填充區(qū)域810中的樣本的系數(shù)可為零。在一配置中,可提供904當(dāng) 前幀804的L個樣本的重疊長度。當(dāng)前幀的L個樣本的重疊長度可重疊且添加有卯6先 前幀802的經(jīng)重構(gòu)的先行長度。當(dāng)前幀804的第一零填充區(qū)域及重疊長度可重疊先前幀 80250%。在一配置中,可提供908當(dāng)前幀的(M-L)個樣本。還可提供910當(dāng)前幀的L 個先行樣本。所述L個先行樣本可重疊未來幀806。可產(chǎn)生當(dāng)前幀的(M-L) /2個樣本 的第二零填充區(qū)域。在一配置中,當(dāng)前幀804的L個先行樣本及第二零填充區(qū)域可重疊 未來幀80650%。已被應(yīng)用方法900的幀可滿足如先前所描述的普林森-布拉德利 (Princen-Bradley)條件。
圖IO為說明一種用于重構(gòu)已由MDCT窗口函數(shù)加以修改的幀的方法1000的一配置
的流程圖。在一配置中,由幀重構(gòu)模塊34來實(shí)施方法1000??珊铣?002當(dāng)前幀804
的開始于第一零填充區(qū)域810的末端到(M-L)區(qū)域814的末端的樣本??上虍?dāng)前幀804
的L個樣本的重疊區(qū)域添加1004先前幀802的先行長度。在一配置中,可存儲1006開
始于(M-L)區(qū)域814的末端到第二零填充區(qū)域818的開端的當(dāng)前幀804的L個先行樣本816。在一實(shí)例中,可將L個先行樣本816存儲于解碼器304的存儲器組件中。在一 配置中,可輸出1008 M個樣本??蓪⑺敵龅腗個樣本與額外樣本組合以重構(gòu)當(dāng)前幀 804。
圖11說明了可根據(jù)本文中所描述的系統(tǒng)及方法而用于通信/計算裝置1108中的各種 組件。通信/計算裝置1108可包括控制所述裝置1108的操作的處理器1102。還可將所 述處理器1102稱作CPU。存儲器1104 (其可包括只讀存儲器(ROM)及隨機(jī)存取存儲 器(RAM)兩者)將指令及數(shù)據(jù)提供到處理器1102。存儲器1104的一部分還可包括非 易失性隨機(jī)存取存儲器(NVRAM)。
裝置1108還可包括含有傳輸器1110及接收器1112的外殼1122以允許在接入終端 1108與遠(yuǎn)程位置之間傳輸及接收數(shù)據(jù)。可將傳輸器1110及接收器1112組合于收發(fā)器 1120中??蓪⑻炀€1118附接到外殼1122且將其電耦接到收發(fā)器1120??蓪鬏斊?110、 接收器1112、收發(fā)器1120及天線UI8用于通信裝置1108配置中。
裝置1108還包括用于檢測及量化由收發(fā)器1120所接收的信號的電平的信號檢測器 1106。信號檢測器U06檢測例如總能量、每偽噪聲(PN)碼片的導(dǎo)頻能量、功率譜密 度的信號及其它信號。
通信裝置1108的狀態(tài)改變器1114基于當(dāng)前狀態(tài)及由收發(fā)器1120所接收且由信號檢 測器1106所檢測的額外信號來控制通信/計算裝置1108的狀態(tài)。裝置1108可能能夠以 若干狀態(tài)中的任一狀態(tài)來操作通信/計算裝置1108還包括系統(tǒng)確定器1124,所述系統(tǒng)確定器1124用于控制裝置 1108且在確定當(dāng)前服務(wù)提供者系統(tǒng)不適當(dāng)時確定裝置1108應(yīng)轉(zhuǎn)移到哪一服務(wù)提供者系 統(tǒng)。
通信/計算裝置U08的各組件可由總線系統(tǒng)1126耦接在一起,除數(shù)據(jù)總線之外,總 線系統(tǒng)1126還可包括功率總線、控制信號總線及狀態(tài)信號總線。然而,為清晰起見, 在圖11中將各種總線繪示為總線系統(tǒng)1126。通信/計算裝置1108還可包括數(shù)字信號處 理器(DSP) 1116以用于處理信號。
可使用多種不同技術(shù)及技藝中的任一者來表示信息及信號。舉例來說,可由電壓、 電流、電磁波、磁場或磁粒子、光場或光學(xué)粒子或其任何組合來表示在以上描述中可能 提及的數(shù)據(jù)、指令、命令、信息、信號、位、符號及碼片。
可將結(jié)合本文中所揭示的配置而描述的各種說明性邏輯塊、模塊、電路及算法步驟
實(shí)施為電子硬件、計算機(jī)軟件或兩者的組合。為清楚地說明硬件與軟件的此互換性,已
在上文大致就其功能性而描述了各種說明性組件、塊、模塊、電路及步驟。將此功能性實(shí)施為硬件還是軟件視特定應(yīng)用及強(qiáng)加于整個系統(tǒng)的設(shè)計約束而定。所屬領(lǐng)域的技術(shù)人 員可以針對每一特定應(yīng)用以多種方式來實(shí)施所描述的功能性,但不應(yīng)將所述實(shí)施方案決 策解釋為導(dǎo)致脫離本發(fā)明系統(tǒng)及方法的范圍。
可通過通用處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程 門陣列信號(FPGA)或其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬件組件或 其經(jīng)設(shè)計以執(zhí)行本文所述功能的任何組合來實(shí)施或執(zhí)行結(jié)合本文所揭示配置而描述的 各種說明性邏輯塊、模塊及電路。通用處理器可為微處理器,但在替代方案中,處理器 可為任何處理器、控制器、微控制器或狀態(tài)機(jī)。還可將處理器實(shí)施為計算裝置的組合, 例如,DSP與微處理器的組合、多個微處理器的組合、 一個或一個以上微處理器與DSP 核心的聯(lián)合或任何其它此類配置的組合。
結(jié)合本文中所揭示的配置而描述的方法或算法的步驟可直接以硬件、由處理器執(zhí)行 的軟件模塊或所述兩者的組合體現(xiàn)。軟件模塊可駐留于RAM存儲器、快閃存儲器、ROM 存儲器、可擦除可編程只讀存儲器(EPROM)、電可擦除可編程只讀存儲器(EEPROM)、 寄存器、硬盤、可拆卸盤、緊密光盤只讀存儲器(CD-ROM)或此項技術(shù)中已知的任何 其它形式的存儲媒體中??蓪⒋鎯γ襟w耦接到所述處理器,使得所述處理器可從所述存 儲媒體讀取信息或?qū)⑿畔?與入到所述存儲媒體。在替代例中,所述存儲媒體可與所述處 理器成一體。所述處理器及所述存儲媒體可駐留于ASIC中。所述ASIC可駐留于用戶 終端中。在替代例中,所述處理器及所述存儲媒體可作為離散組件而駐留于用戶終端中。
本文中所揭示的方法包含一個或一個以上用于實(shí)現(xiàn)所描述的方法的步驟或動作。所 述方法步驟及/或動作可彼此互換而不脫離本系統(tǒng)及方法的范圍。換句話說,除非針對配 置的恰當(dāng)操作而規(guī)定步驟或動作的特定次序,否則可修改特定步驟及/或動作的次序及/ 或使用而不脫離本系統(tǒng)及方法的范圍。可將本文中所揭示的方法以硬件、軟件、或兩者 實(shí)施。硬件及存儲器的實(shí)例可包括RAM、 ROM、 EPROM、 EEPROM、快閃存儲器、光 盤、寄存器、硬盤、CD-ROM或任何其它類型的硬件及存儲器。
雖然已說明及描述了本系統(tǒng)及方法的特定配置與應(yīng)用,但將理解,所述系統(tǒng)及方法并不 受限于本文中所揭示的精確配置及組件。可在不脫離所主張的系統(tǒng)及方法的精神及范圍 的情況下對本文中所揭示的方法及系統(tǒng)的布置、操作及細(xì)節(jié)進(jìn)行所屬領(lǐng)域的技術(shù)人員所 顯而易見的多種修改、改變及變化。
權(quán)利要求
1.一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的方法,所述方法包含接收信號;將所述信號分割為多個幀;確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián);如果確定所述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;以及對所述幀進(jìn)行編碼。
2. 根據(jù)權(quán)利要求1所述的方法,其中使用基于MDCT編碼的方案對所述幀進(jìn)行編碼。
3. 根據(jù)權(quán)利要求1所述的方法,其中所述幀包含2M的長度,其中M表示所述幀中 的樣本的數(shù)目。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述第一零填充區(qū)域位于所述幀的開端處。
5. 根據(jù)權(quán)利要求1所述的方法,其中所述第二零填充區(qū)域位于所述幀的末端處。
6. 根據(jù)權(quán)利要求1所述的方法,其中所述第一零填充區(qū)域及所述第二區(qū)域包含(M-L) /2的長度,其中L是小于或等于M的值,且其中M是所述幀中的樣本的數(shù)目。
7. 根據(jù)權(quán)利要求7所述的方法,其進(jìn)一步包含提供長度為L的當(dāng)前重疊區(qū)域。
8. 根據(jù)權(quán)利要求7所述的方法,其中長度為L的所述重疊區(qū)域重疊且添加有與先前幀 相關(guān)聯(lián)的先行樣本。
9. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含提供長度為L的先行區(qū)域,其中L小 于或等于M,且其中M是所述幀中的樣本的數(shù)目。
10. 根據(jù)權(quán)利要求9所述的方法,其中長度為L的所述先行區(qū)域和與未來幀相關(guān)聯(lián)的未 來重疊區(qū)域重疊。
11.根據(jù)權(quán)利要求1所述的方法,其中所述第一零填充區(qū)域及所述當(dāng)前重疊區(qū)域重疊先 前幀50%。
12.根據(jù)權(quán)利要求1所述的方法,其中所述第二零填充區(qū)域及所述先行區(qū)域重疊未來幀 50%。
13.根據(jù)權(quán)利要求1所述的方法,其中添加有來自重疊的幀的相關(guān)聯(lián)樣本的所述幀的每 一樣本的和等于一。
14.一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的設(shè)備,其包含 處理器存儲器,其與所述處理器進(jìn)行電子通信 指令,其存儲于所述存儲器中,所述指令可執(zhí)行以 接收信號將所述信號分割為多個幀;確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián);如果確定所述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗 口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;以及 對所述幀進(jìn)行編碼。
15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中使用基于MDCT編碼的方案對所述幀編碼。
16. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述幀包含等于2M的樣本長度,其中M表示 所述幀中的樣本的數(shù)目。
17. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述第一零填充區(qū)域位于所述幀的開端處。
18. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述第二零填充區(qū)域位于所述幀的末端處。
19. 一種經(jīng)配置而以與音頻信號相關(guān)聯(lián)的幀修改窗口的系統(tǒng),其包含: 用于處理的裝置;用于接收信號的裝置;用于將所述信號分割為多個幀的裝置;用于確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián)的裝置; 用于在確定所述幀與非語音信號相關(guān)聯(lián)的情況下將經(jīng)修改離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域的裝置以及用于對所述幀進(jìn)行編碼的裝置。
20. —種計算機(jī)可讀媒體,其經(jīng)配置以存儲一組指令,所述指令可執(zhí)行以接收信號-將所述信號分割為多個幀;確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián);如果確定所述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗口 函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;以及 對所述幀進(jìn)行編碼。
21. —種用于選擇待用于計算幀的經(jīng)修改離散余弦變換(MDCT)的窗口函數(shù)的方法, 所述方法包含提供用于選擇待用于計算幀的MDCT的窗口函數(shù)的算法 將所述所選擇的窗口函數(shù)應(yīng)用于所述幀;以及基于由額外編碼模式強(qiáng)加于MDCT編碼模式的約束而以所述MDCT編碼模式來 對所述幀進(jìn)行編碼,其中所述約束包含所述幀的長度、先行長度及延遲。
22. —種用于重構(gòu)音頻信號的經(jīng)編碼幀的方法,所述方法包含接收包;分解所述包以檢索經(jīng)編碼幀合成所述幀的位于第-一零填充區(qū)域與第一區(qū)域之間的樣本; 向第一長度的重疊區(qū)域添加先前幀的先行長度 存儲所述幀的所述第一長度的先行;以及 輸出經(jīng)重構(gòu)的幀。
全文摘要
本發(fā)明描述一種用于以與音頻信號相關(guān)聯(lián)的幀修改窗口的方法。接收信號。將所述信號分割為多個幀。確定所述多個幀內(nèi)的一個幀是否與非語音信號相關(guān)聯(lián)。如果確定所述幀與非語音信號相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域。對所述幀進(jìn)行編碼。解碼器窗口與編碼器窗口相同。
文檔編號G10L19/02GK101496098SQ200780028286
公開日2009年7月29日 申請日期2007年7月31日 優(yōu)先權(quán)日2006年7月31日
發(fā)明者文卡特什·克里希南, 阿南塔帕德馬那伯罕·A·坎達(dá)哈達(dá)伊 申請人:高通股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1