專利名稱::音頻編碼和解碼系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及用于對音頻信號進(jìn)行編碼和解碼的系統(tǒng)、方法和技術(shù),該音頻信號諸如是通過通信聲道接收的或者從存儲設(shè)備讀取的數(shù)字音頻信號。
背景技術(shù):
:存在各種不同的用于對音頻信號進(jìn)行編碼和解碼的技術(shù)。然而,不斷地希望其性能、質(zhì)量和壓縮能夠改進(jìn)。
發(fā)明內(nèi)容除了其它技術(shù),本發(fā)明通過提供整體音頻編碼技術(shù)來解決此需求,其中該整體音頻編碼技術(shù)使用了瞬變幀中的可變分辯率,并且基于量化數(shù)據(jù)的量值(magnitude)來生成可變長度的碼書分段。在此,本發(fā)明首先介紹本說明書參考使用的2007年8月17日提交的名稱為"基于幀的數(shù)據(jù)的可變分辨率處理"、申請?zhí)枮?00710141662.0(下文簡記為"D1")的
發(fā)明內(nèi)容。Dl提出之背景許多傳統(tǒng)的信號處理技術(shù)是基于幀的。在這些技術(shù)中,將數(shù)據(jù)流分割為離散的幀,并且通常以相當(dāng)統(tǒng)一的方式處理每個(gè)這樣的幀中的數(shù)據(jù)。在一個(gè)示例中,將輸入音頻信號分割為相等長度的幀。然后,以特定的方式處理每個(gè)幀。要為每個(gè)幀確定的公共處理參數(shù)是塊長度,或者等同地,為處理目的而應(yīng)將幀分割為多少個(gè)大小相等的塊。塊長度決定了初始域(例如,對音頻信號為時(shí)域)和頻(或其它變換)域中的分辨率。更具體地,越短的塊在初始域提供越高的分辨率而在頻域中提供越低的分辨率。音頻信號經(jīng)常由多個(gè)準(zhǔn)穩(wěn)態(tài)片段(episode)構(gòu)成,其每個(gè)都包括被顯著瞬變所打斷的多個(gè)音調(diào)頻率成分。這樣,這種音頻信號的一個(gè)單獨(dú)幀經(jīng)常包括一些與瞬變對應(yīng)的采樣,但是大多數(shù)采樣與該信號的準(zhǔn)穩(wěn)態(tài)部分對應(yīng)。因?yàn)橐纛l信號中的瞬變能夠短到只有幾個(gè)采樣,所以在被檢測到包含瞬變的幀內(nèi)使用的塊的大小理想情況下應(yīng)該只是幾個(gè)采樣,從而濾波器的時(shí)間分辨率與該瞬變匹配。不幸的是,在同一幀內(nèi)使用不同的塊大小通常是不實(shí)際的。使得在具有被檢測到的瞬變的幀內(nèi)的所有塊僅為幾個(gè)采樣的寬度會導(dǎo)致在該幀內(nèi)的頻率分辨率極低,因此,對該幀內(nèi)的其它采樣是不合適的;即,這些其它的采樣,只要它們離該瞬變足夠遠(yuǎn),就是準(zhǔn)穩(wěn)態(tài)的并因此要使用高的頻率分辨率來更好地處理。這個(gè)矛盾通常導(dǎo)致一種折衷的塊大小,其既不是對于瞬變采樣最優(yōu)也不是對于同一幀中的準(zhǔn)穩(wěn)態(tài)采樣最優(yōu)。圖1中示出了用于處理輸入采樣12的幀的傳統(tǒng)系統(tǒng)的框圖。首先,在瞬變檢測器14中分析采樣12,以判定該幀是否包含瞬變。根據(jù)該檢測,在模塊16選擇窗函數(shù)。在這點(diǎn)上,音頻編碼算法經(jīng)常使用具有不同時(shí)間-頻率分辨率的濾波器組。一種常用的濾波器組是MDCT(改進(jìn)型離散余弦變換),其具有能夠由下述基本函數(shù)描述的脈沖響應(yīng)<formula>formulaseeoriginaldocumentpage8</formula>其中k=0,l,...,M-l;n-0,l,…,2M陽l;w(n)是長度2M的窗函數(shù)。參照,例如,H.S,Malvar,"SignalProcessingwithLappedTransfroms",ArtechHouse,1992(這里參照Malvar)。在這種情況下,時(shí)間-頻率分辨率由M決定,在此,M有時(shí)被稱為塊大小。大的M意味著低的時(shí)間分辨率但是高的頻率分辨率,而小的M意味著高的時(shí)間分辨率和低的頻率分辨率。為了實(shí)現(xiàn)模塊16(如圖1所示),傳統(tǒng)的編碼算法通常使用兩個(gè)塊大小。如果在模塊14中沒有檢測到瞬變,則使用大的塊大小,其被實(shí)現(xiàn)為覆蓋整個(gè)幀的單個(gè)塊?;蛘?,如果檢測到瞬變,則使用小的塊大小,其被實(shí)現(xiàn)為覆蓋該幀的預(yù)定數(shù)量的塊。與這兩個(gè)塊大小相對應(yīng)的主窗函數(shù)分別是是窗函數(shù)30(在圖2中示出并標(biāo)注為WIN—LONG—LONG2LONG)和窗函數(shù)40(在圖3中示出并標(biāo)注為WIN—SHORT—SHORT2SHORT)。為了使得MDCT能夠在這兩個(gè)主窗函數(shù)之間正確地切換,完全重構(gòu)條件(例如,如在Malvar中所述)要求使用三個(gè)過渡窗(transitionwindow)函數(shù),例如窗函數(shù)50(圖16中示出并標(biāo)注為WIN_LONG_LONG2SHORT)、窗函數(shù)60(圖5中示出并標(biāo)注為WIN—LONG—SHORT2LONG)、和窗函數(shù)70(圖6中示出并標(biāo)注為WIN—LONG—SHORT2SHORT)。需要注意,所有這三個(gè)過渡窗函數(shù)50、60和70與長塊(即,覆蓋整個(gè)幀的塊)結(jié)合使用。這樣,在傳統(tǒng)的技術(shù)中,將一個(gè)幀分配給單獨(dú)一個(gè)長塊(并與長窗口30、50、60或70對應(yīng))或一系列相同的短塊(并與相同的短窗口40對應(yīng))。因?yàn)槊總€(gè)塊都比塊與塊之間的間隔要長,導(dǎo)致了長窗口和短窗口的交疊的序列,就如圖7中所示的窗函數(shù)序列80,其中,每個(gè)窗口都覆蓋當(dāng)前塊的M個(gè)新采樣以及先前塊的M個(gè)采樣。在該圖中,為了進(jìn)行參照,與窗函數(shù)30、40、50、60或70對應(yīng)的每個(gè)塊的中間分別標(biāo)明為31、41、51、61或71。需要注意,這種傳統(tǒng)的技術(shù)不僅基于模塊14對當(dāng)前幀所進(jìn)行的檢測,而且還基于對于先前幀和后續(xù)幀所進(jìn)行的相同檢測,來為不包含瞬變的幀選擇窗函數(shù)。即,窗函數(shù)50、60和70用作瞬變幀和非瞬變幀之間的過渡窗函數(shù)。返回到圖1,然后,在模塊17中,將在模塊16中所選擇的窗函數(shù)應(yīng)用(對瞬變幀則多次應(yīng)用)到當(dāng)前幀的輸入采樣12。也就是說,對于每個(gè)塊,將采樣值與對應(yīng)于該塊的窗函數(shù)值相乘,以獲得一組加權(quán)值。然后,使用所選擇的窗函數(shù)在模塊19中處理這些加權(quán)值,以提供輸出值22。在模塊19中執(zhí)行的處理的具體類型能夠根據(jù)所希望的應(yīng)用而變化。例如,對于音頻信號,處理可以包括分析、編碼、和/或增強(qiáng)。Dl
發(fā)明內(nèi)容Dl通過在檢測到包含瞬變的幀內(nèi)使用多個(gè)不同窗函數(shù),以及其他內(nèi)容,來解決這個(gè)問題和其它問題。在優(yōu)選實(shí)施例中,Dl在具有被檢測瞬變的單個(gè)數(shù)據(jù)幀內(nèi)提供至少兩級分辨率。更優(yōu)選的是,不改變幀內(nèi)的塊大小而提供該多種分辨率。因此,例如,能夠在瞬變的附近使用更高的分辨率而在幀的其它部分使用更低的分辨率。需要注意,未限定的術(shù)語"分辨率"這里指的是初始(例如,時(shí)間)域中的分辨率。因?yàn)轭l(或其它變換)域中的分辨率與初始域中的分辨率成相反的變化,在發(fā)明的這些實(shí)施例中,為幀中不包含瞬變的部分提供了更高的頻率(或其它變換域)分辨率。此外,通過保持塊大小不變,通常能夠在不使處理結(jié)構(gòu)變復(fù)雜的情況下獲得前述優(yōu)點(diǎn)。這樣,在一方面,Dl的目的是處理基于幀的數(shù)據(jù),其中,獲得數(shù)據(jù)幀、在所述幀中發(fā)生瞬變的指示、以及所述瞬變在所述幀中的位置。根據(jù)所述瞬變的指示,為所述幀設(shè)定塊大小,從而有效地在所述幀中定義多個(gè)大小相等的塊。另外,根據(jù)所述瞬變的所述位置,為所述多個(gè)大小相等的塊中的不同塊選擇不同的窗函數(shù),并且通過使用所選擇的窗函數(shù)來處理所述數(shù)據(jù)幀。在優(yōu)選實(shí)施例中,所述塊相互交疊,并且每個(gè)窗函數(shù)也與每個(gè)相鄰的窗函數(shù)交疊,優(yōu)選地是采用滿足完全重構(gòu)條件的方式。前述性質(zhì)優(yōu)選地用于幀中的相鄰的塊和窗函數(shù),以及在相鄰幀中的相鄰的塊和窗函數(shù)。在任何情況下,優(yōu)選地將窗函數(shù)選擇為,在所述多個(gè)大小相等的塊中所識別出的包含瞬變的塊中,提供更高的分辨率。而且,這優(yōu)選地通過在所識別出的塊中使用在所述多個(gè)窗函數(shù)中的比其它窗函數(shù)更窄的瞬變窗函數(shù)來實(shí)現(xiàn)(例如,通過將在該塊中、但是在該瞬變窗函數(shù)外部的采樣清零)。換而言之,雖然在該幀中的塊的寬度保持不變,但是如果需要,則這些塊中的窗函數(shù)的寬度能夠變化,以便為該幀的每個(gè)塊獲得期望的分辨率折衷(例如,時(shí)間/頻率)。在這點(diǎn)上,能夠用多種不同的方法來定義窗函數(shù)的寬度。例如,能夠?qū)⑵涠x為窗函數(shù)中非零部分的長度、窗函數(shù)中高于特定閾值的部分的長度、或窗函數(shù)中包含有該窗函數(shù)的某個(gè)特定百分比的內(nèi)容(例如,能量)的部分的長度。因此,能夠通過壓縮或擴(kuò)展標(biāo)準(zhǔn)形狀,然后將在塊中但不包括在該壓縮形狀中的任何采樣清零,來改變窗函數(shù)的寬度。或者,能夠通過使用不同的形狀并且一些形狀的更多能量集中在更小的部分,來改變寬度。在另一方面,Dl的目的是處理基于幀的數(shù)據(jù),其中,獲得數(shù)據(jù)幀、在所述幀中發(fā)生瞬變的指示、以及所述瞬變在所述幀中的位置。選擇在所述幀中使用的不同的窗函數(shù),以便在包含所述瞬變的區(qū)域內(nèi)提供更高的分辨率,并且通過使用所選擇的窗函數(shù)來處理所述數(shù)據(jù)幀。前述概括僅僅是為了提供D1的特定方面的簡單描述。通過結(jié)合附圖并參照權(quán)利要求和以下優(yōu)選實(shí)施例的詳細(xì)描述,能夠獲得對D1的更完全的理解。Dl的主要目的是改進(jìn)傳統(tǒng)系統(tǒng)的窗函數(shù)選擇組件16。Dl的一個(gè)特征是引入新的"簡短窗函數(shù)(briefwindowflmction)",例如,如圖8中所示的窗函數(shù)100。與傳統(tǒng)的窗函數(shù)WIN—SHORT—SHORT2SHORT40類似,這個(gè)被標(biāo)注為WIN_SHORT—BRIEF2BRIEF的窗函數(shù)100目的是用于短塊中。實(shí)際上,如以下詳細(xì)所述,在Dl的優(yōu)選實(shí)施例中,窗函數(shù)WIN—SHORT—BRIEF2BRIEF100目的是用在與窗函數(shù)WIN—SHORT—SHORT2SHORT40相同的幀中。然而,與傳統(tǒng)窗函數(shù)不同,簡短窗函數(shù)ioo用于采用多個(gè)首部和尾部的零權(quán)重,對其所占據(jù)的塊的整個(gè)長度(圖8中,具有端點(diǎn)102和103)的僅僅中心部分進(jìn)行信號整形,以便提高該部分的時(shí)間分辨率。例如,在短塊的長度等于256個(gè)采樣的情況下,簡短窗函數(shù)100優(yōu)選地在中心160個(gè)采樣中(在這里其還是對稱的)為非零,并且在這些采樣中的最初16個(gè)和最后16個(gè)與和簡短窗函數(shù)100相鄰的各個(gè)過渡窗函數(shù)交疊,并且該窗口的最初48個(gè)采樣和最后48個(gè)采樣為零權(quán)重。在D1的優(yōu)選實(shí)施例中,簡短窗函數(shù)100僅用于在音頻幀中檢測到瞬變采樣的情況中(例如,在包含瞬變采樣的塊中),而規(guī)則的短窗函數(shù)(例如,傳統(tǒng)窗函數(shù)40),或者D1所提供的多個(gè)新的過渡函數(shù)之一,用于在該幀中剩余部分的準(zhǔn)穩(wěn)態(tài)采樣。與傳統(tǒng)技術(shù)相比,這實(shí)現(xiàn)了以下可能性*能夠使用明顯更大的塊大小,在這種情況下,準(zhǔn)穩(wěn)態(tài)采樣的頻率分辨率得到改善,而瞬變采樣周圍的時(shí)間分辨率保持不變。*能夠保持塊大小不變,在這種情況下,準(zhǔn)穩(wěn)態(tài)采樣的頻率分辨率不變,而瞬變采樣周圍的時(shí)間分辨率得到改善。*能夠使用略微更大的塊,在這種情況下,準(zhǔn)穩(wěn)態(tài)采樣的頻率分辨率略微得到改善,而瞬變采樣周圍的時(shí)間分辨率也略微得到改善。使用任何以上選擇,解決相矛盾的時(shí)間-頻率分辨率需求的折衷方案得到改進(jìn)。為了便于結(jié)合其它兩個(gè)主窗函數(shù)(即,WIN—LONG—LONG2LONG30和WIN_SHORT—SHORT2SHORT40)使用窗函數(shù)ioo(例如,為了滿足完全重構(gòu)條件),優(yōu)選地引入額外的過渡窗函數(shù)。這種過渡窗函數(shù)的示例如下。然而,首先需要注意本公開普遍使用的術(shù)語WIN—5ZocfcZ^"gA—尸n'or『FZSM&『F,其中,別oc^e"gfZi指示當(dāng)前窗函數(shù)所占據(jù)的塊的長度(例如,長或短),尸n'w『F標(biāo)識在緊鄰的先前塊中的窗函數(shù)的類型(例如,長、短、或簡短),而&fe『F標(biāo)識在緊鄰的后續(xù)塊中的窗函數(shù)的類型(例如,長、短、或簡短)。過渡窗函數(shù)110(在圖9中示出并標(biāo)注為WIN—SHORT_SHORT2BRIEF)用于短塊中,該短塊緊鄰在包含瞬變的另一個(gè)短塊之前。即,該窗口緊鄰在窗函數(shù)WIN_SHORT—BRIEF2BRIEF100之前。窗函數(shù)120(示于圖10并標(biāo)注為WIN—SHORT—BRIEF2SHORT)用于短塊中,該短塊緊鄰在包含瞬變的另一個(gè)短塊之后。即,該窗口緊鄰在窗函數(shù)WIN—SHORT一BRIEF2BRIEF100之后。窗函數(shù)130(示于圖11并標(biāo)注為WIN_LONG—LONG2BRIEF)用于長塊中,該長塊緊鄰在包含瞬變的另一個(gè)短塊之前。即,該窗口覆蓋了在包含瞬變的后續(xù)幀之前緊鄰的幀,該瞬變正好在該后續(xù)幀的第一個(gè)塊中。窗函數(shù)140(示于圖12并標(biāo)注為WIN—LONG—BRIEF2LONG)用于長塊中,該長塊緊鄰在包含瞬變的另一個(gè)短塊之后。即,該窗口覆蓋了在包含瞬變的先前幀之后緊鄰的幀,該瞬變正好在該先前幀的最后的一個(gè)塊中。窗函數(shù)150(示于圖13并標(biāo)注為WIN—LONG—BRIEF2BRIEF)用于長塊中,該長塊夾在兩個(gè)包含瞬變的短塊之間。即,該窗口覆蓋了在兩個(gè)包含瞬變的幀之間的幀,在先前幀中的瞬變正好在其最后的一個(gè)塊中,而后續(xù)幀中的瞬變正好在其第一個(gè)塊中。窗函數(shù)160(示于圖14并標(biāo)注為WIN—LONG—SHORT2BRIEF)用于長塊中,該長塊覆蓋了在兩個(gè)包含瞬變的幀之間的幀,在先前幀中的瞬變正好不在其最后的一個(gè)塊中,而后續(xù)幀中的瞬變正好在其第一個(gè)塊中。窗函數(shù)170(示于圖15并標(biāo)注為WIN—LONG—BRIEF2SHORT)用于長塊中,該長塊覆蓋了在兩個(gè)包含瞬變的幀之間的幀,在先前幀中的瞬變正好在其最后的一個(gè)塊內(nèi),而后續(xù)幀中的瞬變正好不在其第一個(gè)塊內(nèi)。在每種情況下,窗函數(shù)優(yōu)選地設(shè)計(jì)為使得其以滿足完全重構(gòu)條件的方式,在每個(gè)邊上與相鄰的窗函數(shù)交疊??梢允褂玫拇昂瘮?shù)的具體示例給出如下。圖16是示出用于根據(jù)D1的代表實(shí)施例選擇窗函數(shù)的技術(shù)的流程圖。一般地說,圖16中所示出的整個(gè)過程會是自動的(例如,采用軟件、固件、專用硬件、或者其組合來實(shí)現(xiàn))。最初地,在步驟202獲得數(shù)據(jù)幀。在這點(diǎn)上,可以根據(jù)D1的實(shí)施例處理多種不同類型的數(shù)據(jù)。在此公開中,經(jīng)常假定該數(shù)據(jù)對應(yīng)于音頻信號。然而,這不應(yīng)該看作是限制,而是所獲得的數(shù)據(jù)可以表示任何其他物理現(xiàn)象,比如圖像信號、視頻信號、或者用于表示熱、壓力、輻射、運(yùn)動、距離、任何生物功能、天氣和/或任何地質(zhì)現(xiàn)象的信號。還需要注意,該數(shù)據(jù)幀可能己經(jīng)由該數(shù)據(jù)的來源(例如,作為數(shù)據(jù)通過通信頻道而被接收的地方)進(jìn)行了定義?;蛘?,例如,該數(shù)據(jù)可以以連續(xù)流進(jìn)行接收,并被(例如,在內(nèi)部)分割為幀以進(jìn)行處理。在任何情況下,本處理尤其(雖然不是排它地)適用于被分割為各個(gè)幀的數(shù)據(jù)。如上面所示,在某些特定方面,基于幀的處理容許以統(tǒng)一的方式處理整個(gè)數(shù)據(jù)流中的各個(gè)部分。在D1的優(yōu)選實(shí)施例中,每個(gè)幀有統(tǒng)一的塊大小。在這點(diǎn)上,將塊優(yōu)選地定義為幀的基本信號處理單位。例如,在要將幀中的數(shù)據(jù)從原始域(例如,在音頻情況下的時(shí)域)變換到(例如,在信號處理模塊19)頻域(例如,使用離散余弦變換或快速傅里葉變換),或者變換到由一組正交函數(shù)定義的任何其它變換域的情況下,優(yōu)選地對每個(gè)塊,分別執(zhí)行該變換和在該變換域中的任何后續(xù)處理。這樣,在優(yōu)選實(shí)施例中,幀可以由單個(gè)塊覆蓋,或者可以由多個(gè)大小相等的塊覆蓋。更優(yōu)選地,如傳統(tǒng)技術(shù)一樣,僅有兩種塊大小覆蓋整個(gè)幀的大的塊大小,和導(dǎo)致均勻分布在整個(gè)幀中的多個(gè)連續(xù)塊的小的塊大小。此外,為了處理其它將發(fā)生的邊界問題,如采用傳統(tǒng)技術(shù)一樣,Dl的塊優(yōu)選地相互交疊(例如,以滿足完全重構(gòu)條件的方式)。從概念上,能夠?qū)⒚總€(gè)塊視為包含隨后要進(jìn)行處理(例如,在模塊19中)的多個(gè)核心采樣和與這些核心采樣相鄰的多個(gè)邊界采樣。在優(yōu)選實(shí)施例中,核心采樣是在該序列中的新采樣,而邊界采樣是來自先前塊的歷史采樣。在另一方面,多個(gè)幀優(yōu)選地連續(xù)并且不交疊。因此,在一個(gè)幀的開始處的塊與先前幀交疊。對于由單個(gè)塊覆蓋的幀,該單個(gè)塊覆蓋整個(gè)先前幀。除了獲取數(shù)據(jù)幀本身之外,步驟202還獲取瞬變指示符(例如,從瞬變檢測器14)。在優(yōu)選實(shí)施例中,所獲得的瞬變指示符指示在當(dāng)前幀中是否存在瞬變,如果存在,則指示其在幀中的位置。如果在當(dāng)前幀中檢測到一個(gè)以上的瞬變,則優(yōu)選地獲取(例如,由瞬變檢測器14確定,然后將其從瞬變檢測器14接收)每個(gè)這種瞬變的位置。為了簡化解釋,本公開有時(shí)不失一般性地假設(shè)在每個(gè)幀中只檢測到單個(gè)瞬變(如果有的話)。能夠使用例如任何現(xiàn)有技術(shù)來執(zhí)行實(shí)際的瞬變檢測。通常,瞬變會將自我顯示為在非常短的時(shí)間內(nèi)在高頻成分中的一個(gè)尖峰,因此,能夠以此為基礎(chǔ)而被檢測到。在任何情況下,經(jīng)常會指定一個(gè)閾值級別,在其之下的信號活動將不被視為是瞬變。返回參考圖16,在步驟203,判斷在當(dāng)前幀中是否存在瞬變。優(yōu)選地,該判斷直接基于瞬變檢測器14所提供的信息。如果不存在瞬變,則處理進(jìn)行到步驟205。如果存在一個(gè)瞬變,則處理進(jìn)行到步驟210。在步驟205,基于當(dāng)前幀不包含瞬變的判定來設(shè)定塊大小。在優(yōu)選實(shí)施例中,在這種情況下,使用單個(gè)塊覆蓋整個(gè)幀。更優(yōu)選的,該塊包含在當(dāng)前幀中的所有采樣作為核心采樣,以及來自一個(gè)(或多個(gè))先前幀的部分或全部采樣。示例性的塊大小為2048個(gè)采樣,即,1024個(gè)核心采樣(幀大小也為1024個(gè)采樣)和1024個(gè)來自先前幀的采樣。接下來,在步驟207,為當(dāng)前幀選擇窗函數(shù)(假定單個(gè)塊覆蓋整個(gè)幀)。在優(yōu)選實(shí)施例中,此步驟包括,評估先前緊鄰的和后續(xù)緊鄰的幀/塊。由于窗函數(shù)數(shù)量的增加,與傳統(tǒng)技術(shù)相比,適當(dāng)窗口序列的確定通常略微更為復(fù)雜,但是潛在的原理相對更直接。具體地,選擇長窗函數(shù),并且具體形狀取決于在先前和后續(xù)幀中任何瞬變的存在及其位置。具體選擇優(yōu)選地如下進(jìn)行<table>tableseeoriginaldocumentpage16</column></row><table>一旦在步驟207中選擇了合適的窗函數(shù),就在步驟17應(yīng)用該窗函數(shù)(例如,如上所討論的)。在另一方面,如果在步驟203中判定在當(dāng)前幀中存在瞬變,則處理進(jìn)行到步驟210,在步驟中,將塊大小設(shè)置為"小"。例如,對于1024個(gè)采樣的幀大小而言,為256個(gè)采樣的塊大小,即,128個(gè)核心采樣和與先前塊交疊的128個(gè)采樣(從而使得該幀被8個(gè)塊覆蓋)。雖然本實(shí)施例為這兩種可能情形(瞬變/無瞬變)中的每一種都構(gòu)想了單一塊大小,但是需要注意,在其它的實(shí)施例中,可以基于任何期望的標(biāo)準(zhǔn)來選擇不同的塊大小,并且一個(gè)幀可以由多個(gè)不同大小的塊構(gòu)成。在任何情況下,一旦確定了塊大小,處理進(jìn)行到步驟212,在該步驟中,為當(dāng)前幀中的不同的塊選擇不同的窗函數(shù)。因?yàn)榇_知當(dāng)前幀包含至少一個(gè)瞬變,所以WIN_SHORT—BRIEF2BRIEF窗函數(shù)100至少將會使用一次(在所確定的一個(gè)(或多個(gè))位置處)。更優(yōu)選地,根據(jù)如下原則,為當(dāng)前幀的短塊選擇一系列簡短窗函數(shù)和短窗函數(shù):*將,WIN_SHORT—BRIEF2BRIEF應(yīng)用于發(fā)生瞬變的塊中的采樣,以便改善該塊的時(shí)間分辨率。*在包含瞬變的窗口之前緊鄰的窗口的窗函數(shù)具有"...2BRIEF"形式的指數(shù)。*在包含瞬變的窗口之后緊鄰的窗口的窗函數(shù)具有BRIEF2..."形式的指數(shù)。因此,可以允許任何以下的窗函數(shù)組合<table>tableseeoriginaldocumentpage17</column></row><table>在本公開中題目為"窗函數(shù)選擇例程"的部分中,闡述了用c語言所編寫的具體程序,用于在一個(gè)幀中放置窗函數(shù)。然而,一般而言,瞬變前的過渡窗函數(shù)是基于其自身的塊長度(長或短)和在其之前緊鄰的窗函數(shù)的性質(zhì)(長、短、或簡短),從以上表格的左邊列中選出的。相似地,瞬變后的過渡窗函數(shù)是基于其自身的塊長度(長或短)和在其之后緊鄰的窗函數(shù)的性質(zhì)(長、短、或簡短),從以上表格的右邊列中選出的。優(yōu)選地,對于在當(dāng)前幀中并非以下特性的每個(gè)塊分配窗函數(shù)WIN—SHORT一SHORT2SHORT40:(i)瞬變前(在瞬變塊之前緊鄰的塊)、(ii)瞬變(包含瞬變的塊)、(iii)瞬變后(在瞬變塊之后緊鄰的塊)、(iv)幀的第一個(gè)塊、或(v)幀的最后的一個(gè)塊。對于當(dāng)前幀中的第一個(gè)塊(假定其不是瞬變前塊、瞬變塊、瞬變后塊)優(yōu)選地分配窗函數(shù)WIN_SHORT_/Vz'orWF2SHORT,對于當(dāng)前幀中的最后的一個(gè)塊(假定其不是瞬變前塊、瞬變塊、瞬變后塊)優(yōu)選地分配窗函數(shù)WIN一SHORT一SHORT25^feWF。一旦步驟212完成,過程就進(jìn)行到步驟17,以應(yīng)用所選擇的窗函數(shù)。一旦步驟17完成,過程就返回到步驟202,以處理下一幀。應(yīng)當(dāng)理解,圖16中所示的流程圖實(shí)際上主要是概念的。實(shí)際上,如上所述,一個(gè)幀的一個(gè)(或多個(gè))窗函數(shù)的選擇通常會受到在相鄰幀中瞬變的存在及其位置的影響。因此,一個(gè)幀的一個(gè)(或多個(gè))窗函數(shù)的選擇,可以與一個(gè)或更多其它幀的一個(gè)(或多個(gè))窗函數(shù)的選擇同時(shí)執(zhí)行。至少,對于當(dāng)前幀的選擇優(yōu)選地要預(yù)想要被應(yīng)用于后續(xù)幀的窗函數(shù)。需要注意,圖16中所示的流程圖中的部分216能夠用于代替在傳統(tǒng)窗口選擇模塊16(圖1中)中執(zhí)行的相應(yīng)處理。因此,Dl的技術(shù)典型地能夠被容易地體現(xiàn)為對于傳統(tǒng)系統(tǒng)的改進(jìn)??梢允褂肈l的一種應(yīng)用是音頻編碼/解碼。在這種系統(tǒng)中,編碼器典型地向解碼器指明其用于編碼當(dāng)前幀的窗函數(shù),從而使得解碼器能夠使用相同的窗函數(shù)來解碼該幀。采用傳統(tǒng)技術(shù),要實(shí)現(xiàn)此目的,通常只需要向解碼器傳送一個(gè)窗函數(shù)索引,因?yàn)?對沒有檢測到瞬變的幀,只使用其中一種長窗函數(shù),并且因此需要向解碼器指明。*對于包含一個(gè)或多個(gè)瞬變的幀,該幀中的所有窗函數(shù)都相同,艮卩,WIN—SHORT—SHORT2SHORT40。圖7中示出了這樣的幀70(其夾在兩個(gè)未檢測到瞬變的幀之間)。以上陳述對D1的技術(shù)也成立。即,為了使解碼器使用與編碼器相同的窗函數(shù)來解碼幀,只需要向解碼器傳送一個(gè)窗函數(shù)索引。這是因?yàn)?對于沒有檢測到瞬變的幀,Dl的技術(shù)也只需要向解碼器指明使用長窗函數(shù)中的哪一個(gè)。*對于檢測到瞬變的幀,編碼器只需向解碼器指明在當(dāng)前幀的第一個(gè)塊中是否存在瞬變以及在下一個(gè)幀的第一個(gè)塊中是否存在瞬變;然后,就能夠使用在此所述的步驟,確定用于整個(gè)幀的窗函數(shù)序列。因?yàn)樵趦?yōu)選實(shí)施例中,WIN_SHORT—BRIEF2BRIEF窗函數(shù)100用于具有瞬變的塊,因此可以使用以下術(shù)語來傳遞此信息WIN—SHORT—Cz^re"WwZ^,其中,C^re"f(SHORT-否,BRIEF-是)標(biāo)識在當(dāng)前幀的第一個(gè)塊中是否存在瞬變,(SHORT-否,BRIEF-是)標(biāo)識在后續(xù)幀的第一個(gè)塊中是否存在瞬變。例如,WIN—SHORT—BRIEF2BRIEF指示在當(dāng)前幀的第一個(gè)塊中以及后續(xù)禎的第一個(gè)塊中存在瞬變,而WIN_SHORT_BRIEF2SHORT指示在當(dāng)前幀的第一個(gè)塊中存在瞬變,而在后續(xù)幀的第一個(gè)塊中不存在瞬變。圖17-20示出了根據(jù)D1的示例性窗函數(shù)序列。在每個(gè)這樣的序列中,具有至少一個(gè)瞬變的幀(由WIN—SHORT—BRIEF2BRIEF窗函數(shù)100所指示)在每個(gè)邊上被兩個(gè)不包含瞬變的幀所包圍。然而,這些示例并非用于進(jìn)行限定;每個(gè)都具有至少一個(gè)瞬變的連續(xù)的幀也是允許的。示例性實(shí)現(xiàn)一個(gè)廣泛使用的窗函數(shù)為如下正弦函數(shù)<formula>formulaseeoriginaldocumentpage19</formula>WINLONGSHORT2SHORT:<formula>formulaseeoriginaldocumentpage20</formula><formula>formulaseeoriginaldocumentpage21</formula>WINLONGBRIEF2BRIEF:<formula>formulaseeoriginaldocumentpage21</formula>WINLONGSHORT2BRIEF:<formula>formulaseeoriginaldocumentpage21</formula>WINLONGBRIEF2SH0RT:<formula>formulaseeoriginaldocumentpage22</formula>一組好的窗口長度參數(shù)為L=1024、S=128、以及8=32。然而,也可以使用其它的參數(shù)。本發(fā)明的一方面涉及用于對音頻信號進(jìn)行編碼的系統(tǒng)、方法和技術(shù)。獲得分割成幀的采樣音頻信號。識別在其中一個(gè)幀中的瞬變的位置,并且通過對幀數(shù)據(jù)執(zhí)行多分辨率濾波器組分析來生成變換數(shù)據(jù)采樣,包括以不同的分辯率來對包括該瞬變的幀的不同部分進(jìn)行濾波?;谛睦砺晫W(xué)模型,通過使用可變數(shù)量的比特,對變換數(shù)據(jù)采樣進(jìn)行量化,來生成量化數(shù)據(jù),并且基于量化數(shù)據(jù)的量值,把該量化數(shù)據(jù)分成可變長度的分段。把碼書分配給每個(gè)可變長度的分段,并且用被分配給此可變長度的分段的碼書,來對每個(gè)可變長度的分段中的量化數(shù)據(jù)進(jìn)行編碼。根據(jù)前述的配置,經(jīng)常有可能同時(shí)實(shí)現(xiàn)對音頻數(shù)據(jù)更準(zhǔn)確的編碼,而用更少量的比特來表示此數(shù)據(jù)。本發(fā)明通過提供解碼系統(tǒng)、方法和技術(shù)來解決此需求,其中,通過把碼書應(yīng)用到指定的量化指數(shù)范圍(在某些情況下甚至跨越量化單元的邊界),并且通過基于比特流內(nèi)的窗信息來識別要在單個(gè)音頻數(shù)據(jù)幀中應(yīng)用的一序列不同的窗,來從比特流獲取音頻數(shù)據(jù)。因此,在一個(gè)典型實(shí)施例中,本發(fā)明涉及用于對基于幀的比特流中的音頻信號進(jìn)行解碼的系統(tǒng)、方法和技術(shù)。每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化指數(shù)。該處理信息包括(i)熵碼書指數(shù),(ii)用于指定碼書將要被應(yīng)用于的熵編碼量化指數(shù)范圍的碼書應(yīng)用信息,以及(iii)窗信息。通過將所確定的碼書應(yīng)用于對應(yīng)的熵編碼量化指數(shù)范圍,解碼熵編碼量化指數(shù)。然后通過對所解碼的量化指數(shù)進(jìn)行反量化,生成子帶采樣,并且基于窗信息,確定在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用了的一序列不同的窗函數(shù)。通過對子帶采樣進(jìn)行逆變換,并且使用由窗信息所指示的多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。根據(jù)前述的配置,通常有可能獲得更高的效率,并且同時(shí)提供對原始音頻數(shù)據(jù)的更良好再現(xiàn)。前述的概述僅僅是為了提供本發(fā)明的特定方面的簡要描述。通過參考權(quán)利要求和以下關(guān)于優(yōu)選實(shí)施例的詳細(xì)描述,并結(jié)合附圖,可以獲得關(guān)于本發(fā)明的更完整的理解。前述的概述僅僅是為了提供本發(fā)明的特定方面的簡要描述。通過參考權(quán)利要求和以下關(guān)于優(yōu)選實(shí)施例的詳細(xì)描述,并結(jié)合附圖,可以獲得關(guān)于本發(fā)明的更完整的理解。圖1是用于基于瞬變的存在而改變在數(shù)據(jù)幀中的時(shí)間分辨率的傳統(tǒng)系統(tǒng)的框圖;圖2示出了當(dāng)具有長塊大小的幀夾在兩個(gè)也具有長塊大小的幀之間時(shí)所用的傳統(tǒng)窗函數(shù);圖3示出了用于具有短塊大小的幀的傳統(tǒng)窗函數(shù);圖4示出了當(dāng)具有長塊大小的幀的先前幀具有長塊大小,后續(xù)幀具有短塊大小時(shí),用于該幀的傳統(tǒng)過渡窗函數(shù);圖5示出了當(dāng)具有長塊大小的幀的先前幀具有短塊大小,后續(xù)幀具有長塊大小時(shí),用于該幀的傳統(tǒng)過渡窗函數(shù);圖6示出了當(dāng)具有長塊大小的幀的先前幀具有短塊大小,后續(xù)幀具有短塊大小時(shí),用于該幀的傳統(tǒng)過渡窗函數(shù);圖7示出了一個(gè)示例傳統(tǒng)窗函數(shù)序列,其中,包含瞬變的幀在每個(gè)邊上與兩個(gè)不包含瞬變的幀相鄰接;圖8示出了根據(jù)Dl的代表性實(shí)施例的簡短窗函數(shù)WIN—SHORT一BRIEF2BRIEF;圖9示出了根據(jù)Dl的代表性實(shí)施例的過渡窗函數(shù)WIN—SHORT—SHORT2BRIEF;圖10示出了根據(jù)DlWINSHORT—BRIEF2SHORT;圖11示出了根據(jù)DlWIN—LONG—LONG2BRIEF;圖12示出了根據(jù)DlWINLONG—BRIEF2LONG;圖13示出了根據(jù)DlWIN—LONG—BRIEF2BRIEF;圖14示出了根據(jù)DlWIN—LONG—SHORT2BRIEF;圖15示出了根據(jù)DlWIN—LONG—BRIEF2SHORT;圖16是示出用于根據(jù)Dl的代表性實(shí)施例用于選擇窗函數(shù)K術(shù)的流程圖17示出了根據(jù)D1的第一示例窗函數(shù)序列;圖18示出了根據(jù)D1的第二示例窗函數(shù)序列;的代表性實(shí)施例的過渡窗函數(shù)的代表性實(shí)施例的過渡窗函數(shù)的代表性實(shí)施例的過渡窗函數(shù)的代表性實(shí)施例的過渡窗函數(shù)的代表性實(shí)施例的過渡窗函數(shù)的代表性實(shí)施例的過渡窗函數(shù)圖19示出了根據(jù)D1的第三示例窗函數(shù)序列;以及圖20示出了根據(jù)D1的第四示例窗函數(shù)序列;圖2〗是根據(jù)本發(fā)明的典型實(shí)施例的音頻信號編碼器的框圖。圖22是示出了根據(jù)本發(fā)明的典型實(shí)施例的用于識別碼書分段和對應(yīng)碼書的最初集合的過程。圖23示出了根據(jù)本發(fā)明的典型實(shí)施例的量化指數(shù)的順序的實(shí)例,其中將這些量化指數(shù)分割到具有對應(yīng)碼書的碼書分段中。圖24是根據(jù)本方面的典型實(shí)施例,在排除了圖23所示分割中的分段后,將量化指數(shù)分割到碼書分段中所得的分割。圖25示出了常規(guī)的量化指數(shù)分割的結(jié)果,其中量化分段直接對應(yīng)于量化單元。圖26示出了根據(jù)本發(fā)明的典型實(shí)施例的量化指數(shù)分割的結(jié)果,其中有效地將量化指數(shù)集合在一起;圖27是根據(jù)本發(fā)明的典型實(shí)施例,示出了解碼器可能用到的各種示例性環(huán)境的框圖。圖28A-B根據(jù)本發(fā)明的典型實(shí)施例,分別示出了用單個(gè)長數(shù)據(jù)塊來覆蓋一個(gè)幀以及用多個(gè)短數(shù)據(jù)塊來覆蓋一個(gè)幀的用法。圖29A-C示出了根據(jù)本發(fā)明的典型實(shí)施例的瞬變幀的不同的實(shí)例。圖30是根據(jù)本發(fā)明的典型實(shí)施例的音頻信號解碼系統(tǒng)10的框圖。具體實(shí)施例方式<編碼系統(tǒng)>本發(fā)明涉及用于對音頻信號進(jìn)行編碼,例如以便后續(xù)存儲和傳輸?shù)南到y(tǒng)、方法和技術(shù)。本發(fā)明可以使用到的應(yīng)用包括,但不限于:數(shù)字音頻廣播、數(shù)字電視(衛(wèi)星、地面和/或有線廣播)、家庭影院、數(shù)字影院、鐳射視頻碟片播放器、因特網(wǎng)上的內(nèi)容流以及個(gè)人音頻播放器。圖21是根據(jù)本發(fā)明的典型實(shí)施例的音頻信號編碼系統(tǒng)10的框圖。如下所述,在一個(gè)典型子實(shí)施例中,完全用計(jì)算機(jī)可執(zhí)行的代碼來實(shí)現(xiàn)圖21所示的各個(gè)部分或組件。然而,在替換的實(shí)施例中,可以用此處所討論的任何其它方法來實(shí)現(xiàn)這些部分或組件中的任意或全部。最初,把與初始音頻信號的時(shí)間采樣對應(yīng)的脈沖編碼調(diào)制(PCM)信號12輸入到幀分割部分14。就這點(diǎn)而言,初始音頻信號典型地由多個(gè)聲道組成,例如用于普通立體聲的左和右聲道,或者用于環(huán)繞聲的5-7個(gè)標(biāo)準(zhǔn)聲道以及一個(gè)低頻效果(LFE)聲道。LFE聲道典型地具有有限的帶寬(例如小于120Hz),并且具有比標(biāo)準(zhǔn)聲道更高的音量。在整個(gè)描述中,用;cj來表示給定聲道的配置,其中x表示標(biāo)準(zhǔn)聲道的數(shù)量,y表示LFE聲道的數(shù)量。因此,將用2.0來表示普通立體聲,并且用5.1、6.1或7.1來表示典型的常規(guī)環(huán)繞聲。本發(fā)明的優(yōu)選實(shí)施例支持多達(dá)64.3的聲道配置,以及從8千赫茲(kHz)至lj192kHz的采樣頻率,包括44.1kHz到48kHz,具有至少為24比特的精度。一般來說,除非此處特別說明,都獨(dú)立于其它聲道來對每個(gè)聲道進(jìn)行處理??梢詮耐獠吭窗裀CM信號12輸入到系統(tǒng)10,或者可替換地可以由系統(tǒng)IO例如通過采樣原始音頻信號內(nèi)部生成PCM信號12。在幀分割部分14,把每個(gè)聲道的PCM采樣12分割成時(shí)域中的連續(xù)幀序列。就這點(diǎn)而言,在本發(fā)明的技術(shù)中,把幀看作是用于處理目的的基本數(shù)據(jù)單元。優(yōu)選地,每個(gè)這種幀具有從相對小的幀大小集合中所選取的固定采樣數(shù)量,其中所選擇的對于任何特定時(shí)間間隔的幀大小取決于例如采樣速率和幀間所能容忍的延遲量。更優(yōu)選地,每個(gè)幀包括128、256、512或1024個(gè)采樣,其中除了降低延遲非常重要的情況之外,優(yōu)選更長的幀。在以下討論的大多實(shí)例中,假設(shè)每個(gè)幀由1024個(gè)采樣構(gòu)成。然而,不能將這種實(shí)例當(dāng)作是限制性的。把從幀分割部分14所輸出的每個(gè)數(shù)據(jù)采樣幀輸入到瞬變分析部分16,其確定所輸入的PCM采樣幀是否包含信號瞬變,優(yōu)選地將該瞬變定義為信號能量的突然迅速的上升(沖擊)或下降。基于這種檢測,隨后把每個(gè)幀分類成瞬變幀(即,包括瞬變的幀)或準(zhǔn)穩(wěn)態(tài)幀(即,不包括瞬變的幀)。此外,瞬變分析部分16對每個(gè)瞬變信號的位置和持續(xù)時(shí)間進(jìn)行識別,并且隨后使用該信息來識別"瞬變分段"??梢允褂萌魏我阎乃沧儥z測方法,包括美國專利申請11/029722申請中所述的任何瞬變檢測技術(shù)。此處所用的術(shù)語"瞬變分段"是指信號的一部分,其具有相同或相似統(tǒng)計(jì)特性。因此,準(zhǔn)穩(wěn)態(tài)幀通常由單個(gè)瞬變分段構(gòu)成,而瞬變幀通常由兩個(gè)或三個(gè)瞬變分段構(gòu)成。例如,如果在一幀中僅發(fā)生了瞬變的沖擊或下降,那么該瞬變幀通常會具有兩個(gè)瞬變分段一個(gè)覆蓋了該幀在沖擊或下降之前的部分,另一個(gè)覆蓋了該幀在沖擊或下降之后的部分。如果在瞬變幀中沖擊和下降都發(fā)生了,那么通常將會存在三個(gè)瞬變分段,每個(gè)分段各自覆蓋由沖擊和下降所分割的幀的部分。隨后把該基于幀的數(shù)據(jù)和瞬變檢測信息提供給濾波器組18??勺兎洲q率的分析濾波器組18將每個(gè)聲道音頻的音頻PCM采樣分解成子帶信號,其中子帶的性質(zhì)取決于所使用變換技術(shù)。就這點(diǎn)而言,盡管濾波器組18可以使用各種不同的變換技術(shù),在優(yōu)選實(shí)施例中,該變換是單一的并且基于正弦的。如US11/029722申請中所詳述,更優(yōu)選地,濾波器組18使用離散余弦變換(DCT)和改進(jìn)型離散余弦變換(MDCT)。在此處所述的大多實(shí)例中,假設(shè)使用的是MDCT。因此,在優(yōu)選實(shí)施例中,對于每個(gè)MDCT塊,子帶信號由多個(gè)子帶采樣構(gòu)成,每個(gè)子帶采樣對應(yīng)于不同的子帶頻率;此外,由于變換的單一性質(zhì),子帶采樣的數(shù)量等于由MDCT所處理的時(shí)域采樣的數(shù)量。此外,在優(yōu)選實(shí)施例中,基于從瞬變分析部分16所接收的瞬變檢測結(jié)果來對濾波器組18的時(shí)一頻分辯率進(jìn)行控制。更優(yōu)選地,濾波器組使用Dl申請中所述的技術(shù)。一般來說,該技術(shù)使用一個(gè)長變換塊來覆蓋每個(gè)準(zhǔn)穩(wěn)態(tài)幀,并且使用多個(gè)相同的更短變換塊來覆蓋每個(gè)瞬變幀。在典型實(shí)例中,幀大小是1024個(gè)采樣,把每個(gè)準(zhǔn)穩(wěn)態(tài)幀視為由一個(gè)初級塊(具有1028個(gè)采樣)構(gòu)成,把每個(gè)瞬變幀視為由八個(gè)初級塊(每個(gè)具有128個(gè)采樣)構(gòu)成。為了避免邊界效應(yīng),MDCT塊比初級塊大,并且優(yōu)選地是初級塊的兩倍大小,因此由2048個(gè)采樣構(gòu)成長MDCT塊,由256個(gè)采樣構(gòu)成短MDCT塊。在應(yīng)用MDCT之前,把窗函數(shù)應(yīng)用到每個(gè)MDCT塊,以便對各個(gè)濾波器的頻率響應(yīng)進(jìn)行整形。因?yàn)閮H將單個(gè)長MDCT塊用于準(zhǔn)穩(wěn)態(tài)幀,所以使用單個(gè)窗函數(shù)以便滿足完全重構(gòu)要求,盡管其特定形狀優(yōu)選地取決于鄰近幀中所使用的窗函數(shù)。另一方面,與常規(guī)技術(shù)不同,該優(yōu)選實(shí)施例的技術(shù)在單個(gè)瞬變幀中使用不同的窗函數(shù)。更優(yōu)選地,當(dāng)在該幀中使用單個(gè)變換(例如MDCT)塊大小的同時(shí),選擇這種窗函數(shù),以便在瞬變幀中至少提供兩個(gè)分辯率級別。結(jié)果,例如,可以在瞬變信號附近實(shí)現(xiàn)更高的時(shí)域分辯率(以更低的頻域分辯率為代價(jià)),并且可以在該瞬變幀的其它部分(例如更穩(wěn)態(tài)的部分)實(shí)現(xiàn)更高的頻域分辯率(以更低的時(shí)域分辯率為代價(jià))。此外,通過保持變換塊大小恒定,通常無需復(fù)雜化處理結(jié)構(gòu)就能實(shí)現(xiàn)前述的優(yōu)勢。在優(yōu)選實(shí)施例中,除了常規(guī)的窗函數(shù),還引入了以下新的"簡短"窗函數(shù)WIN—SHORT—BRIEF2BRIEF:<formula>formulaseeoriginaldocumentpage28</formula>其中,S是短初級塊大小(例如128個(gè)采樣),并且B是簡短塊大小(例如B二32)。如D1申請中所詳述的,優(yōu)選地還使用額外的過渡窗函數(shù),以便滿足完全重構(gòu)要求。注意到,同樣如D1申請中所詳述,可以使用"簡短"窗函數(shù)的其它具體形式。然而,在本發(fā)明的優(yōu)選實(shí)施例中,與瞬變幀的其它(例如更穩(wěn)態(tài)的)部分中所使用的其它窗函數(shù)相比,所使用的"簡短"窗函數(shù)的能量更多地匯聚在變換塊的更小部分中。事實(shí)上,在特定的實(shí)施例中,多個(gè)函數(shù)值為O,從而保持中央和初級塊的采樣值。在重組交叉部分20,優(yōu)選地對當(dāng)前聲道的當(dāng)前幀的子帶采樣進(jìn)行重排列,以便把對應(yīng)于相同子帶的相同瞬變分段中的采樣集合在一起。在具有長MDCT的幀(即準(zhǔn)穩(wěn)態(tài)幀)中,已經(jīng)按照頻率升序(例如從子帶0到子帶1023)重新排列了子帶采樣。因?yàn)镸DCT的子帶采樣是按照自然順序排列的,所以不把重構(gòu)交叉應(yīng)用到具有長MDCT的幀。然而當(dāng)幀是由"iVM附B/odts/^fFr/M個(gè)短MDCT塊(即瞬變幀)組成的時(shí)候,按照頻率升序(例如從子帶0到子帶127)來排列每個(gè)短MDCT的子帶采樣。再把這種子帶采樣的分組按照時(shí)間順序排列,從而形成從0到1023的子帶采樣的自然順序。在重組交叉部分20中,通過將每個(gè)瞬變分段中具有相同頻率的采樣排列在一起,然后按照頻率升序?qū)λ鼈冞M(jìn)行排列,來對這些子帶采樣進(jìn)行重構(gòu)交叉。結(jié)果通常是減少了需要傳輸?shù)谋忍氐臄?shù)量。如下,是具有三個(gè)瞬變分段和八個(gè)短MDCT塊的幀的自然順序的實(shí)例<table>tableseeoriginaldocumentpage30</column></row><table>重構(gòu)交叉順序的子帶采樣的線性序列是[O,2,4,……,254,1,3,5,......,255,256,259,302,......,637,......]。此處所用的"臨界頻帶"是指人耳的頻率分辯率,即帶寬//,在該帶寬內(nèi),人耳不能分辨出不同的頻率。帶寬4/"隨著頻率/的增加而增加,其中/和4/"之間近似指數(shù)關(guān)系。每個(gè)臨界頻帶可以表示為濾波器組的多個(gè)鄰近的子帶采樣。例如,短(例如128采樣)MDCT的臨界頻帶的范圍典型地在最低頻率時(shí)的4個(gè)子帶采樣寬度到最高頻率時(shí)的42個(gè)子帶采樣寬度之間。心理聲學(xué)模型32提供了人耳的噪聲掩蔽門限。心理聲學(xué)模型32所基于的基本概念是人的聽覺系統(tǒng)中有門限。在這些值(掩蔽門限)之下的音頻信號不能被聽到。結(jié)果,沒有必要把這部分信息發(fā)送給解碼器。心理聲學(xué)模型32的目的是為了提供這些門限值??梢允褂矛F(xiàn)有的通用心理聲學(xué)模型,例如MPEG的兩種心理聲學(xué)模型。在本發(fā)明的優(yōu)選實(shí)施例中,心理聲學(xué)模型32輸出每個(gè)量化單元的掩蔽門限(如下定義)。可選擇的和/差編碼器22使用特定的聯(lián)合聲道編碼技術(shù)。優(yōu)選地,編碼器22如下把左/右聲道對的子帶采樣變換成和/差聲道對和聲道-0.5X(左聲道+右聲道);以及差聲道二0.5X(左聲道一右聲道)。因此,在解碼期間,在左/右聲道中的子帶采樣重構(gòu)如下左聲道=和聲道+差聲道;以及右聲道=和聲道一差聲道??蛇x擇的聯(lián)合強(qiáng)度編碼器24通過使用人耳在高頻的聲學(xué)成像定位特性,對在聯(lián)合聲道中的高頻成分進(jìn)行編碼。心理聲學(xué)模型指示出人耳對于在高頻的空間聲象的感覺,主要是由左/右音頻信號的相對強(qiáng)度來定義的,而較少是由各個(gè)頻率成分定義的。這是聯(lián)合強(qiáng)度編碼的理論基礎(chǔ)。以下是用于聯(lián)合強(qiáng)度編碼的簡單技術(shù)。對于待組合的兩個(gè)和三個(gè)聲道,把對應(yīng)的子帶采樣交叉加到聲道中,并且用全部子帶采樣替換其中一個(gè)初始源聲道(例如,左聲道)中的子帶采樣,稱為聯(lián)合子帶采樣。然后對于每個(gè)量化單元,調(diào)整功率,以便匹配該初始源聲道的功率,保留每個(gè)聲道的每個(gè)量化單元的比例因子。最后,僅對經(jīng)過功率調(diào)整的聯(lián)合子帶采樣和每個(gè)聲道中的量化單元的比例因子進(jìn)行保留和發(fā)送。例如,如果五S是源聲道中的聯(lián)合量化單元的功率,并且五/是聯(lián)合聲道中的聯(lián)合量化單元的功率,那么可以如下計(jì)算比例因子全局比特分配部分34把多個(gè)比特分配到每個(gè)量化單元。就這點(diǎn)而言,"量化單元"優(yōu)選地由子帶采樣矩形構(gòu)成,該子帶采樣矩形由頻域中的臨界頻帶和時(shí)域中的瞬變分段來界定。在此矩形中的所有子帶采樣都屬于相同量化單元。這些采樣的序號可以不同,例如,因?yàn)樵诒景l(fā)明的優(yōu)選實(shí)施例中有兩類子帶采樣排列順序(即自然順序和交叉順序),但是它們優(yōu)選地表示相同分組的子帶采樣。在一個(gè)實(shí)例中,第一量化單元由子帶采樣0,1,2,3,128,129,130和131所組成。然而,第一量化單元的子帶采樣的序號變成O,1,2,3,4,5,6和7。這兩組不同序號表示相同的子帶采樣。為了將量化噪聲功率的值降低到低于每個(gè)掩蔽門限值,全局比特分配部分34將每個(gè)幀可用的所有比特在該幀的量化單元之間進(jìn)行分配。優(yōu)選地,通過調(diào)整量化單元的量化步長,來控制每個(gè)量化單元的量化噪聲功率和分配給該量化單元的比特?cái)?shù)量??梢允褂酶鞣N現(xiàn)有的比特分配技術(shù),包括例如,注水。在注水技術(shù)中,(1)確定具有最大NMR(噪聲掩蔽比)的量化單元;(2)減小分配給該量化單元的量化步長,從而降低量化噪聲;并且隨后(3)重復(fù)前述的兩個(gè)步驟,直到所有量化單元的NMR小于1(或者其它預(yù)先設(shè)定的門限)為止,或者直到用盡了在當(dāng)前幀中所允許的比特為止。如上所述,量化部分26優(yōu)選地通過使用由全局比特分配器34所提供的統(tǒng)一量化步長,直接地對每個(gè)量化單元中的采樣進(jìn)行量化,來對子帶采樣進(jìn)行量化。然而,根據(jù)對全局比特分配部分34進(jìn)行調(diào)整,可以使用其它任何量化技術(shù)。碼書選擇器通過量化指數(shù)的局部統(tǒng)計(jì)特性來對這些量化指數(shù)進(jìn)行分組或分段,并且從碼書庫中選擇碼書來分配給每個(gè)量化指數(shù)組。在本發(fā)明的優(yōu)選實(shí)施例中,基本上同時(shí)發(fā)生分段和碼書選擇。在本發(fā)明的優(yōu)選實(shí)施例中,量化指數(shù)編碼器28(以下額外詳細(xì)描述)通過使用碼書選擇器36為每個(gè)分段所選擇的碼書,來對量化指數(shù)執(zhí)行霍夫曼編碼。優(yōu)選地,對每個(gè)聲道的子帶采樣量化指數(shù)執(zhí)行霍夫曼編碼。更優(yōu)選地,使用兩組碼書(一組用于準(zhǔn)穩(wěn)態(tài)幀另一組用于瞬變幀)來對子帶采樣量化指數(shù)執(zhí)行霍夫曼編碼,其中每組碼書由9個(gè)霍夫曼碼書組成。因此,可以使用多達(dá)9個(gè)霍夫曼碼書的優(yōu)選實(shí)施例,來對給定幀的量化指數(shù)進(jìn)行編碼。這些碼書的屬性優(yōu)選地如下所示<table>tableseeoriginaldocumentpage33</column></row><table>在本發(fā)明的替換實(shí)施例中執(zhí)行其它類型的熵編碼(例如算術(shù)編碼)。然而,在本實(shí)例中假設(shè)使用霍夫曼編碼。此處所用的"霍夫曼"編碼旨在包括任何用假設(shè)的符號概率、使用比較不普通的源符號更短的比特串來表示更普通的源符號的前綴二進(jìn)制代碼,而不管該編碼技術(shù)是否與最初的霍夫曼算法相同??紤]到預(yù)期將由量化指數(shù)編碼器28執(zhí)行的編碼,在優(yōu)選實(shí)施例中碼書選擇器36的目標(biāo)是在每個(gè)聲道中選擇分類指數(shù)的分段,并且確定將哪個(gè)碼書應(yīng)用到每個(gè)分段。第一步是基于由瞬變分析部分16所識別的幀類型(準(zhǔn)穩(wěn)態(tài)或瞬變)來確定將使用哪個(gè)碼書組。然后優(yōu)選地按照以下方式,選擇具體的碼書和分段。在常規(guī)音頻信號處理算法中,熵碼書的應(yīng)用范圍與量化單元相同,因此通過量化單元中的最大量化指數(shù)來定義熵碼書。因此,沒有進(jìn)一步優(yōu)化的可能。相反,在本發(fā)明的優(yōu)選實(shí)施例中,碼書選擇忽視了量化單元邊界,而是同時(shí)選擇恰當(dāng)?shù)拇a書及其將要應(yīng)用于的分段。更優(yōu)選地,通過量化指數(shù)的局部統(tǒng)計(jì)特性來把量化指數(shù)分割成分段。通過這些分段的邊緣來定義碼書的應(yīng)用范圍。參考圖22中的流程圖,描述了用于確定碼書分段和對應(yīng)碼書的技術(shù)實(shí)例。最初,在步驟82,選擇碼書分段以及對應(yīng)碼書的最初集合??梢酝ㄟ^各種不同的方法來執(zhí)行這個(gè)步驟,例如使用群集技術(shù),或者通過在連續(xù)間隔內(nèi)將僅能夠由給定大小的碼書容納的量化指數(shù)簡單地集合在一起。就后一種方法而言,在可應(yīng)用的碼書組(例如九個(gè)不同的碼書)中,主要的差別是能夠容納的最大量化指數(shù)。因此碼書選擇首先包括選擇能夠容納所考慮的所有量化指數(shù)的量值的碼書。因此,步驟82的一種方法是從容納第一個(gè)量化指數(shù)的最小碼書開始,并且隨后一直使用該碼書,直到需要更大的碼書或者直到可以使用更小的碼書。無論如何,步驟82的結(jié)果是提供碼書分段和對應(yīng)碼書的最初序列。一個(gè)實(shí)例包括圖23中所示的分段101-113。此處,每個(gè)碼分段101-113具有通過其水平長度來指示的長度,其中通過其垂直高度來表示分配的碼書接下來,在步驟83中,再次,優(yōu)選地基于量化指數(shù)的量值,按照需要或希望合并碼書分段。就這點(diǎn)而言,因?yàn)榇a書分段優(yōu)選地可以具有任意邊界,所以這些邊界的位置典型地必須發(fā)送到解碼器。因此,如果在步驟82之后,碼書分段的數(shù)量過于巨大,優(yōu)選地排除一些小的碼書分段,直到滿足指定的準(zhǔn)則85為止。在優(yōu)選實(shí)施例中,排除方法是把小碼書分段(例如最短的碼書分段)與具有最小碼書指數(shù)(對應(yīng)于最小碼書)的碼書分段相合并,以合并到所考慮的碼書分段的左邊和右邊。圖24提供了將步驟83應(yīng)用到圖23所示的碼書分割的結(jié)果的實(shí)例。在此情況下,把分段102與(使用相同碼書的)分段101和103合并在一起,以提供分段121,把分段104和106與分段105合并在一起,以提供分段122,把分段110和111與分段109合并在一起,以提供分段125,并且把分段113與分段112合并在一起,以提供分段126。如果碼書指數(shù)等于0(例如分段108),則沒有量化指數(shù)需要發(fā)送,所以優(yōu)選地不拒絕這種分離的碼書分段,因此在本實(shí)例中不拒絕碼書分段108。如圖22所示,優(yōu)選地重復(fù)地應(yīng)用步驟83,直到滿足了結(jié)束準(zhǔn)則85。取決于特定的實(shí)施例,結(jié)束準(zhǔn)則包括,例如,分段的總數(shù)量不超過指定的最大數(shù),每個(gè)分段具有最小長度和/或所參考的碼書總數(shù)不超過指定的最大數(shù)。在此交互過程中,可以基于各種不同的準(zhǔn)則來選擇排除下一個(gè)分段,這些準(zhǔn)則例如最短的現(xiàn)有分段,其碼書指數(shù)可以被增加最小量的分段,比特?cái)?shù)量的最小投影增加,或者將獲得的總體凈效益(例如,取決于分段長度以及其碼書指數(shù)所需要的增加)。當(dāng)把如圖25所示的常規(guī)分割與如圖26所示的根據(jù)本發(fā)明的分割進(jìn)行比較的時(shí)候,就可以了解本技術(shù)的優(yōu)勢。在圖25中,把量化指數(shù)分割成四個(gè)量化分段151—154,具有對應(yīng)的右邊界161—163。根據(jù)常規(guī)方法,量化分段151—154直接對應(yīng)于量化單元。在該例中,最大量化指數(shù)171屬于量化單元154。因此,對于量化單元154,必須選擇大的碼書(例如碼書c)。這不是一個(gè)明智的選擇,因?yàn)榱炕瘑卧?54的大部分量化指數(shù)很小。相反,當(dāng)應(yīng)用本發(fā)明的技術(shù)時(shí),用上述技術(shù),把相同的量化指數(shù)分割成碼書181—184。結(jié)果,用碼書分段183(已經(jīng)基于其中的其它量化指數(shù)的量值,把碼書c分配給了碼書分段183)中的量化指數(shù)來對最大量化指數(shù)171進(jìn)行分組。雖然此量化指數(shù)171仍然需要相同大小的碼書(例如碼書C),但是它與其它大的量化指數(shù)共享此碼書。即,此大碼書與碼書分段183中的量化指數(shù)的統(tǒng)計(jì)特性匹配。此外,因?yàn)樵诖a書分段184中所有的量化指數(shù)都很小,那么對其選擇小的碼書(例如碼書a),即,該碼書與其中的量化指數(shù)的統(tǒng)計(jì)特性匹配。很容易理解,該碼書選擇技術(shù)通??梢詼p少用于發(fā)送量化指數(shù)的比特?cái)?shù)量。如上所示,然而,使用此技術(shù)具有一些"額外花消"。常規(guī)的技術(shù)通常僅需要把碼書指數(shù)的邊信息發(fā)送到解碼器,因?yàn)樗麄兊膽?yīng)用范圍與量化單元相同。然而,本技術(shù)通常不僅需要發(fā)送碼書指數(shù)的邊信息,而且需要把應(yīng)用范圍發(fā)送到解碼器,因?yàn)樵搼?yīng)用范圍和量化單元典型地是不相關(guān)的。為了解決這個(gè)問題,在某些實(shí)施例中,如果不能補(bǔ)償此"額外花消",則本發(fā)明的技術(shù)默認(rèn)使用常規(guī)方法(即,簡單地把量化單元用作量化分段),無論如何希望這種情況極少發(fā)生。如上所示,解決此向題的一種方法是在允許的統(tǒng)計(jì)特性的條件下,分成盡可能大的碼書分段。一旦碼書選擇器36完成了此處理,把分段數(shù)量、每個(gè)分段的長度(每個(gè)碼書的應(yīng)用范圍)、以及每個(gè)分段的所選碼書指數(shù)提供給復(fù)用器45,以包含在比特流中。量化指數(shù)編碼器28使用碼書選擇器36所選擇的分段和對應(yīng)碼書對量化指數(shù)執(zhí)行壓縮編碼。在碼書HuffDecl8_256xl中和碼書HuffDec27一256xl(對應(yīng)于碼書指數(shù)9)中的最大量化指數(shù),即255,表示逸出(ESCAPE)。因?yàn)榱炕笖?shù)可能可以超過兩個(gè)碼書的最大范圍,所以使用遞歸編碼來對更大的指數(shù)進(jìn)行編碼,其中q表示為-其中m是q的商,并且r是q的余數(shù)。用對應(yīng)于碼書指數(shù)9的霍夫曼碼書對余數(shù)r進(jìn)行編碼,而直接將商q打包在比特流中。優(yōu)選地用霍夫曼碼書對用于打包商q的比特?cái)?shù)進(jìn)行編碼。因?yàn)榇a書HuffDec18—256x1和碼書HuffDec27—256x1不是中平(midtread)的,當(dāng)發(fā)送絕對值時(shí),發(fā)送用于表示符號的額外比特。由于對應(yīng)于碼書指數(shù)1到8的碼書是中平的,^f以在霍夫曼解碼后加上偏移量來重構(gòu)量化指數(shù)符號。復(fù)用器45把所有霍夫曼碼,以及上述的所有額外信息、用戶定義的任何輔助信息一起打包成單個(gè)比特流60。此外,對于當(dāng)前音頻數(shù)據(jù)幀,優(yōu)選地插入錯(cuò)誤代碼。更優(yōu)選地,編碼器10打包完所有的音頻數(shù)據(jù)之后,把最后一個(gè)字(32比特)中的所有空閑比特設(shè)為1。在解碼器端,如果不是所有的空閑碼字都等于1,那么在當(dāng)前幀中斷言錯(cuò)誤,并且啟動錯(cuò)誤處理過程。在本發(fā)明的優(yōu)選實(shí)施例中,因?yàn)檩o助數(shù)據(jù)處在錯(cuò)誤檢測碼之后,所以在完成了代碼錯(cuò)誤檢測之后,解碼器可以停止并且等待下一個(gè)音頻幀。換句話說,輔助數(shù)據(jù)對解碼沒有影響,并且不需要通過解碼器來處理。結(jié)果,完全可以由用戶來確定對輔助數(shù)據(jù)的定義和理解,從而給用戶很大的靈活性。每個(gè)幀的輸出結(jié)構(gòu)優(yōu)選地如下<table>tableseeoriginaldocumentpage37</column></row><table>每個(gè)普通聲道的數(shù)據(jù)結(jié)構(gòu)優(yōu)選地如下:<table>tableseeoriginaldocumentpage37</column></row><table><table>tableseeoriginaldocumentpage38</column></row><table>解碼系統(tǒng)本發(fā)明的解碼系統(tǒng)涉及用于,例如在從存儲設(shè)備獲得了或者通過通信聲道接收了音頻信號后,對音頻信號進(jìn)行解碼的系統(tǒng)、方法和技術(shù)??梢允褂帽景l(fā)明的應(yīng)用包括,但不限于數(shù)字音頻廣播、數(shù)字電視(衛(wèi)星、地面和/或有線廣播)、家庭影院、數(shù)字影院、鐳射視頻碟片播放器、英特網(wǎng)上的內(nèi)容流以及個(gè)人音頻播放器。例如,結(jié)合前面<編碼系統(tǒng)〉部分公開的方法和技術(shù),來使用本發(fā)明的音頻解碼系統(tǒng)、方法和技術(shù)。圖27示出了可以使用根據(jù)本發(fā)明的解碼器100的某些示例性的通用環(huán)境。一般而言,根據(jù)本發(fā)明的解碼器IOO接收基于幀的比特流20作為輸入,并且,對于每個(gè)幀,該比特流20包括該幀中的實(shí)際音頻數(shù)據(jù)(典型地,熵編碼量化指數(shù))以及各種處理信息(例如,包括控制、格式化和/或輔助信息)。通常經(jīng)由硬線連接或者經(jīng)由可斷開的連接器,把比特流20輸入到解碼器100。如上所示,比特流20可以源于各種不同源中的任意一個(gè)。該源包括例如,通過天線32接收的數(shù)字射頻(或其它電磁)傳輸,并將其在解調(diào)器34中轉(zhuǎn)換成比特流20;存儲設(shè)備36(例如半導(dǎo)體、磁或光存儲設(shè)備),通過讀卡器38從存儲設(shè)備36獲得比特流20;電纜連接42,解調(diào)器44從電纜連接42得到比特流20;直接提供比特流的電纜連接48。例如,可以用前面<編碼系統(tǒng)>部分中所述的任何技術(shù)來生成了比特流20。如所示,在本發(fā)明的特定實(shí)施例中,比特流20本身可能得自其它信號,例如,復(fù)用比特流,如那些根據(jù)MPEG2系統(tǒng)協(xié)議復(fù)用的比特流,其中音頻比特流與各種格式的視頻比特流、其它格式的音頻比特流、以及元數(shù)據(jù)復(fù)用在一起;或者用表示音頻數(shù)據(jù)比特的冗余編碼的、交織的和/或收縮的符號來調(diào)制(使用任意己知的技術(shù))的接收射頻信號。如前面<編碼系統(tǒng)>部分中所詳述,在本發(fā)明的優(yōu)選實(shí)施例中,已經(jīng)把比特流20中的音頻數(shù)據(jù)變換成了子帶采樣(優(yōu)選使用統(tǒng)一的基于正弦的變換技術(shù)),進(jìn)行了量化并且隨后進(jìn)行了熵編碼。在優(yōu)選實(shí)施例中,使用改進(jìn)型離散余弦變換(MDCT)對音頻信號進(jìn)行了變換,并且對其進(jìn)行了量化,然后使用恰當(dāng)?shù)幕舴蚵幋a對其進(jìn)行了熵編碼。然而在可替換的實(shí)施例中,可以改為使用其它的變換和/霍熵編碼技術(shù),并且以下討論中所涉及的MDCT或霍夫曼應(yīng)理解為僅是示例性的。此處把音頻數(shù)據(jù)稱為脈沖編碼調(diào)制(PCM)采樣或音頻釆樣,因?yàn)樽儞Q優(yōu)選是統(tǒng)一的,所以采樣數(shù)量在時(shí)域中和在變換域中是相同的。同樣,盡管此處所述的音頻數(shù)據(jù)以及許多控制、格式和輔助信息都已被執(zhí)行霍夫曼編碼,但是應(yīng)該明白的是,這些編碼通常是選擇性的,并且優(yōu)選實(shí)施例中僅為了使用該編碼來減少數(shù)據(jù)大小。對于使用了霍夫曼編碼的情況,解碼器io優(yōu)選存儲與編碼器所使用的碼書相同的碼書。例如,優(yōu)選地,霍夫曼碼書中"碼"是十進(jìn)制格式的霍夫曼碼,"比特增量"是與前一行上的碼相比,當(dāng)前碼所需的額外比特(十進(jìn)制格式)數(shù)量,并且"指數(shù)"是十進(jìn)制格式的未編碼值。在優(yōu)選實(shí)施例中,輸入音頻數(shù)據(jù)是基于幀的,其中每個(gè)幀定義了特定的時(shí)間間隔,并且包括在該時(shí)間間隔中多個(gè)音頻聲道的采樣。優(yōu)選地,每個(gè)這種幀具有從相對小的幀大小集合中選擇的固定采樣數(shù)量,其中任意特定時(shí)間間隔的所選幀大小取決于,例如,采樣速率和幀間所能容忍的延遲量。更優(yōu)選地,每個(gè)幀包括128、256、512或1024個(gè)采樣,其中優(yōu)選更長的幀,除非降低延遲非常重要。在以下討論的大多實(shí)例中,假設(shè)每個(gè)幀由1024個(gè)采樣構(gòu)成。然而,不能將這種實(shí)例當(dāng)作是限制性的。為了處理(首先是MDCT或其它變換處理),把幀分割成多個(gè)更小的、優(yōu)選是大小相等的塊(有時(shí)稱為"初級塊",以便將其與典型地更長的MDCT或其它變換塊進(jìn)行區(qū)別)。圖28A和28B中示出了此分割。在圖28A中,通過單個(gè)初級塊51(例如包括1024個(gè)音頻數(shù)據(jù)采樣)來覆蓋整個(gè)幀50。在圖28B中,用八個(gè)連續(xù)的初級塊52—59(例如每個(gè)塊包括128個(gè)音頻數(shù)據(jù)采樣)來覆蓋幀50??梢园衙總€(gè)采樣幀歸類為瞬變幀(即包括信號瞬變的幀)或準(zhǔn)靜態(tài)幀(即不包括瞬變的幀)。就這點(diǎn)而言,優(yōu)選把信號瞬變定義為信號能量的突然迅速的上升(沖擊)或下降。瞬變信號僅稀疏地發(fā)生,并且為了本發(fā)明的目的,假設(shè)在每個(gè)幀中最多發(fā)生兩個(gè)瞬變信號。此處所用的術(shù)語"瞬變分段"指其信號具有相同或相似統(tǒng)計(jì)特性的整個(gè)幀或幀的一個(gè)分段。因此,準(zhǔn)靜態(tài)幀通常由單個(gè)瞬變分段構(gòu)成,而瞬變幀通常由兩個(gè)或三個(gè)瞬變分段構(gòu)成。例如,如果在幀中僅發(fā)生了沖擊或下降,那么瞬變幀通常會具有兩個(gè)瞬變分段一個(gè)覆蓋了該幀在沖擊或下降之前的部分,另一個(gè)覆蓋了該幀在沖擊或下降之后的部分。如果在瞬變幀中沖擊和下降都發(fā)生了,那么通常將會存在三個(gè)瞬變分段,每個(gè)分段各自覆蓋由沖擊和下降所分割的幀的部分。圖29A—C示出了這些可能性,其中每個(gè)圖示出了被分割成八個(gè)大小相等的初級塊61—68的單個(gè)采樣幀60。在圖29A中,瞬變信號70在第二個(gè)塊62中發(fā)生,因此具有兩個(gè)瞬變分段,一個(gè)由塊61單獨(dú)構(gòu)成,并且另一個(gè)由塊62—68構(gòu)成。在圖29B中,瞬變信號71在塊64中發(fā)生,并且另一個(gè)瞬變信號72在塊66中發(fā)生,因此具有三個(gè)瞬變分段,一個(gè)由塊61—63構(gòu)成,一個(gè)由塊64—65構(gòu)成并且最后一個(gè)由塊66—68構(gòu)成。在圖29C中,瞬變信號73發(fā)生在塊68中,因此具有兩個(gè)瞬變分段,一個(gè)由塊61—67構(gòu)成,另一個(gè)由塊68單獨(dú)構(gòu)成。圖30是根據(jù)本發(fā)明的典型實(shí)施例的音頻信號解碼系統(tǒng)100的框圖,其中,實(shí)心箭頭指示音頻數(shù)據(jù)流,虛線箭頭指示控制、格式和/或輔助信息流,并且虛線框指示出在本實(shí)施例中只有當(dāng)比特流20中的對應(yīng)控制數(shù)據(jù)指明時(shí)才例示的組件,以下將詳細(xì)描述。如下所述,在典型的子實(shí)施例中,圖30中所示的各個(gè)部分、模塊或組件可以完全用計(jì)算機(jī)可執(zhí)行代碼來實(shí)現(xiàn)。然而,在可替換的實(shí)施例中,可以用此處所述的任何其它方法來實(shí)現(xiàn)任意或全部這些部分或組件。最初將比特流20輸入到解復(fù)用器115,其把比特流20分割成數(shù)據(jù)幀,并且對每個(gè)幀中的數(shù)據(jù)進(jìn)行拆包,以便分離處理信息和音頻信號信息。就第一個(gè)任務(wù)而言,優(yōu)選將比特流20中的數(shù)據(jù)解釋為幀序列,其中每個(gè)新幀以相同的"同步字"(優(yōu)選是0x7FFF)開始。根據(jù)本發(fā)明的典型實(shí)施例,用于執(zhí)行這些功能的計(jì)算機(jī)程序列表包括例如此處所述的5//—5^eaw(9、Frawe(9、Fra附e/7^&^和C/w;^dt附"&^e"ce(9模塊,以及這些列出的模塊所調(diào)用或參考的其它模塊或?qū)λ鼈兊拿枋?。每個(gè)數(shù)據(jù)幀的結(jié)構(gòu)優(yōu)選如下<table>tableseeoriginaldocumentpage42</column></row><table>因此,例如,如果nFrmHeaderType指示通用幀頭,那么把nFrmHeaderType之后前10個(gè)比特解釋為nNumWord(下面定義),把接下來的3個(gè)比特解釋為nNumNormalCh(下面定義),等等。然而,如果nFrmHeaderType指示擴(kuò)展幀頭,那么把nFrmHeaderType之后前13個(gè)比特解釋為nNumWord,把接下來的6個(gè)比特解釋為nNumNormalCh,等等。以下討論將解釋在本發(fā)明的本實(shí)施例中所用的各種頭字段。字段指示在當(dāng)前幀(32比特碼字)中從同步碼字(其第一個(gè)比特)的開始到該當(dāng)前幀的錯(cuò)誤檢測字的結(jié)束的音頻數(shù)據(jù)長度。字段""M^75/odhs尸wFrw"指示對應(yīng)于當(dāng)前音頻數(shù)據(jù)幀的短窗改進(jìn)型離散余弦變換(MDCT)塊的數(shù)量。在本發(fā)明的優(yōu)選實(shí)施例中,一個(gè)短窗MDCT塊包括128個(gè)初級音頻數(shù)據(jù)采樣(優(yōu)選是熵編碼的量化的子帶采樣),因此對應(yīng)于音頻數(shù)據(jù)幀的初級音頻數(shù)據(jù)采樣數(shù)量是128XnNumBlocksPerFrm。注意到,為了避免邊界效應(yīng),MDCT塊優(yōu)選大于初級塊,并且更優(yōu)選是初級塊大小的兩倍。因此,如果短初級塊由128個(gè)音頻數(shù)據(jù)采樣構(gòu)成,那么短MDCT塊優(yōu)選由256個(gè)采樣構(gòu)成,并且如果長初級塊由1024個(gè)音頻數(shù)據(jù)采樣構(gòu)成,那么長MDCT塊優(yōu)選由2048個(gè)采樣構(gòu)成。更優(yōu)選地,每個(gè)初級塊由新的(后來的)音頻數(shù)據(jù)采樣構(gòu)成o字段"^^mp/ei^fe/mfec"指示用于音頻信號的采樣頻率的指數(shù)。以下表格中示出了指數(shù)集合和對應(yīng)的采樣頻率的實(shí)例<table>tableseeoriginaldocumentpage44</column></row><table>字段"《7VwmMw^/C72"指示標(biāo)準(zhǔn)聲道的數(shù)量。通過幀頭類型來確定表示此字段的比特?cái)?shù)量。在本實(shí)施例中,如果nFrmHeaderType指示了通用幀頭,那么使用3個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在1到8之間變化。另一方面,如果nFrmHeaderType指示了擴(kuò)展幀頭,那么使用6個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在1到64之間變化。字段""A^附Z/eO"指示LFE聲道的數(shù)量。在本實(shí)施例中,如果nFrmHeaderType指示了通用幀頭,那么使用1個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在0到1之間變化。另一方面,如果nFrmHeaderType指示了擴(kuò)展幀頭,那么使用2個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在O到3之間變化。字段"M肌02Q^"指示在當(dāng)前幀的末端是否存在任何輔助信息,例如,保護(hù)額外的信道配置信息。優(yōu)選地,用bAuxChCfg二O表示否,用bAuxChCfg二l表示是。字段m^s^mA;r'指示是否已對當(dāng)前幀應(yīng)用了和/差編碼。優(yōu)選僅在通用幀頭中顯示此字段,并且不在擴(kuò)展幀頭中顯示此字段。優(yōu)選地,用bUseSumDiff^O表示否,bUseSumDiff二l表示是。字段"6t/^//C"指示是否已對當(dāng)前幀應(yīng)用了聯(lián)合強(qiáng)度編碼。同樣優(yōu)選僅在通用幀頭中顯示此字段,并且不在擴(kuò)展幀頭中顯示此字段。優(yōu)選地,用bUseJIC-O表示否,bUseJIC=l表示是。如果已對當(dāng)前幀應(yīng)用了聯(lián)合強(qiáng)度編碼,字段"^J/cCV,指示聯(lián)合強(qiáng)度編碼的開始臨界頻帶。同樣優(yōu)選僅在通用幀頭中顯示此字段,并且不在擴(kuò)展幀頭中顯示此字段。如上所述,頭中的所有數(shù)據(jù)都是處理信息。以下將顯而易見,一些聲道專用數(shù)據(jù)也是處理數(shù)據(jù),盡管絕大部分這種數(shù)據(jù)是音頻數(shù)據(jù)采樣。聲道數(shù)據(jù)結(jié)構(gòu)在優(yōu)選實(shí)施例中,每個(gè)標(biāo)準(zhǔn)聲道的通用數(shù)據(jù)結(jié)構(gòu)如下:窗序列窗函數(shù)指數(shù)指示MDCT窗函數(shù)瞬變分段數(shù)量指示瞬變分段的數(shù)量-僅用于瞬變幀瞬變分段長度指示瞬變分段的長度-僅用于瞬變幀霍夫曼碼書指數(shù)和應(yīng)用碼書數(shù)量每個(gè)瞬變分段所使用的霍夫曼碼書的數(shù)量應(yīng)用范圍每個(gè)霍夫曼碼書的應(yīng)用范圍范圍碼書指數(shù)每個(gè)霍夫曼碼書的碼書指數(shù)子帶采樣量化指數(shù)所有子帶采樣的量化指數(shù)量化步長指數(shù)每個(gè)量化單元的量化步長指數(shù)和/差編碼決定指示出解碼器是否應(yīng)該對量化單元的采樣執(zhí)行和/差解碼聯(lián)合強(qiáng)度編碼比例因子指數(shù)用于重構(gòu)來自源聲道的聯(lián)合量化單元的子帶采樣的比例因子的指數(shù)然而,在特定實(shí)施例中,并不是所用標(biāo)準(zhǔn)聲道都包含窗序列信息。如果沒有把窗序列信息提供給一個(gè)或多個(gè)聲道,優(yōu)選從提供給聲道o(ChO)的窗序列信息中拷貝此數(shù)據(jù)組,盡管在其它實(shí)施例中可以從任何其它指定聲道中拷貝該信息。在優(yōu)選實(shí)施例中,每個(gè)LFC聲道的通用數(shù)據(jù)格式如下-霍夫曼碼書指數(shù)和應(yīng)用范圍碼書數(shù)量指示碼書的數(shù)量應(yīng)用范圍每個(gè)霍夫曼碼書的應(yīng)用范圍碼書指數(shù)每個(gè)霍夫曼碼書的碼書指數(shù)子帶采樣量化指數(shù)所有子帶采樣的量化指數(shù)量化步長指數(shù)每個(gè)量化單元的量化步長指數(shù)如上所示,窗序列信息':僅提供給標(biāo)準(zhǔn)聲道)優(yōu)選包括MDCT窗函數(shù)指數(shù)。在本實(shí)施例中,把該指數(shù)指定為""附wr^eCwreW",并且具有以下的值和意義<table>tableseeoriginaldocumentpage46</column></row><table>當(dāng)nWinTypeCurrent=0、1、2、3、4、5、6、7或8時(shí),指示長MDCT窗函數(shù),并且把此單個(gè)長窗函數(shù)用于整個(gè)幀。nWinTypeCurrent的其它值(nWinTypeCurrent=9、10、11或12)指示短MDCT窗函數(shù)。對于后面的情況,當(dāng)前幀由nNumBlockPerFrm(例如多達(dá)8個(gè))個(gè)短MDCT組成,并且nWinTypeCurrent僅指示這些nNumBlockPerFrm個(gè)短MDCT的第一個(gè)和最后一個(gè)窗函數(shù)。結(jié)合Dl申請中所詳述的完全重構(gòu)要求,優(yōu)選通過瞬變出現(xiàn)的位置,來確定在該幀中的其它短窗函數(shù)。在任意情況下,接收數(shù)據(jù)優(yōu)選包括足以完全確定編碼器端所使用的整個(gè)窗序列的窗信息。就這點(diǎn)而言,在本實(shí)施例中,字段"nNumCluster"指示當(dāng)前幀中瞬變分段的數(shù)量。當(dāng)窗函數(shù)指數(shù)nWinTypeCurrent指示出在當(dāng)前幀(nWinTypeCurrent二O、1、2、3、4、5、6、7或8)中應(yīng)用了長窗函數(shù)時(shí),那么當(dāng)前幀是準(zhǔn)靜態(tài)的,因此瞬變分段的數(shù)量隱含為1,并且nNumCluster不需要出現(xiàn)在比特流中(因此優(yōu)選不對其進(jìn)行傳輸)。另一方面,在優(yōu)選實(shí)施例中,當(dāng)指示了短窗函數(shù)時(shí),把2個(gè)比特分配給nNumCluster,并且其值在0—2之間變化,分別對應(yīng)于1一3個(gè)瞬變分段。注意到,即使在準(zhǔn)靜態(tài)幀(例如單個(gè)瞬變分段)中也可以使用短窗函數(shù)。例如,當(dāng)編碼器想要實(shí)現(xiàn)低的編碼延遲時(shí),可以發(fā)生這種情況。在此低延遲模式中,一幀中的音頻數(shù)據(jù)釆樣數(shù)量可以小于1024(g卩,長初級塊的長度)。例如,編碼器可能已選擇為在一幀中只包括256個(gè)PCM采樣,在此情況下,用幀中的兩個(gè)短塊(每個(gè)包括128個(gè)PCM采樣,由256采樣MDCT塊所覆蓋)來覆蓋那些采樣,意味著該解碼器也應(yīng)用了兩個(gè)短窗。此模式的優(yōu)勢是在本實(shí)例中把正比于緩沖器大小(如果其它條件相同)的編碼延遲降低了例如4倍(1024/256=4)。如果當(dāng)前幀是瞬變幀(即包括至少一部分瞬變信號,從而nNumCluster指示多于一個(gè)瞬變分段),那么在接收數(shù)據(jù)中優(yōu)選包括字段"a"A^wi5/ocfo尸e^Vw尸erC7wj^7""C7wW^7",并且通過每個(gè)瞬變分段nCluster占用的短MDCT塊的數(shù)量來指示該瞬變分段nCluster的長度。優(yōu)選地,對每個(gè)這種字進(jìn)行了霍夫曼編碼,并且因此,可以對每個(gè)瞬變分段長度解碼,以重構(gòu)瞬變分段的位置。另一方面,如果當(dāng)前幀是準(zhǔn)靜態(tài)幀(不管是具有單個(gè)長窗函數(shù)還是固定數(shù)量的短窗函數(shù)),優(yōu)選不把a(bǔ)nNumBlocksPerFrmPerCluster[nCluster]顯示在比特流中(即,不發(fā)送該信息),因?yàn)樵撍沧兎侄伍L度是隱含的,即,幀中的單個(gè)長塊具有長窗函數(shù)(例如2048個(gè)MDCT采樣),或者幀中的所有塊具有多個(gè)(例如多達(dá)8個(gè))短窗函數(shù)(例如每個(gè)包括256個(gè)MDCT采樣)。如上所示,當(dāng)通過單個(gè)長塊來覆蓋幀時(shí),通過nWinTypeCurrent來指定該單個(gè)塊。然而,當(dāng)通過多個(gè)短塊來覆蓋幀時(shí),此情形通常是更加復(fù)雜一點(diǎn)。額外復(fù)雜度的原因是,由于完全重構(gòu)要求,當(dāng)前塊的窗函數(shù)取決于緊鄰的之前和之后塊中所使用的窗函數(shù)。因此在本發(fā)明的當(dāng)前實(shí)施例中,為了當(dāng)指示了短塊時(shí)確定合適的窗序列,而執(zhí)行額外的處理。以下結(jié)合模塊134的討論來詳細(xì)描述此額外處理。復(fù)用器115還提取霍夫曼碼書指數(shù)和應(yīng)用范圍信息。以下描述該信息和對其的處理。一旦如上所述對幀數(shù)據(jù)進(jìn)行了拆包,就獲得變換系數(shù),并以適當(dāng)順序?qū)ζ溥M(jìn)行排列,并且隨后執(zhí)行逆變換處理,以生成原始時(shí)域數(shù)據(jù)。以下參考圖30,更加詳細(xì)地描述了這些通用步驟。系數(shù)獲取參考圖30,在模塊118中,基于解復(fù)用器15中提取的對應(yīng)信息,選擇恰當(dāng)?shù)拇a書和應(yīng)用范圍。更具體地,以上參考的霍夫曼碼書指數(shù)和應(yīng)用范圍信息優(yōu)選包括以下字段。字段"a"HS7VwmBm^/""C7z^妙7"指示在瞬變分段nCluster中的碼書數(shù)量。字段"w"http://5JSfl"d^c^e/""az^er_//""5fl"^/*4"指示在瞬變分段nCluster中碼書分段nBand(即,霍夫曼碼書的應(yīng)用范圍)的長度(就量化指數(shù)而言);每一個(gè)這種值本身優(yōu)選是被霍夫曼編碼的,其中模塊18使用HuffDec2一64xl,對準(zhǔn)靜態(tài)幀的值進(jìn)行解碼,并且使用HuffDec332x1對瞬變幀的值進(jìn)行解碼。字段<table>tableseeoriginaldocumentpage49</column></row><table>其中,維數(shù)指示由單個(gè)霍夫曼碼來編碼的量化指數(shù)的數(shù)量。注意到,在本實(shí)施例中,指定了每個(gè)碼書應(yīng)用范圍(即每個(gè)碼書分段)的長度。每個(gè)碼書分段可以跨越邊界幾個(gè)或多個(gè)量化單元。同樣,有可能通過其它方式來指定碼書分段,例如,通過指定每個(gè)碼書應(yīng)用范圍的開始點(diǎn)。然而,如果指定了該長度(而不是開始點(diǎn)),通常有可能用更少的比特總數(shù)來編碼。在任意情況下,接收信息優(yōu)選唯一地識別每個(gè)碼書要應(yīng)用于的應(yīng)用范圍,并且解碼器ioo使用此信息來對實(shí)際量化指數(shù)進(jìn)行解碼。此方法與常規(guī)方法有重大的不同,在常規(guī)方法中把碼書分配給每個(gè)量化單元,從而常規(guī)方法中沒有發(fā)送應(yīng)用范圍。然而,通常,通過靈活地指定應(yīng)用范圍所獲得的額外效率,更多地補(bǔ)償了上述額外開銷。在模塊120中,通過把模塊118中所識別的碼書應(yīng)用于對應(yīng)的量化指數(shù)應(yīng)用范圍,對由解復(fù)用器15所提取的量化指數(shù)進(jìn)行解碼。其結(jié)果是完全解碼的量化指數(shù)集合。在模塊122中,對量化單元數(shù)量進(jìn)行重構(gòu)。就這點(diǎn)而言,優(yōu)選通過由頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化指數(shù)矩形,來定義每個(gè)"量化單元"。在此矩形中的所有量化指數(shù)都屬于相同量化單元。優(yōu)選基于由解復(fù)用器115所提取的瞬變分段信息,按照上述方式,來識別瞬變分段。"臨界頻帶"是指人耳的頻率分辯率,即帶寬Z/,在該帶寬內(nèi),人耳不能分辨出不同的頻率。帶寬4/"優(yōu)選隨著頻率/的增加而增加,其中/和4/"之間近似指數(shù)關(guān)系。每個(gè)臨界頻帶可以表示為濾波器組的多個(gè)鄰近子帶采樣。對于每個(gè)MDCT塊大小和采樣速率,預(yù)先確定臨界頻帶的邊界,其中編碼器和解碼器使用相同的臨界頻帶。根據(jù)前述信息,重構(gòu)量化單元的數(shù)量,如下<formula>formulaseeoriginaldocumentpage50</formula>其中w/^iVwwi8am^/""C7u^r7是瞬變分段nCluster的碼書數(shù)量,m"7/5^a"必:d^/"wawWeV/""5fl"W是瞬變分段nCluster的碼書nBand的碼書應(yīng)用范圍的上邊界,戶C萬五啦e/""Ba^/是臨界頻帶nBand的上邊界,并且a"Ma""/""C/w"e/7是瞬變分段nCluster的量化單元的數(shù)量。在反量化模塊124中,從比特流20中解碼出適用于每個(gè)量化單元的量化步長的大小,并且使用此步長根據(jù)從解碼模塊120所接收的量化指數(shù)重構(gòu)子帶采樣。在優(yōu)選實(shí)施例中,"mw0Sfep/"afex/V2C/wstei7/""Baw/7"指示出量化單元(nCluster、nBand)的量化步長指數(shù),并且對于準(zhǔn)靜態(tài)幀,用霍夫曼碼書HuffDec6—116x1來對mM^S^//"cfex/""C7z^e^/""Ba"t(/進(jìn)行解碼,對應(yīng)瞬變幀,用霍夫曼碼書HuffDec7J16xl來對其進(jìn)行解碼。一旦識別出量化步長,優(yōu)選如下獲得每個(gè)子帶采樣值(假設(shè)在編碼器使用線形量化)f帶秉存二蘆化步長X量化指數(shù)。在本發(fā)明的可替換的實(shí)施例中,使用非線形的量化技術(shù)。優(yōu)選僅在通過bUseJIC值指定的情況下,才在模塊128中執(zhí)行聯(lián)合強(qiáng)度解碼。如果執(zhí)行,聯(lián)合強(qiáng)度解碼器128從源聲道中拷貝子帶采樣,然后將它們乘以比例因子,以重構(gòu)聯(lián)合聲道的子帶采樣,即,凝合聲遭菜存二比樹茵子X蕭聲遭菜摔。在一個(gè)典型實(shí)施例中,源聲道是前左聲道,并且每個(gè)其它標(biāo)準(zhǔn)聲道都被編碼成聯(lián)合聲道。優(yōu)選地,相同量化單元中的所有子帶采樣具有相同的比例因子。優(yōu)選僅在通過bUseSumDiff指定的情況下,才在模塊130中執(zhí)行和/差解碼。如果執(zhí)行,優(yōu)選如下執(zhí)行左/右聲道中子帶采樣的重構(gòu)左聲遣=浙聲遭+差聲邀以及右聲遣,聲遭一差聲道。如前面<編碼系統(tǒng)>部分所述,在編碼器的優(yōu)選實(shí)施例中,在稱為交織的過程中,對當(dāng)前聲道的當(dāng)前幀的子帶采樣進(jìn)行重新排列,以便把對應(yīng)于相同子帶的相同瞬變分段中的采樣集合在一起。因此,在解交織模塊132中,把子帶采樣重新排列回它們的自然順序。一種用于執(zhí)行這種重新排列的技術(shù)如下<formula>formulaseeoriginaldocumentpage52</formula>其中nNumCluster是瞬變分段的數(shù)量,anNumBlocksFRmPerCluster[nCluster]是瞬變分段nCluster的瞬變分段長度,nClusterBinO[nCluster]是瞬變分段nCluster的第一個(gè)子帶采樣位置,affiinINterleaved[q]是按照交織順序排列的子帶采樣的隊(duì)列,并且a氾inNatuml[p]是按照自然順序排列的子帶采樣的隊(duì)列。因此,根據(jù)由解交織模塊132所執(zhí)行的處理,每個(gè)聲道的每個(gè)幀的子帶采樣都以它們的自然順序來輸出。變換到基于時(shí)間的采樣在模塊134,識別(在編碼器端)對于當(dāng)前數(shù)據(jù)幀的變換塊所使用的窗函數(shù)序列。如上所示,在本實(shí)施例中,在編碼器端使用了MDCT變換。然而,在其它實(shí)施例中,可能使用了其它類型的變換(優(yōu)選是統(tǒng)一的并且基于正弦的),并且本發(fā)明的解碼器100可以完全適應(yīng)。在本發(fā)明中,如上所示,對于長變換塊幀,所接收的字段nWinTypeCurrent對用于整個(gè)幀的單個(gè)長窗函數(shù)進(jìn)行識別。因此,在此實(shí)施例中,對于長變換塊幀,在模塊134無須執(zhí)行額外處理。另一方面,對于短變換塊幀,當(dāng)前實(shí)施例中的字段nWinTypeCmrent僅指示了用于第一個(gè)和最后一個(gè)變換塊的窗函數(shù)。因此,優(yōu)選對短變換塊幀執(zhí)行以下處理。當(dāng)在該幀中使用短塊時(shí),所接收的nWinTypeCurrent的值優(yōu)選指示出當(dāng)前幀的第一個(gè)塊和下一幀的第一個(gè)塊是否包含瞬變信號。此信息,與瞬變分段的位置(從接收的瞬變分段長度來識別)和完全重構(gòu)要求一起,允許解碼器100確定把哪個(gè)窗函數(shù)用到該幀的每個(gè)塊中。由于在優(yōu)選實(shí)施例中,把WIN—SHORT—BRIEF2BRIEF窗函數(shù)用于具有瞬變的塊,可以使用以下命名法來傳遞此信息。WIN—SHORT—Cw/re"^Swfo,其中,Cwre"f(SHORT二否,BRIEF=是)對當(dāng)前幀的第一個(gè)塊中是否存在瞬變進(jìn)行識別,并且(SHORT二否,BRIEF二是)對當(dāng)下一幀的第一個(gè)塊中是否存在瞬變進(jìn)行識別。例如WIN—SHORT_BRIEF2BRIEF指示出當(dāng)前幀的第一個(gè)塊中以及下一幀的第一個(gè)塊中存在瞬變,并且WIN_SHORT—BRIEF2SHORT指示出當(dāng)前幀的第一個(gè)塊中存在瞬變并且下一幀的第一個(gè)塊中不存在瞬變。因此,CwreW有助于確定在該幀的第一個(gè)塊中的窗函數(shù)(通過指示出該幀的第一個(gè)塊是否包括瞬變信號),并且有助于對該幀的最后一個(gè)塊的窗函數(shù)進(jìn)行識別(通過指示出下一幀的第一個(gè)塊是否包括瞬變信號)。尤其,如果Current是SHORT,第一個(gè)塊的窗函數(shù)應(yīng)該是WIN—SHORT一Last2SHORT,其中經(jīng)由完全重構(gòu)特性通過上一幀的最后一個(gè)窗函數(shù)來確定"Last"。另一方面,如果Current是BRIEF,第一個(gè)塊的窗函數(shù)應(yīng)該是WIN一SHORILLast2BRIEF,其中同樣經(jīng)由完全重構(gòu)特性通過上一幀的最后一個(gè)窗函數(shù)來確定Last。對于該幀的最后一個(gè)塊,如果其包含瞬變,其窗函數(shù)應(yīng)該是WIN—SHORT_BRIEF2BRIEF。當(dāng)此塊中沒有瞬變時(shí),如果Subs是SHORT,該幀的最后一個(gè)塊的窗函數(shù)應(yīng)該是WIN—SHORTJLast2SHORT,其中經(jīng)由完全重構(gòu)特性通過該幀的倒數(shù)第二個(gè)幀的窗函數(shù)來確定Last。另一方面,如果Subs是BRIEF,該幀的最后一個(gè)塊的窗函數(shù)應(yīng)該是WIN—SHORT—Last2BRIEF,其中同樣經(jīng)由完全重構(gòu)特性通過該幀的倒數(shù)第二個(gè)塊的窗函數(shù)來確定Last。最后,可以經(jīng)由完全重構(gòu)特性,通過(多個(gè))瞬變位置來確定該幀中其余塊的窗函數(shù),其中通過瞬變分段的開始指示該瞬變位置。Dl申請給出了這種做法的詳細(xì)過程。在模塊136中,對于當(dāng)前幀的每個(gè)變換塊,使用由模塊134針對該塊所識別的窗函數(shù),對子帶采樣進(jìn)行逆變換,以恢復(fù)原始數(shù)據(jù)值(受到了在編碼過程中所引入的任何量化噪聲和其它數(shù)值不精確性的影響)。模塊136的輸出是對輸入到編碼器的PCM采樣的重構(gòu)序列。系統(tǒng)環(huán)境一般來說,除了特別說明,此處所述的所有系統(tǒng)、方法和技術(shù)都可以用一個(gè)或者多個(gè)可編程通用計(jì)算設(shè)備來實(shí)現(xiàn)。這種設(shè)備典型地包括,例如,經(jīng)由諸如公共總線彼此互連的以下組件中的至少一些組件一個(gè)或多個(gè)中央處理單元(CPU);只讀存儲器(ROM);隨機(jī)存儲器(RAM);用于與其它設(shè)備進(jìn)行接口的輸入/輸出軟件和電路(例如,用硬線連接,例如串口,并口,USB連接或火線連接,或者使用諸如藍(lán)牙或802.11協(xié)議的無線連接);用來連接到一個(gè)或多個(gè)網(wǎng)絡(luò)的軟件和電路(例如,用諸如以太網(wǎng)卡或無線協(xié)議,例如碼分多址(CDMA)、全球移動通信系統(tǒng)(GSM)、藍(lán)牙、802.11協(xié)議或其它基于小區(qū)的或不基于小區(qū)的系統(tǒng)的硬線連接),其中在本發(fā)明的多個(gè)實(shí)施例中,該一個(gè)或多個(gè)網(wǎng)絡(luò)連接到因特網(wǎng)或其它網(wǎng)絡(luò);顯示器(例如陰極射線顯示器、液晶顯示器、有機(jī)發(fā)光顯示器、聚合發(fā)光顯示器或者任何其它薄膜顯示器);其它輸出設(shè)備(例如一個(gè)或多個(gè)揚(yáng)聲器、耳機(jī)設(shè)備和打印機(jī));一個(gè)或多個(gè)輸入設(shè)備(例如鼠標(biāo)、觸摸板、寫字板、觸摸感應(yīng)顯示器或其它定點(diǎn)設(shè)備、鍵盤、小鍵盤、麥克風(fēng)和掃描儀);大容量存儲單元(例如硬盤驅(qū)動器);實(shí)時(shí)時(shí)鐘;可擦除存儲讀/寫設(shè)備(例如用于從RAM,磁盤、磁帶、光磁盤、光盤等等讀出或向它們寫入);調(diào)制解調(diào)器(例如用于發(fā)送傳真或用于經(jīng)由撥號連接來連接到因特網(wǎng)或其它計(jì)算機(jī)網(wǎng)絡(luò))。在操作中,用于執(zhí)行上述方法和功能的處理步驟,通過通用計(jì)算機(jī)來執(zhí)行時(shí),典型地將最初存儲在大容量存儲器(例如硬盤)中,并下載到RAM中,然后通過RAM之外的CPU來執(zhí)行。然而,在一些情況下,最初將處理步驟存儲在RAM或ROM中??梢詮母鞣N提供商獲得用于實(shí)現(xiàn)本發(fā)明的合適設(shè)備。在各個(gè)實(shí)施例中,根據(jù)任務(wù)的大小和復(fù)雜性來使用不同類型的設(shè)備。合適的設(shè)備包括大型計(jì)算機(jī)、多處理器計(jì)算機(jī)、工作站、個(gè)人計(jì)算機(jī)、甚至諸如PDA、無線電話或任何其它工具或設(shè)備的更小的計(jì)算機(jī),無論獨(dú)立的、硬連接到網(wǎng)絡(luò)或無線連接到網(wǎng)絡(luò)。此外,盡管以上描述了通用可編程設(shè)備,在可替換的實(shí)施例中,可以替代(或額外)使用一個(gè)或多個(gè)專用處理器或計(jì)算機(jī)??偟膩碚f,應(yīng)該注意到的是,除非明確說明,上述的任何功能都可以用軟件、硬件、固件或它們的任意合并來實(shí)現(xiàn),其中基于已知的工程折衷來選擇特定的實(shí)現(xiàn)。更具體地,本領(lǐng)域的技術(shù)人員很容易理解,當(dāng)用固定的、預(yù)定的或邏輯方式來實(shí)現(xiàn)上述功能時(shí),可以通過編程(例如軟件或固件)、邏輯組件(硬件)的恰當(dāng)排列或這兩個(gè)的任意合并來完成。應(yīng)該注意到的是,本發(fā)明還涉及機(jī)器可讀介質(zhì),可以在其上存儲用于執(zhí)行本發(fā)明的方法和功能的程序指令。這種介質(zhì)包括,例如,磁盤、磁帶、諸如CDROM和DVDROM的光可讀介質(zhì)、或者諸如PCMCIA卡的半導(dǎo)體存儲器、各種類型的存儲卡、USB存儲設(shè)備等等。在每種情況下,介質(zhì)可以是便攜物的形式,例如微型磁盤驅(qū)動器或小磁盤、磁盤、磁帶、盤式磁帶、卡、棒等等,或者可以是相對較大的或不可移動的物體的形式,例如提供在計(jì)算機(jī)或其它設(shè)備中的硬盤驅(qū)動器、ROM或RAM。前述的描述主要強(qiáng)調(diào)了電子計(jì)算機(jī)和設(shè)備。然而,應(yīng)該明白的是,任何其它計(jì)算或其它類型的設(shè)備可以替換使用,例如利用了電子,光,生物和化學(xué)處理的任意合并的設(shè)備。額外考慮前述實(shí)施例涉及音頻數(shù)據(jù)的處理。然而,需要明白的是,可以結(jié)合對于其它類型數(shù)據(jù)的處理來使用本發(fā)明的技術(shù),例如視頻數(shù)據(jù)、傳感數(shù)據(jù)(例如地震、氣象、輻射)、經(jīng)濟(jì)學(xué)數(shù)據(jù)或者其它可觀察的或可測量的數(shù)據(jù)。以上描述了本發(fā)明的各種不同的實(shí)施例,其中所述的每個(gè)實(shí)施例包括了特定的特征。然而,本領(lǐng)域的技術(shù)人員將會明白,所述的與任何單個(gè)實(shí)施例有關(guān)的特征并不限于該實(shí)施例,而是還可以包括在和/或以各種組合方式安排在任何其它實(shí)施例中。同樣,在上述討論中,有時(shí)將功能歸因于特定的模塊或組件。然而,可以根據(jù)需要,在不同的模塊或組件中對功能進(jìn)行重新分配,在一些情況下,完全消除了對特定組件或模塊的需要,和/或需要添加新的組件件或模塊。本領(lǐng)域的技術(shù)人員將會明白,參考本發(fā)明的特定實(shí)施例,優(yōu)選地根據(jù)已知的工程折衷來精確地分配功能。因此,盡管本發(fā)明詳細(xì)描述了示例性實(shí)施例和附圖,對于本領(lǐng)域的技術(shù)人員來說,在不脫離本發(fā)明的精神和范圍的前提下,顯然可以對本發(fā)明做出各種改變和修改。因此,本發(fā)明并不限于附圖和上述描述中所述的精確的實(shí)施例。而是,旨在把不脫離本發(fā)明實(shí)質(zhì)的所有這種變形看作在本發(fā)明的范圍之內(nèi),其中本發(fā)明的范圍僅由所附權(quán)利要求來限定。權(quán)利要求1、一種用于對音頻信號進(jìn)行編碼的方法,包括(a)獲得分割成幀的采樣音頻信號;(b)識別在其中一個(gè)幀中的瞬變的位置;(c)通過對該幀數(shù)據(jù)執(zhí)行多分辨率濾波器組分析來生成變換數(shù)據(jù)采樣,包括以不同分辨率對該包括瞬變的幀中的不同部分進(jìn)行濾波;(d)通過基于心理聲學(xué)模型使用可變數(shù)量的比特對該變換數(shù)據(jù)采樣進(jìn)行量化,生成量化數(shù)據(jù);(e)基于該量化數(shù)據(jù)的量值,把該量化數(shù)據(jù)分組成可變長度的分段;(f)為每個(gè)可變長度的分段分配碼書;以及(g)使用分配給每個(gè)可變長度的分段的碼書,對該可變長度的分段中的量化數(shù)據(jù)進(jìn)行編碼。2、如權(quán)利要求l所述的方法,其中,所述變換數(shù)據(jù)采樣包括以下至少之一(i)兩個(gè)不同聲道的對應(yīng)數(shù)據(jù)值的和,以及(ii)兩個(gè)不同聲道的數(shù)據(jù)值的差。3、如權(quán)利要求l所述的方法,其中,所述變換數(shù)據(jù)采樣中的至少一些已經(jīng)被進(jìn)行聯(lián)合強(qiáng)度編碼。4、如權(quán)利要求l所述的方法,其中,通過執(zhí)行改進(jìn)型離散余弦變換來生成所述變換數(shù)據(jù)采樣。5、如權(quán)利要求l所述的方法,其中,在包括瞬變的所述幀中的濾波包括把濾波器組應(yīng)用到多個(gè)大小相等的連續(xù)的變換塊中的每一水6、如權(quán)利要求5所述的方法,其中,在包括瞬變的所述幀中的濾波包括與應(yīng)用到不包括瞬變的變換塊的窗函數(shù)相比,把不同的窗函數(shù)應(yīng)用到包括瞬變的其中一個(gè)變換塊。7、如權(quán)利要求1所述的方法,其中,在步驟(g)中的編碼包括進(jìn)行霍夫曼編碼,對于不包括檢測到的瞬變信號的幀,使用包括9個(gè)碼書的第一碼書組,對于包括檢測到的瞬變信號的幀,使用包括9個(gè)碼書的第二碼書組。8、如權(quán)利要求1所述的方法,其中,步驟(e)包括用于將較短的量化數(shù)據(jù)分段合并到鄰近分段中的迭代技術(shù)。9、如權(quán)利要求l所述的方法,其中,通過把固定數(shù)量的比特分配給多個(gè)量化單元的每一個(gè)中的每一個(gè)采樣,來生成所述量化數(shù)據(jù),不同的量化單元具有不同的每采樣比特?cái)?shù),并且其中所述可變長度的分段獨(dú)立于所述量化單元。10、如權(quán)利要求1所述的方法,其中步驟(e)和(f)同時(shí)執(zhí)行。11、一種用于對音頻信號進(jìn)行解碼的方法,包括(a)獲得包括多個(gè)幀的比特流,每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化指數(shù),所述處理信息包括(i)多個(gè)碼書指數(shù),每個(gè)碼書指數(shù)識別一個(gè)碼書,(ii)碼書應(yīng)用信息,用于指定要應(yīng)用碼書的熵編碼量化指數(shù)范圍,以及(iii)窗{言息;(b)通過將由碼書指數(shù)所識別的碼書應(yīng)用到由碼書應(yīng)用信息所指定的熵編碼量化指數(shù)范圍,對熵編碼量化指數(shù)進(jìn)行解碼;(c)通過對所解碼的量化指數(shù)進(jìn)行反量化,生成子帶采樣;(d)基于窗信息,識別出在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用的一序列多個(gè)不同窗函數(shù);以及(e)通過對子帶采樣進(jìn)行逆變換,并且在所述單個(gè)音頻數(shù)據(jù)幀中使用由窗信息所指示的所述多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。12、如權(quán)利要求ll所述的方法,其中,至少一個(gè)熵編碼量化指數(shù)范圍跨越了量化單元的邊界,量化單元是由通過頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化指數(shù)矩形來定義的。13、如權(quán)利要求11所述的方法,其中,碼書應(yīng)用信息針對由碼書指數(shù)所識別的每個(gè)碼書,識別一個(gè)熵編碼量化指數(shù)范圍。14、如權(quán)利要求ll所述的方法,其中,碼書應(yīng)用信息針對由碼書指數(shù)所識別的每個(gè)碼書,指定熵編碼量化指數(shù)長度。15、如權(quán)利要求ll所述的方法,其中,窗信息指示在幀中瞬變的位置,并且其中,在步驟(d)基于與瞬變的位置有關(guān)的預(yù)定規(guī)則,識別出所述一序列多個(gè)不同窗函數(shù)。16、如權(quán)利要求15所述的方法,其中,所述預(yù)定規(guī)則指定在包括瞬變的任意變換塊中使用了特定窗函數(shù)。17、如權(quán)利要求16所述的方法,其中,所述預(yù)定規(guī)則還符合完全重構(gòu)要求。18,如權(quán)利要求15所述的方法,其中,所述特定窗函數(shù)比所述單個(gè)音頻數(shù)據(jù)幀中的所述多個(gè)不同窗函數(shù)中的其它窗函數(shù)窄。19、如權(quán)利要求15所述的方法,其中,所述特定窗函數(shù)是對稱的,并且僅占其整個(gè)變換塊的中央部分,在其變換塊的各端具有多個(gè)o值。20、如權(quán)利要求11所述的方法,其中,(i)所述多個(gè)碼書指數(shù)、(ii)所述碼書應(yīng)用信息以及(iii)所述窗信息都是經(jīng)過熵編碼的。21、一種用于對音頻信號進(jìn)行解碼的設(shè)備,包括a)比特流獲得裝置,獲得包括多個(gè)幀的比特流,每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化指數(shù),所述處理信息包括(i)多個(gè)碼書指數(shù),每個(gè)碼書指數(shù)識別一個(gè)碼書,(ii)碼書應(yīng)用信息,用于指定要應(yīng)用碼書的熵編碼量化指數(shù)范圍,以及(iii)窗信息;(b)解碼裝置,通過將由碼書指數(shù)所識別的碼書應(yīng)用到由碼書應(yīng)用信息所指定的熵編碼量化指數(shù)范圍,對熵編碼量化指數(shù)進(jìn)行解碼;(c)子帶采樣生成裝置,通過對所解碼的量化指數(shù)進(jìn)行反量化,生成子帶采樣;(d)窗函數(shù)識別裝置,基于窗信息,識別出在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用的一序列多個(gè)不同窗函數(shù);以及(e)時(shí)域音頻數(shù)據(jù)獲得裝置,通過對子帶采樣進(jìn)行逆變換,并且在所述單個(gè)音頻數(shù)據(jù)幀中使用由窗信息所指示的所述多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。22、如權(quán)利要求21所述的設(shè)備,其中,至少一個(gè)熵編碼量化指數(shù)范圍跨越了量化單元的邊界,量化單元是由通過頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化指數(shù)矩形來定義的。23、如權(quán)利要求21所述的設(shè)備,其中,窗信息指示在幀中瞬變的位置,并且其中,在步驟(d)基于與瞬變的位置有關(guān)的預(yù)定規(guī)則,識別出所述一序列多個(gè)不同窗信息,其中,所述預(yù)定規(guī)則指定在包括瞬變的任意變換塊中使用了特定窗函數(shù),并且其中,所述預(yù)定規(guī)則還符合完全重構(gòu)要求。24、如權(quán)利要求21所述的設(shè)備,其中,所述特定窗函數(shù)是對稱的,并且僅占其整個(gè)變換塊的中央部分,在其變換塊的各端具有多個(gè)O值。25、如權(quán)利要求21所述的設(shè)備,其中,(i)所述多個(gè)碼書指數(shù)、(ii)所述碼書應(yīng)用信息以及(iii)所述窗信息都是經(jīng)過熵編碼的。全文摘要提供了用于對音頻信號進(jìn)行編碼的系統(tǒng)、方法和技術(shù),其中獲得分割成幀的采樣音頻信號。識別在其中一個(gè)幀中的瞬變位置,通過對幀數(shù)據(jù)執(zhí)行多分辨率濾波器組分析來生成變換數(shù)據(jù)采樣,包括以不同的分辨率對包括瞬變的幀的不同部分進(jìn)行濾波。通過基于心理聲學(xué)模型使用可變數(shù)量的比特對變換數(shù)據(jù)采樣進(jìn)行量化,來生成量化數(shù)據(jù),并且基于量化數(shù)據(jù)的量值,把該量化數(shù)據(jù)分組成可變長度的分段。為每個(gè)可變長度的分段分配碼書,并且使用分配給每個(gè)可變長度的分段的碼書,來對該可變長度的分段中的量化數(shù)據(jù)進(jìn)行編碼。文檔編號H03M7/40GK101290774SQ20081000346公開日2008年10月22日申請日期2008年1月17日優(yōu)先權(quán)日2007年1月31日發(fā)明者游余立申請人:廣州廣晟數(shù)碼技術(shù)有限公司