專利名稱:音訊信號(hào)解碼器、音訊信號(hào)編碼器、編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)、方法及計(jì)算機(jī)程序的制作方法
技術(shù)領(lǐng)域:
背景技術(shù):
發(fā)明背景
根據(jù)本發(fā)明的一些實(shí)施例關(guān)于一音訊信號(hào)解碼器。根據(jù)本發(fā)明的進(jìn)一步實(shí)施例關(guān) 于一音訊信號(hào)編碼器。根據(jù)本發(fā)明的另一些實(shí)施例關(guān)于一編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)。 根據(jù)本發(fā)明的又一些實(shí)施例關(guān)于一種用于提供一解碼多聲道音訊信號(hào)表現(xiàn)形態(tài)的方法、及 一種用于提供一多聲道音訊信號(hào)的一編碼表現(xiàn)形態(tài)的方法、及一種用于實(shí)施所述方法的計(jì) 算機(jī)程序。根據(jù)本發(fā)明的一些實(shí)施例與針對(duì)時(shí)間扭曲MDCT轉(zhuǎn)換編碼器的方法有關(guān)。在下文中,將對(duì)在時(shí)間扭曲音訊編碼領(lǐng)域做一簡(jiǎn)要介紹,其中時(shí)間扭曲音訊編碼 的概念可連同本發(fā)明的一些實(shí)施例來被應(yīng)用。在最近幾年,用以將音訊信號(hào)轉(zhuǎn)換成頻域表現(xiàn)形態(tài)、及有效率地編碼這一這一頻 域表現(xiàn)形態(tài)(例如考慮知覺遮蔽臨界值)的技術(shù)已被開發(fā)。這一音訊信號(hào)編碼概念在以下 情況下特別有效率,即如果對(duì)于傳送一組編碼頻譜系數(shù)而言的區(qū)塊段長(zhǎng)度長(zhǎng),且如果只有 是一相對(duì)少數(shù)的頻譜系數(shù)遠(yuǎn)大于全域遮蔽臨界值,而多數(shù)的頻譜系數(shù)在該全域遮蔽臨界附 近或小于該全域遮蔽臨界從而可被忽略(或用最小碼長(zhǎng)編碼)。例如,余弦式或正弦式調(diào)制重疊轉(zhuǎn)換由于其能量集中壓縮性質(zhì)通常被用在信號(hào) 源編碼的應(yīng)用中。也就是說,對(duì)于具有恒定基本頻率(fundamental frequency)(基頻 (pitch))的諧音而言,它們將信號(hào)能量集中到少數(shù)頻譜分量(子頻帶),這導(dǎo)致有效率的信 號(hào)表現(xiàn)形態(tài)。一般地,信號(hào)的(基本)基頻將被理解為可與信號(hào)之頻譜區(qū)別的最低主頻。在一 般的語音模型中,基頻是經(jīng)人的喉嚨調(diào)制的激勵(lì)信號(hào)的頻率。若只是一個(gè)單一的基本頻率 存在,則頻譜將極為簡(jiǎn)單,只包含該基本頻率與泛音。這種頻譜可被高效地編碼。然而,對(duì) 于具有變化基頻的信號(hào)而言,與每一諧波分量相對(duì)應(yīng)的能量通過若干轉(zhuǎn)換系數(shù)來傳播,從 而導(dǎo)致編碼效率的降低。為了克服這一編碼效率的降低,將被編碼的音訊信號(hào)被以一非均勻時(shí)間網(wǎng)格有效 率地重新取樣。在隨后的處理中,通過非均勻重新取樣所獲得的樣本位置如同它們將代表 非均勻時(shí)間網(wǎng)格上的值地被處理。這種操作通常由短語「時(shí)間扭曲」來表示。取樣次數(shù)可 依據(jù)基頻的時(shí)間變化有利地選擇,借此在音訊信號(hào)的時(shí)間扭曲版本中的基頻變化小于音訊 信號(hào)的原始版本(在時(shí)間扭曲之前)中的基頻變化。在將音訊信號(hào)時(shí)間扭曲之后,音訊信 號(hào)的時(shí)間扭曲版本被轉(zhuǎn)換到頻域?;l依賴時(shí)間扭曲具有的效應(yīng)是,時(shí)間扭曲音訊信號(hào)的 頻域表現(xiàn)形態(tài)典型地能量集中到一數(shù)目遠(yuǎn)少于原始(非時(shí)間扭曲)音訊信號(hào)頻域表現(xiàn)形態(tài) 的頻譜分量。在解碼器端,時(shí)間扭曲音訊信號(hào)的頻域表現(xiàn)形態(tài)被轉(zhuǎn)換回到時(shí)域,借此在解碼器端可得到時(shí)間扭曲音訊信號(hào)的時(shí)域表現(xiàn)形態(tài)。然而,在解碼器端重建時(shí)間扭曲音訊信號(hào)的時(shí)域表現(xiàn)形態(tài)中,編碼器端輸入音訊信號(hào)的原始基頻變化不包括在內(nèi)。因此,通過對(duì)時(shí)間扭 曲音訊信號(hào)的解碼器端重建時(shí)域表現(xiàn)形態(tài)的重新取樣,又一時(shí)間扭曲被施加。為了在解碼 器端獲得編碼器端輸入音訊信號(hào)的良好重建,期望的是解碼器端時(shí)間扭曲至少近似是關(guān)于 編碼器端時(shí)間扭曲的反操作。為了獲得一合適的時(shí)間扭曲,期望的是在解碼器端可得一容 許調(diào)整解碼器端時(shí)間扭曲的一信息是所期望的。因?yàn)榈湫退枰氖菑囊粲嵭盘?hào)編碼器向音訊信號(hào)解碼器傳送這一信息,所以期 望的是維持這一傳輸所需要的比特率較小而仍然能夠使解碼器端進(jìn)行所需要的時(shí)間扭曲
信息可靠的重建。鑒于以上討論,期望有考慮到多聲道音訊信號(hào)的高比特效率有效儲(chǔ)存及/或傳輸 的一概念。
發(fā)明內(nèi)容
發(fā)明概要根據(jù)本發(fā)明的一實(shí)施例產(chǎn)生根據(jù)一編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)提供一解碼多 聲道音訊信號(hào)表現(xiàn)形態(tài)的一音訊信號(hào)解碼器。該音訊信號(hào)解碼器包含一時(shí)間扭曲解碼器, 該時(shí)間扭曲解碼器被組配成選擇性地使用個(gè)別音訊聲道特定時(shí)間扭曲輪廓或一共同多聲 道時(shí)間扭曲輪廓以時(shí)間扭曲重建由編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)表示的多個(gè)音訊聲道。根據(jù)本發(fā)明的這一實(shí)施例基于以下發(fā)現(xiàn),不同類型多聲道音訊信號(hào)的有效率編碼 可通過在音訊聲道特定時(shí)間扭曲輪廓與共同多聲道時(shí)間扭曲輪廓的儲(chǔ)存及/或傳輸之間 切換來實(shí)現(xiàn)。已發(fā)現(xiàn)的是,在一些情況下,在一多聲道音訊信號(hào)的多個(gè)聲道中,基頻變化明 顯地不同。而且,已發(fā)現(xiàn)的是在其他情況下,對(duì)于一多聲道音訊信號(hào)的多個(gè)聲道而言,基頻 變化接近相等。鑒于這些不同類型的信號(hào)(或一單一音訊信號(hào)的多個(gè)信號(hào)部分),已發(fā)現(xiàn)的 是,若解碼器可靈活地(可切換地或選擇性地)從個(gè)別音訊聲道特定時(shí)間扭曲輪廓表現(xiàn)形 態(tài)或從一共同多聲道時(shí)間扭曲輪廓表現(xiàn)形態(tài)得出用于重建多聲道音訊信號(hào)的不同聲道的 時(shí)間扭曲輪廓的話,則編碼效率可被提高。在一較佳實(shí)施例中,時(shí)間扭曲解碼器被組配成選擇性地使用一共同多聲道時(shí)間扭 曲輪廓來時(shí)間扭曲重建多個(gè)音訊聲道,個(gè)別編碼頻譜域信息可用于此。根據(jù)本發(fā)明的一層 面,已發(fā)現(xiàn)的是,使用一共同多聲道時(shí)間扭曲輪廓以時(shí)間扭曲重建多個(gè)音訊聲道不僅在不 同音訊聲道表示一類似音訊內(nèi)容的情況下,即使在不同音訊聲道表示明顯不同音訊內(nèi)容的 情況下也是可應(yīng)用的。因此,已發(fā)現(xiàn)的是,針對(duì)不同音訊聲道評(píng)估個(gè)別編碼頻譜域信息時(shí)結(jié) 合使用一共同多聲道時(shí)間扭曲輪廓的概念是有用的。例如,若第一音訊聲道表示復(fù)音音樂 作品的第一部分,而第二音訊聲道表示復(fù)音音樂作品的第二部分,則這一概念特別有用。第 一音訊信號(hào)與第二音訊信號(hào)可例如表示由不同歌手或不同樂器產(chǎn)生的聲音。因此,第一音 訊聲道的頻譜域表現(xiàn)形態(tài)可能與第二音訊聲道的頻譜域表現(xiàn)形態(tài)明顯不同。例如,不同音 訊聲道的基本頻率可能是不同的。且,不同的音訊聲道可能包含有關(guān)基本頻率的諧波的不 同特性。然而,不同音訊聲道的基頻也許有接近平行變化的明顯趨勢(shì)。在這種情況下,將一 共用時(shí)間扭曲(通過共同多聲道時(shí)間扭曲輪廓來描述)施加到不同的音訊聲道是非常有效 的,即使不同的音訊聲道包含明顯不同的音訊內(nèi)容(例如具有不同的基本頻率與不同的諧波頻譜)。然而,在其他情況下,自然是期望將不同時(shí)間扭曲施加到不同音訊聲道。在本發(fā)明的一較佳實(shí)施例中,時(shí)間扭曲解碼器被組配成接收與第一音訊聲道相關(guān) 聯(lián)的第一編碼頻譜域信息,并據(jù)以使用一頻域到時(shí)域轉(zhuǎn)換提供第一音訊聲道的扭曲時(shí)域表 現(xiàn)形態(tài)。并且,時(shí)間扭曲解碼器進(jìn)一步被組配成接收與第二音訊聲道相關(guān)聯(lián)的第二編碼頻 譜域信息,并據(jù)以使用一頻域到時(shí)域轉(zhuǎn)換提供第二音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài)。在這種 情況下,第二編碼頻譜域信息可能與第一頻譜域信息不同。并且,時(shí)間扭曲解碼器被組配成 根據(jù)共同多聲道時(shí)間扭曲輪廓來時(shí)變地重新取樣第一音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài)(或 它的一處理過的版本),獲得第一音訊聲道的規(guī)則取樣表現(xiàn)形態(tài)、且也根據(jù)共同多聲道時(shí) 間扭曲輪廓來時(shí)變地重新取樣第二音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài)(或它的一處理過的版 本),獲得第二音訊聲道的規(guī)則取樣表現(xiàn)形態(tài)。
在另一較佳實(shí)施例中,時(shí)間扭曲解碼器被組配成從共同多聲道時(shí)間扭曲輪廓信息 得出一共同多聲道時(shí)間輪廓。再者,時(shí)間扭曲解碼器被組配成根據(jù)第一編碼窗口形狀信息 得出與第一音訊聲道相關(guān)聯(lián)的第一個(gè)別特定聲道(channel-specific)窗口形狀,及根據(jù) 第二編碼窗口形狀信息得出與第二音訊聲道相關(guān)聯(lián)的第二個(gè)別特定聲道窗口形狀。時(shí)間 扭曲解碼器進(jìn)一步被組配成將第一窗口形狀施加到第一音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài),以 獲得第一音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài)的一處理過的版本,及將第二窗口形狀施加到第二 音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài),以獲得第二音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài)的一處理過的版 本。在這種情況下,時(shí)間扭曲解碼器可依據(jù)一個(gè)別的特定聲道窗口形狀信息將不同的窗口 形狀施加到第一與第二音訊聲道的扭曲時(shí)域表現(xiàn)形態(tài)。已發(fā)現(xiàn)的是,在一些情況下在準(zhǔn)備一時(shí)間扭曲操作中將不同形狀的窗口施加到不 同音訊信號(hào)是值得推薦的,即使時(shí)間扭曲操作是基于一共用時(shí)間扭曲輪廓。例如可能存在 一幀與一接續(xù)幀之間的過渡,其中在該幀中針對(duì)兩個(gè)音訊聲道存在一共用時(shí)間扭曲輪廓, 而在該接續(xù)幀中針對(duì)兩個(gè)音訊聲道存在不同的時(shí)間扭曲輪廓。然而,在該接續(xù)幀中的這兩 個(gè)音訊聲道其中之一的時(shí)間扭曲輪廓可能是當(dāng)前幀中的共用時(shí)間扭曲輪廓的一非變化延 續(xù),而在該接續(xù)幀中的另一音訊聲道的時(shí)間扭曲輪廓可能相對(duì)于當(dāng)前幀中的共用時(shí)間扭曲 輪廓有變化。因此,適于時(shí)間扭曲輪廓的非變化演化的窗口形狀可用于所述音訊聲道之一, 而適于時(shí)間扭曲輪廓的變化演化的窗口形狀可應(yīng)用于另一音訊聲道。因此,音訊聲道的不 同演化可被考慮在內(nèi)。在根據(jù)本發(fā)明的另一實(shí)施例中,時(shí)間扭曲解碼器可被組配成施加一共用時(shí)間依比 例調(diào)整,在窗口化該第一與第二音訊聲道的時(shí)域表現(xiàn)形態(tài)時(shí),將一共用時(shí)間依比例調(diào)整施 加到不同的窗口形狀,該共用時(shí)間依比例調(diào)整由該共同多聲道時(shí)間輪廓決定。已發(fā)現(xiàn)的是, 即使在各自的時(shí)間扭曲之前不同的窗口形狀用于窗口化不同的音訊聲道,對(duì)扭曲輪廓的時(shí) 間依比例調(diào)整也應(yīng)被并行地調(diào)整,以避免聽覺印象的降級(jí)根據(jù)本發(fā)明的又一實(shí)施例產(chǎn)生一音訊信號(hào)編碼器,該音訊信號(hào)編碼器用于提供一 多聲道音訊信號(hào)的編碼表現(xiàn)形態(tài)。該音訊信號(hào)編碼器包含一編碼音訊表現(xiàn)形態(tài)提供器,該 編碼音訊表現(xiàn)形態(tài)提供器被組配成依據(jù)描述與多個(gè)音訊聲道中的不同音訊聲道相關(guān)聯(lián)的 時(shí)間扭曲輪廓之間的相似性或差異的信息,選擇性地提供包含與多聲道音訊信號(hào)的多個(gè)音 訊聲道共同相關(guān)聯(lián)的一共用時(shí)間扭曲輪廓信息的一音訊表現(xiàn)形態(tài),或包含與多個(gè)音訊聲道 中的不同音訊聲道個(gè)別地相關(guān)聯(lián)的個(gè)別時(shí)間扭曲輪廓信息的一編碼音訊表現(xiàn)形態(tài)。根據(jù)本發(fā)明的這一實(shí)施例是基于以下發(fā)現(xiàn),即在許多情況下,多聲道音訊信號(hào)的多個(gè)聲道包含類 似的基頻變化特性。因此,在一些情況下,將與多個(gè)音訊聲道共同相關(guān)聯(lián)的一共用時(shí)間扭曲 輪廓信息包括在多聲道音訊信號(hào)的編碼表現(xiàn)形態(tài)中是有效率的。以此方式,編碼效率對(duì)許 多信號(hào)可被提高。然而,已發(fā)現(xiàn)的是,對(duì)于其他類型的信號(hào)(或甚至一信號(hào)的其他部分)而 言,則不推薦使用這種共用時(shí)間扭曲信息。因此,若音訊信號(hào)編碼器判定與考慮中的不同音 訊聲道相關(guān)聯(lián)的扭曲輪廓之間的相似性或差異,則一有效率信號(hào)編碼可被獲得。然而,已發(fā) 現(xiàn)的是,查看個(gè)別時(shí)間時(shí)間扭曲輪廓確實(shí)是值得的,因?yàn)橛性S多包含明顯不同時(shí)域表現(xiàn)形 態(tài)或頻域表現(xiàn)形態(tài)的信號(hào),盡管它 們具有非常類似的時(shí)間扭曲輪廓。因此,已發(fā)現(xiàn)的是,時(shí) 間扭曲輪廓的評(píng)估是用于評(píng)估信號(hào)的相似性的新準(zhǔn)則,相較于只評(píng)估多個(gè)音訊信號(hào)的時(shí)域 表現(xiàn)形態(tài)或所述音訊信號(hào)的頻域表現(xiàn)形態(tài),這提供額外的信息。 在一較佳實(shí)施例中,編碼音訊表現(xiàn)形態(tài)提供器被組配成應(yīng)用一共用時(shí)間扭曲輪廓 信息來獲得第一音訊聲道的時(shí)間扭曲版本,及獲得第二音訊聲道的時(shí)間扭曲版本。該編碼 音訊表現(xiàn)形態(tài)提供器進(jìn)一步被組配成根據(jù)第一音訊聲道的時(shí)間扭曲版本提供與第一音訊 聲道相關(guān)聯(lián)的第一個(gè)別編碼頻譜域信息,及根據(jù)第二音訊聲道的時(shí)間扭曲版本提供與第二 音訊聲道相關(guān)聯(lián)的第二個(gè)別編碼頻譜域信息。這一實(shí)施例是基于上述發(fā)現(xiàn),即音訊聲道可 具有明顯不同的音訊內(nèi)容,即使其具有非常類似的時(shí)間扭曲輪廓。因此,提供與不同音訊聲 道相關(guān)聯(lián)的不同頻譜域信息通常是值得推薦的,即使音訊聲道根據(jù)共用時(shí)間扭曲信息被時(shí) 間扭曲。換言之,實(shí)施例是基于以下發(fā)現(xiàn),即在時(shí)間扭曲輪廓的相似性與不同音訊聲道的頻 域表現(xiàn)形態(tài)相似性之間不存在嚴(yán)格的相互關(guān)系。在另一較佳實(shí)施例中,編碼器被組配成獲得共用扭曲輪廓信息,使得共用扭曲輪 廓表示與第一音訊信號(hào)聲道及第二音訊信號(hào)聲道相關(guān)聯(lián)的個(gè)別扭曲輪廓的一平均。在又一較佳實(shí)施例中,編碼音訊表現(xiàn)形態(tài)提供器被組配成在多聲道音訊信號(hào)的 編碼表現(xiàn)形態(tài)中提供旁側(cè)信息,使得該旁側(cè)信息逐一音訊幀地(on a per-audio-frame basis)指示一幀的時(shí)間扭曲數(shù)據(jù)是否存在及一幀的共用時(shí)間扭曲輪廓信息是否存在。通過 提供指示一幀的時(shí)間扭曲數(shù)據(jù)是否存在的信息,減少傳輸時(shí)間扭曲信息所需要的比特率是 可能的。已發(fā)現(xiàn)的是,若時(shí)間扭曲用于這一幀,則典型地需要傳送描述這一幀中的多個(gè)時(shí)間 扭曲輪廓值的信息。然而,也已發(fā)現(xiàn)時(shí)間扭曲的應(yīng)用對(duì)于許多幀不帶來明顯的利益。然而, 已發(fā)現(xiàn)的是,更有效率的是使用例如一額外信息的比特來指示時(shí)間扭曲數(shù)據(jù)對(duì)于一幀是否 可使用。通過使用這種發(fā)信,大量時(shí)間扭曲信息(典型包含關(guān)于多個(gè)時(shí)間扭曲輪廓值的信 息)的傳輸可被省略,從而節(jié)省比特。根據(jù)本發(fā)明的再一實(shí)施例產(chǎn)生表示一多聲道音訊信號(hào)的一編碼多聲道音訊信號(hào) 表現(xiàn)形態(tài)。該多聲道音訊信號(hào)表現(xiàn)形態(tài)包含表示根據(jù)一共用時(shí)間扭曲而時(shí)間扭曲的多個(gè)時(shí) 間扭曲音訊聲道的一編碼頻域表現(xiàn)形態(tài)。該多聲道音訊信號(hào)表現(xiàn)形態(tài)也包含與所述音訊聲 道共同相關(guān)聯(lián)且表示共用時(shí)間扭曲的一共用時(shí)間扭曲輪廓信息的編碼表現(xiàn)形態(tài)。在一較佳實(shí)施例中,編碼頻域表現(xiàn)形態(tài)包含具有不同音訊內(nèi)容的多個(gè)音訊聲道的 編碼頻域信息。同樣地,共用扭曲輪廓信息的編碼表現(xiàn)形態(tài)與具有不同音訊內(nèi)容的所述多 個(gè)音訊聲道相關(guān)聯(lián)。根據(jù)本發(fā)明的另一實(shí)施例產(chǎn)生一種根據(jù)編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)提供解碼 多聲道音訊信號(hào)表現(xiàn)形態(tài)的方法。該方法可通過本文中同樣地針對(duì)本發(fā)明裝置所描述的特征與功能中的任意一者來實(shí)施。根據(jù)本發(fā)明的又一實(shí)施例產(chǎn)生一種用于提供多聲道音訊信號(hào)的編碼表現(xiàn)形態(tài)的方法。該方法可通過本文中同樣地針對(duì)本發(fā)明裝置所描述的特征與功能中的任意一者來實(shí) 施。根據(jù)本發(fā)明的再一實(shí)施例產(chǎn)生一種用于實(shí)施上述方法的計(jì)算機(jī)程序。
根據(jù)本發(fā)明的實(shí)施例將隨后參考所包含附圖予以描述,其中圖1顯示一時(shí)間扭曲音訊編碼器的方塊概要圖;圖2顯示一時(shí)間扭曲音訊解碼器的方塊概要圖;圖3顯示根據(jù)本發(fā)明的一實(shí)施例的一音訊信號(hào)解碼器的方塊概要圖;圖4顯示根據(jù)本發(fā)明的一實(shí)施例的用于提供解碼音訊信號(hào)表現(xiàn)形態(tài)之方法的流 程圖;圖5顯示根據(jù)本發(fā)明的一實(shí)施例的從一音訊信號(hào)解碼器之方塊概要圖的詳細(xì)摘 錄;圖6顯示根據(jù)本發(fā)明的一實(shí)施例的從用于提供解碼音訊信號(hào)表現(xiàn)形態(tài)的方法的 流程圖的詳細(xì)摘錄;圖7a、圖7b顯示根據(jù)本發(fā)明的一實(shí)施例的重建時(shí)間扭曲輪廓的圖形表現(xiàn)形態(tài);圖8顯示根據(jù)本發(fā)明的一實(shí)施例的重建時(shí)間扭曲輪廓的另一圖形表現(xiàn)形態(tài);圖9a、圖9b顯示用于計(jì)算時(shí)間扭曲輪廓的算法;圖9c顯示從一時(shí)間扭曲比索引到一時(shí)間扭曲比值的映射表;圖IOa及圖IOb顯示用于計(jì)算時(shí)間輪廓、樣本位置、過渡長(zhǎng)度、「第一位置」及「最 后位置」的算法的表現(xiàn)形態(tài);圖IOc顯示用于窗口形狀計(jì)算的算法的表現(xiàn)形態(tài);圖IOd及圖IOe顯示用于一窗口的應(yīng)用的算法的表現(xiàn)形態(tài);圖IOf顯示用于時(shí)變重新取樣的算法的表現(xiàn)形態(tài);圖IOg顯示用于后時(shí)間扭曲幀處理及用于重疊與相加的算法的圖形表現(xiàn)形態(tài);圖Ila及圖lib顯示一圖例;圖12顯示可從一時(shí)間扭曲輪廓提取的一時(shí)間輪廓的圖形表現(xiàn)形態(tài);圖13顯示根據(jù)本發(fā)明的一實(shí)施例提供扭曲輪廓的裝置的詳細(xì)方塊概要圖;圖14顯示根據(jù)本發(fā)明的另一實(shí)施例的一音訊信號(hào)解碼器的方塊概要圖;圖15顯示根據(jù)本發(fā)明的一實(shí)施例的另一時(shí)間扭曲輪廓計(jì)算器的方塊概要圖;圖16a及圖16b顯示根據(jù)本發(fā)明的一實(shí)施例的計(jì)算時(shí)間扭曲節(jié)點(diǎn)值的圖形表現(xiàn)形 態(tài);圖17顯示根據(jù)本發(fā)明的一實(shí)施例的另一音訊信號(hào)編碼器的方塊概要圖;圖18顯示根據(jù)本發(fā)明的一實(shí)施例的另一音訊信號(hào)解碼器的方塊概要圖;以及圖19a_19f顯示根據(jù)本發(fā)明的一實(shí)施例的一音訊流的語法元素的表現(xiàn)形態(tài)。
具體實(shí)施例方式實(shí)施例的詳細(xì)描述1.根據(jù)圖1的時(shí)間扭曲音訊編碼器因?yàn)楸景l(fā)明與時(shí)間扭曲音訊編碼及時(shí)間扭曲音訊解碼有關(guān),可實(shí)施本發(fā)明的一原 型時(shí)間扭曲音訊編碼器及一時(shí)間扭曲音訊解碼器的簡(jiǎn)略概述將被提出。圖1顯示一時(shí)間扭曲音訊編碼器的方塊概要圖,其中本發(fā)明的一些層面及實(shí)施例 可被整合在該時(shí)間扭曲音訊編碼器中。圖1中的音訊信號(hào)編碼器100被組配成接收一輸入 音訊信號(hào)110及在一幀序列中提供該輸入音訊信號(hào)110的一編碼表現(xiàn)形態(tài)。音訊編碼器 100包含一取樣器104,該取樣器104適于對(duì)音訊信號(hào)110 (輸入信號(hào))取樣,以得到被用作 頻域轉(zhuǎn)換的基礎(chǔ)的信號(hào)區(qū)塊(取樣表現(xiàn)形態(tài))105。音訊編碼器100進(jìn)一步包含一轉(zhuǎn)換窗 口計(jì)算器106,該轉(zhuǎn)換窗口計(jì)算器106適于得到用于從取樣器104輸出的取樣表現(xiàn)形態(tài)105 的依比例調(diào)整窗口。這些被輸入到一窗口化程序(windower) 108中,該窗口化程序108適 于將依比例調(diào)整窗口施加到從取樣器104得到的取樣表現(xiàn)形態(tài)105。在一些實(shí)施例中,音 訊編碼器100可額外地包含一頻域轉(zhuǎn)換器108a,以得到取樣且依比例調(diào)整表現(xiàn)形態(tài)105的 頻域表現(xiàn)形態(tài)(例如以轉(zhuǎn)換系數(shù)形式)。該頻域表現(xiàn)形態(tài)可被處理或進(jìn)一步作為音訊信號(hào) 110的編碼表現(xiàn)形態(tài)被傳送。音訊編碼器100進(jìn)一步使用可被提供給音訊編碼器100或可通過音訊編碼器100 得到之音訊信號(hào)Iio的基頻輪廓112。因此音訊編碼器100可取舍地包含用于得到基頻輪 廓112的一基頻估計(jì)器。該取樣器104可在輸入音訊信號(hào)110的一連續(xù)表現(xiàn)形態(tài)上操作。 可取舍地,取樣器104可在輸入音訊信號(hào)110的一已取樣表現(xiàn)形態(tài)上操作。在后一種情況 下,取樣器104可對(duì)音訊信號(hào)110重新取樣。取樣器104可例如適于時(shí)間扭曲相鄰重疊音 訊區(qū)塊,使得重疊部分在取樣后的每一輸入?yún)^(qū)塊中具有一恒定基頻或被減小基頻變化。轉(zhuǎn)換窗口計(jì)算器106依據(jù)由取樣器104所執(zhí)行的時(shí)間扭曲得到音訊區(qū)塊的依比例 調(diào)整窗口。為了達(dá)到這個(gè)目的,一可取舍的取樣率調(diào)整方塊114可能是存在的,以定義取樣 器所使用的時(shí)間扭曲規(guī)則,該時(shí)間扭曲規(guī)則而后也被提供給轉(zhuǎn)換窗口計(jì)算器106。在一備選 實(shí)施例中,取樣率調(diào)整方塊114可被省略,且基頻輪廓112可被直接提供給轉(zhuǎn)換窗口計(jì)算器 106,該轉(zhuǎn)換窗口計(jì)算器106本身可執(zhí)行合適的計(jì)算。再者,取樣器104可將所施加的取樣 動(dòng)作傳送至轉(zhuǎn)換窗口計(jì)算器106,以致能合適依比例調(diào)整窗口的計(jì)算。時(shí)間扭曲被執(zhí)行,使得由取樣器104扭曲與取樣的取樣音訊區(qū)塊的基頻輪廓較輸 入?yún)^(qū)塊中的原始音訊信號(hào)110的基頻輪廓恒定。2.根據(jù)圖2的時(shí)間扭曲音訊解碼器圖2顯示一時(shí)間扭曲音訊解碼器200的方塊概要圖,其中該時(shí)間扭曲音訊解碼器 200用于處理一音訊信號(hào)之第一與第二幀的第一時(shí)間扭曲且取樣或簡(jiǎn)單時(shí)間扭曲表現(xiàn)形 態(tài),其中該音訊信號(hào)具有一幀序列,其中第二幀接著第一幀,且用于進(jìn)一步處理該第二幀及 接著該幀序列中的該第二幀的第三幀的第二時(shí)間扭曲表現(xiàn)形態(tài)。音訊解碼器200包含一轉(zhuǎn) 換窗口計(jì)算器210,該轉(zhuǎn)換窗口計(jì)算器210適于使用關(guān)于第一與第二幀的基頻輪廓212的 信息得到用于第一時(shí)間扭曲表現(xiàn)形態(tài)211a的第一依比例調(diào)整窗口,以及使用關(guān)于第二與 第三幀的基頻輪廓的信息得到用于第二時(shí)間扭曲表現(xiàn)形態(tài)211b的第二依比例調(diào)整窗口, 其中所述依比例調(diào)整窗口可具有相同的樣本數(shù)目,且 其中用來漸出(fade out)第一依比例調(diào)整窗口的第一樣本數(shù)目可不同于用來漸入(fade in)第二依比例調(diào)整窗口的第二樣本數(shù)目。音訊解碼器200進(jìn)一步包含一窗口化程序216,該窗口化程序216適于將第一依比例調(diào) 整窗口施加到第一時(shí)間扭曲表現(xiàn)形態(tài),以及將第二依比例調(diào)整窗口施加到第二時(shí)間扭曲表 現(xiàn)形態(tài)。音訊解碼器200此外還包含一重新取樣器218,該重新取樣器218適于反時(shí)間扭曲 第一依比例調(diào)整時(shí)間扭曲表現(xiàn)形態(tài),以使用關(guān)于第一與第二幀之基頻輪廓的信息得到第一 取樣表現(xiàn)形態(tài),以及反時(shí)間扭曲第二依比例調(diào)整表現(xiàn)形態(tài),以使用關(guān)于第二與第三幀的基 頻輪廓的信息得到第二取樣表現(xiàn)形態(tài),借此第一取樣表現(xiàn)形態(tài)中與第二幀相對(duì)應(yīng)的部分包 含一基頻輪廓,該基頻輪廓在一預(yù)定容限范圍內(nèi)等于第二取樣表現(xiàn)形態(tài)中與第二幀相對(duì)應(yīng) 的部分的基頻輪廓。為了得到依比例調(diào)整窗口,轉(zhuǎn)換窗口計(jì)算器210可直接接收基頻輪廓 212,或從一可取舍的取樣率調(diào)整器220接收關(guān)于時(shí)間扭曲的信息,取樣率調(diào)整器220接收 基頻輪廓212且以如下方式得到一反時(shí)間扭曲策略即在重疊區(qū)域中的樣本在一線性時(shí)間 標(biāo)度上的樣本位置是相同的或接近相同的且被規(guī)則地間隔,使得重疊區(qū)域中的基頻變成相 同,且可取舍地,在反時(shí)間扭曲之前在重疊窗口部分中不同的衰落長(zhǎng)度在反時(shí)間扭曲之后 變成相同的長(zhǎng)度。音訊解碼器200此外還包含一可取舍的加法器230,該加法器230適于將第一取樣 表現(xiàn)形態(tài)中與第二幀相對(duì)應(yīng)的部分加入到第二取樣表現(xiàn)形態(tài)中與第二幀相對(duì)應(yīng)的部分,以 得到音訊信號(hào)的第二幀的一重建表現(xiàn)形態(tài)作為一輸出信號(hào)242。在一個(gè)實(shí)施例中,第一時(shí)間 扭曲表現(xiàn)形態(tài)與第二時(shí)間扭曲表現(xiàn)形態(tài)可被提供作為音訊解碼器200的輸入。在另一實(shí)施 例中,可取舍地,音訊解碼器200可包含一反頻域轉(zhuǎn)換器240,該反頻域轉(zhuǎn)換器240可從被提 供到該反頻域轉(zhuǎn)換器240的輸入端的第一與第二時(shí)間扭曲表現(xiàn)形態(tài)的頻域表現(xiàn)形態(tài)得到 第一與第二時(shí)間扭曲表現(xiàn)形態(tài)。3.根據(jù)圖3的時(shí)間扭曲音訊信號(hào)解碼器在下文中,將予以描述一簡(jiǎn)化音訊信號(hào)解碼器。圖3顯示這一簡(jiǎn)化音訊信號(hào)解碼 器300的方塊概要圖。該音訊信號(hào)解碼器300被組配成接收編碼音訊信號(hào)表現(xiàn)形態(tài)310,并 據(jù)以提供一解碼音訊信號(hào)表現(xiàn)形態(tài)312,其中該編碼音訊信號(hào)表現(xiàn)形態(tài)310包含一時(shí)間扭 曲輪廓演化信息。該音訊信號(hào)解碼器300包含一時(shí)間扭曲輪廓計(jì)算器320,該時(shí)間扭曲輪廓 計(jì)算器320被組配成根據(jù)時(shí)間扭曲輪廓演化信息產(chǎn)生時(shí)間扭曲輪廓數(shù)據(jù)322,該時(shí)間扭曲 輪廓演化信息描述時(shí)間扭曲輪廓的時(shí)間演化,且該時(shí)間扭曲輪廓演化信息被編碼音訊信號(hào) 表現(xiàn)形態(tài)310所包含。當(dāng)從時(shí)間扭曲輪廓演化信息312得到時(shí)間扭曲輪廓數(shù)據(jù)322時(shí),時(shí) 間扭曲輪廓計(jì)算器320從一預(yù)定時(shí)間扭曲輪廓初始值一再地重新開始,這將在下文中予以 詳細(xì)地描述。重新開始可能會(huì)有時(shí)間扭曲輪廓包含不連續(xù)(大于通過時(shí)間扭曲輪廓演化信 息312編碼的步階的步進(jìn)式改變)的結(jié)果。音訊信號(hào)解碼器300進(jìn)一步包含一時(shí)間扭曲輪 廓數(shù)據(jù)重新依比例調(diào)整器330,該時(shí)間扭曲輪廓數(shù)據(jù)重新依比例調(diào)整器330被組配成重新 依比例調(diào)整時(shí)間扭曲輪廓數(shù)據(jù)322的至少一部分,使得在時(shí)間扭曲輪廓的重新依比例調(diào)整 版本332中,在時(shí)間扭曲輪廓計(jì)算的重新開始處的不連續(xù)被避免、減小或消除。音訊信號(hào)解碼器300也包含一扭曲解碼器340,該扭曲解碼器340被組配成根據(jù)編 碼音訊信號(hào)表現(xiàn)形態(tài)310且使用時(shí)間扭曲輪廓的重新依比例調(diào)整版本332提供一解碼音訊 信號(hào)表現(xiàn)形態(tài)312。為了將音訊信號(hào)解碼器300放入到時(shí)間扭曲音訊解碼之背景脈絡(luò)中,應(yīng)注意的是,編碼音訊信號(hào)表現(xiàn)形態(tài)310可包含轉(zhuǎn)換系數(shù)211的一編碼表現(xiàn)形態(tài),而且也包含基頻輪 廓212(也被指定為時(shí)間扭曲輪廓)的一編碼表現(xiàn)形態(tài)。時(shí)間扭曲輪廓計(jì)算器320與時(shí)間扭 曲輪廓數(shù)據(jù)重新依比例調(diào)整器330可被組配成以時(shí)間扭曲輪廓的重新依比例調(diào)整版本332 之形式提供基頻輪廓212的重建表現(xiàn)形態(tài)。扭曲解碼器340可例如接管窗口化216、重新取 樣218、取樣率調(diào)整220以及窗口形狀調(diào)整210的功能。再者,扭曲解碼器340可例如可取 舍地包含反轉(zhuǎn)換240及重疊/相加230的功能,使得解碼音訊信號(hào)表現(xiàn)形態(tài)312可與時(shí)間 扭曲音訊解碼器200的輸出音訊信號(hào)232等效。通過將重新依比例調(diào)整施加到時(shí)間扭曲輪廓數(shù)據(jù)322,時(shí)間扭曲輪廓的一連續(xù) (或至少近似連續(xù))的重新依比例調(diào)整版本332可被獲得,從而保證數(shù)值上溢或下溢被避 免,甚至當(dāng)使用對(duì)編碼有效率的相對(duì)變化時(shí)間扭曲輪廓演化信息時(shí)亦然。4.根據(jù)圖4的一種用于提供解碼音訊信號(hào)表現(xiàn)形態(tài)的方法。圖4顯示根據(jù)包含時(shí)間扭曲輪廓演化信息的編碼音訊信號(hào)表現(xiàn)形態(tài)提供解碼音 訊信號(hào)表現(xiàn)形態(tài)之方法的流程圖,該流程可借根據(jù)圖3的裝置300執(zhí)行。方法400包含第 一步驟410,第一步驟410根據(jù)描述時(shí)間扭曲輪廓的時(shí)間演化的時(shí)間扭曲輪廓演化信息從 一預(yù)定時(shí)間扭曲輪廓初始值一再地重新開始產(chǎn)生時(shí)間扭曲輪廓數(shù)據(jù)。 方法400進(jìn)一步包含步驟420,步驟420重新依比例調(diào)整時(shí)間扭曲控制數(shù)據(jù)的至少 一部分,使得在時(shí)間扭曲輪廓的重新依比例調(diào)整版本中,在其中的一個(gè)重新開始處的不連 續(xù)被避免、減小或消除。方法400進(jìn)一步包含根據(jù)編碼音訊信號(hào)表現(xiàn)形態(tài)且使用時(shí)間扭曲輪廓的重新依 比例調(diào)整版本提供解碼音訊信號(hào)表現(xiàn)形態(tài)的步驟430。5.參考圖5-9且根據(jù)本發(fā)明之一實(shí)施例的詳細(xì)描述在下文中,將參考圖5-9詳細(xì)地描述根據(jù)本發(fā)明的一實(shí)施例。圖5顯示一裝置500方塊概要圖,該裝置500根據(jù)時(shí)間扭曲輪廓演化信息510提 供時(shí)間扭曲控制信息512。裝置500包含根據(jù)時(shí)間扭曲輪廓演化信息510提供重建時(shí)間扭 曲輪廓信息522的一裝置520,以及根據(jù)重建時(shí)間扭曲輪廓信息522提供時(shí)間扭曲控制信息 512的一時(shí)間扭曲控制信息計(jì)算器530。提供重建時(shí)間扭曲輪廓信息的裝置520在下文中,裝置520的結(jié)構(gòu)與功能將予以描述。裝置520包含一時(shí)間扭曲輪廓計(jì) 算器540,該時(shí)間扭曲輪廓計(jì)算器540被組配成接收時(shí)間扭曲輪廓演化信息510,并據(jù)以提 供一新扭曲輪廓部分信息542。例如,針對(duì)將被重建的每一音訊信號(hào)幀,一組時(shí)間扭曲輪廓 演化信息可被傳送至裝置500。然而,與將被重建的一音訊信號(hào)幀相關(guān)聯(lián)的該組時(shí)間扭曲輪 廓演化信息510可被用于重建多個(gè)音訊信號(hào)幀。類似地,多組時(shí)間扭曲輪廓演化信息可被 用于重建一單一音訊信號(hào)幀的音訊內(nèi)容,這將在下文中予以詳細(xì)地討論。作為結(jié)論,在一些 實(shí)施例中可陳述為,時(shí)間扭曲輪廓演化信息510可以以一速率被更新,音訊信號(hào)的多組轉(zhuǎn) 換域系數(shù)將以該同一速率被重建或更新(每一音訊信號(hào)幀一個(gè)時(shí)間扭曲輪廓部分)。時(shí)間扭曲輪廓計(jì)算器540包含一扭曲節(jié)點(diǎn)值計(jì)算器544,該扭曲節(jié)點(diǎn)值計(jì)算器544 被組配成根據(jù)多個(gè)時(shí)間扭曲輪廓比值(或時(shí)間扭曲比索引)(或其時(shí)間序列)計(jì)算多個(gè)扭 曲輪廓節(jié)點(diǎn)值(或其時(shí)間序列),其中時(shí)間扭曲比值(或索引)由時(shí)間扭曲輪廓演化信息 510所組成。為了達(dá)到這一目的,扭曲節(jié)點(diǎn)值計(jì)算器544被組配成以一預(yù)定初始值(例如1)開始提供時(shí)間扭曲輪廓節(jié)點(diǎn)值,以及使用時(shí)間扭曲輪廓比值計(jì)算接續(xù)的時(shí)間扭曲輪廓節(jié) 點(diǎn)值,這將在下文中予以討論。再者,時(shí)間扭曲輪廓計(jì)算器540可取舍地包含一內(nèi)插器548,該內(nèi)插器548被組配 成在接續(xù)的時(shí)間扭曲輪廓節(jié)點(diǎn)值之間內(nèi)插。因此,新時(shí)間扭曲輪廓部分的描述542被獲得, 其中該新時(shí)間扭曲輪廓部分典型地從扭曲節(jié)點(diǎn)值計(jì)算器524所使用的預(yù)定初始值開始。此 外,裝置520被組配成考慮額外的時(shí)間扭曲輪廓部分,即用于提供全部時(shí)間扭曲輪廓部分 的一所謂的「上一時(shí)間扭曲輪廓部分」及一所謂的「當(dāng)前時(shí)間扭曲輪廓部分」。為了達(dá)到這 一目的,裝置520被組配成將該所謂的「上一時(shí)間扭曲輪廓部分」及該所謂的「當(dāng)前時(shí)間扭 曲輪廓部分」儲(chǔ)存在沒有在圖5中顯示的一存儲(chǔ)器中。然而,裝置520也包含一重新依比例調(diào)整器550,該重新依比例調(diào)整器550被組配 成重新依比例調(diào)整該「上一時(shí)間扭曲輪廓部分」及該「當(dāng)前時(shí)間扭曲輪廓部分」,以避免(或 減小、或消除)基于「上一時(shí)間扭曲輪廓部分」、「當(dāng)前時(shí)間扭曲輪廓部分」及「新時(shí)間扭曲輪 廓部分」的全部時(shí)間扭曲輪廓部分中的任何不連續(xù)。為了達(dá)到這一目的,重新依比例調(diào)整器 550被組配成接收「上一時(shí)間扭曲輪廓部分」及「當(dāng)前時(shí)間扭曲輪廓部分」的所儲(chǔ)存描述,以 及共同地重新依比例調(diào)整該「上一時(shí)間扭曲輪廓部分」及該「當(dāng)前時(shí)間扭曲輪廓部分」,以 獲得該「上一時(shí)間扭曲輪廓部分」及該「當(dāng)前時(shí)間扭曲輪廓部分」的重新依比例調(diào)整版本。 與重新依比例調(diào)整器550所執(zhí)行的重新依比例調(diào)整有關(guān)的細(xì)節(jié)將參考圖7a、圖7b及圖8在 下文中予以討論。此外,重新依比例調(diào)整器550也可被組配成例如從沒有在圖5中顯示的一存儲(chǔ)器 接收與「上一時(shí)間扭曲輪廓部分」相關(guān)聯(lián)的一和值及與「當(dāng)前時(shí)間扭曲輪廓部分」相關(guān)聯(lián)的 另一和值。這些和值有時(shí)分別用“l(fā)ast_warp_sum”及“Cur_warp_sum”標(biāo)明。重新依比例 調(diào)整器550被組配成使用一重新依比例調(diào)整因數(shù)重新依比例調(diào)整與時(shí)間扭曲輪廓部分相 關(guān)聯(lián)的和值,其中對(duì)應(yīng)的時(shí)間扭曲輪廓部分用該同一重新依比例調(diào)整因數(shù)來重新依比例調(diào) 整。因此,重新依比例調(diào)整和值被獲得在一些情況下,裝置520可包含一更新器560,該更新器560被組配成一再地更新 重新依比例調(diào)整器550的時(shí)間扭曲輪廓部分輸入且亦更新重新依比例調(diào)整器550的和值輸 入。例如,更新器560可被組配成以幀速率更新該信息。例如,當(dāng)前幀周期的「新時(shí)間扭曲 輪廓部分」可作為下一幀周期中的「當(dāng)前時(shí)間扭曲輪廓部分」。類似地,當(dāng)前幀周期的重新依 比例調(diào)整的「當(dāng)前時(shí)間扭曲輪廓部分」可作為下一幀周期中的「上一時(shí)間扭曲輪廓部分」。 因此,一存儲(chǔ)器有效率實(shí)施態(tài)樣被產(chǎn)生,因?yàn)楫?dāng)前幀周期的「上一時(shí)間扭曲輪廓部分」可在 當(dāng)前幀周期完成以后被丟棄。綜上所述,裝置520被組配成為每一幀周期(一些特別幀周期除外,例如在幀序列 開始、或在幀序列結(jié)束、或在時(shí)間扭曲無效的幀中)提供包含一「新時(shí)間扭曲輪廓部分」、一 「重新依比例調(diào)整當(dāng)前時(shí)間扭曲輪廓部分」及一「重新依比例調(diào)整上一時(shí)間扭曲輪廓部分」 的描述的時(shí)間扭曲輪廓部分的描述。此外,裝置520可為每一幀周期(上述特別幀周期除 外)提供例如包含一「新時(shí)間扭曲輪廓部分和值」、一「重新依比例調(diào)整當(dāng)前時(shí)間扭曲輪廓 和值」及一「重新依比例調(diào)整上一時(shí)間扭曲輪廓和值」的扭曲輪廓和值的表現(xiàn)形態(tài)。時(shí)間扭曲控制信息計(jì)算器530被組配成根據(jù)裝置520所提供的重建時(shí)間扭曲輪廓 信息計(jì)算時(shí)間扭曲控制信息512。例如,時(shí)間扭曲控制信息計(jì)算器包含一時(shí)間輪廓計(jì)算器570,該時(shí)間輪廓計(jì)算器570被組配成根據(jù)重建時(shí)間扭曲控制信息計(jì)算時(shí)間輪廓572。再者, 時(shí)間扭曲輪廓信息計(jì)算器530包含一樣本位置計(jì)算器574,該樣本位置計(jì)算器574被組配成 接收時(shí)間輪廓572并據(jù)以例如以樣本位置向量576的形式提供樣本位置信息。樣本位置向 量576描述例如由重新取樣器218所執(zhí)行的時(shí)間扭曲。時(shí)間扭曲控制信息計(jì)算器530也包含一過渡長(zhǎng)度計(jì)算器,該過渡長(zhǎng)度計(jì)算器被組 配成從重建時(shí)間扭曲控制信息得到過渡長(zhǎng)度信息。過渡長(zhǎng)度信息582可例如包含描述左過 渡長(zhǎng)度的信息以及描述右過渡長(zhǎng)度的信息。過渡長(zhǎng)度可例如依據(jù)由「上一時(shí)間扭曲輪廓部 分」、「當(dāng)前時(shí)間扭曲輪廓部分」及「新時(shí)間扭曲輪廓部分」所描述的時(shí)間部分的長(zhǎng)度而定。 例如,若由「上一時(shí)間扭曲輪廓部分」所描述的時(shí)間部分的時(shí)間擴(kuò)展較由「當(dāng)前時(shí)間扭曲輪 廓部分」所描述的時(shí)間部分的時(shí)間擴(kuò)展短,或若由「新時(shí)間扭曲輪廓部分」所描述的時(shí)間部 分的時(shí)間擴(kuò)展較由「當(dāng)前時(shí)間扭曲輪廓部分」所描述的時(shí)間部分的時(shí)間擴(kuò)展短,則過渡長(zhǎng)度 可被縮短(當(dāng)與缺省過渡長(zhǎng)度相比較時(shí))。此外,時(shí)間扭曲控制信息計(jì)算器530可進(jìn)一步包含第一與最后位置計(jì)算器584,該第 一與最后位置計(jì)算器584被組配成根據(jù)左及右過渡長(zhǎng)度計(jì)算所謂的「第一位置」與所謂的「最 后位置」?!傅谝晃恢谩古c「最后位置」增加重新依比例調(diào)整器的效率,因?yàn)樵诖翱诨院?,這 些位置以外的區(qū)域與零相同,從而不需要針對(duì)時(shí)間扭曲被考慮。在這里應(yīng)注意的是,樣本位置 向量576包含例如由重新依比例調(diào)整器280所執(zhí)行之時(shí)間扭曲所需要的信息。此外,左與右 過渡長(zhǎng)度582及「第一位置」與「最后位置」586組成例如窗口化程序216所需要的信息。因此,可以說裝置520與時(shí)間扭曲控制信息計(jì)算器530可一起接管取樣率調(diào)整 220、窗口形狀調(diào)整210及取樣位置計(jì)算219的功能。在下文中,包含裝置520及時(shí)間扭曲控制信息計(jì)算器530的音訊解碼器的功能將 參考圖6、圖7a、圖7b、圖8、圖9a-9c、圖10a-10g、圖11a、圖lib及圖12予以描述。圖6顯示根據(jù)本發(fā)明之一實(shí)施例的用于解碼音訊信號(hào)的編碼表現(xiàn)形態(tài)的方法的 流程圖。方法600包含提供一重建時(shí)間扭曲輪廓信息,其中提供重建時(shí)間扭曲輪廓信息之 該步驟包含計(jì)算610扭曲節(jié)點(diǎn)值、在扭曲節(jié)點(diǎn)值之間內(nèi)插620以及重新依比例調(diào)整630 — 個(gè)或多個(gè)先前計(jì)算的扭曲輪廓部分及一個(gè)或多個(gè)先前計(jì)算的扭曲輪廓和值。該方法600進(jìn) 一步包含使用在步驟610及620所獲得的「新時(shí)間扭曲輪廓部分」、重新依比例調(diào)整的先前 計(jì)算的時(shí)間扭曲輪廓部分(「當(dāng)前時(shí)間扭曲輪廓部分」及「上一時(shí)間扭曲輪廓部分」)也可 取舍地使用該重新依比例調(diào)整的先前計(jì)算的扭曲輪廓和值計(jì)算640時(shí)間扭曲控制信息。結(jié) 果,時(shí)間輪廓信息、及/或樣本位置信息、及/或過渡長(zhǎng)度信息及/或第一位置與最后位置 信息可在步驟640被獲得。方法600進(jìn)一步包含使用在步驟640所獲得的時(shí)間扭曲控制信息執(zhí)行650時(shí)間扭 曲信號(hào)重建。與時(shí)間扭曲信號(hào)重建有關(guān)的細(xì)節(jié)隨后將予以描述。方法600也包含更新存儲(chǔ)器的步驟660,這將在下文中予以描述。時(shí)間扭曲輪廓部分的計(jì)算在下文中,與時(shí)間扭曲輪廓部分的計(jì)算有關(guān)的細(xì)節(jié)將參考圖7a、圖7b、圖8、圖9a、 圖9b、圖9c予以描述。將假設(shè)一初始狀態(tài)是存在的,這在圖7a的圖形表現(xiàn)形態(tài)710中予以繪示。可看出 的是,第一扭曲輪廓部分716 (扭曲輪廓部分1)與第二扭曲輪廓部分718 (扭曲輪廓部分2)是存在的。每一扭曲輪廓部分通常包含通常儲(chǔ)存在一存儲(chǔ)器中的多個(gè)離散扭曲輪廓數(shù) 據(jù)值。不同的扭曲輪廓數(shù)據(jù)值與多個(gè)時(shí)間值相關(guān)聯(lián),其中時(shí)間在橫坐標(biāo)712處被顯示。扭 曲輪廓數(shù)據(jù)值的幅度在縱坐標(biāo)714處被顯示??煽闯龅氖?,第一扭曲輪廓部分具有一終值 1,而第二扭曲輪廓部分具有一初始值1,其中值1可被認(rèn)為是一「預(yù)定值」。應(yīng)注意的是, 第一扭曲輪廓部分716可被認(rèn)為是一「上一時(shí)間扭曲輪廓部分」(也被指定為“l(fā)aSt_Warp_ contour”),而第二扭曲輪廓部分718可被認(rèn)為是一「當(dāng)前時(shí)間扭曲輪廓部分」(也被稱為 "cur_warp_contour,,)。從該初始狀態(tài)開始,一新扭曲輪廓部分例如在方法600的步驟610、620被計(jì)算。 因此,第三扭曲輪廓部分的扭曲輪廓數(shù)據(jù)值(也被指定為「扭曲輪廓部分3」或「新時(shí)間扭 曲輪廓部分」或“new_warp_COntOUr”)被計(jì)算。該計(jì)算可例如根據(jù)在圖9a中所示的算法 910被分成扭曲節(jié)點(diǎn)值的計(jì)算,及根據(jù)在圖9a中所示的算法920的在扭曲節(jié)點(diǎn)值之間的內(nèi) 插620。因此,一新扭曲輪廓部分722被獲得,該新扭曲輪廓部分722從預(yù)定值(例如1)開 始且被顯示在圖7a的圖形表現(xiàn)形態(tài)720中??煽闯龅氖?,第一時(shí)間扭曲輪廓部分716、第二 時(shí)間扭曲輪廓部分718及第三時(shí)間扭曲輪廓部分與相繼且連續(xù)的時(shí)間區(qū)間相關(guān)聯(lián)。再者, 可看出的是,在第二時(shí)間扭曲輪廓部分718的結(jié)束點(diǎn)718b與第三時(shí)間扭曲輪廓部分的起始 點(diǎn)722a之間存在一不連續(xù)724。應(yīng)注意的是,不連續(xù)724通常包含一幅度,該幅度大于一時(shí)間扭曲輪廓部分中的 時(shí)間扭曲輪廓的任何兩個(gè)時(shí)間相鄰扭曲輪廓數(shù)據(jù)值之間的變化。這是由于第三時(shí)間扭曲輪 廓部分722的初始值722a被施加為預(yù)定值(例如1)且與第二時(shí)間扭曲輪廓部分718的終 值718b相獨(dú)立的事實(shí)。應(yīng)注意的是,不連續(xù)724從而大于兩個(gè)相鄰、離散扭曲輪廓數(shù)據(jù)值 之間的不可避免的變化。然而,第二時(shí)間扭曲輪廓部分718與第三時(shí)間扭曲輪廓部分722之間的這一不連 續(xù)對(duì)于時(shí)間扭曲輪廓數(shù)據(jù)值的進(jìn)一步使用而言將是不利的。因此,在方法600的步驟630,第一時(shí)間扭曲輪廓部分與第二時(shí)間扭曲輪廓部分被 共同地重新依比例調(diào)整。例如,第一時(shí)間扭曲輪廓部分716的時(shí)間扭曲輪廓數(shù)據(jù)值及第二 時(shí)間扭曲輪廓部分718的時(shí)間扭曲輪廓數(shù)據(jù)值通過乘以一重新依比例調(diào)整因數(shù)(也被指定 為“n0rm_fac”)來重新依比例調(diào)整。因此,第一時(shí)間扭曲輪廓部分716的一重新依比例調(diào) 整版本716’被獲得,且第二時(shí)間扭曲輪廓部分718的一重新依比例調(diào)整版本718’也被獲 得。相反,在這一重新依比例調(diào)整步驟,第三時(shí)間扭曲輪廓部分的左側(cè)通常不受影響,這可 在圖7a的圖形表現(xiàn)形態(tài)730中看出。重新依比例調(diào)整可被執(zhí)行,使得經(jīng)重新依比例調(diào)整的 結(jié)束點(diǎn)718b’包含與第三時(shí)間扭曲輪廓部分722的起始點(diǎn)722a至少近似相同的數(shù)據(jù)值。 因此,第一時(shí)間扭曲輪廓部分的重新依比例調(diào)整版本716’、第二時(shí)間扭曲輪廓部分的重新 依比例調(diào)整版本718’及第三時(shí)間扭曲輪廓部分722 —起形成一(近似)連續(xù)的時(shí)間扭曲 輪廓部分。特別地,該依比例調(diào)整可被執(zhí)行,使得經(jīng)重新依比例調(diào)整的結(jié)束點(diǎn)718b’與起始 點(diǎn)722a的數(shù)據(jù)值之間的差值不大于時(shí)間扭曲輪廓部分716’、718’、722中任何兩個(gè)相鄰數(shù) 據(jù)值之間的差值的最大值。因此,包含重新依比例調(diào)整的時(shí)間扭曲輪廓部分716’、718’及原始時(shí)間扭曲輪廓 部分722的近似連續(xù)的時(shí)間扭曲輪廓部分被用于計(jì)算在步驟640被執(zhí)行的時(shí)間扭曲控制信 息。例如,針對(duì)與第二時(shí)間扭曲輪廓部分718時(shí)間相關(guān)聯(lián)的音訊幀,時(shí)間扭曲控制信息可被計(jì)算。然而,在步驟640計(jì)算時(shí)間扭曲控制信息之后,在步驟650,一時(shí)間扭曲信號(hào)重建 可被執(zhí)行,這將在下文中較詳細(xì)地解釋。隨后,需要獲得下一音訊幀的時(shí)間扭曲控制信息。為了達(dá)到這一目的,第一時(shí)間扭 曲輪廓部分的重新依比例調(diào)整版本716’可被摒棄以節(jié)省存儲(chǔ)器,因?yàn)槠洳辉俦恍枰H欢?重新依比例調(diào)整版本716’自然也可被保存用于任何目的。此外,在新的計(jì)算上以第二時(shí)間 扭曲輪廓部分的重新依比例調(diào)整版本718’代替「上一時(shí)間扭曲輪廓部分」,這在圖7b中的 圖形表現(xiàn)形態(tài)740中可看出。再者,作為先前計(jì)算中之「新時(shí)間扭曲輪廓部分」的第三時(shí)間 扭曲輪廓部分722在下一計(jì)算中扮演「當(dāng)前時(shí)間扭曲輪廓部分」的角色。關(guān)聯(lián)性在圖形表 現(xiàn)形態(tài)740中被顯示。繼存儲(chǔ)器的這一更新(方法600的步驟660)之后,一新時(shí)間扭曲輪廓部分752被 計(jì)算,這可在圖形表現(xiàn)形態(tài)750中看出。為了達(dá)到這一目的,方法600的步驟610及步驟620 可在新的輸入數(shù)據(jù)下被重新執(zhí)行。第四時(shí)間扭曲輪廓部分752當(dāng)前作用為「新時(shí)間扭曲輪 廓部分」。如所看出的,在第三時(shí)間扭曲輪廓部分的結(jié)束點(diǎn)722b與第四時(shí)間扭曲輪廓部分 752的起始點(diǎn)752a之間通常存在不連續(xù)。這一不連續(xù)754通過接續(xù)重新依比例調(diào)整(方法 600的步驟630)第二時(shí)間扭曲輪廓部分的重新依比例調(diào)整版本718’及第三時(shí)間扭曲輪廓 部分722的原始版本來減小或消除。因此,第二時(shí)間扭曲輪廓部分的兩次重新依比例調(diào)整 版本718”及第三時(shí)間扭曲輪廓部分的一次重新依比例調(diào)整版本722’被獲得,這可從圖7b 中的圖形表現(xiàn)形態(tài)760看出。如所看出的,時(shí)間扭曲輪廓部分718”、722’、752形成一至少 近似連續(xù)的時(shí)間扭曲輪廓部分,該時(shí)間扭曲輪廓部分用于在重新執(zhí)行步驟640時(shí)計(jì)算時(shí)間 扭曲控制信息。例如,時(shí)間扭曲控制信息可根據(jù)時(shí)間扭曲輪廓部分718”、722’、752被計(jì)算, 該時(shí)間扭曲控制信息與集中在第二時(shí)間扭曲輪廓部分上的一音訊信號(hào)時(shí)間幀相關(guān)聯(lián)。應(yīng)注意的是,在一些情況下,期望每一時(shí)間扭曲輪廓部分具有一相關(guān)聯(lián)扭曲輪廓 和值。例如,第一扭曲輪廓和值可能與第一時(shí)間扭曲輪廓部分相關(guān)聯(lián)、第二扭曲輪廓和值可 能與第二時(shí)間扭曲輪廓部分相關(guān)聯(lián)等等。所述扭曲輪廓和值可例如用于在步驟640計(jì)算時(shí) 間扭曲控制信息。例如,扭曲輪廓和值可代表各自時(shí)間扭曲輪廓部分的扭曲輪廓數(shù)據(jù)值的和。然而, 因?yàn)闀r(shí)間扭曲輪廓部分被依比例調(diào)整,有時(shí)期望也依比例調(diào)整時(shí)間扭曲輪廓和值,使得時(shí) 間扭曲輪廓和值追隨其相關(guān)聯(lián)時(shí)間扭曲輪廓部分的特性。因此,當(dāng)?shù)诙r(shí)間扭曲輪廓部分 718被依比例調(diào)整以獲得其依比例調(diào)整版本718’時(shí),與該第二時(shí)間扭曲輪廓部分718相關(guān) 聯(lián)的扭曲輪廓和值可被依比例調(diào)整(例如通過相同的依比例調(diào)整因數(shù))。類似地,當(dāng)?shù)谝粫r(shí) 間扭曲輪廓部分716被依比例調(diào)整以獲得其依比例調(diào)整版本716’時(shí),與該第一時(shí)間扭曲輪 廓部分716相關(guān)聯(lián)的扭曲輪廓和值可被依比例調(diào)整(例如通過相同的依比例調(diào)整因數(shù)),如 果期望的話。再者,當(dāng)繼續(xù)考慮新時(shí)間扭曲輪廓部分時(shí),一重新相關(guān)聯(lián)(或存儲(chǔ)器重新分配)可 被執(zhí)行。例如,作用為計(jì)算與時(shí)間扭曲輪廓部分716’、718’、722相關(guān)聯(lián)的時(shí)間扭曲控制信 息的「當(dāng)前時(shí)間扭曲輪廓和值」的與第二時(shí)間扭曲輪廓部分的依比例調(diào)整版本718’相關(guān) 聯(lián)的扭曲輪廓和值可被認(rèn)為是用于計(jì)算與時(shí)間扭曲輪廓部分718”、722’、752相關(guān)聯(lián)的時(shí) 間扭曲控制信息的「上一時(shí)間扭曲和值」。類似地,與第三時(shí)間扭曲輪廓部分722相關(guān)聯(lián)的扭曲輪廓和值可被認(rèn)為是用于計(jì)算與時(shí)間扭曲輪廓部分716’、718’、722相關(guān)聯(lián)之時(shí)間扭 曲控制信息的「新扭曲輪廓和值」且可被映射以作為用于計(jì)算與時(shí)間扭曲輪廓部分718”、 722’、752相關(guān)聯(lián)之時(shí)間扭曲控制信息的「當(dāng)前扭曲輪廓和值」。再者,第四時(shí)間扭曲輪廓部 分752的最新計(jì)算的扭曲輪廓和值可作用為計(jì)算與時(shí)間扭曲輪廓部分718”、722’、752相關(guān) 聯(lián)之時(shí)間扭曲控制信息的「新扭曲輪廓和值」。根據(jù)圖8的例子圖8顯示繪示通過根據(jù)本發(fā)明的實(shí)施例解決之問題的圖形表現(xiàn)形態(tài)。第一圖形表 現(xiàn)形態(tài)810顯示以一些習(xí)知實(shí)施例所獲得的一經(jīng)重建的相對(duì)基頻隨時(shí)間推移的時(shí)間演化。 橫坐標(biāo)812描述時(shí)間,縱坐標(biāo)814描述相對(duì)基頻。曲線816顯示可從相對(duì)基頻信息被重建 的相對(duì)基頻隨時(shí)間推移的時(shí)間演化。關(guān)于相對(duì)基頻輪廓的重建,應(yīng)注意的是,對(duì)于應(yīng)用時(shí)間 扭曲修正型離散余弦轉(zhuǎn)換(MDCT)而言,只是對(duì)實(shí)際幀中的基頻的相對(duì)變化的知曉是必要 的。為了理解這一點(diǎn),現(xiàn)參考用于從相對(duì)基頻輪廓獲得時(shí)間輪廓的計(jì)算步驟,該步驟針對(duì)相 同的相對(duì)基頻輪廓的依比例調(diào)整版本產(chǎn)生相同的時(shí)間輪廓。因此,只編碼相對(duì)而非絕對(duì)基 頻值就足夠,而這增加了編碼效率。為了進(jìn)一步增加效率,實(shí)際量化值不是相對(duì)基頻而是基 頻中的相對(duì)改變,即當(dāng)前相對(duì)基頻與先前相對(duì)基頻的比(這將在下文中詳細(xì)地討論)。在例 如信號(hào)根本不顯示出諧波結(jié)構(gòu)的一些幀中,可能并不希望時(shí)間扭曲。在這些情況下,額外的 旗標(biāo)可以可取舍地指示一平坦基頻而非用上述方法編碼這一平坦輪廓。因?yàn)樵谡鎸?shí)世界的 信號(hào)中,這些幀的數(shù)量通常足夠高,所以在全部時(shí)刻加入的該額外比特與保存用于非扭曲 幀的比特之間的折中有利于比特節(jié)省。用于計(jì)算基頻變化(相對(duì)基頻輪廓、或時(shí)間扭曲輪廓)的初始值可被任意地選擇, 且甚至在編碼器與解碼器中會(huì)是不同的。由于時(shí)間扭曲MDCT(TW-MDCT)的性質(zhì),基頻變化 的不同初始值仍然產(chǎn)生相同的樣本位置及適合的窗口形狀以執(zhí)行TW-MDCT。例如,一(音訊)編碼器獲得每一節(jié)點(diǎn)的基頻輪廓,其在連同一非必需的濁音/清 音說明的樣本中被表現(xiàn)為實(shí)際基頻延遲,該濁音/清音說明例如是通過應(yīng)用從語音編碼所 知的一基頻估計(jì)及濁音/清音判定獲得。若對(duì)于當(dāng)前節(jié)點(diǎn)而言,分類被設(shè)定為濁音,或無濁 音/清音判定可利用,則編碼器計(jì)算實(shí)際基頻延遲間的比并將其量化,或如果是清音則只 設(shè)定該比為1。另一例子可能是基頻變化通過一種合適方法(例如信號(hào)變化估計(jì))直接估 計(jì)。在解碼器中,在編碼音訊的起始處的第一相對(duì)基頻的初始值被設(shè)定為一任意值, 例如設(shè)定為1。因此,解碼相對(duì)基頻輪廓不再處于與編碼器基頻輪廓相同的絕對(duì)范圍內(nèi)而 是它的一依比例調(diào)整版本。然而,如上所述,TW-MDCT算法產(chǎn)生相同的樣本位置與窗口形 狀。此外,若編碼基頻比將產(chǎn)生一平坦基頻輪廓,則編碼器可能決定不發(fā)送完全編碼輪廓, 而是將activePitchData旗標(biāo)設(shè)定為0,以在這一幀中節(jié)省比特(例如在這一幀中節(jié)省 numPitchbits氺numPitches 個(gè)比特)。在下文中,在不存在發(fā)明的基頻輪廓重新正規(guī)化之情況下發(fā)生的問題將予以討 論。如上所述,對(duì)于TW-MDCT而言,只需要在圍繞當(dāng)前區(qū)塊的某一有限時(shí)間間距范圍內(nèi)的相 對(duì)基頻改變用于計(jì)算時(shí)間扭曲與正確的窗口形狀調(diào)適(參考上文的解釋)。時(shí)間扭曲針對(duì) 檢測(cè)到基頻改變的部分采用解碼輪廓,并且在所有其他情況下保持恒定(參考圖8的圖形 表現(xiàn)形態(tài)810)。對(duì)于計(jì)算一個(gè)區(qū)塊的窗口與取樣位置而言,需要三個(gè)連續(xù)的相對(duì)基頻輪廓部分(例如三個(gè)時(shí)間扭曲輪廓部分),其中第三個(gè)是該幀中新近被傳送的一者(被指定為 「新時(shí)間扭曲輪廓部分」),而其他的兩個(gè)過去被緩存(例如被指定為「上一時(shí)間扭曲輪廓部 分」與「當(dāng)前時(shí)間扭曲輪廓部分」)。為了獲得一例子,例如參考圖7a及圖7b以及圖8的圖形表現(xiàn)形態(tài)810、860所做 出的解釋。為了計(jì)算例如用于從幀0延伸到幀2的幀1的(或與幀1相關(guān)聯(lián)的)窗口的取 樣位置,幀0、1及2的(或與幀0、1及2相關(guān)聯(lián)的)基頻輪廓是需要的。在比特流中,只幀 2的基頻信息在當(dāng)前幀中被發(fā)送,而其他兩個(gè)從過去獲得。如在這里所解釋的,通過將第一 解碼相對(duì)基頻比施加到幀1的上一基頻以獲得在幀2的第一節(jié)點(diǎn)處的基頻等等,基頻輪廓 可以是連續(xù)的。由于信號(hào)的性質(zhì),現(xiàn)在可能的是,若基頻輪廓是簡(jiǎn)單連續(xù)的(即若新近被傳 送的輪廓部分被附接到現(xiàn)存的兩個(gè)部分而未加以任何修改),編碼器的內(nèi)部數(shù)字格式中的 范圍上溢在某一時(shí)間之后發(fā)生。例如,信號(hào)可能以具有強(qiáng)諧波特性及在開始處具有一高基 頻值的一部分開始,其中該高基頻值在該部分中不斷減小,從而產(chǎn)生不斷減小的相對(duì)基頻。 然后可能接著是不具有基頻信息的一部分,使得相對(duì)基頻保持恒定。然后,一諧波部分可能 再次以較先前部分中的最后絕對(duì)基頻高的一絕對(duì)基頻開始,且再次下降。然而,若我們只使 相對(duì)基頻連續(xù),則其與在上一諧波部分的末尾處相同,且將進(jìn)一步下降等等。若信號(hào)足夠強(qiáng) 且在其諧波部分具有一總體上升或下降的趨勢(shì)(如在圖8的圖形表現(xiàn)形態(tài)810中所示),相 對(duì)基頻遲早要達(dá)到內(nèi)部數(shù)字格式之范圍的邊界。從語音編碼所周知的是,語音信號(hào)的確顯 示出此特性。因此,當(dāng)使用上述的習(xí)知方法時(shí),編碼包括語音的真實(shí)世界信號(hào)的一序連集合 在一相對(duì)短暫時(shí)間后實(shí)際超出用于相對(duì)基頻的浮點(diǎn)數(shù)值范圍并不令人吃驚??傊?,對(duì)于其中基頻可被決定的音訊信號(hào)部分(或幀),相對(duì)基頻輪廓(或時(shí)間扭 曲輪廓)的合適演化可被決定。對(duì)于其中基頻不可被決定(例如因?yàn)橐粲嵭盘?hào)部分是類似 噪聲)的音訊信號(hào)部分(或音訊信號(hào)幀),相對(duì)基頻輪廓(或時(shí)間扭曲輪廓)可被保持恒 定。因此,若在具有不斷增加基頻與不斷減小基頻的音訊部分之間存在不平衡,則相對(duì)基頻 輪廓(或時(shí)間扭曲輪廓)將陷入數(shù)值下溢或數(shù)值上溢。例如,在圖形表現(xiàn)形態(tài)810中,針對(duì)存在具有不斷減小基頻的多個(gè)相對(duì)基頻輪廓 部分820a、820a、820c、820d以及不具有基頻的一些音訊部分822a、822b,而不存在具有不 斷增加基頻之音訊部分的情況,一相對(duì)基頻輪廓被顯示。因此,可看出的是,相對(duì)基頻輪廓 816陷入數(shù)值下溢(至少在非常不利的情況下)。在下文中,針對(duì)這一問題的解決方案將予以描述。為了避免上述問題,特別是數(shù)值 下溢或上溢,根據(jù)本發(fā)明的一層面的一周期性相對(duì)基頻輪廓重新正規(guī)化已被引入。因?yàn)榕?曲時(shí)間輪廓與窗口形狀的計(jì)算只依賴于上述三個(gè)相對(duì)基頻輪廓部分(也被指定為「時(shí)間扭 曲輪廓部分」)上的相對(duì)改變,如這里所解釋的,用相同的結(jié)果重新正規(guī)化(例如音訊信號(hào) 之)每一幀的這一輪廓(例如可由三個(gè)「時(shí)間扭曲輪廓部分」組成的時(shí)間扭曲輪廓)是可 能的。為此,例如選擇第二輪廓部分(也被指定為「時(shí)間扭曲輪廓部分」)中的最后樣本 作為參考,且輪廓此時(shí)以使這一樣本具有一值1. 0的方式被正規(guī)化(例如在線性域中倍增) (參考圖8中的圖形表現(xiàn)形態(tài)860)。圖8的圖形表現(xiàn)形態(tài)860表示相對(duì)基頻輪廓正規(guī)化。橫坐標(biāo)862顯示以幀(幀0、 1、2)被再分的時(shí)間??v坐標(biāo)864描述相對(duì)基頻輪廓的值。
在正規(guī)化之前的相對(duì)基頻輪廓用870標(biāo)明且覆蓋兩個(gè)幀(例如幀標(biāo)編號(hào)0及幀標(biāo) 編號(hào)1)。從預(yù)定相對(duì)基頻輪廓初始值(或時(shí)間扭曲輪廓初始值)開始的一新相對(duì)基頻輪廓 部分(也被指定為「時(shí)間扭曲輪廓部分」)用874標(biāo)明。如所看到的,新相對(duì)基頻輪廓部分 874從該預(yù)定相對(duì)基頻輪廓初始值(例如1)的重新開始帶來在重新開始時(shí)間點(diǎn)之前的相對(duì) 基頻輪廓部分870與新相對(duì)基頻輪廓部分874之間的不連續(xù),該不連續(xù)用878標(biāo)明。這一 不連續(xù)將對(duì)根據(jù)輪廓的任何時(shí)間扭曲控制信息的導(dǎo)出帶來嚴(yán)重的問題,且可能會(huì)產(chǎn)生音訊 失真。因此,先前所獲得的在重新開始時(shí)間點(diǎn)重新開始之前的相對(duì)基頻輪廓部分870被重 新依比例調(diào)整(或被正規(guī)化),以獲得一重新依比例調(diào)整相對(duì)基頻輪廓部分870’。該正規(guī) 化被執(zhí)行,使得相對(duì)基頻輪廓部分870中的最后樣本被依比例調(diào)整為預(yù)定相對(duì)基頻輪廓初 始值(例如1. 0)。算法的詳細(xì)描述在下文中,通過根據(jù)本發(fā)明之一實(shí)施例的一音訊解碼器執(zhí)行的一些算法將予以詳 細(xì)地描述。為了達(dá)到這一目的,現(xiàn)參考圖5、圖6、圖9a、圖%、圖9c及圖lOa-lOg。再者,參 考圖Ila及圖lib中的數(shù)據(jù)元素、輔助元素及常數(shù)的圖例。一般而言,可以說在這里所描述的方法可用于解碼根據(jù)一時(shí)間扭曲修正型離散 余弦轉(zhuǎn)換被編碼的音訊流。因此,當(dāng)TW-MDCT針對(duì)音訊流被致能時(shí)(這可由例如被稱為 “twMdct”旗標(biāo)的一旗標(biāo)指示,該旗標(biāo)可能被包含在一特定配置信息中),一時(shí)間扭曲濾波器 組與區(qū)塊交換可取代一標(biāo)準(zhǔn)濾波器組與區(qū)塊交換。除反修正型離散余弦反轉(zhuǎn)換(IMDCT)之 外,時(shí)間扭曲濾波器組與區(qū)塊交換包含從一任意間隔時(shí)間網(wǎng)格到正常規(guī)則間隔時(shí)間網(wǎng)格的 時(shí)域到時(shí)域映射及窗口形狀的對(duì)應(yīng)調(diào)適。在下文中,解碼過程將被描述。在第一步,扭曲輪廓被解碼。扭曲輪廓可能例如使 用扭曲輪廓節(jié)點(diǎn)的碼簿索引被編碼。扭曲輪廓節(jié)點(diǎn)的碼簿索引例如使用在圖9a的圖形表 現(xiàn)形態(tài)910中所示的算法來解碼。根據(jù)該算法,扭曲比值(Warp_valUe_tbl)例如使用由圖 9c中的映射表990所定義的映射從扭曲比碼簿索引(tw-ratio)得到。如從參考數(shù)字910 所示的算法看出的是,若旗標(biāo)(tW_data_present)指示時(shí)間扭曲數(shù)據(jù)不存在,則扭曲節(jié)點(diǎn) 值可被設(shè)定為一恒定預(yù)定值。相反,若該旗標(biāo)指示時(shí)間扭曲數(shù)據(jù)是存在的,則第一扭曲節(jié)點(diǎn) 值可被設(shè)定為預(yù)定時(shí)間扭曲輪廓初始值(例如1)。(一時(shí)間扭曲輪廓部分的)接續(xù)的扭曲 節(jié)點(diǎn)值可根據(jù)多重時(shí)間扭曲比值的一乘積來決定。例如,緊接第一扭曲節(jié)點(diǎn)(i = 0)的一 節(jié)點(diǎn)的扭曲節(jié)點(diǎn)值可等于第一扭曲比值(若初始值為1)或等于第一扭曲比值與初始值的 乘積。接續(xù)的時(shí)間扭曲節(jié)點(diǎn)值(i = 2、3、···, num_tw_nodes)通過形成多重時(shí)間扭曲比值 (可取舍地考慮初始值,若初始值不等于1的話)的一乘積來計(jì)算。自然,乘積形成的順序 是任意的。然而,通過將第i扭曲節(jié)點(diǎn)值乘以一單一扭曲比值而從第i扭曲節(jié)點(diǎn)值得到第 (i+Ι)扭曲節(jié)點(diǎn)值是有利的,其中該單一扭曲比值描述時(shí)間扭曲輪廓的兩個(gè)接續(xù)節(jié)點(diǎn)值之 間的比例。如可從在參考數(shù)字910處所示的算法看出的,對(duì)于一單一音訊幀上的一單一時(shí)間 扭曲輪廓部分而言,可能存在多個(gè)扭曲比碼薄索引(其中在時(shí)間扭曲輪廓部分與音訊幀之 間可能存在一對(duì)一對(duì)應(yīng))。總之,在步驟610,針對(duì)一特定時(shí)間扭曲輪廓部分(或一特定音訊幀),多個(gè)時(shí) 間扭曲節(jié)點(diǎn)值可例如使用扭曲節(jié)點(diǎn)值計(jì)算器544被獲得。隨后,一線性內(nèi)插可在時(shí)間扭曲節(jié)點(diǎn)值(Warp_n0de_ValUeS[i])之間被執(zhí)行。例如,為了獲得「新時(shí)間扭曲輪廓部分」 (new_warp_contour)的時(shí)間扭曲輪廓數(shù)據(jù)值,在圖9a的參考數(shù)字920處所示的算法可被 使用。例如,新時(shí)間扭曲輪廓部分中的樣本數(shù)目等于反修正型離散余弦反轉(zhuǎn)換的時(shí)域樣本 數(shù)目的一半。關(guān)于這一問題,應(yīng)注意的是,相鄰音訊信號(hào)幀通常被移位(至少近似)MDCT 或IMDCT的時(shí)域樣本數(shù)目的一半。換言之,為了獲得樣本式(N_long個(gè)樣本)new_warp_ contour[], warp_node_values[]使用在參考數(shù)字920處所示的算法被線性內(nèi)插在被相等 間隔(interp_diSt分開)的節(jié)點(diǎn)之間。內(nèi)插可以例如通過圖5之裝置的內(nèi)插器548或者在算法600的步驟620被執(zhí)行。在獲得針對(duì)這一幀(即當(dāng)前在考慮中的幀)的全部扭曲輪廓之前,過去被緩存的 值被重新依比例調(diào)整,使得paSt_Warp_COntOUr[]的最后扭曲值等于1(或任何其他預(yù)定 值,較佳地,等于新時(shí)間扭曲輪廓部分的初始值)。這里應(yīng)注意的是,術(shù)語「過去扭曲輪廓(past warp contour)」較佳地包含上述「上 一時(shí)間扭曲輪廓部分」及上述「當(dāng)前時(shí)間扭曲輪廓部分」。也應(yīng)注意的是,「過去扭曲輪廓」 通常包含等于IMDCT中時(shí)域樣本數(shù)目的一長(zhǎng)度,使得「過去扭曲輪廓」的值用在0與2*n_ Iong-I之間的索引來標(biāo)明。因此,“past_warp_contour[2*n_long-l]”標(biāo)明「過去扭曲輪 廓」的一最后扭曲值。因此,正規(guī)化因子“n0rm_fac”可根據(jù)在圖9a的參考數(shù)字930處所示 的方程式來計(jì)算。因此,過去扭曲輪廓(包含「上一時(shí)間扭曲輪廓部分」與「當(dāng)前時(shí)間扭曲 輪廓部分」)可根據(jù)在圖9a的參考數(shù)字932處所示的方程式來成倍地重新依比例調(diào)整。此 夕卜,「上一扭曲輪廓和值」(last_Warp_sum)與「當(dāng)前扭曲輪廓和值」(cur_warp_sum)可被 成倍地重新依比例調(diào)整,如在圖9a的參考數(shù)字934及936處所示。該重新依比例調(diào)整可由 圖5的重新依比例調(diào)整器550或在圖6的方法600的步驟630被執(zhí)行。應(yīng)注意的是,在這里(例如在參考數(shù)字930處)所描述的正規(guī)化然后可被修改,例 如通過用任何其他所期望的預(yù)定值取代初始值「1」。通過施加正規(guī)化,也被指定作為一「時(shí)間扭曲輪廓部分」的“fullwarp_ contour [],,通過序連"past_warp_contour,,%“new_warp_contour,,:5(^||0 因此,三個(gè)時(shí) 間扭曲輪廓部分(「上一時(shí)間扭曲輪廓部分」、「當(dāng)前時(shí)間扭曲輪廓部分」及「新時(shí)間扭曲輪 廓部分」)形成「全部扭曲輪廓(full warp contour)」,這在進(jìn)一步的計(jì)算步驟中可能被應(yīng)用。此外,一扭曲輪廓和值(new_warp_sum)被計(jì)算,例如作為所有“ new_warp_ contour [] ”值的和。例如,新扭曲輪廓和值可根據(jù)在圖9a的參考數(shù)字940處所示的算法計(jì)算。接著上述計(jì)算,被時(shí)間扭曲控制信息計(jì)算器330或方法600的步驟640所需要的 輸入信息是可得的。因此,時(shí)間扭曲控制信息的計(jì)算640可例如通過時(shí)間扭曲控制信息計(jì) 算器530來執(zhí)行。同樣地,時(shí)間扭曲信號(hào)重建650可通過音訊解碼器來執(zhí)行。計(jì)算640與 時(shí)間扭曲信號(hào)重建650兩者將在下文中較詳細(xì)地解釋。然而,注意到本算法一再地繼續(xù)進(jìn)行是重要的。從而在計(jì)算上有效率,以更新存儲(chǔ) 器。例如,丟棄關(guān)于上一時(shí)間扭曲輪廓部分的信息是可能的。再者,使用當(dāng)前的「當(dāng)前時(shí)間 扭曲輪廓部分」作為下一計(jì)算周期中的「上一時(shí)間扭曲輪廓部分」是可取的。再者,使用當(dāng) 前的「新時(shí)間扭曲輪廓部分」作為下一計(jì)算周期中的「當(dāng)前時(shí)間扭曲輪廓部分」是可取的。這一分配可使用在圖9b的參考數(shù)字950處所示的方程式來做出,(其中Warp_Contour[n] 描述當(dāng)前的「新時(shí)間扭曲輪廓部分」,其中2*n_long彡η < 3 · n_long)。合適的分配可在圖9b的參考數(shù)字952及954處看到。換言之,用于解碼下一幀的存儲(chǔ)器緩沖器可根據(jù)在參考數(shù)字950、952及954處所 示的方程式來更新。應(yīng)注意的是,若沒有針對(duì)一先前幀產(chǎn)生合適的信息,則根據(jù)方程式950、952及954 的更新不提供合理的結(jié)果。因此,在解碼第一幀之前,或若最后幀用在交換編碼器的背景脈 絡(luò)中的一不同類型編碼器(例如一 LPC域編碼器)編碼,則存儲(chǔ)器的狀態(tài)可根據(jù)在圖9b的 參考數(shù)字960、962及964處所示的方程式來設(shè)定。時(shí)間扭曲控制信息的計(jì)算在下文中,將簡(jiǎn)要地描述時(shí)間扭曲控制信息可如何根據(jù)時(shí)間扭曲輪廓(包含例如 三個(gè)時(shí)間扭曲輪廓部分)及根據(jù)扭曲輪廓和值來計(jì)算。例如,所期望的是使用時(shí)間扭曲輪廓來重建時(shí)間輪廓。為了達(dá)到這一目的,在 圖IOa的參考數(shù)字1010、1012處所示的算法可被使用。如所看出的,時(shí)間輪廓將一索引 i(0彡i彡3 -n.long)映射到一對(duì)應(yīng)時(shí)間輪廓值上。這種映射的一例子被顯示在圖12中。基于時(shí)間輪廓的計(jì)算,通常需要計(jì)算樣本位置(Sample_p0S[]),該樣本位置描述 以一線性時(shí)間依比例調(diào)整的時(shí)間扭曲樣本的位置。這種計(jì)算可使用在圖IOb的參考數(shù)字 1030處所示的算法來執(zhí)行,在算法1030中,在圖IOa的參考數(shù)字1020及1022處所示的輔 助函數(shù)可被使用。因此,關(guān)于取樣時(shí)間的信息可被獲得。此夕卜,時(shí)間扭曲過渡的某些長(zhǎng)度(warp_trans_len_left ;warped_trans_ lenright)例如使用在圖IOb中所示的算法1032來計(jì)算??扇∩岬?,時(shí)間扭曲過渡長(zhǎng)度可 依據(jù)窗口類型或轉(zhuǎn)換長(zhǎng)度來調(diào)整,例如使用在圖IOb的參考數(shù)字1034處所示的算法。此 外,所謂的「第一位置」及所謂的「最后位置」可以根據(jù)過渡長(zhǎng)度信息,例如使用在圖IOb的 參考數(shù)字1036處所示的算法來計(jì)算??傊?,可通過裝置530或在方法600的步驟640被執(zhí) 行的樣本位置與窗口長(zhǎng)度調(diào)整將被執(zhí)行。從“Warp_C0nt0Ur[] ”,以一線性時(shí)間調(diào)整的時(shí)間 扭曲樣本的一樣本位置向量(“Sample_p0S□”)可被計(jì)算。為此,首先,時(shí)間輪廓可使用 在參考數(shù)字1010、1012處所示的算法來產(chǎn)生。在參考數(shù)字1020及1022處所示的輔助函數(shù) “warpjnjecO”及“warp_time_inv()” 下,樣本位置向量(“sample_p0s □”)及過渡長(zhǎng) 度(“warped_trans_len_left” 及 “warped_trans_len_right”)被計(jì)算,例如使用在參考 數(shù)字1030、1032、1034及1036處所示的算法。因此,時(shí)間扭曲控制信息512被獲得。時(shí)間扭曲信號(hào)重建在下文中,可根據(jù)時(shí)間扭曲控制信息被執(zhí)行的時(shí)間扭曲信號(hào)重建將被簡(jiǎn)要地討 論,以將時(shí)間扭曲輪廓的計(jì)算放入到合適的背景脈絡(luò)中音訊信號(hào)的重建包含執(zhí)行在這里沒有詳細(xì)描述的反修正型離散余弦反轉(zhuǎn)換,因?yàn)?其為本技術(shù)領(lǐng)域中的任何一個(gè)具有通常知識(shí)者所熟知。反修正型離散余弦反轉(zhuǎn)換的執(zhí)行允 許根據(jù)一組頻域系數(shù)重建扭曲時(shí)域樣本。執(zhí)行IMDCT例如可被逐幀式地執(zhí)行,這表示例如 一 2048扭曲時(shí)域樣本幀根據(jù)一 1024頻域系數(shù)組來重建。為了正確重建,接續(xù)的窗口重疊 不多于兩個(gè)是必要的。由于TW-MDCT的性質(zhì),可能發(fā)生的是,一個(gè)幀的反時(shí)間扭曲部分延伸 到一非相鄰幀,從而違反了上述前提。因此窗口形狀的衰落長(zhǎng)度需要通過計(jì)算上述合適的warped_trans_len_left 及 warped_trans_len_right 值來縮短。一窗口化與區(qū)塊交換650b而后被施加到從IMDCT所獲得的時(shí)域樣本。該窗口 化與區(qū)塊交換650b可依據(jù)時(shí)間扭曲控制信息被施加到由IMDCT 650a所提供的扭曲時(shí)域 樣本,以獲得窗口化扭曲時(shí)域樣本。例如,依據(jù)“windowjhape”信息或元素,不同的過取 樣轉(zhuǎn)換窗口原型可被使用,其中過取樣窗口的長(zhǎng)度可由在圖IOc的參考數(shù)字1040處所示 的方程式提出。例如,對(duì)于第一種類型的窗口形狀(例如wind0w_shape == 1)而言,窗 口系數(shù)根據(jù)在圖IOc的參考數(shù)字1042處所示的定義由凱薩爾-貝塞爾導(dǎo)出(KBD)窗口 ("Kaiser-Bessel" derived (KBD) window)提出,其中W’、「凱薩爾-貝塞爾核心窗口函數(shù) ("Kaiser-Bessel kernel window function,,)」被定義,如在圖 IOc 的參考數(shù)字 1044 處 所示。否則,當(dāng)一不同窗口形狀被使用時(shí)(例如,若Wind0W_Shape = = 0),一正弦窗口可 根據(jù)在參考數(shù)字1046處的定義被使用。對(duì)于所有種類的窗口序列(“windowjequences”) 而言,用于左窗口部分的原型通過先前區(qū)塊的窗口形狀來決定,在圖IOc的參考數(shù)字1048 處所示的公式表示這一事實(shí)。同樣地,用于右窗口形狀的原型通過在圖IOc的參考數(shù)字 1050處所示的公式來決定。在下文中,上述窗口對(duì)由IMDCT所提供的扭曲時(shí)域樣本的施加將予以描述。在一 些實(shí)施例中,幀的信息可由多個(gè)短序列(例如,八個(gè)短序列)提供。在其他實(shí)施例中,幀的 信息可使用具有不同長(zhǎng)度的區(qū)塊來提供,其中對(duì)于起始序列、停止序列及/或非標(biāo)準(zhǔn)長(zhǎng)度 序列而言,特別處理可能被需要。然而,因?yàn)檫^渡長(zhǎng)度可如上述那樣被決定,可能足以區(qū)分 使用八個(gè)短序列被編碼的幀(由合適的幀類型信息“eight_sh0rt_sequence”指示)與所 有其他幀。例如,在由八個(gè)短序列所描述的幀中,在圖IOd的參考數(shù)字1060處所示的算法可 被施加用于窗口化。相反,對(duì)于使用其他信息被編碼的幀而言,在圖IOe的參考數(shù)字1064處 所示的算法可被施加。換言之,在圖IOd中的參考數(shù)字1060處所示的類似C-程序碼部分 描述一所謂「八個(gè)短序列」的窗口化與內(nèi)部重疊相加。相反,在圖IOd的參考數(shù)字1064處 所示的類似C-程序碼部分描述其他情況下的窗口化。重新取樣在下文中,依據(jù)時(shí)間扭曲控制信息的窗口化扭曲時(shí)域樣本的反時(shí)間扭曲650c將 予以描述,從而規(guī)則取樣的時(shí)域樣本、或簡(jiǎn)單時(shí)域樣本通過時(shí)變重新取樣來獲得。在時(shí)變重 新取樣中,窗口化區(qū)塊z[]根據(jù)取樣位置來重新取樣,例如使用在圖IOf的參考數(shù)字1070 處所示的脈沖響應(yīng)。在重新取樣之前,窗口化區(qū)塊可在兩端用零填充,如在圖IOf的參考數(shù) 字1072處所示。重新取樣本身通過在圖IOf的參考數(shù)字1074處所示的偽碼部分來描述。后重新取樣器幀處理在下文中,時(shí)域樣本的一可取舍的后處理650d將予以描述。在一些實(shí)施例中,后 重新取樣幀處理可依據(jù)窗口序列的類型來執(zhí)行。依據(jù)參數(shù)“ windowjequence ”,某些進(jìn)一步 的處理步驟可被施加。例如,若窗口序列是一所謂的 “EIGHT_SHORT_SEQUENCE”、一所謂的 “L0NG_START_ SEQUENCE”、一所謂的 “SH0RT_START_1152_SEQUENCE” 后接一所謂的 LPD_SEQUENCE,則如在 參考數(shù)字1080a、1080b、1082處所示的后處理可被執(zhí)行。
例如,若下一窗口序列是一所謂的“LPD_SEQUENCE”,則一修正窗口 Wcm (η)可考慮 在參考數(shù)字1080b處所示的定義被計(jì)算,如在參考數(shù)字1080a處所示。同樣地,修正窗口 Wcorr (η)可被施加,如在圖IOg的參考數(shù)字1082處所示。對(duì)于所有其他情況而言,可能沒有什么要做,如在圖IOg的參考數(shù)字1084處所看 出的。與先前窗口序列的重疊與相加此外,當(dāng)前時(shí)域樣本與一個(gè)或多個(gè)先前時(shí)域樣本的重疊與相加650e可被執(zhí)行。對(duì) 于所有序列而言,該重疊與相加可能是相同的,且可如在圖IOg的參考數(shù)字1086處所示地 在數(shù)學(xué)上描述。圖例關(guān)于所提出的解釋,現(xiàn)參考在圖Ila及圖Ild中所示的圖例。特別地,反轉(zhuǎn)換的合 成窗口長(zhǎng)度N通常是語法元素“windowjequence”與算法脈絡(luò)的函數(shù)。其可例如被定義如 在圖lib的參考數(shù)字1190處所顯示。根據(jù)圖13的實(shí)施例圖13顯示用于提供重建時(shí)間扭曲輪廓信息的裝置1300的方塊概要圖,其中該裝 置1300接管參考圖5所描述的裝置520的功能。然而,數(shù)據(jù)路徑與緩沖器被較詳細(xì)地顯示。 該裝置1300包含執(zhí)行扭曲節(jié)點(diǎn)值計(jì)算器544之功能的一扭曲節(jié)點(diǎn)值計(jì)算器1344。該扭曲節(jié) 點(diǎn)值計(jì)算器1344接收扭曲比的碼薄索引“tw_rati0□”作為編碼扭曲比信息。扭曲節(jié)點(diǎn)值 計(jì)算器包含一扭曲值表格表示,例如在圖9c中所表示的時(shí)間扭曲比索引到時(shí)間扭曲比值 上的映射。扭曲節(jié)點(diǎn)值計(jì)算器1344可進(jìn)一步包含用于執(zhí)行在圖9a的參考數(shù)字910處所表 示的算法的一乘法器。因此,扭曲節(jié)點(diǎn)值計(jì)算器提供扭曲節(jié)點(diǎn)值“warpjodejaluesti] ”。 再者,裝置1300包含一扭曲輪廓內(nèi)插器1348,該扭曲輪廓內(nèi)插器1348起內(nèi)插器540a的功 能且可被組配成執(zhí)行在圖9a的參考數(shù)字920處所示的算法,從而獲得新扭曲輪廓(“neW_ warp_contour")的值。裝置1300進(jìn)一步包含一新扭曲輪廓緩沖器1350,該新扭曲輪廓緩 沖器1350儲(chǔ)存新扭曲輪廓的值(即warp_contour[i],其中2 ·η_1οηδ彡i < 3 ·η_1οηδ)。 裝置1300進(jìn)一步包含一過去扭曲輪廓緩沖器/更新器1360,該過去扭曲輪廓緩沖器/更新 器1360儲(chǔ)存「上一時(shí)間扭曲輪廓部分」與「當(dāng)前時(shí)間扭曲輪廓部分」且根據(jù)一重新依比例 調(diào)整及根據(jù)當(dāng)前幀之處理的完成更新存儲(chǔ)器的內(nèi)容。因此,該過去扭曲輪廓緩沖器/更新 器1360可與過去扭曲輪廓重新依比例調(diào)整器1370協(xié)同工作,使得該過去扭曲輪廓緩沖器 /更新器與該過去扭曲輪廓重新依比例調(diào)整器一起完成算法930、932、934、936、950、960的 功能??扇∩岬?,該過去扭曲輪廓緩沖器/更新器1360也可接管算法932、936、952、954、 962,964的功能。因此,裝置1300提供扭曲輪廓(“warp_C0nt0ur”)且最佳地也提供扭曲輪廓和值。根據(jù)圖14的音訊信號(hào)編碼器在下文中,根據(jù)本發(fā)明的一層面的音訊信號(hào)編碼器將予以描述。圖14的該音訊信 號(hào)編碼器整體用1400標(biāo)明。該音訊信號(hào)編碼器被組配成接收音訊信號(hào)1410,及可取舍地, 與該音訊信號(hào)1410相關(guān)聯(lián)的一在外部被提供的扭曲輪廓信息1412。再者,該音訊信號(hào)編碼 器1400被組配成提供音訊信號(hào)1410的一編碼表現(xiàn)形態(tài)1440。
音訊信號(hào)編碼器1400包含一時(shí)間扭曲輪廓編碼器1420,該時(shí)間扭曲輪廓編碼器 1420被組配成接收與音訊信號(hào)1410相關(guān)聯(lián)的時(shí)間扭曲輪廓信息1422,且據(jù)以提供一編碼 時(shí)間扭曲輪廓信息1424。音訊信號(hào)編碼器1400進(jìn)一步包含一時(shí)間扭曲信號(hào)處理器(或時(shí)間扭曲信號(hào)編碼 器)1430,該時(shí)間扭曲信號(hào)處理器1430被組配成接收音訊信號(hào)1410,以及據(jù)以提供音訊信 號(hào)1410的時(shí)間扭曲編碼表現(xiàn)形態(tài)1432,將時(shí)間扭曲信息1422所描述的時(shí)間扭曲考慮在內(nèi)。 音訊信號(hào)1410的編碼表現(xiàn)形態(tài)1414包含編碼時(shí)間扭曲輪廓信息1424及音訊信號(hào)1410的 頻譜的編碼表現(xiàn)形態(tài)1432??扇∩岬?,音訊信號(hào)編碼器1400包含一扭曲輪廓信息計(jì)算器1440,該扭曲輪廓信 息計(jì)算器1440被組配成根據(jù)音訊信號(hào)1410提供時(shí)間扭曲輪廓信息1422。然而,或者,該時(shí) 間扭曲輪廓信息1422可根據(jù)在外部被提供的扭曲輪廓信息1412來提供。時(shí)間扭曲輪廓編碼器1420可被組配成計(jì)算由時(shí)間扭曲輪廓信息1422所描述的時(shí) 間扭曲輪廓之接續(xù)節(jié)點(diǎn)值之間的比例。例如,所述節(jié)點(diǎn)值可能是由時(shí)間扭曲輪廓信息所表 示的時(shí)間扭曲輪廓的樣本值。例如,若針對(duì)音訊信號(hào)1410的每一幀,時(shí)間扭曲輪廓信息包 含多個(gè)值,時(shí)間扭曲節(jié)點(diǎn)值可以是這一時(shí)間扭曲輪廓信息的一真正的子集。例如,時(shí)間扭曲 節(jié)點(diǎn)值可以是時(shí)間扭曲輪廓值的一周期性真正子集。每N個(gè)音訊樣本可能存在一時(shí)間扭曲 輪廓節(jié)點(diǎn)值,其中N可能大于或等于2。時(shí)間扭曲輪廓節(jié)點(diǎn)值比例計(jì)算器可被組配成計(jì)算時(shí)間扭曲輪廓的接續(xù)時(shí)間扭曲 節(jié)點(diǎn)值之比,從而提供描述時(shí)間扭曲輪廓的接續(xù)節(jié)點(diǎn)值之比的信息。時(shí)間扭曲輪廓編碼器 的比例編碼器可被組配成編碼時(shí)間扭曲輪廓的接續(xù)節(jié)點(diǎn)值之比。例如,比例編碼器可將不 同比例映射到不同的碼薄索引。例如,一映射可被選擇,使得由時(shí)間扭曲輪廓值比例計(jì)算器 所提供的比例在0. 9與1. 1之間或者甚至在0. 95與1. 05之間的一范圍內(nèi)。因此,該比例 編碼器可被組配成將這一范圍映射到不同的碼薄索引。例如,在圖9c的表格中所示的對(duì)應(yīng) 關(guān)系可作為這一映射中的支持點(diǎn),使得例如一比例1被映射到碼薄索引3上,而比例1. 0057 被映射到碼薄索引4上等等(比較圖9c)。在圖9c的表格中所示的那些之間的比值可被映 射到合適的碼薄索引,例如對(duì)在圖9c的表格中所示的碼薄索引而言,映射到最接近比值的 碼薄索引。自然,不同的編碼可被使用,使得例如一些可用碼薄索引可被選擇較這里所顯示 的大或小。同樣地,在扭曲輪廓節(jié)點(diǎn)值與碼薄值索引之間的相關(guān)聯(lián)性可被合適地選擇。同 樣地,碼薄索引可使用例如二進(jìn)制編碼、可取舍地使用熵編碼來編碼。因此,編碼比例1424被獲得。時(shí)間扭曲信號(hào)處理器1430包含一時(shí)間扭曲時(shí)域到頻域轉(zhuǎn)換器1434,該轉(zhuǎn)換器 1434被組配成接收音訊信號(hào)1410及與該音訊信號(hào)(或其一編碼版本)相關(guān)聯(lián)的時(shí)間扭曲 輪廓信息1422a,以及據(jù)以提供一頻譜域(頻域)表現(xiàn)形態(tài)1436。時(shí)間扭曲輪廓信息1422a可較佳地使用一輪廓解碼器1425從由時(shí)間扭曲輪廓編 碼器1420所提供的編碼信息1424得到。以此方式,可實(shí)現(xiàn)的是,編碼器(特別是其時(shí)間扭 曲信號(hào)處理器1430)及解碼器(接收音訊信號(hào)的編碼表現(xiàn)形態(tài)1414)在同一扭曲輪廓(即 解碼(時(shí)間)扭曲輪廓)上操作。然而,在一簡(jiǎn)化實(shí)施例中,時(shí)間扭曲信號(hào)處理器1430所 使用的時(shí)間扭曲輪廓信息1422a可與輸入到時(shí)間扭曲輪廓編碼器1420的時(shí)間扭曲輪廓信息1422相同。當(dāng)例如使用音訊信號(hào)1410的時(shí)變重新依比例調(diào)整操作形成頻域表現(xiàn)形態(tài)1436 時(shí),時(shí)間扭曲時(shí)域到頻域轉(zhuǎn)換器1434可例如考慮時(shí)間扭曲。然而,可取舍地,時(shí)變重新依比 例調(diào)整與時(shí)域到頻域轉(zhuǎn)換被整合在一單一處理步驟中。時(shí)間扭曲信號(hào)處理器也包含一頻譜 值編碼器1438,該頻譜值編碼器1438被組配成編碼頻域表現(xiàn)形態(tài)1436。頻譜值編碼器1438 可例如被組配成考慮知覺遮蔽。同樣地,頻譜值編碼器1438可被組配成使編碼精確性適應(yīng) 頻帶的知覺相關(guān)性以及施加一熵編碼。因此,音訊信號(hào)1410的編碼表現(xiàn)形態(tài)1432被獲得。根據(jù)圖15的時(shí)間扭曲輪廓計(jì)算器圖15顯示根據(jù)本發(fā)明之另一實(shí)施例的時(shí)間扭曲輪廓計(jì)算器的方塊概要圖。時(shí)間 扭曲輪廓計(jì)算器1500被組配成接收一編碼扭曲比信息1510,以便據(jù)以提供多個(gè)扭曲節(jié)點(diǎn) 值1512。該時(shí)間扭曲輪廓計(jì)算器1500包含例如一扭曲比解碼器1520,該扭曲比解碼器1520 被組配成從編碼扭曲比信息1510得到一扭曲比值序列1522。該時(shí)間扭曲輪廓計(jì)算器1500 也包含一扭曲輪廓計(jì)算器1530,該扭曲輪廓計(jì)算器1530被組配成從扭曲比值序列1522得 到扭曲節(jié)點(diǎn)值序列1512。例如,扭曲輪廓計(jì)算器可被組配成獲得從一扭曲輪廓初始值開始 的扭曲輪廓節(jié)點(diǎn)值,其中與一扭曲輪廓起始點(diǎn)相關(guān)聯(lián)的扭曲輪廓初始值與扭曲輪廓節(jié)點(diǎn)值 之比由扭曲比值1522決定。扭曲節(jié)點(diǎn)值計(jì)算器亦被組配成根據(jù)一乘積形成計(jì)算以一中間 扭曲輪廓節(jié)點(diǎn)與扭曲輪廓起始點(diǎn)隔開的一特定扭曲輪廓節(jié)點(diǎn)的扭曲輪廓節(jié)點(diǎn)值1512,且該 乘積包含扭曲輪廓初始值(例如1)與中間扭曲輪廓節(jié)點(diǎn)的扭曲輪廓節(jié)點(diǎn)值之比、及中間扭 曲輪廓節(jié)點(diǎn)的扭曲輪廓節(jié)點(diǎn)值與該特定扭曲輪廓節(jié)點(diǎn)的扭曲輪廓節(jié)點(diǎn)值之比作為因數(shù)。在下文中,時(shí)間扭曲輪廓計(jì)算器1500的操作將參考圖16a及圖16b予以簡(jiǎn)要地討 論。圖16a顯示時(shí)間扭曲輪廓的連續(xù)計(jì)算的圖形表現(xiàn)形態(tài)。第一圖形表現(xiàn)形態(tài)1610 顯示一時(shí)間扭曲比碼薄索引序列1510(索引=0、索引=1、索引=2、索引=3、索引=7)。 再者,圖形表現(xiàn)形態(tài)1610顯示與所述碼薄索引相關(guān)聯(lián)的一扭曲比值序列(0.983、0.988、 0.994、1. 000、1.023)。再者,可看出的是,第一扭曲節(jié)點(diǎn)值1621(i = 0)被選擇為1(其中 1是一初始值)。如所看出的,第二扭曲節(jié)點(diǎn)值1622(i = 1)通過將初始值1乘以第一比值 0. 983 (與第一索引0相關(guān)聯(lián))來獲得??蛇M(jìn)一步看出的是,第三扭曲節(jié)點(diǎn)值1623通過使第 二扭曲節(jié)點(diǎn)值16220. 983乘以第二扭曲比值0.988(與第二索引1相關(guān)聯(lián))來獲得。以同 樣的方式,第四扭曲節(jié)點(diǎn)值1624通過使第三扭曲節(jié)點(diǎn)值1623乘以第三扭曲比值0. 994 (與 第三索引2相關(guān)聯(lián))來獲得。因此,一扭曲節(jié)點(diǎn)值序列1621、1622、1623、1624、1625、1626 被獲得。各自的扭曲節(jié)點(diǎn)值被有效率地獲得,使得其是初始值(例如1)與位于起始扭曲節(jié) 點(diǎn)值1621與各自扭曲節(jié)點(diǎn)值1622到1626之間的所有中間扭曲比值的乘積。圖形表現(xiàn)形態(tài)1640繪示扭曲節(jié)點(diǎn)值之間的線性內(nèi)插。例如,在兩個(gè)相鄰時(shí)間扭曲 節(jié)點(diǎn)值1621、1622之間的內(nèi)插值1621a、1621b、1621c可例如利用線性內(nèi)插在一音訊信號(hào)解 碼器中被獲得。圖16b顯示使用從一預(yù)定初始值的周期性重新開始的一時(shí)間扭曲輪廓重建的圖 形表現(xiàn)形態(tài),該時(shí)間扭曲輪廓重建動(dòng)作可以可取舍地在時(shí)間扭曲輪廓計(jì)算器1500中被實(shí) 施。換言之,一再或周期性重新開始不是一基本特征,所提供的數(shù)值上溢可在編碼器端或在解碼器端通過任何合適的測(cè)量被避免。如所看到的,一扭曲輪廓部分可從一起始點(diǎn)1660 開始,其中扭曲輪廓節(jié)點(diǎn)1661、1662、1663、1664可被決定。為了達(dá)到這一目的,扭曲比值 (0. 983,0. 988,0. 965、1. 000)可被考慮,使得第一時(shí)間扭曲輪廓部分的鄰近扭曲輪廓節(jié)點(diǎn) 1661到1664以這些扭曲比值所決定的比例被分開。然而,一另外的第二時(shí)間扭曲輪廓部分 可在第一時(shí)間扭曲輪廓部分(包含節(jié)點(diǎn)1660-1664)的一結(jié)束點(diǎn)1664之后開始已被實(shí)現(xiàn)。 第二時(shí)間扭曲輪廓部分可從一新起始點(diǎn)1665開始,該新起始點(diǎn)1665可獨(dú)立于任何扭曲比 值而取用該預(yù)定初始值。因此,第二時(shí)間扭曲輪廓部分的扭曲節(jié)點(diǎn)值可根據(jù)第二時(shí)間扭曲 輪廓部分的扭曲比值從第二時(shí)間扭曲輪廓部分的起始點(diǎn)1665開始被計(jì)算。稍后,第三時(shí)間 扭曲輪廓部分可從一相對(duì)應(yīng)的起始點(diǎn)1670開始,該對(duì)應(yīng)起始點(diǎn)1670可再次獨(dú)立于任何扭 曲比值而取用該預(yù)定初始值。因此,時(shí)間扭曲輪廓部分的周期性重新開始被獲得。可取舍 地,一再重新正規(guī)化可被施加,如上文所詳細(xì)描述的。根據(jù)圖17的音訊信號(hào)編碼器在下文中,根據(jù)本發(fā)明之另一實(shí)施例的音訊信號(hào)編碼器將參考圖17予以簡(jiǎn)要地 描述。音訊信號(hào)編碼器1700被組配成接收一多聲道音訊信號(hào)1710且提供該多聲道音訊信 號(hào)1710的一編碼表現(xiàn)形態(tài)1712。該音訊信號(hào)編碼器1700包含一編碼音訊表現(xiàn)形態(tài)提供 器1720,該編碼音訊表現(xiàn)形態(tài)提供器1720被組配成依據(jù)描述與多個(gè)音訊聲道中的不同音 訊聲道相關(guān)聯(lián)的扭曲輪廓之間的相似性或差異的信息,選擇性地提供包含通常與該多聲道 音訊信號(hào)的多個(gè)音訊聲道相關(guān)聯(lián)的一共同扭曲輪廓信息的一音訊表現(xiàn)形態(tài),或包含與多個(gè) 音訊聲道中的不同音訊聲道個(gè)別地相關(guān)聯(lián)的個(gè)別扭曲輪廓信息的一編碼音訊表現(xiàn)形態(tài)。例如,音訊信號(hào)編碼器1700包含被組配成提供描述與音訊聲道相關(guān)聯(lián)的扭曲輪 廓之間的相似性或差異的信息1732的一扭曲輪廓相似性計(jì)算器或扭曲輪廓差異計(jì)算器 1730。該編碼音訊表現(xiàn)形態(tài)提供器包含例如一選擇性時(shí)間扭曲輪廓編碼器1722,該選擇性 時(shí)間扭曲輪廓編碼器1722被組配成接收時(shí)間扭曲輪廓信息1724 (該信息1724可在外部被 提供或可由一可取舍的時(shí)間扭曲輪廓信息計(jì)算器1734提供)及信息1732。若信息1732指 示兩個(gè)或多個(gè)音訊聲道的時(shí)間扭曲輪廓充分地相似,選擇性時(shí)間扭曲輪廓編碼器1722可 被組配成提供一共同編碼時(shí)間扭曲輪廓信息。該共同扭曲輪廓信息可例如基于兩個(gè)或多個(gè) 聲道的扭曲輪廓信息的平均。然而,或者,該共同扭曲輪廓信息可基于一單音訊聲道的一單 一扭曲輪廓信息,但與多個(gè)聲道共同地相關(guān)聯(lián)。然而,若信息1732指示多個(gè)音訊聲道的扭曲輪廓不充分地相似,則選擇性時(shí)間扭 曲輪廓編碼器1722可提供不同扭曲輪廓的獨(dú)立編碼信息。編碼音訊表現(xiàn)形態(tài)提供器1720也包含一時(shí)間扭曲信號(hào)處理器1726,該時(shí)間扭曲 信號(hào)處理器1726亦被組配成接收時(shí)間扭曲輪廓信息1724與多聲道音訊信號(hào)1710。時(shí)間扭 曲信號(hào)處理器1726被組配成編碼音訊信號(hào)1710的多個(gè)聲道。時(shí)間扭曲信號(hào)處理器1726 也包含不同的操作模式。例如,時(shí)間扭曲信號(hào)處理器1726可被組配成個(gè)別地選擇性地編碼 音訊聲道,或利用聲道之間的相似性共同地對(duì)它們編碼。在一些情況下,時(shí)間扭曲信號(hào)處理 器1726能共同地編碼具有一共用時(shí)間扭曲輪廓信息的多個(gè)音訊聲道。有些情況中,左音訊 聲道與右音訊聲道顯示出相同的相對(duì)基頻演化但是具有除此之外不同的信號(hào)特性,例如, 不同絕對(duì)基本頻率或不同頻譜包絡(luò)線。在這種情況下,因?yàn)樽笠粲嵚暤琅c右音訊聲道之間 的明顯差異,不希望共同地編碼左音訊聲道與右音訊聲道。然而,左音訊聲道與右音訊聲道中的相對(duì)基頻演化可能是平行的,使得共用時(shí)間扭曲的應(yīng)用是非常有效率的解決方案。這 種音訊信號(hào)的一個(gè)例子是復(fù)音音樂(polyphone music),其中多個(gè)音訊聲道的內(nèi)容顯示出 明顯的差異(例如受不同歌手或樂器支配),但是顯示出類似的基頻變化。因此,通過提供 針對(duì)多個(gè)音訊聲道具有時(shí)間扭曲輪廓的共同編碼的可能性而同時(shí)保持獨(dú)立編碼被提供共 用基頻輪廓信息的不同音訊聲道的頻譜的選擇,編碼效率可被明顯地提高。編碼音訊表現(xiàn)形態(tài)提供器1720可取舍地包含一旁側(cè)信息編碼器1728,該旁側(cè)信 息編碼器1728被組配成接收信息1732及提供一旁側(cè)信息,該旁側(cè)信息指示是否針對(duì)數(shù)個(gè) 音訊聲道提供一共用編碼扭曲輪廓或是否針對(duì)多個(gè)音訊聲道提供個(gè)別編碼扭曲輪廓。例 如,這種旁側(cè)信息可以一 1比特旗標(biāo)(即“C0mm0n_tw”)的形式被提供??傊?,選擇性時(shí)間扭曲輪廓編碼器1722選擇性地提供與多個(gè)音訊信號(hào)相關(guān)聯(lián)的 時(shí)間扭曲音訊輪廓的個(gè)別編碼表現(xiàn)形態(tài),或表示與多個(gè)音訊聲道相關(guān)聯(lián)的一單一共同時(shí)間 扭曲輪廓的一共同編碼時(shí)間扭曲輪廓表現(xiàn)形態(tài)。旁側(cè)信息編碼器1728可取舍地提供指示 個(gè)別時(shí)間扭曲輪廓表現(xiàn)形態(tài)或一共同時(shí)間扭曲輪廓表現(xiàn)形態(tài)是否被提供的一旁側(cè)信息。時(shí) 間扭曲信號(hào)處理器1726提供多個(gè)音訊聲道的編碼表現(xiàn)形態(tài)??扇∩岬兀还灿镁幋a信息可 針對(duì)多個(gè)音訊聲道被提供。然而,通常情況下甚至可能提供多個(gè)音訊聲道的個(gè)別編碼表現(xiàn) 形態(tài),其中對(duì)所述多個(gè)音訊聲道而言,一共用時(shí)間扭曲輪廓表現(xiàn)形態(tài)是可得的,使得具有不 同音訊內(nèi)容但是相同時(shí)間扭曲的不同音訊聲道被適當(dāng)?shù)乇硎?。因此,編碼表現(xiàn)形態(tài)1712包 含由選擇性時(shí)間扭曲輪廓編碼器1722、及時(shí)間扭曲信號(hào)處理器1726、及選擇性地旁側(cè)信息 編碼器1728所提供的編碼信息。根據(jù)圖18的音訊信號(hào)解碼器圖18顯示根據(jù)本發(fā)明之一實(shí)施例的一音訊信號(hào)解碼器的方塊概要圖。音訊信號(hào) 解碼器1800被組配成接收一編碼音訊信號(hào)表現(xiàn)形態(tài)1810 (例如編碼表現(xiàn)形態(tài)1712)及據(jù) 以提供多聲道音訊信號(hào)的一解碼表現(xiàn)形態(tài)1812。音訊信號(hào)解碼器1800包含一旁側(cè)信息提 取器1820及一時(shí)間扭曲解碼器1830。該旁側(cè)信息提取器1820被組配成從編碼音訊信號(hào)表 現(xiàn)形態(tài)1810提取一時(shí)間扭曲輪廓應(yīng)用信息1822及一扭曲輪廓信息1824。例如,旁側(cè)信息 提取器1820可被組配成認(rèn)定針對(duì)編碼音訊信號(hào)的多個(gè)聲道,一單一共用時(shí)間扭曲輪廓信 息是否可得,或者針對(duì)多個(gè)聲道,獨(dú)立時(shí)間扭曲輪廓信息是否可得。因此,該旁側(cè)信息提取 器可提供時(shí)間扭曲輪廓應(yīng)用信息1822(指示共同或個(gè)別時(shí)間扭曲輪廓信息是否是可得的) 與時(shí)間扭曲輪廓信息1824(描述個(gè)別時(shí)間扭曲輪廓的共用(共同)時(shí)間扭曲輪廓的時(shí)間演 化)兩者。時(shí)間扭曲解碼器1830可被組配成根據(jù)編碼音訊信號(hào)表現(xiàn)形態(tài)1810重建多聲道 音訊信號(hào)的解碼表現(xiàn)形態(tài),將由信息1822、1824所描述的時(shí)間扭曲考慮在內(nèi)。例如,時(shí)間扭 曲解碼器1830可被組配成施加用于解碼不同音訊聲道的一共用時(shí)間扭曲輪廓,其中對(duì)于 所述不同聲道而言,個(gè)別編碼頻域信息是可得的。因此,時(shí)間扭曲解碼器1830可例如重建 包含類似或相同時(shí)間扭曲但是不同基頻的多聲道音訊信號(hào)的不同聲道。 根據(jù)圖19a到圖19e的音訊流在下文中,包含一個(gè)或多個(gè)聲道及一個(gè)或多個(gè)時(shí)間扭曲輪廓的一編碼表現(xiàn)形態(tài)的 一音訊流將予以描述。圖19a顯示一所謂“USAC_raW_data_bl0Ck”數(shù)據(jù)流元素的圖形表現(xiàn)形態(tài),其中該 數(shù)據(jù)流元素可包含一單聲道元素(SCE)、一雙聲道元素(CPE)或一個(gè)或多個(gè)單聲道元素及/或一個(gè)或多個(gè)雙聲道元素的一組合?!癠SAC_raW_data_bl0Ck”通??砂痪幋a音訊數(shù)據(jù)區(qū)塊,而額外的時(shí)間扭曲輪 廓信息可在一獨(dú)立數(shù)據(jù)流元素中被提供。然而,將一些時(shí)間扭曲輪廓數(shù)據(jù)編碼到“USAC_ raw_data_block"中通常是可能的。如從圖19b所看出的,一單聲道元素典型地包含一頻域聲道流(“fd_channel_ stream”),這將參考第9d圖予以詳細(xì)地解釋。如從圖19c可看出的,一雙聲道元素(“channel_pair_eIeIment”)通常包含多 個(gè)頻域聲道流。同樣地,雙聲道元素可包含時(shí)間扭曲信息。例如,可在一組態(tài)數(shù)據(jù)流元素中 或在“USAC_saw_data_block”中被傳送的時(shí)間扭曲啟動(dòng)旗標(biāo)(“tw_MDCT”)決定時(shí)間扭曲 信息是否被包括在該雙聲道元素中。例如,若tw_MDCT旗標(biāo)指示時(shí)間扭曲有效,則雙聲道元 素可包含指示針對(duì)雙聲道元素的音訊聲道是否存在一共用時(shí)間扭曲的一旗標(biāo)(“commoru tw”)。若該旗標(biāo)(“C0mm0n_tw”)指示針對(duì)多個(gè)音訊聲道存在一共用時(shí)間扭曲,則一共用 時(shí)間扭曲信息(tW_data)被例如與頻域聲道流相獨(dú)立地包括在該雙聲道元素中?,F(xiàn)參考描述頻域聲道流的圖19d。如從圖19d可看出的,頻域聲道流例如包含一全 域增益信息。同樣地,若時(shí)間扭曲有效(旗標(biāo)“tw_MDCT”有效)且針對(duì)多個(gè)音訊信號(hào)聲道 不存在共用時(shí)間扭曲信息(旗標(biāo)“C0mm0n_tw”是無效的),則頻域聲道流包含時(shí)間扭曲數(shù) 據(jù)。再者,頻域聲道流也包含依比例調(diào)整因數(shù)數(shù)據(jù)(“SCale_faCt0r_data”)及編碼頻 譜數(shù)據(jù)(例如算術(shù)編碼頻譜數(shù)據(jù)“%_印沈^^1_叔切”)。現(xiàn)參考簡(jiǎn)要討論時(shí)間扭曲數(shù)據(jù)的語法的圖19e。時(shí)間扭曲數(shù)據(jù)可例如可取舍地 包含指示時(shí)間扭曲數(shù)據(jù)是否存在的一旗標(biāo)(例如“tW_data_present”或「有效基頻數(shù)據(jù) (active Pitch Data)」)。若時(shí)間扭曲數(shù)據(jù)是存在的(即時(shí)間扭曲數(shù)據(jù)不是平的),則時(shí) 間扭曲數(shù)據(jù)可包含具有可例如根據(jù)圖9c的碼薄表被編碼的多個(gè)編碼時(shí)間扭曲比值(例如 "tw_ratio [i] ” 或 ‘‘pitchldx [i] ” )的一序列。因此,時(shí)間扭曲數(shù)據(jù)可包含指示不存在可得時(shí)間扭曲數(shù)據(jù)的一旗標(biāo),若時(shí)間扭曲 輪廓是恒定的(時(shí)間扭曲比近似等于1.000),則該旗標(biāo)可由一音訊信號(hào)編碼器設(shè)定。相反, 若時(shí)間扭曲輪廓是變化的,則接續(xù)時(shí)間扭曲輪廓節(jié)點(diǎn)之間的比可使用組成‘‘tW_rati0”信息 的碼薄索引來編碼。結(jié)論綜上所述,根據(jù)本發(fā)明的實(shí)施例帶來時(shí)間扭曲領(lǐng)域中的不同提高。在此所描述的本發(fā)明層面在時(shí)間扭曲MDCT轉(zhuǎn)換編碼器之背景脈絡(luò)中(參見例如 參考文獻(xiàn)[1])。根據(jù)本發(fā)明的實(shí)施例提供用于提高時(shí)間扭曲MDCT轉(zhuǎn)換編碼器之性能的方法。根據(jù)本發(fā)明的一層面,一特別有效率的比特流格式被提供。該比特流格式描述基 于且增強(qiáng)MPEG-2 AAC比特流語法(例如參見參考文獻(xiàn)[2]),但是當(dāng)然可應(yīng)用到在一串流起 始具有一般性描述標(biāo)頭及一獨(dú)立逐幀式信息語法的所有比特流格式。例如,以下旁側(cè)信息可在比特流中被傳送一般地,一個(gè)比特旗標(biāo)(例如所指定的“tw_MDCT” )在一般特定音訊配置(GASC) 中可能是存在的,指示時(shí)間扭曲是否有效?;l數(shù)據(jù)可使用在圖19e中所示的語法或在圖19f中所示的語法來傳送。在圖19f中所示的語法中,基頻的數(shù)目(“numPitches”)可能 等于16,且基頻比特的數(shù)目(“numPitchBits”)可能等于3。換言之,每一時(shí)間扭曲輪廓部 分(或每一音訊信號(hào)幀)可能存在16個(gè)編碼扭曲比值,且每一扭曲輪廓比值可使用3個(gè)比 特來編碼。此外,在一單聲道元素(SCE)中,若扭曲是有效的,基頻數(shù)據(jù)(pitch_data[])可能 位于個(gè)別聲道中的部分?jǐn)?shù)據(jù)之前。在雙聲道元素(CPE)中,若二聲道有一共同基頻數(shù)據(jù),則一共同基頻旗標(biāo)發(fā)出信 號(hào),其后結(jié)果是若無共同基頻數(shù)據(jù),個(gè)別基頻輪廓被發(fā)現(xiàn)于個(gè)別聲道中。在下文中,針對(duì)一雙聲道元素的實(shí)例將被提出。一個(gè)實(shí)例可能是被置于立體聲全 景中的一單一諧波聲源的信號(hào)。在這種情況下,第一聲道與第二聲道的相對(duì)基頻輪廓將是 相等的或者由于變化估計(jì)中的一些小錯(cuò)誤將只略有不同。在這種情況下,編碼器可決定不 是針對(duì)每一聲道發(fā)送兩個(gè)獨(dú)立編碼的基頻輪廓,而是只發(fā)送一個(gè)基頻輪廓,該基頻輪廓是 第一與第二聲道的基頻輪廓的一平均,并且在這兩個(gè)聲道上施加TW-MDCT的過程中使用相 同的輪廓。另一方面,可能存在一信號(hào),其中基頻輪廓的估計(jì)針對(duì)第一與第二聲道分別產(chǎn)生 不同結(jié)果。在這種情況下,獨(dú)立編碼的基頻輪廓在對(duì)應(yīng)聲道中被發(fā)送。在下文中,根據(jù)本發(fā)明的一層面的基頻輪廓數(shù)據(jù)的有利解碼將予以描述。例如,若 「有效基頻數(shù)據(jù)(PitchData)」旗標(biāo)為0,則基頻輪廓針對(duì)該幀中的所有樣本被設(shè)定為1,否 則個(gè)別基頻輪廓節(jié)點(diǎn)被計(jì)算如下參存在 numPitches+1 個(gè)節(jié)點(diǎn),· node
總是 1. 0 ;# node [i] = node [i-1] ^relChange [i] (i = 1· · numPitches+1),其中 relChange 通過pitchldx[i]的反量化來獲得?;l輪廓而后通過節(jié)點(diǎn)間的線性內(nèi)插來產(chǎn)生,其中節(jié)點(diǎn)樣本位置是(hframeLen/ numPitchesframeLen。實(shí)施備選依據(jù)某些實(shí)施要求,本發(fā)明的實(shí)施例可用硬件或軟件實(shí)施。實(shí)施態(tài)樣可使用數(shù)字 儲(chǔ)存媒質(zhì)來執(zhí)行,例如其上儲(chǔ)存有多個(gè)電氣可讀控制信號(hào)的軟式磁碟、DVD、CD、ROM、PROM、 EPR0M、EEPR0M或閃存,其中所述電氣可讀控制信號(hào)與(或可與)一可編程計(jì)算機(jī)系統(tǒng)協(xié)同 工作,使得各自的方法被執(zhí)行。根據(jù)本發(fā)明的一些實(shí)施例包含具有多個(gè)電氣可讀控制信號(hào)的一數(shù)據(jù)載體,所述電 氣可讀控制信號(hào)可與一可編程計(jì)算機(jī)系統(tǒng)協(xié)同工作,使得本文所述的其中一種方法被執(zhí) 行。一般地,本發(fā)明的實(shí)施例可被實(shí)施為具有程序碼的一計(jì)算機(jī)程序產(chǎn)品,當(dāng)該計(jì)算 機(jī)程序產(chǎn)品在一計(jì)算機(jī)上執(zhí)行時(shí),該程序碼可操作以執(zhí)行其中的一種方法。該程序碼可例 如被儲(chǔ)存在一機(jī)器可讀載體上。其他實(shí)施例包含儲(chǔ)存在一機(jī)器可讀載體上的用于執(zhí)行本文所述的其中一種方法 的計(jì)算機(jī)程序。換言之,本發(fā)明方法的一實(shí)施例從而是具有程序碼的一計(jì)算機(jī)程序,當(dāng)該計(jì)算機(jī) 程序在一計(jì)算機(jī)上執(zhí)行時(shí),該程序碼用于執(zhí)行本文所述的其中的一種方法。
本發(fā)明方法的另一實(shí)施例從而是包含(其上記錄)用于執(zhí)行本文所述的其中一種 方法之計(jì)算機(jī)程序的一數(shù)據(jù)載體(或數(shù)字儲(chǔ)存媒質(zhì)、或計(jì)算機(jī)可讀媒質(zhì))。本發(fā)明方法的又一實(shí)施例從而是表示用于執(zhí)行本文所述的其中一種方法的計(jì)算 機(jī)程序的一數(shù)據(jù)流或一信號(hào)序列。該數(shù)據(jù)流或信號(hào)序列可例如被組配成通過例如因特網(wǎng)的 一數(shù)據(jù)通訊連接體來傳送。再一實(shí)施例包含被組配成或適于執(zhí)行本文所述的其中一種方法的一處理裝置,例 如一計(jì)算機(jī)、或一可編程邏輯裝置。Al另一實(shí)施例包含其上安裝有用于執(zhí)行本文所述的其中一種方法的計(jì)算機(jī)程序的
一計(jì)算機(jī)。在一些實(shí)施例中,一可編程邏輯裝置(例如一現(xiàn)場(chǎng)可編程門陣列)可用來執(zhí)行本 文所述的方法的一些或全部功能。在一些實(shí)施例中,一現(xiàn)場(chǎng)可編程門陣列可與一微處理器 協(xié)同工作,以執(zhí)行本文所述的其中一種方法。參考文獻(xiàn)[1]L. Villemoes, "Time Warped Transform Coding of Audio Signals,,,PCT/ EP2006/010246,國(guó)際專利申請(qǐng)案(Int. patent application),2005 年 11 月[2]Generic Coding of Moving Pictures and Associated Audio :Advanced Audio Coding.國(guó)際標(biāo)準(zhǔn)(International Standard) 13818-7,IS0/IECJTC1/SC29/WG11 運(yùn) 動(dòng)圖像專家組(Moving pictures Expert Group), 199權(quán)利要求
1.一種根據(jù)一編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)(211,212 ;310 ;1810)提供一解碼多聲道 音訊信號(hào)表現(xiàn)形態(tài)(232 ;312 ;1812)的音訊信號(hào)解碼器(200 ;300 ; 1500 ;1800),該音訊信 號(hào)解碼器包含一時(shí)間扭曲解碼器(210,216,218,219,220,230,240 ;340 ; 1830),該時(shí)間扭曲解碼器 被組配成選擇性地使用個(gè)別音訊聲道特定時(shí)間扭曲輪廓(332;1824)或一共同多聲道時(shí)間 扭曲輪廓(332;1824)以重建由該編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)表示的多個(gè)音訊聲道。
2.根據(jù)權(quán)利要求1所述的音訊信號(hào)解碼器(200;300;1800),其中該時(shí)間扭曲解碼器 (210,216,218,219,220,230,240 ;340 ;1830)被組配成選擇性地使用一共同多聲道時(shí)間扭 曲輪廓(332 ; 1824)來時(shí)間扭曲重建由該編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)表示的多個(gè)音訊聲 道,個(gè)別編碼頻譜域信息(211)可用于此。
3.根據(jù)權(quán)利要求2所述的音訊信號(hào)解碼器(200;300;1800),其中該時(shí)間扭曲解碼器 被(210,216,218,219,220,230,240 ;340 ; 1830)組配成接收與所述音訊聲道中的第一音訊 聲道相關(guān)聯(lián)的第一頻譜域信息,并據(jù)以使用一頻域到扭曲時(shí)域轉(zhuǎn)換提供該第一音訊聲道的 一時(shí)域表現(xiàn)形態(tài)(X[][]);其中該時(shí)間扭曲解碼器進(jìn)一步被組配成接收與所述音訊聲道中的第二音訊聲道相關(guān) 聯(lián)的第二編碼頻譜域信息,并據(jù)以使用一頻域到時(shí)域轉(zhuǎn)換提供該第二音訊聲道的一扭曲時(shí) 域表現(xiàn)形態(tài)(X[] □);其中該第二頻譜域信息與該第一頻譜域信息不同;以及其中該時(shí)間扭曲解碼器被組配成根據(jù)該共同多聲道時(shí)間扭曲輪廓時(shí)變重新取樣該第 一音訊聲道的該扭曲時(shí)域表現(xiàn)形態(tài)或它的一處理過的版本,以獲得該第一音訊聲道的一規(guī) 則取樣表現(xiàn)形態(tài),及根據(jù)該共同多聲道時(shí)間扭曲輪廓時(shí)變重新取樣該第二音訊聲道的該扭曲時(shí)域表現(xiàn) 形態(tài)或它的一處理過的版本,以獲得該第二音訊聲道的一規(guī)則取樣表現(xiàn)形態(tài)。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的音訊信號(hào)解碼器(200;300 ;1800),其中該時(shí)間 扭曲解碼器被組配成從該共同多聲道時(shí)間扭曲輪廓信息得出一共同多聲道時(shí)間輪廓,以及根據(jù)第一編碼窗口形狀信息得出與所述音訊聲道中的該第一音訊聲道相關(guān)聯(lián)的第一 個(gè)別特定聲道窗口形狀,以及根據(jù)第二編碼窗口形狀信息得出與所述音訊聲道中的該第二音訊聲道相關(guān)聯(lián)的第二 個(gè)別特定聲道窗口形狀,以及將該第一窗口形狀施加到該第一音訊聲道的該扭曲時(shí)域表現(xiàn)形態(tài),以獲得該第一音訊 聲道的該扭曲時(shí)域表現(xiàn)形態(tài)的一處理過的版本,以及將該第二窗口形狀施加到該第二音訊聲道的該扭曲時(shí)域表現(xiàn)形態(tài),以獲得該第二音訊 聲道的該扭曲時(shí)域表現(xiàn)形態(tài)的一處理過的版本;其中該時(shí)間扭曲解碼器能夠依據(jù)個(gè)別特定聲道窗口形狀信息將不同窗口形狀施加到 一特定幀的該第一與第二音訊聲道的該扭曲時(shí)域表現(xiàn)形態(tài)。
5.根據(jù)權(quán)利要求4所述的音訊信號(hào)解碼器(200;300;1800),其中該時(shí)間扭曲解碼器 被組配成在窗口化該第一與第二音訊聲道的該扭曲時(shí)域表現(xiàn)形態(tài)時(shí),將一共用時(shí)間依比例 調(diào)整施加到不同的窗口形狀,該共用時(shí)間依比例調(diào)整由該共同多聲道時(shí)間輪廓決定。
6.一種用于提供一多聲道音訊信號(hào)的一編碼表現(xiàn)形態(tài)(150,152 ;1712)的音訊信號(hào)編碼器(100 ; 1700),該音訊信號(hào)編碼器包含一編碼音訊表現(xiàn)形態(tài)提供器(104,106,108,108a, 114 ; 1720),該編碼音訊表現(xiàn)形態(tài)提 供器被組配成依據(jù)一描述與多個(gè)音訊聲道中的不同音訊聲道相關(guān)聯(lián)的時(shí)間扭曲輪廓之間 的相似性或差異的信息,選擇性地提供一包含與該多聲道音訊信號(hào)的所述多個(gè)音訊聲道共 同相關(guān)聯(lián)的一共用多聲道時(shí)間扭曲輪廓信息的編碼音訊表現(xiàn)形態(tài)(150,152;1712),或一 包含與所述多個(gè)音訊聲道中的所述不同音訊聲道個(gè)別相關(guān)聯(lián)的個(gè)別時(shí)間扭曲輪廓信息的 編碼音訊表現(xiàn)形態(tài)。
7.根據(jù)權(quán)利要求6所述的音訊信號(hào)編碼器(100; 1700),其中該編碼音訊表現(xiàn)形態(tài)提供 器(104,106,108,108a, 114 ; 1720)被組配成應(yīng)用共用多聲道時(shí)間扭曲輪廓信息,以獲得所 述音訊聲道中的第一音訊聲道的一時(shí)間扭曲版本,及獲得所述音訊聲道中的第二音訊聲道 的一時(shí)間扭曲版本,且根據(jù)該第一音訊聲道的該時(shí)間扭曲版本提供與所述音訊聲道中的該 第一音訊聲道相關(guān)聯(lián)的第一個(gè)別編碼頻譜域信息,及根據(jù)該第二音訊聲道的該時(shí)間扭曲版 本提供與所述音訊聲道中的該第二音訊聲道相關(guān)聯(lián)的第二個(gè)別編碼頻譜域信息。
8.根據(jù)權(quán)利要求6或7所述的音訊信號(hào)編碼器(100; 1700),其中該編碼音訊表現(xiàn)形態(tài) 提供器(104,106,108,108a,114 ;1720)被組配成提供該多聲道音訊信號(hào)的該編碼表現(xiàn)形 態(tài)(150,152 ;1712),使得該多聲道信號(hào)的該編碼表現(xiàn)形態(tài)包含該共用多聲道時(shí)間扭曲輪 廓信息,根據(jù)該共用多聲道時(shí)間扭曲輪廓信息經(jīng)時(shí)間扭曲的一第一聲道音訊信號(hào)的時(shí)間扭 曲版本的一編碼頻譜表現(xiàn)形態(tài),及根據(jù)該共用多聲道時(shí)間扭曲輪廓信息經(jīng)時(shí)間扭曲的一第 二聲道音訊信號(hào)的時(shí)間扭曲版本的一編碼頻譜表現(xiàn)形態(tài)。
9.根據(jù)權(quán)利要求6至8中任一項(xiàng)所述的音訊信號(hào)編碼器(100; 1700),其中該音訊信號(hào) 編碼器被組配成獲得該共用多聲道時(shí)間扭曲輪廓信息,使得該共用多聲道時(shí)間扭曲輪廓信 息表示與該第一音訊信號(hào)聲道及該第二音訊信號(hào)聲道相關(guān)聯(lián)的個(gè)別扭曲輪廓的一平均。
10.根據(jù)權(quán)利要求6至9中任一項(xiàng)所述的音訊信號(hào)編碼器(100;1700),其中該編碼音 訊表現(xiàn)形態(tài)提供器被組配成在該多聲道音訊信號(hào)的該編碼表現(xiàn)形態(tài)(150 ;152 ;1712)中提 供一旁側(cè)信息(tW_data_present ;commorutw),該旁側(cè)信息逐一音訊幀地指示一特定音訊 幀的時(shí)間扭曲數(shù)據(jù)是否存在,及該特定音訊幀的一共用時(shí)間扭曲輪廓信息是否存在。
11.一種表示一多聲道音訊信號(hào)的編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)(usac_raw_data_ block),該多聲道音訊信號(hào)表現(xiàn)形態(tài)包含一編碼頻域表現(xiàn)形態(tài)(fcLcharmelstream),表示根據(jù)一共用時(shí)間扭曲時(shí)間扭曲的多 個(gè)時(shí)間扭曲音訊聲道;以及一共用多聲道時(shí)間扭曲輪廓信息的一經(jīng)編碼表現(xiàn)形態(tài)(tW_data),與所述音訊聲道共 同相關(guān)聯(lián)且表示該共用時(shí)間扭曲。
12.根據(jù)權(quán)利要求11所述的編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)(usac_raw_data_bl0ck), 其中該編碼頻域表現(xiàn)形態(tài)包含具有不同音訊內(nèi)容的多個(gè)音訊聲道的個(gè)別編碼頻域信息 (fd_channel_stream),且其中該共用多聲道時(shí)間扭曲輪廓信息的該編碼表現(xiàn)形態(tài)(tw_ data)與具有不同音訊內(nèi)容的所述多個(gè)音訊聲道相關(guān)聯(lián)。
13.一種根據(jù)一編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)(211,212;310;1810)提供一解碼多聲 道音訊信號(hào)表現(xiàn)形態(tài)(232 ;300 ; 1500 ; 1800)的方法,該方法包含以下步驟選擇性地使用個(gè)別音訊聲道特定時(shí)間扭曲輪廓或一共同多聲道時(shí)間扭曲輪廓以重建由該編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)表示的多個(gè)音訊聲道。
14.一種用于提供一多聲道音訊信號(hào)的一編碼表現(xiàn)形態(tài)(150,152 ;1712)的方法,該方 法包含以下步驟依據(jù)一描述與多個(gè)音訊聲道中的不同音訊聲道相關(guān)聯(lián)的時(shí)間扭曲輪廓之間的相似性 或差異的信息,選擇性地提供編碼音訊表現(xiàn)形態(tài),其包含與該多聲道音訊信號(hào)的所述多個(gè) 音訊聲道共同相關(guān)聯(lián)的一共用多聲道時(shí)間扭曲輪廓信息,或包含與所述多個(gè)音訊聲道中的 所述不同音訊聲道個(gè)別相關(guān)聯(lián)的個(gè)別時(shí)間扭曲輪廓信息的一編碼音訊表現(xiàn)形態(tài)。
15.一種計(jì)算機(jī)程序,當(dāng)該計(jì)算機(jī)程序在一計(jì)算機(jī)上執(zhí)行時(shí),其用于執(zhí)行根據(jù)權(quán)利要求 13或14所述的方法。
全文摘要
一種根據(jù)一編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)提供一解碼多聲道音訊信號(hào)表現(xiàn)形態(tài)的音訊信號(hào)解碼器,包含一時(shí)間扭曲解碼器,該時(shí)間扭曲解碼器被組配成選擇性地使用個(gè)別音訊聲道特定時(shí)間扭曲輪廓或一共同多聲道時(shí)間扭曲輪廓以重建由編碼多聲道音訊信號(hào)表現(xiàn)形態(tài)表示的多個(gè)音訊聲道。用于提供一多聲道音訊信號(hào)的編碼表現(xiàn)形態(tài)的音訊信號(hào)編碼器,包含一編碼音訊表現(xiàn)形態(tài)提供器,該編碼音訊表現(xiàn)形態(tài)提供器被組配成依據(jù)描述與多個(gè)音訊聲道中的不同音訊聲道相關(guān)聯(lián)的時(shí)間扭曲輪廓之間的相似性或差異的信息,選擇性地提供包含與該多聲道音訊信號(hào)的所述多個(gè)音訊聲道共同相關(guān)聯(lián)的一共用時(shí)間扭曲輪廓信息的一音訊表現(xiàn)形態(tài),或包含與所述多個(gè)音訊聲道中的不同音訊聲道個(gè)別地相關(guān)聯(lián)的個(gè)別時(shí)間扭曲輪廓信息的一編碼音訊表現(xiàn)形態(tài)。
文檔編號(hào)G10L19/02GK102007531SQ200980111687
公開日2011年4月6日 申請(qǐng)日期2009年7月1日 優(yōu)先權(quán)日2008年7月11日
發(fā)明者伯恩德·艾德勒, 古拉米·??怂? 史蒂芬·拜爾, 吉拉德·舒勒, 薩夏·迪施, 雷夫·蓋葛, 馬克斯·紐恩多夫 申請(qǐng)人:弗勞恩霍弗實(shí)用研究促進(jìn)協(xié)會(huì)