自適應(yīng)音頻內(nèi)容生成的制作方法
【專利摘要】本發(fā)明的實施例涉及自適應(yīng)音頻內(nèi)容生成。具體而言,公開了一種用于生成自適應(yīng)音頻內(nèi)容的方法,該方法包括:從基于聲道的源音頻內(nèi)容中提取至少一個音頻對象,以及至少部分地基于該至少一個音頻對象生成自適應(yīng)音頻內(nèi)容。還公開了相應(yīng)的系統(tǒng)和計算機程序產(chǎn)品。
【專利說明】自適應(yīng)音頻內(nèi)容生成
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明總體上涉及音頻信號處理,更具體地,涉及自適應(yīng)音頻內(nèi)容生成。
【背景技術(shù)】
[0002] 目前的音頻內(nèi)容通常按照基于聲道(channel based)的格式來生成和保存。例 如,立體聲、環(huán)繞5. 1、環(huán)繞7. 1都是得到廣泛應(yīng)用的基于聲道的音頻內(nèi)容格式。隨著多媒體 技術(shù)的不斷發(fā)展,諸如三維(3D)電影和電視之類的多媒體數(shù)字內(nèi)容正在變得日益流行。然 而,傳統(tǒng)的基于聲道的音頻格式通常難以有效地創(chuàng)建與之相適應(yīng)的具有沉浸感的、逼真的 音頻內(nèi)容。因此,期望多聲道音頻系統(tǒng)能夠相應(yīng)地得到擴展,從而創(chuàng)建更為富有沉浸感的立 體聲聲場。實現(xiàn)這一目標(biāo)的重要途徑之一是使用自適應(yīng)(adaptive)音頻內(nèi)容。
[0003] 與傳統(tǒng)基于聲道的音頻內(nèi)容相比,自適應(yīng)音頻內(nèi)容不僅包括音頻聲道,而且還包 括音頻對象(audio object)。在此使用的術(shù)語"音頻對象"是指在所定義的一段持續(xù)時間中 而存在的各種音頻元素或聲源。音頻對象可以是動態(tài)的或者靜態(tài)的。音頻對象可以是在聲 場中充當(dāng)聲源的人、動物或者任何其他物體。可選地,音頻對象還可以具有關(guān)聯(lián)的元數(shù)據(jù), 例如用于描述對象的位置、速度、大小等方面的信息。音頻對象的使用使得自適應(yīng)音頻內(nèi)容 具有很高的沉浸感和良好的聽覺效果,并且允許調(diào)音師等操作者方便地控制和調(diào)整音頻對 象。而且,借助于對音頻對象的操作,可以準(zhǔn)確地控制離散的聲音元素,而無需考慮具體的 回放揚聲器配置。同時,自適應(yīng)音頻內(nèi)容可以進(jìn)一步包括稱為"靜態(tài)環(huán)境聲"(audio bed) 的基于聲道的部分和/或任何其他音頻元素。在此使用的術(shù)語"靜態(tài)環(huán)境聲"或簡稱"環(huán)境 聲"是指將在預(yù)定義的固定位置被回放的聲音的音頻聲道。靜態(tài)環(huán)境聲可以被認(rèn)為是靜態(tài) 的音頻對象,并且同樣可以具有相關(guān)聯(lián)的元數(shù)據(jù)。以此方式,自適應(yīng)音頻內(nèi)容還可以兼具聲 道格式的優(yōu)勢以便例如表示復(fù)雜的聲音紋理。
[0004] 自適應(yīng)音頻內(nèi)容的生成方式不同于單純基于聲道的音頻內(nèi)容。因此,為了獲得自 適應(yīng)音頻內(nèi)容,必須自始使用相應(yīng)的專用處理流程來創(chuàng)建和處理音頻信號。然而,受到物理 設(shè)備和/或技術(shù)條件的制約,并非所有音頻內(nèi)容提供方都能夠生成這種自適應(yīng)音頻內(nèi)容。 很多音頻內(nèi)容提供方只能產(chǎn)生和提供基于聲道的音頻內(nèi)容。而且,期望為已經(jīng)被創(chuàng)建和發(fā) 布的基于聲道的音頻內(nèi)容創(chuàng)建三維(3D)體驗。然而,對于目前已經(jīng)存在的大量基于聲道 的傳統(tǒng)音頻內(nèi)容而言,尚不存在一種方案能夠?qū)⑦@些音頻內(nèi)容有效地轉(zhuǎn)換為自適應(yīng)音頻內(nèi) 容。
[0005] 因此,本領(lǐng)域中需要一種能夠?qū)⒒诼暤赖囊纛l內(nèi)容轉(zhuǎn)換為自適應(yīng)音頻內(nèi)容的技 術(shù)方案。
【發(fā)明內(nèi)容】
[0006] 為了解決上述問題,本發(fā)明提出一種用于生成自適應(yīng)音頻的方法和系統(tǒng)。
[0007] 在一個方面,本發(fā)明的實施例提供一種用于生成自適應(yīng)音頻內(nèi)容的方法。該方法 包括:從基于聲道的源音頻內(nèi)容中提取至少一個音頻對象;以及至少部分地基于所述至少 一個音頻對象生成所述自適應(yīng)音頻內(nèi)容。這方面的實施例還包括包含相應(yīng)的計算機程序產(chǎn) 品。
[0008] 在另一方面,本發(fā)明的實施例提供一種用于生成自適應(yīng)音頻內(nèi)容的系統(tǒng)。該系統(tǒng) 包括:音頻對象提取器,被配置為從基于聲道的源音頻內(nèi)容中提取至少一個音頻對象;以 及自適應(yīng)音頻生成器,被配置為至少部分地基于所述至少一個音頻對象生成所述自適應(yīng)音 頻內(nèi)容。
[0009] 通過下文描述將會理解,根據(jù)本發(fā)明的實施例,能夠在確保音頻保真度的同時,將 傳統(tǒng)基于聲道的音頻內(nèi)容有效地轉(zhuǎn)換為自適應(yīng)音頻內(nèi)容。特別地,能夠從源音頻內(nèi)容中準(zhǔn) 確地提取一個或多個音頻對象,用于表示尖銳的和動態(tài)的聲音,從而允許對各個主要聲源 對象的控制、編輯、回放和/或后處理(re-authoring)。同時,復(fù)雜的音頻紋理可以是基于 聲道的格式以支持高效的創(chuàng)作和分發(fā)。本發(fā)明的實施例所帶來的其他益處將通過下文描述 而清楚。
【專利附圖】
【附圖說明】
[0010] 通過參考附圖閱讀下文的詳細(xì)描述,本發(fā)明實施例的上述以及其他目的、特征和 優(yōu)點將變得易于理解。在附圖中,以示例而非限制性的方式示出了本發(fā)明的若干實施例,其 中:
[0011] 圖1示出了根據(jù)本發(fā)明的一個示例實施例的自適應(yīng)音頻內(nèi)容的示意圖;
[0012] 圖2示出了根據(jù)本發(fā)明的一個示例實施例的用于生成自適應(yīng)音頻內(nèi)容的方法的 流程圖;
[0013] 圖3示出了根據(jù)本發(fā)明的另一示例實施例的用于生成自適應(yīng)音頻內(nèi)容的方法的 流程圖;
[0014] 圖4示出了根據(jù)本發(fā)明的一個示例實施例的生成靜態(tài)環(huán)境聲的示意圖;
[0015] 圖5A和圖5B不出了根據(jù)本發(fā)明的不例實施例的重置的首頻對象的不意圖;
[0016] 圖6示出了根據(jù)本發(fā)明的一個示例實施例的元數(shù)據(jù)編輯的示意圖;
[0017] 圖7示出了根據(jù)本發(fā)明的一個示例實施例的用于生成自適應(yīng)音頻內(nèi)容的系統(tǒng)的 框圖;以及
[0018] 圖8示出了可用于實現(xiàn)本發(fā)明的示例實施例的計算機系統(tǒng)的示意性框圖。
[0019] 在各個附圖中,相同或?qū)?yīng)的標(biāo)號表不相同或?qū)?yīng)的部分。
【具體實施方式】
[0020] 下面將參考附圖中示出的若干示例實施例來描述本發(fā)明的原理和精神。應(yīng)當(dāng)理 解,描述這些實施例僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實現(xiàn)本發(fā)明,而并 非以任何方式限制本發(fā)明的范圍。
[0021] 首先參考圖1,其示出了根據(jù)本發(fā)明實施例的自適應(yīng)音頻內(nèi)容生成的示意圖。根據(jù) 本發(fā)明的實施例,將要被處理的源音頻內(nèi)容101采用傳統(tǒng)的基于聲道的格式,例如立體聲、 環(huán)繞5. 1、環(huán)繞7. 1等格式。特別地,根據(jù)本發(fā)明的實施例,源音頻內(nèi)容101可以是任何類型 的最終混合音,或者是在被合并為傳統(tǒng)立體聲或多聲道內(nèi)容的最終混合音之前可被分別處 理的一組音軌。源音頻內(nèi)容101被處理以生成兩個部分:基于聲道的靜態(tài)環(huán)境聲102,以及 音頻對象103和104。靜態(tài)環(huán)境聲102可以利用聲道來表示復(fù)雜的音頻紋理,例如聲場中 的背景聲音和環(huán)境聲音,這有利于高效的編輯和分發(fā)。音頻對象可以是聲場中的主要聲源, 例如尖銳和/或動態(tài)聲音的聲源。在圖1所示的示例中,音頻對象包括鳥103和青娃104。 自適應(yīng)音頻內(nèi)容105可以基于靜態(tài)環(huán)境聲102和聲音對象103、104而被生成。
[0022] 應(yīng)當(dāng)注意,根據(jù)本發(fā)明的實施例,自適應(yīng)音頻內(nèi)容并非必須包括音頻對象和環(huán)境 聲。相反,某些自適應(yīng)音頻內(nèi)容可以僅包含音頻對象和環(huán)境聲之一。備選地,自適應(yīng)音頻內(nèi) 容可以包含除音頻對象和/或環(huán)境聲之外的任何適當(dāng)格式的附加音頻元素。例如,某些自 適應(yīng)音頻內(nèi)容可以包括環(huán)境聲和某些類似于對象的內(nèi)容,例如頻譜中的部分對象。本發(fā)明 的范圍在此方面不受限制。
[0023] 下面參考圖2詳細(xì)描述根據(jù)本發(fā)明一個示例實施例的用于生成自適應(yīng)音頻內(nèi)容 的方法200的流程圖。方法200開始之后,在步驟S201,從基于聲道的音頻內(nèi)容中提取至 少一個音頻對象。為討論方便起見,將作為輸入的基于聲道的音頻內(nèi)容稱為"源音頻內(nèi)容"。 根據(jù)本發(fā)明的實施例,可以直接對源音頻內(nèi)容的音頻信號進(jìn)行處理,以從中提取音頻對象。 備選地,為了更好地保持源音頻內(nèi)容的空間保真度等目的,也可以首先對源音頻內(nèi)容的信 號進(jìn)行預(yù)處理,例如信號分解,使得音頻對象可以從經(jīng)過預(yù)處理的音頻信號中被提取。這方 面的實施例將在下文詳述
[0024] 根據(jù)本發(fā)明的實施例,可以使用任何適當(dāng)?shù)姆椒▉韴?zhí)行音頻對象提取??傮w上, 可以基于頻譜連續(xù)性和空間一致性,來確定音頻內(nèi)容中屬于同一對象的信號分量。在實現(xiàn) 中,可以對源音頻內(nèi)容進(jìn)行處理以獲取一個或多個音頻信號特征或稱線索,用以衡量源音 頻內(nèi)容中的子頻帶、聲道和/或幀是否屬于同一音頻對象。這種音頻信號特征的示例可 以包括但不限于:聲音的方向/位置,發(fā)散性,直達(dá)混響聲能比(DRR)、開/關(guān)同步、調(diào)和性 (harmonicity)調(diào)制、音高和音高波動、顯著性/局部響度/能量、重復(fù)性,等等。任何其 他適當(dāng)?shù)囊纛l信號特征均可以與本發(fā)明的實施例結(jié)合使用,本發(fā)明的范圍在此方面不受限 制。音頻對象提取的若干具體實施例將在下文進(jìn)一步描述。
[0025] 在步驟S201處提取的音頻對象可以采用各種適當(dāng)?shù)男问健@?,在某些實施?中,音頻對象可以被生成為包含具有相似音頻信號特征的信號分量的多聲道音軌。備選地, 音頻對象也可以被生成為經(jīng)過下混音的單聲道音軌。注意,這里所描述的僅僅是幾個示例。 所提取的音頻對象可以利用目前已知或者將來開發(fā)的任何適當(dāng)形式來表示,本發(fā)明的范圍 在此方面不受限制。
[0026] 方法200繼而進(jìn)行到步驟S202,在此至少部分地基于在步驟S201處提取的至少一 個音頻對象生成自適應(yīng)音頻內(nèi)容。根據(jù)某些實施例,可以將音頻對象以及可能還有其他音 頻元素封裝為單個聲音文件,以作為得到的自適應(yīng)音頻內(nèi)容。這些附加音頻元素可以包括 但不限于基于聲道的靜態(tài)環(huán)境聲和/或任何其他格式的音頻內(nèi)容。備選地,音頻對象和附 加音頻元素可以分別分發(fā),并且由回放系統(tǒng)將其結(jié)合以便基于回放揚聲器的配置來自適應(yīng) 地重建音頻內(nèi)容。
[0027] 特別地,根據(jù)本發(fā)明的某些實施例,在生成自適應(yīng)音頻內(nèi)容時,還可以對音頻對象 和/或其他音頻元素(如果有的話)執(zhí)行各種后處理。后處理過程例如可以包括分離重疊 的音頻對象、操控音頻對象、修改音頻對象的屬性、控制自適應(yīng)音頻內(nèi)容的增益,等等。這方 面的實施例將在下文進(jìn)一步描述。
[0028] 在此特定示例中,方法200在步驟S202之后結(jié)束。通過執(zhí)行方法200,可以將基于 聲道的音頻內(nèi)容轉(zhuǎn)換為自適應(yīng)的音頻內(nèi)容,其中尖銳的、動態(tài)的聲音利用音頻對象來表示, 而背景聲音之類的復(fù)雜音頻紋理則借助于其他格式來表示,例如被表示為靜態(tài)環(huán)境聲。這 種自適應(yīng)音頻內(nèi)容可以被高效地分發(fā),并且可以利用各種回放系統(tǒng)配置而被保真地回放。 以此方式,可以同時兼具對象格式和聲道格式之類的其他格式的優(yōu)勢。
[0029] 接下來參考圖3,其示出了根據(jù)本發(fā)明一個示例實施例的用于生成自適應(yīng)音頻內(nèi) 容的方法300的流程圖。應(yīng)當(dāng)理解,方法300可被認(rèn)為是上文參考圖2描述的方法200的 一種具體實施例。
[0030] 方法300開始之后,在步驟S301對基于聲道的源音頻內(nèi)容執(zhí)行指向性音頻信號和 發(fā)散性音頻信號分解,從而將源音頻內(nèi)容分解為指向性音頻信號和發(fā)散性音頻信號。執(zhí)行 信號分解的目的是為了隨后更加準(zhǔn)確和有效地提取音頻對象和生成靜態(tài)環(huán)境聲。具體而 言,如下文將會詳述的,分解出的指向性音頻信號可被用于提取音頻對象,而發(fā)散性音頻信 號則可用于生成靜態(tài)環(huán)境聲。以此方式,能夠在獲得具有良好沉浸感的聽覺感受的同時,確 保源音頻內(nèi)容的較高保真度。而且,這有利于實現(xiàn)靈活的對象提取和較為準(zhǔn)確的元數(shù)據(jù)估 計。有關(guān)的實施例將在下文進(jìn)一步描述。
[0031] 指向性音頻信號是能夠相對容易地被定位并且可以跨聲道平移(pan)的主要聲 音。發(fā)散性音頻信號是與指向性聲源的相關(guān)性和/或跨聲道相關(guān)性較弱的環(huán)境信號。根據(jù) 本發(fā)明的實施例,在步驟S301,可以利用任何適當(dāng)方法提取源音頻內(nèi)容中的指向性音頻信 號,則剩余的信號便是發(fā)散性音頻信號。用于提取指向性音頻信號的方法例如可以包括但 不限于:主元分析(PCA)、獨立元分析、B格式(B-format)分析,等等。以PCA為例,它可以 基于特征值配對的概率分析而處理任何聲道配置。例如,對于具有左聲道(L)、右聲道(R)、 中央聲道(C),左環(huán)繞聲道(Ls)和右環(huán)繞聲道(Rs)這5個聲道的源音頻內(nèi)容,可以對若干 對(例如,10對)聲道分別應(yīng)用PCA,并且輸出相應(yīng)的立體聲指向性信號和發(fā)散性信號。
[0032] 傳統(tǒng)上,基于PCA的分離通常僅被應(yīng)用于雙聲道配對。根據(jù)本發(fā)明的某些實施例, PCA可被擴展到多聲道音頻信號,以實現(xiàn)對源音頻內(nèi)容更為有效的信號分量分解。具體而 言,對于包括C個聲道的源音頻內(nèi)容,假設(shè)在這C個聲道上根據(jù)平移法則(panning law)分 布有D個指向性聲源,并且C個發(fā)散性音頻信號(每個由一個聲道表示)與指向性聲源弱 相關(guān)和/或跨C個聲道弱相關(guān)。根據(jù)本發(fā)明的實施例,可以將每個聲道的模型定義為一個 環(huán)境信號和根據(jù)其空間感知位置而被加權(quán)的指向性音頻信號的和。時域多聲道信號X。= (X1, · · · , χε)τ可以表示為:
[0033]
【權(quán)利要求】
1. 一種用于生成自適應(yīng)音頻內(nèi)容的方法,所述方法包括: 從基于聲道的源音頻內(nèi)容中提取至少一個音頻對象;以及 至少部分地基于所述至少一個音頻對象而生成所述自適應(yīng)音頻內(nèi)容。
2. 根據(jù)權(quán)利要求1所述的方法,其中提取所述至少一個音頻對象包括: 將所述源音頻內(nèi)容分解為指向性音頻信號和發(fā)散性音頻信號;以及 從所述指向性音頻信號中提取所述至少一個音頻對象。
3. 根據(jù)權(quán)利要求2所述的方法,其中分解所述源音頻信號內(nèi)容包括: 對所述源音頻內(nèi)容執(zhí)行信號分量分解;以及 通過分析分解出的信號分量來計算發(fā)散概率。
4. 根據(jù)權(quán)利要求1到3中任一項所述的方法,其中提取所述至少一個音頻對象包括: 對于所述源音頻內(nèi)容中的多個幀中的每一個幀,通過頻譜合成來識別和聚集存在相同 音頻對象的聲道;以及 跨所述多個幀對識別和聚集的所述聲道執(zhí)行時間合成,以便沿時間合成所述至少一個 音頻對象。
5. 根據(jù)權(quán)利要求4所述的方法,其中識別和聚集所述存在相同音頻對象的聲道包括: 對于所述多個幀中的每一個幀,將頻率范圍劃分為多個子頻帶;以及 基于所述多個子頻帶之間的包絡(luò)和頻譜形狀中至少一個的相似性,來識別和聚集所述 存在相同音頻對象的聲道。
6. 根據(jù)權(quán)利要求1到5中任一項所述的方法,還包括: 從所述源音頻內(nèi)容生成基于聲道的靜態(tài)環(huán)境聲, 并且其中生成所述自適應(yīng)音頻內(nèi)容包括基于所述至少一個音頻對象和所述靜態(tài)環(huán)境 聲來生成所述自適應(yīng)音頻內(nèi)容。
7. 根據(jù)權(quán)利要求6所述的方法,其中生成所述靜態(tài)環(huán)境聲包括: 將所述源音頻內(nèi)容分解為指向性音頻信號和發(fā)散性音頻信號;以及 從所述發(fā)散性音頻信號生成所述靜態(tài)環(huán)境聲。
8. 根據(jù)權(quán)利要求6到7中任一項所述的方法,其中生成所述靜態(tài)環(huán)境聲包括: 通過對所述源音頻內(nèi)容執(zhí)行環(huán)境上混音來創(chuàng)建至少一個高度聲道;以及 從所述源音頻內(nèi)容的聲道和所述至少一個高度聲道生成所述靜態(tài)環(huán)境聲。
9. 根據(jù)權(quán)利要求1到8中任一項所述的方法,還包括: 估計與所述自適應(yīng)音頻內(nèi)容相關(guān)聯(lián)的元數(shù)據(jù)。
10. 根據(jù)權(quán)利要求9所述的方法,其中生成所述自適應(yīng)音頻內(nèi)容包括編輯與所述自適 應(yīng)音頻內(nèi)容相關(guān)聯(lián)的所述元數(shù)據(jù)。
11. 根據(jù)權(quán)利要求10所述的方法,其中編輯所述元數(shù)據(jù)包括控制所述自適應(yīng)音頻內(nèi)容 的增益。
12. 根據(jù)權(quán)利要求1到11中任一項所述的方法,其中生成所述自適應(yīng)音頻內(nèi)容包括: 對所述至少一個音頻對象執(zhí)行后處理,所述后處理包括以下至少一個: 分離所述至少一個音頻對象中的至少部分重疊的音頻對象; 修改與所述至少一個音頻對象相關(guān)聯(lián)的屬性;以及 交互地操控所述至少一個音頻對象。
13. -種用于生成自適應(yīng)音頻內(nèi)容的系統(tǒng),所述系統(tǒng)包括: 音頻對象提取器,被配置為從基于聲道的源音頻內(nèi)容中提取至少一個音頻對象;以及 自適應(yīng)音頻生成器,被配置為至少部分地基于所述至少一個音頻對象生成所述自適應(yīng) 音頻內(nèi)容。
14. 根據(jù)權(quán)利要求13所述的系統(tǒng),還包括: 信號分解器,被配置為將所述源音頻內(nèi)容分解為指向性音頻信號和發(fā)散性音頻信號, 并且其中所述音頻對象提取器被配置為從所述指向性音頻信號中提取所述至少一個 音頻對象。
15. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述信號分解器包括: 分量分解器,被配置為對所述源音頻內(nèi)容執(zhí)行信號分量分解;以及 概率計算器,被配置為通過分析分解出的信號分量來計算發(fā)散概率。
16. 根據(jù)權(quán)利要求13到15中任一項所述的系統(tǒng),其中所述音頻對象提取器包括: 頻譜合成器,被配置為對于所述源音頻內(nèi)容中的多個幀中的每一個幀,通過頻譜合成 來識別和聚集存在相同音頻對象的聲道;以及 時間合成器,被配置為跨所述多個幀對識別和聚集的所述聲道執(zhí)行時間合成,以便沿 時間合成所述至少一個音頻對象。
17. 根據(jù)權(quán)利要求16所述的系統(tǒng),其中所述頻譜合成器包括: 頻率劃分器,被配置為對于所述多個幀中的每一個幀,將頻率范圍劃分為多個子頻帶, 并且其中所述頻譜合成器被配置為基于所述多個子頻帶之間的包絡(luò)和頻譜形狀中至 少一個的相似性,來識別和聚集所述存在相同音頻對象的聲道。
18. 根據(jù)權(quán)利要求13到17中任一項所述的系統(tǒng),還包括: 靜態(tài)環(huán)境聲生成器,被配置為從所述源音頻內(nèi)容生成基于聲道的靜態(tài)環(huán)境聲, 并且其中所述自適應(yīng)音頻生成器被配置為基于所述至少一個音頻對象和所述靜態(tài)環(huán) 境聲來生成所述自適應(yīng)音頻內(nèi)容。
19. 根據(jù)權(quán)利要求18所述的系統(tǒng),還包括: 信號分解器,被配置為將所述源音頻內(nèi)容分解為指向性音頻信號和發(fā)散性音頻信號, 并且其中所述靜態(tài)環(huán)境聲生成器被配置為從所述發(fā)散性音頻信號生成所述靜態(tài)環(huán)境 聲。
20. 根據(jù)權(quán)利要求18到19中任一項所述的系統(tǒng),其中所述靜態(tài)環(huán)境聲生成器包括: 高度聲道創(chuàng)建器,被配置為通過對所述源音頻內(nèi)容執(zhí)行環(huán)境上混音來創(chuàng)建至少一個高 度聲道, 并且其中所述靜態(tài)環(huán)境聲生成器被配置為從所述源音頻內(nèi)容的聲道和所述至少一個 高度聲道來生成所述靜態(tài)環(huán)境聲。
21. 根據(jù)權(quán)利要求13到20中任一項所述的系統(tǒng),還包括: 元數(shù)據(jù)估計器,被配置為估計與所述自適應(yīng)音頻內(nèi)容相關(guān)聯(lián)的元數(shù)據(jù)。
22. 根據(jù)權(quán)利要求21所述的系統(tǒng),還包括: 元數(shù)據(jù)編輯器,被配置為編輯與所述自適應(yīng)音頻內(nèi)容相關(guān)聯(lián)的所述元數(shù)據(jù)。
23. 根據(jù)權(quán)利要求22所述的系統(tǒng),其中所述元數(shù)據(jù)編輯器包括增益控制器,被配置為 控制所述自適應(yīng)音頻內(nèi)容的增益。
24. 根據(jù)權(quán)利要求13到23中任一項所述的系統(tǒng),其中所述自適應(yīng)音頻生成器包括: 后處理控制器,被配置為對所述至少一個音頻對象執(zhí)行后處理,所述后處理控制器包 括以下至少一個: 對象分離器,被配置為分離所述至少一個音頻對象中的至少部分重疊的音頻對象; 屬性修改器,被配置為修改與所述至少一個音頻對象相關(guān)聯(lián)的屬性;以及 對象操控器,被配置為交互地操控所述至少一個音頻對象。
25. -種計算機程序產(chǎn)品,包括有形地包含于機器可讀介質(zhì)上的計算機程序,所述計算 機程序包含用于執(zhí)行根據(jù)權(quán)利要求1到12任一項所述的方法的程序代碼。
【文檔編號】G10L19/008GK104240711SQ201310246711
【公開日】2014年12月24日 申請日期:2013年6月18日 優(yōu)先權(quán)日:2013年6月18日
【發(fā)明者】王珺, 蘆烈, 胡明清, D·J·布里巴特, N·R·辛格斯 申請人:杜比實驗室特許公司