亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

存儲(chǔ)音頻文件的設(shè)備和方法

文檔序號(hào):7636280閱讀:352來(lái)源:國(guó)知局
專利名稱:存儲(chǔ)音頻文件的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及波場(chǎng)合成領(lǐng)域,更具體地,涉及利用要處理的數(shù)據(jù)對(duì) 波場(chǎng)合成呈現(xiàn)裝置的控制。本發(fā)明涉及波場(chǎng)合成概念,具體涉及結(jié)合多呈現(xiàn)器系統(tǒng)的有效波 場(chǎng)合成概念。
背景技術(shù)
對(duì)于在娛樂(lè)電子設(shè)備領(lǐng)域中的新技術(shù)和創(chuàng)新產(chǎn)品有著日益增長(zhǎng) 的需求。對(duì)于新多媒體系統(tǒng)的成功來(lái)說(shuō),提供最佳功能或容量是非常 重要的先決條件。這通過(guò)使用數(shù)字技術(shù)、特別是使用計(jì)算機(jī)技術(shù)來(lái)實(shí) 現(xiàn)。其示例是提供了增強(qiáng)的接近現(xiàn)實(shí)的視聽印象的應(yīng)用。在先前的音 頻系統(tǒng)中,實(shí)質(zhì)性缺點(diǎn)在于自然以及虛擬環(huán)境的三維聲音再現(xiàn)的質(zhì)量。許多年來(lái),己知音頻信號(hào)的多信道揚(yáng)聲器再現(xiàn)的方法并對(duì)該方法 進(jìn)行了標(biāo)準(zhǔn)化。所有常用技術(shù)具有以下缺點(diǎn)揚(yáng)聲器的地點(diǎn)和收聽者 的位置已經(jīng)在傳輸格式中有所體現(xiàn)。揚(yáng)聲器相對(duì)于收聽者的錯(cuò)誤設(shè)置 使音頻質(zhì)量顯著下降。僅在再現(xiàn)空間的小區(qū)域內(nèi)(所謂有效點(diǎn)(sweet spot))可能有最佳聲音。在新技術(shù)的幫助下,可以實(shí)現(xiàn)較好的自然空間感以及音頻再現(xiàn)的 更大范圍或包層。TU Delft處已經(jīng)研究了所謂波場(chǎng)合成(WFS)的技 術(shù)原理,并首次在80年代后期提出(Berkout,A丄;deVries,D.; Vogel, R: Acoustic control by Wave field Synthesis. JASA93, 1993 )。由于該方法對(duì)于計(jì)算機(jī)功率和傳輸速率的極大需求,波場(chǎng)合成直 到現(xiàn)在在實(shí)際中也很少采用。目前,只有微處理器技術(shù)領(lǐng)域中的進(jìn)步 和音頻編碼允許在具體應(yīng)用中采用該技術(shù)。期望明年出現(xiàn)在專業(yè)領(lǐng)域 中的第一個(gè)成果。設(shè)想在一些年后,消費(fèi)領(lǐng)域內(nèi)的第一波場(chǎng)合成應(yīng)用
開始投放市場(chǎng)。WFS的基本思想基于波動(dòng)說(shuō)的惠更斯原理的應(yīng)用 波所捕獲的每一點(diǎn)是以球或圓方武傳播的元波的起點(diǎn)。 應(yīng)用于聲學(xué),通過(guò)彼此相鄰設(shè)置的大量揚(yáng)聲器(所謂揚(yáng)聲器陣列),來(lái)復(fù)制每個(gè)到來(lái)的波陣面(wave front)的任意形狀。在最簡(jiǎn)單 的情況下,即要再現(xiàn)單個(gè)點(diǎn)源并且揚(yáng)聲器按照線性設(shè)置,則每個(gè)揚(yáng)聲 器的音頻信號(hào)必須以時(shí)間延遲的方式饋入,并進(jìn)行振幅縮放,從而各 個(gè)揚(yáng)聲器的輻射聲場(chǎng)適當(dāng)?shù)刂丿B。利用多個(gè)聲源,對(duì)于每個(gè)源,單獨(dú) 地計(jì)算對(duì)于每個(gè)揚(yáng)聲器的貢獻(xiàn),并將所產(chǎn)生的信號(hào)相加。如果要再現(xiàn) 的源在具有反射壁的室內(nèi),則也必須作為附加源,經(jīng)由揚(yáng)聲器陣列來(lái) 再現(xiàn)反射。因此,在計(jì)算中的消耗很大程度上取決于聲源的個(gè)數(shù)、錄 音室的反射屬性和揚(yáng)聲器的個(gè)數(shù)。具體地,該技術(shù)的優(yōu)點(diǎn)在于,可以在大區(qū)域的再現(xiàn)空間上有自然 的三維聲音印象。與已知技術(shù)相反,以非常精確的方式再現(xiàn)聲源的方 向和距離。在有限程度上,甚至可以在真實(shí)的揚(yáng)聲器陣列與收聽者之 間定位虛擬聲源。盡管波場(chǎng)合成很好地用于具有己知屬性的環(huán)境,但是如果屬性改 變或基于不匹配環(huán)境實(shí)際屬性的環(huán)境屬性而執(zhí)行波場(chǎng)合成,則會(huì)出現(xiàn) 紊亂。周圍環(huán)境的屬性還可以由周圍環(huán)境的脈沖響應(yīng)來(lái)進(jìn)行描述。 這將基于后續(xù)的示例更加詳細(xì)地提出。假設(shè)揚(yáng)聲器朝墻壁發(fā)出聲音信號(hào),但不希望有反射。使用波場(chǎng)合成的空間補(bǔ)償將包括以下事實(shí) 首先,確定該墻壁的反射,以確定在已從墻壁反射回來(lái)的聲音信號(hào)何 時(shí)再次到達(dá)揚(yáng)聲器、以及該反射的聲音信號(hào)具有多大振幅。如果不期 望來(lái)自該墻壁的反射,則可以利用波場(chǎng)合成,通過(guò)施加具有相應(yīng)振幅、 并具有與揚(yáng)聲器上的反射信號(hào)相反相位的信號(hào)來(lái)消除來(lái)自該墻壁的反 射,從而傳播補(bǔ)償波抵消反射波,使得在所考慮的周圍環(huán)境中消除了 來(lái)自該墻壁的反射。這可以通過(guò)以下實(shí)現(xiàn)首先計(jì)算周圍環(huán)境的脈沖 響應(yīng),然后基于該周圍環(huán)境的脈沖響應(yīng)來(lái)確定墻壁的屬性和位置,其 中,將墻壁當(dāng)作鏡面源,即反射入射聲音的聲源。
如果首先測(cè)量該周圍環(huán)境的脈沖響應(yīng),然后計(jì)算必須以在音頻信 號(hào)上疊加的方式施加于揚(yáng)聲器上的補(bǔ)償信號(hào),則將會(huì)發(fā)生來(lái)自該墻壁 反射的抵消,從而在該周圍環(huán)境中的收聽者具有該墻壁根本不存在的聲音印象。然而,對(duì)于反射波的最佳補(bǔ)償,關(guān)鍵是精確地確定房間的脈沖響 應(yīng),從而不會(huì)出現(xiàn)過(guò)補(bǔ)償或欠補(bǔ)償。因此,波場(chǎng)合成允許在大的再現(xiàn)區(qū)域上恰當(dāng)?shù)赜成涮摂M聲源。同時(shí),在非常復(fù)雜的聲音場(chǎng)景的創(chuàng)建過(guò)程中,向音響大師(sound master) 和錄音師提供了新技術(shù)和創(chuàng)造潛力。80年代末在TUDdft開發(fā)的波場(chǎng) 合成(WFS,或者也稱為聲場(chǎng)合成)表示聲音再現(xiàn)的全息方式。 Kirchhoff-Helmholtz積分用作該方式的基礎(chǔ)。它闡述了可以通過(guò)封閉 體積表面上的單極和雙極聲源(揚(yáng)聲器陣列)的分布來(lái)產(chǎn)生該體積內(nèi) 的任意聲場(chǎng)。在波場(chǎng)合成中,根據(jù)在虛擬位置處發(fā)出虛擬源的音頻信號(hào)來(lái)計(jì)算 揚(yáng)聲器陣列的每個(gè)揚(yáng)聲器的合成信號(hào),其中,關(guān)于振幅和相位來(lái)形成合成信號(hào),從而從出現(xiàn)在揚(yáng)聲器陣列中的揚(yáng)聲器所輸出的各個(gè)聲波的 疊加而產(chǎn)生的波與在虛擬位置處的虛擬源是具有真實(shí)位置的真實(shí)源的 情況下由虛擬位置處的虛擬源所產(chǎn)生的波相對(duì)應(yīng)。典型地,多個(gè)虛擬源出現(xiàn)在各個(gè)虛擬位置上。針對(duì)每個(gè)虛擬位置 的每個(gè)虛擬源來(lái)執(zhí)行合成信號(hào)的計(jì)算,從而典型地, 一個(gè)虛擬源產(chǎn)生 了多個(gè)揚(yáng)聲器的合成信號(hào)。因而,從揚(yáng)聲器角度來(lái)看,該揚(yáng)聲器接收 返回各個(gè)虛擬源的多個(gè)合成信號(hào)。然后,由于線性疊加原理而導(dǎo)致的 這些源的可能疊加產(chǎn)生了實(shí)際從揚(yáng)聲器發(fā)出的再現(xiàn)信號(hào)。揚(yáng)聲器陣列越大,即提供了越多的各個(gè)揚(yáng)聲器,越可以更好地利用波場(chǎng)合成。然而,為此,由于典型地還必須考慮信道信息,所以波 場(chǎng)合成單元所必需的計(jì)算能力必須增加。詳細(xì)地,在原理上,這表示 出現(xiàn)從每個(gè)虛擬源至每個(gè)揚(yáng)聲器的自身的傳輸信道,以及原理上,可 以是以下情況每個(gè)虛擬源產(chǎn)生了每個(gè)揚(yáng)聲器的合成信號(hào),和/或每個(gè) 揚(yáng)聲器獲得了等于虛擬源個(gè)數(shù)的多個(gè)合成信號(hào)。如果特別地,在影院應(yīng)用中的波場(chǎng)合成可能要用在虛擬源也可移 動(dòng)的情況下,則可以看出,由于合成信號(hào)的計(jì)算、信道信息的計(jì)算以 及通過(guò)信道信息和合成信號(hào)的組合的再現(xiàn)信號(hào)的生成,而導(dǎo)致要運(yùn)用 相當(dāng)強(qiáng)的計(jì)算能力。此外,應(yīng)注意,此時(shí),音頻再現(xiàn)的質(zhì)量隨著可用揚(yáng)聲器的個(gè)數(shù)而 增加。這表示音頻再現(xiàn)質(zhì)量變得越好并且越逼真,則在揚(yáng)聲器陣列中 存在的揚(yáng)聲器越多。在上述場(chǎng)景中,例如,可以將各個(gè)揚(yáng)聲器的完全呈現(xiàn)并進(jìn)行了模 數(shù)轉(zhuǎn)換的再現(xiàn)信號(hào)從波場(chǎng)合成中心單元經(jīng)由雙線線路傳輸至各個(gè)揚(yáng)聲 器。這確實(shí)具有以下優(yōu)點(diǎn)幾乎確保了所有揚(yáng)聲器同步工作,從而在 這里不再需要其它措施用于同步目的。另一方面,總是可以僅針對(duì)特 定再現(xiàn)室或針對(duì)利用固定個(gè)數(shù)的揚(yáng)聲器的再現(xiàn),對(duì)波場(chǎng)合成中央單元 進(jìn)行再現(xiàn)。這表示,由于必須至少部分并行且實(shí)時(shí)地進(jìn)行音頻再現(xiàn)信 號(hào)的計(jì)算(尤其對(duì)于許多揚(yáng)聲器和/或許多虛擬源的情況),所以對(duì)于 每個(gè)再現(xiàn)室,必須構(gòu)造它自己的波場(chǎng)合成中央單元,而這必須執(zhí)行相 當(dāng)大的計(jì)算能力。德國(guó)專利DE 10254404 B4公開了如圖7所示的系統(tǒng)。 一個(gè)部分 是中心波場(chǎng)合成模塊10。另一部分包括各個(gè)揚(yáng)聲器模塊12a、12b、12c、 12d、 12e,它們與實(shí)際的物理?yè)P(yáng)聲器14a、 14b、 14c、 14d、 14e (例 如,如圖l所示)連接。應(yīng)注意,多個(gè)揚(yáng)聲器14a-14e位于大于50的 范圍中,以及典型地,在典型應(yīng)用中甚至在遠(yuǎn)大于IOO的范圍中。如 果將特有的揚(yáng)聲器與每個(gè)揚(yáng)聲器相關(guān)聯(lián),則也需要相應(yīng)個(gè)數(shù)的揚(yáng)聲器 模塊。然而,依據(jù)該應(yīng)用,優(yōu)選對(duì)來(lái)自揚(yáng)聲器模塊的鄰接揚(yáng)聲器小組 進(jìn)行選址。在這個(gè)連接中,任意地,例如與四個(gè)揚(yáng)聲器連接的揚(yáng)聲器 模塊以相同的再現(xiàn)信號(hào)饋入四個(gè)揚(yáng)聲器,或者針對(duì)四個(gè)揚(yáng)聲器計(jì)算相 應(yīng)不同的合成信號(hào),從而這種揚(yáng)聲器模塊實(shí)際包括多個(gè)單獨(dú)的揚(yáng)聲器 模塊,然而這些揚(yáng)聲器模塊物理上概括于一個(gè)單元中。在波場(chǎng)合成模塊IO和每個(gè)單獨(dú)的揚(yáng)聲器12a-12e之間,存在特有 的傳輸路徑16a-16e,每個(gè)傳輸路徑與中心波場(chǎng)合成模塊和自己的揚(yáng)聲 器模塊連接。將提供了高數(shù)據(jù)速率的串行傳輸格式(如,所謂Firewire傳輸格
式或USB數(shù)據(jù)格式)優(yōu)選作為用于將數(shù)據(jù)從波場(chǎng)合成模塊傳輸至揚(yáng)聲 器模塊的數(shù)據(jù)傳輸模式。大于每秒100兆比特的數(shù)據(jù)傳輸速率是有利 的。因此,根據(jù)在波場(chǎng)合成模塊中選擇的數(shù)據(jù)格式,來(lái)相應(yīng)地對(duì)從波 場(chǎng)合成模塊10傳輸至揚(yáng)聲器模塊的數(shù)據(jù)流進(jìn)行格式化,并提供在常用 的串行數(shù)據(jù)格式中提供的同步信息。由各個(gè)揚(yáng)聲器模塊從該同步信息 中提取該同步信息,并將該同步信息用于使各個(gè)揚(yáng)聲器模塊相對(duì)于它 們的再現(xiàn)同步,即最終用于獲得模擬揚(yáng)聲器信號(hào)和為此而提供的采樣 (再采樣)的模數(shù)轉(zhuǎn)換。中心波場(chǎng)合成模塊用作主模塊,而所有揚(yáng)聲 器模塊用作客戶端,其中,單獨(dú)的數(shù)據(jù)流全部都獲得經(jīng)由各個(gè)傳輸路 徑16a-16e來(lái)自中心模塊10的相同的同步信息。這確保了所有揚(yáng)聲器 模塊同步工作,即與主模塊10同步,這對(duì)于音頻再現(xiàn)系統(tǒng)不會(huì)遭受音 頻質(zhì)量的損失來(lái)說(shuō)非常重要,從而不會(huì)在相應(yīng)的音頻呈現(xiàn)之后以與各 個(gè)揚(yáng)聲器在時(shí)間上有偏移的方式來(lái)輻射通過(guò)波場(chǎng)合成模塊所計(jì)算的合 成信號(hào)。所描述的概念給波場(chǎng)合成系統(tǒng)提供了顯著的靈活性,該靈活性對(duì)于各種方式的應(yīng)用是可縮放的。但是仍然存在以下問(wèn)題執(zhí)行實(shí)際主 呈現(xiàn)(即,依據(jù)虛擬源的位置和揚(yáng)聲器位置,計(jì)算揚(yáng)聲器的各個(gè)合成 信號(hào))的中心波場(chǎng)合成模塊表示整個(gè)系統(tǒng)的"瓶頸"。盡管在該系統(tǒng)中, 已經(jīng)以分散方式執(zhí)行了"后呈現(xiàn)"(即,具有信道傳輸功能等的合成信 號(hào)的強(qiáng)加),因而巳經(jīng)通過(guò)選擇具有比所確定的閾值能量小的能量的合 成信號(hào),減小了中心呈現(xiàn)模塊與單獨(dú)的揚(yáng)聲器模塊之間的必要數(shù)據(jù)傳 輸能力,但是,仍必須針對(duì)所有揚(yáng)聲器模塊,呈現(xiàn)所有虛擬源,即轉(zhuǎn) 換為合成信號(hào),其中,僅在呈現(xiàn)之后才進(jìn)行選擇。這表示,呈現(xiàn)仍確定了系統(tǒng)的整個(gè)容量。例如,如果中央呈現(xiàn)單元能夠同時(shí)呈現(xiàn)32個(gè)虛擬源,即同時(shí)計(jì)算這32個(gè)虛擬源的合成信號(hào), 則如果在一個(gè)音頻場(chǎng)景中一次有多于32個(gè)源是有效的,則出現(xiàn)了嚴(yán)重 的容量瓶頸。對(duì)于簡(jiǎn)單場(chǎng)景,這是足夠的。對(duì)于較復(fù)雜的場(chǎng)景,尤其 具有融入式的聲音印象,即例如在下雨時(shí),許多雨點(diǎn)表示單獨(dú)的源, 則直接顯而易見地,具有最多為32個(gè)源的容量將不再是足夠的。如果 存在大管弦樂(lè)隊(duì),以及實(shí)際期望對(duì)每個(gè)管弦樂(lè)隊(duì)演奏者或至少每個(gè)樂(lè) 器組,作為在自己位置上的自身源進(jìn)行處理,也存在相應(yīng)的情形。這里,32個(gè)虛擬源可以非常迅速地變得較少。典型地,在己知的波場(chǎng)合成概念中,使用了場(chǎng)景描述,其中,共 同定義了各個(gè)音頻對(duì)象,從而使用場(chǎng)景描述中的數(shù)據(jù)和用于各個(gè)虛擬 源的音頻數(shù)據(jù),呈現(xiàn)器或多呈現(xiàn)裝置可以呈現(xiàn)完整的場(chǎng)景。這里,針 對(duì)每個(gè)音頻對(duì)象,精確地定義了音頻對(duì)象必須從哪里開始并在哪里結(jié) 束。此外,對(duì)于每個(gè)音頻對(duì)象,精確地指出要成為虛擬源的虛擬源的 位置,即要進(jìn)入波場(chǎng)合成呈現(xiàn)裝置的位置,從而針對(duì)每個(gè)揚(yáng)聲器生成相應(yīng)的合成信號(hào)。這導(dǎo)致了以下的事實(shí)通過(guò)作為對(duì)合成信號(hào)的作用, 將從單獨(dú)的揚(yáng)聲器輸出的聲波疊加,對(duì)于收聽者的印象如同聲源位于 再現(xiàn)室內(nèi)或再現(xiàn)室外,這通過(guò)虛擬源的源位置來(lái)定義。典型地,波場(chǎng)合成系統(tǒng)的容量是有限的。這導(dǎo)致了每個(gè)呈現(xiàn)器具有有限的計(jì)算能力。典型地,呈現(xiàn)器能夠同時(shí)處理32個(gè)音頻源。此外,從音頻服務(wù)器至呈現(xiàn)器的傳輸路徑具有有限的傳輸帶寬,即提供了以 每秒比特為單位的最大傳輸速率。對(duì)于例如僅有兩個(gè)虛擬源存在的簡(jiǎn)單場(chǎng)景,如果考慮對(duì)話,除背景噪聲之外,還存在另一虛擬源,則事實(shí)上可以同時(shí)處理例如32個(gè)源 的呈現(xiàn)器的處理能力不存在問(wèn)題。此外,在這種情況下,到呈現(xiàn)器的 傳輸量非常小,使得傳輸路徑的容量是足夠的。然而,在再現(xiàn)更加復(fù)雜的場(chǎng)景(即,具有多于32個(gè)虛擬源的場(chǎng) 景)時(shí),將出現(xiàn)問(wèn)題。在這種情況下,例如在正確再現(xiàn)雨中的場(chǎng)景、 或者自然再現(xiàn)歡呼場(chǎng)景的情況下,限于32個(gè)虛擬源的呈現(xiàn)器的最大計(jì)算能力很快將不再是足夠的。這是由于以下事實(shí)因?yàn)槔缭诼牨娭校?在原理上可以將正在歡呼的每個(gè)收聽者理解為在自身虛擬位置上的自 身虛擬源,所以存在許多單獨(dú)的虛擬源。為了解決這個(gè)限制,存在多 種可能性。因此, 一種可能性是在創(chuàng)建場(chǎng)景描述時(shí)已經(jīng)注意到呈現(xiàn)器 從來(lái)不必同時(shí)處理32個(gè)音頻對(duì)象。具體地,當(dāng)考慮波場(chǎng)合成處理的能力增加時(shí),即當(dāng)要由單獨(dú)或多 個(gè)呈現(xiàn)器模塊呈現(xiàn)大量虛擬源時(shí),有時(shí)將會(huì)到達(dá)容量瓶頸。這是由于
典型的呈現(xiàn)器僅可以同時(shí)處理特定最大個(gè)數(shù)的虛擬源的這一事實(shí)。例如,該個(gè)數(shù)可以是32。然而,呈現(xiàn)器的最大處理能力不是系統(tǒng)的唯一 瓶頸。例如,如果要同時(shí)處理32個(gè)虛擬源,則還必須同時(shí)向呈現(xiàn)器提 供32個(gè)虛擬源的相應(yīng)音頻文件。典型地,呈現(xiàn)器具有輸入緩沖器,它 確實(shí)稍微改善了對(duì)數(shù)據(jù)傳輸?shù)男枨?,但是也必須相?yīng)迅速地被填充, 尤其在呈現(xiàn)器正在同時(shí)處理非常多的源時(shí),即從緩沖器中取出非常多 的數(shù)據(jù)時(shí)。如果設(shè)計(jì)數(shù)據(jù)傳輸結(jié)構(gòu)使它不再趕上數(shù)據(jù)傳遞的速度,則呈現(xiàn)器 會(huì)用盡用于呈現(xiàn)的數(shù)據(jù)。呈現(xiàn)器仍可以通過(guò)簡(jiǎn)單的重復(fù)最后的數(shù)據(jù)直 至新數(shù)據(jù)到達(dá),來(lái)稍微補(bǔ)償這種情況。然而,這在數(shù)據(jù)管理中是加強(qiáng) (intensive)的,并且會(huì)導(dǎo)致可聽到的人為信號(hào)(artifact)。如果虛擬 源是具有確定性信息(如,語(yǔ)音、音樂(lè)等)的源,則這些人為信號(hào)將 更差。如果虛擬源是噪聲源、或者一般所稱的聲源,則當(dāng)前數(shù)據(jù)的這 種重復(fù)將不太關(guān)鍵。但是這里區(qū)分也是存在問(wèn)題的,尤其當(dāng)呈現(xiàn)器已 經(jīng)以最大利用率(工作負(fù)載)限制運(yùn)行(這是"用盡"要呈現(xiàn)的音頻 數(shù)據(jù)的原因)時(shí),但實(shí)際上呈現(xiàn)器必須確切地執(zhí)行這種"附加"任務(wù) 的上下文中。發(fā)明內(nèi)容本發(fā)明的目的是提供了一種用于存儲(chǔ)音頻文件的概念,實(shí)現(xiàn)了更 高質(zhì)量和更易于實(shí)現(xiàn)的波場(chǎng)合成。通過(guò)如權(quán)利要求1所述的用于存儲(chǔ)音頻文件的設(shè)備、如權(quán)利要求 13所述的用于存儲(chǔ)音頻文件的方法、或者如權(quán)利要求14所述的計(jì)算 機(jī)程序來(lái)實(shí)現(xiàn)本發(fā)明的目的。本發(fā)明基于以下發(fā)現(xiàn)有效的數(shù)據(jù)結(jié)構(gòu)是決定性的,從而甚至在呈現(xiàn)器工作在利用率限制下時(shí),也向呈現(xiàn)器提供足夠的數(shù)據(jù)。典型地,從存儲(chǔ)設(shè)備(如PC或工作站的硬盤)中讀出向呈現(xiàn)器提供的數(shù)據(jù)。然而發(fā)現(xiàn),對(duì)音頻文件的存取時(shí)間實(shí)質(zhì)上取決于音頻文件如何存 儲(chǔ)在存儲(chǔ)設(shè)備中的存儲(chǔ)介質(zhì)上。硬盤的寫/讀頭的連續(xù)跳躍導(dǎo)致了以下 事實(shí)存儲(chǔ)設(shè)備的讀出性能極速降低,從而在特定情況下,不再能夠 確保向呈現(xiàn)器提供充足的數(shù)據(jù)。此外發(fā)現(xiàn)了,在呈現(xiàn)器正以利用率限 制工作、或者接近于它的利用率限制的場(chǎng)景中,正是這種情況。相反 地,當(dāng)在另一場(chǎng)景中呈現(xiàn)器并不工作在接近于它的利用率限制下時(shí), 沒有太多的問(wèn)題。因此,在這里,可以很好地接受存儲(chǔ)設(shè)備的寫/讀頭 的跳躍。根據(jù)本發(fā)明,在某種意義上,作為波場(chǎng)合成再現(xiàn)的準(zhǔn)備,因而對(duì) 音頻文件進(jìn)行有效存儲(chǔ),其中,應(yīng)用了交叉場(chǎng)景存儲(chǔ)器優(yōu)化。這樣, 檢查場(chǎng)景描述以發(fā)現(xiàn)第一場(chǎng)景需要的波場(chǎng)合成系統(tǒng)的處理能力比另一 第二場(chǎng)景更高。然后,控制存儲(chǔ)設(shè)備的寫入裝置,從而將由第一場(chǎng)景 的場(chǎng)景描述所標(biāo)識(shí)的音頻文件寫入存儲(chǔ)設(shè)備,使得存儲(chǔ)設(shè)備的讀取裝 置可以比將第一場(chǎng)景的音頻文件以純隨機(jī)方式存儲(chǔ)于存儲(chǔ)設(shè)備上的情 況更加快速地讀出第一場(chǎng)景的音頻文件。與通常的硬盤環(huán)境(其中, 文件總是存儲(chǔ)在硬盤上讀取頭當(dāng)前正處于的位置,即以某種隨機(jī)方式) 相反,根據(jù)本發(fā)明,以優(yōu)化方式寫入強(qiáng)加載在波場(chǎng)合成系統(tǒng)上的場(chǎng)景 的音頻文件,這當(dāng)然導(dǎo)致了不會(huì)以最佳方式寫入其它場(chǎng)景的音頻文件。 然而,由于在其它場(chǎng)景中,存儲(chǔ)設(shè)備可以具有更多的存取時(shí)間,由于 其它場(chǎng)景所需的數(shù)據(jù)傳輸速率無(wú)論如何不會(huì)那么高,由于要并行處理 更少的虛擬源,所以這不成問(wèn)題。在本發(fā)明的優(yōu)選實(shí)施例中,尤其對(duì)于用于多個(gè)場(chǎng)景中的音頻文 件,將音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備上,從而以最佳方式寫入對(duì)需要波場(chǎng) 合成系統(tǒng)最高利用率的場(chǎng)景的存儲(chǔ)存取,同時(shí)接受用于存取相同音頻 文件的其它場(chǎng)景的多個(gè)跳動(dòng)。在具有多個(gè)可以并行使用的單獨(dú)的存儲(chǔ)介質(zhì)(如,RAID陣列) 的存儲(chǔ)設(shè)備中,優(yōu)選地,在并行的單獨(dú)存儲(chǔ)介質(zhì)上存儲(chǔ)要并行使用的 音頻文件,從而可以針對(duì)存在容量問(wèn)題的場(chǎng)景,以最大速度來(lái)讀出這 些音頻文件,而對(duì)于其它場(chǎng)景,同時(shí)要處理的音頻文件并不在獨(dú)立的 盤上,而是在例如同一個(gè)磁盤上,然而,這對(duì)于利用率來(lái)說(shuō)并不關(guān)鍵, 在這里無(wú)論如何不會(huì)那樣高。


將參照附圖,在以下對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行更加詳細(xì)的描 述,其中圖1是用于存儲(chǔ)音頻文件的本發(fā)明概念的電路框圖;圖lb示出了具有不同波場(chǎng)合成系統(tǒng)利用率的場(chǎng)景的示例性音頻片段;圖lc示出了優(yōu)化的交叉場(chǎng)景存儲(chǔ)器的第一示例; 圖ld示出了優(yōu)化的交叉場(chǎng)景存儲(chǔ)器的第二示例; 圖2示出了示例性音頻對(duì)象; 圖3示出了示例性場(chǎng)景描述;圖4示出了比特流,其中具有當(dāng)前時(shí)間數(shù)據(jù)和位置數(shù)據(jù)的報(bào)頭與 每個(gè)音頻對(duì)象相關(guān)聯(lián);圖5示出了嵌入到了整個(gè)波場(chǎng)合成系統(tǒng)中的本發(fā)明概念; 圖6是已知波場(chǎng)合成概念的示意性示例;以及 圖7是已知波場(chǎng)合成概念的另一示例。
具體實(shí)施方式
圖1示出了本發(fā)明的設(shè)備,該設(shè)備利用形成為圖la中示出的實(shí) 施例中的公共寫/讀頭2的寫入裝置和讀取裝置,將音頻片段的音頻文 件存儲(chǔ)于存儲(chǔ)設(shè)備中。音頻片段要由波場(chǎng)合成系統(tǒng)3的呈現(xiàn)器來(lái)呈現(xiàn)。 具體地,音頻片段包括多個(gè)場(chǎng)景,具有為每個(gè)場(chǎng)景所提供的自身場(chǎng)景 描述,以及包括場(chǎng)景的音頻對(duì)象的時(shí)間序列的場(chǎng)景。具體地,音頻對(duì) 象包括與虛擬源有關(guān)的信息、以及與音頻對(duì)象相關(guān)聯(lián)的音頻文件的標(biāo) 識(shí)。根據(jù)本發(fā)明,提供了裝置4,用于檢査場(chǎng)景描述和用于確定第一 場(chǎng)景需要比第二場(chǎng)景更高的波場(chǎng)合成系統(tǒng)的處理能力。為此,如圖la 所示,可以向裝置4提供與波場(chǎng)合成系統(tǒng)3有關(guān)的信息,以及尤其是 與波場(chǎng)合成系統(tǒng)中呈現(xiàn)器的當(dāng)前利用率有關(guān)的信息。裝置4控制控制 裝置5??刂蒲b置5形成用于控制寫/讀頭2,從而將由第一場(chǎng)景的場(chǎng) 景描述所標(biāo)識(shí)的音頻文件(即,具有更高利用率的場(chǎng)景的音頻文件) 寫入存儲(chǔ)設(shè)備1上,使得讀取裝置2可以比將第一場(chǎng)景的音頻文件隨 機(jī)存儲(chǔ)在存儲(chǔ)設(shè)備上的情況更加快速地讀出第一場(chǎng)景的音頻文件。優(yōu)選地,音頻文件來(lái)自另一存儲(chǔ)設(shè)備6 (可以是CD或DVD),并直接 經(jīng)由控制裝置寫在存儲(chǔ)設(shè)備上,或者以控制裝置5所確定的正確順序, 通過(guò)由控制裝置控制的方式直接從附加存儲(chǔ)器6提供給存儲(chǔ)設(shè)備1的 寫/讀頭2。具體地,控制裝置5形成用于對(duì)存儲(chǔ)設(shè)備1 (例如硬盤)寫入, 以便在任何情況下不會(huì)出現(xiàn)分段,即連續(xù)地寫入所有音頻文件。此外, 控制裝置形成用于將音頻文件寫入硬盤中的特定位置。這樣,存儲(chǔ)(即, 物理硬盤的實(shí)際寫入)不再單獨(dú)遺留給硬盤控制器、或者出現(xiàn)類似于 傳統(tǒng)硬盤的情況。作為替代,控制裝置5形成用于精確地控制存儲(chǔ)設(shè) 備1的寫/讀頭2,從而將音頻文件以特定順序和布置存儲(chǔ)在存儲(chǔ)設(shè)備 上。據(jù)此,確保了在波場(chǎng)合成系統(tǒng)要播放音頻片段時(shí),至少針對(duì)波場(chǎng) 合成系統(tǒng)工作在利用率限制下的場(chǎng)景,讀取頭可以盡可能迅速地讀出, 例如可以在其間不進(jìn)行跳躍的情況下沿軌道逐一讀出音頻文件,并將 它們提供給波場(chǎng)合成系統(tǒng)3。相反,對(duì)于其它場(chǎng)景,如將參照?qǐng)Dld所 描述的,接受跳躍,然而,由于要傳輸至呈現(xiàn)器的數(shù)據(jù)無(wú)論如何不會(huì) 那么龐大,所以接受跳躍對(duì)于這些場(chǎng)景來(lái)說(shuō)不那么嚴(yán)重。在此點(diǎn)上應(yīng)指出,由于音頻片段的固有動(dòng)態(tài),尤其是在苛求的音 頻場(chǎng)景中,所以在要根據(jù)本發(fā)明對(duì)它們進(jìn)行處理時(shí),波場(chǎng)合成系統(tǒng)的 利用率根本不恒定。而是,利用率簡(jiǎn)檔(profile)將以極高的動(dòng)態(tài)為 特征。這樣,將會(huì)存在利用率非常低的場(chǎng)景或部分,而直接在此之后, 利用率可以立即到達(dá)最大限制。對(duì)于這種情況,可以很好地想像當(dāng)樂(lè) 器演奏的一段音樂(lè)(僅一個(gè)源)消逝,然后觀眾的歡呼(非常多的不 同源)立即開始時(shí)的場(chǎng)景。根據(jù)本發(fā)明,以最佳和交叉場(chǎng)景的方式來(lái)存儲(chǔ)音頻文件。為此, 在播放具有高利用率的場(chǎng)景時(shí),檢査需要那些音頻文件,以便在之后 以優(yōu)化方式精確地存儲(chǔ)這些音頻文件。如圖la所示,波場(chǎng)合成系統(tǒng)3包括呈現(xiàn)器或多個(gè)呈現(xiàn)器模塊, 作為中心元件。典型地,由調(diào)度器來(lái)控制呈現(xiàn)器,優(yōu)選地,調(diào)度器形 成用于使用可能提供的音頻對(duì)象處理來(lái)生成數(shù)據(jù)流。因此,調(diào)度器負(fù) 責(zé)迅速地從存儲(chǔ)設(shè)備1中讀出數(shù)據(jù),并將該數(shù)據(jù)提供給下游的呈現(xiàn)器, 然后呈現(xiàn)器根據(jù)音頻文件來(lái)產(chǎn)生提供給揚(yáng)聲器陣列中的各個(gè)揚(yáng)聲器的 合成信號(hào)。因此,本發(fā)明的以交叉場(chǎng)景的優(yōu)化方式存儲(chǔ)音頻文件用于為實(shí)際的波場(chǎng)合成呈現(xiàn)(在圖la中也被稱為"播放")做準(zhǔn)備。因此,本發(fā) 明的交叉場(chǎng)景的優(yōu)化存儲(chǔ)器用于以下事實(shí)可以在播放時(shí)進(jìn)行快速的 數(shù)據(jù)讀取,這非??欤沟弥辽俅鎯?chǔ)器接口將不會(huì)成為波場(chǎng)合成處理 的瓶頸。圖lb示出了具有第一場(chǎng)景和第二場(chǎng)景的示例性音頻片段,其中, 在第一場(chǎng)景中,必須并行呈現(xiàn)四個(gè)源和/或四個(gè)音頻文件ADl、 AD2、 AD3、 AD4,其中,必須在第二場(chǎng)景中并行呈現(xiàn)不多于三個(gè)音頻文件, 即AD6、 AD7禾Q AD1。根據(jù)本發(fā)明,基于圖lc,將在接下來(lái)示出針對(duì)多個(gè)并行盤所形成 的存儲(chǔ)器優(yōu)化。這樣,將以最佳方式存儲(chǔ)第一場(chǎng)景的音頻文件作為優(yōu) 先級(jí),這導(dǎo)致了將音頻文件AD1、 AD2存儲(chǔ)在盤1上、以及將音頻文 件AD3、 AD4存儲(chǔ)在盤2上。如從圖lc可以看出的,該存儲(chǔ)器對(duì)于 第二場(chǎng)景是不利的,這是由于在第二場(chǎng)景中,AD1和AD7彼此并行 呈現(xiàn),所以同時(shí)需要這兩個(gè)音頻文件。然而,這兩個(gè)文件均存儲(chǔ)于相 同的盤1上,并由音頻文件AD2而將它們彼此分離。為了讀出第二場(chǎng) 景的音頻文件,因而硬盤將必須進(jìn)行一些跳躍,并且也不能從盤l和 盤2的并行設(shè)置中受益。但是,這也并不是關(guān)鍵的,這是由于第二場(chǎng) 景中波場(chǎng)合成系統(tǒng)的利用率低于第一場(chǎng)景中波場(chǎng)合成系統(tǒng)的利用率, 因而第二場(chǎng)景中的數(shù)據(jù)需求低于第一場(chǎng)景中的數(shù)據(jù)需求。圖d示出了在諸如硬盤之類的存儲(chǔ)介質(zhì)上的軌道7上的音頻文 件的設(shè)置。圖ld示意性地示出了與圖lc的并行存儲(chǔ)介質(zhì)相反的、在 單個(gè)存儲(chǔ)介質(zhì)上的串行設(shè)置。這樣,可以看出,連續(xù)地存儲(chǔ)第一場(chǎng)景 的音頻文件,從而讀取頭不必跳躍以讀取第一場(chǎng)景的第一文件。這導(dǎo) 致了音頻文件AD1至AD4的非??焖俚臄?shù)據(jù)提供。然而,為了讀取第二場(chǎng)景的音頻文件,需要多次跳躍。因此,存
儲(chǔ)設(shè)備的讀取頭必須在讀取了音頻文件AD5之后跳躍至音頻文件 AD2,然后在讀取了音頻文件AD2之后跳回音頻文件AD6。這種情 況與必須要在音頻文件AD7之后讀取音頻文件AD1時(shí)的情況類似。這樣可以看出,在圖ld中示出的實(shí)施例中,讀取第一場(chǎng)景不需 要讀取頭的跳躍,而對(duì)于讀取第二場(chǎng)景,已經(jīng)需要讀取頭的四次跳躍, 這減緩了對(duì)存儲(chǔ)設(shè)備中的數(shù)據(jù)的存取,但是這實(shí)質(zhì)上對(duì)第二場(chǎng)景不比 對(duì)第一場(chǎng)景關(guān)鍵,其中,對(duì)于第一場(chǎng)景而言,平緩地讀出數(shù)據(jù)非常重 要,從而呈現(xiàn)器不會(huì)用盡用于呈現(xiàn)第一場(chǎng)景的數(shù)據(jù)。根據(jù)本發(fā)明,考慮數(shù)據(jù)結(jié)構(gòu)對(duì)于有效的數(shù)據(jù)輸出是決定性的這一 事實(shí)。在許多實(shí)施例中,對(duì)于不同介質(zhì)(CD或DVD),不能保證饋 入呈現(xiàn)器的必要傳輸速率。因此,基于硬盤的管理是必要的。根據(jù)本 發(fā)明,對(duì)于復(fù)雜的場(chǎng)景進(jìn)行存儲(chǔ)器布局的優(yōu)化,以保證對(duì)時(shí)間需求的 觀察。根據(jù)本發(fā)明,因而一方面實(shí)現(xiàn)了音頻和元數(shù)據(jù)的有效傳遞,另一 方面實(shí)現(xiàn)了有效的數(shù)據(jù)結(jié)構(gòu)。這樣,可以經(jīng)由與面向?qū)ο蟮膱?chǎng)景描述 相對(duì)應(yīng)的元數(shù)據(jù)來(lái)固定音頻數(shù)據(jù)的播放順序。如果已知播放順序,則 可以優(yōu)化在播放時(shí)對(duì)音頻數(shù)據(jù)的存取。計(jì)算機(jī)不再必須在硬盤或其它 存儲(chǔ)介質(zhì)的任意位置處"搜索"音頻數(shù)據(jù),而是能夠連續(xù)地讀取音頻 數(shù)據(jù),而在存儲(chǔ)器中讀取訪問(wèn)不需要多次跳躍。通過(guò)降低對(duì)音頻數(shù)據(jù) 的讀取訪問(wèn)過(guò)程中的努力,可以更加有效地利用資源,因而同時(shí)實(shí)時(shí) 處理更多的音頻對(duì)象。在數(shù)據(jù)組織中,優(yōu)選使用中心數(shù)據(jù)庫(kù)。通過(guò)中心組織來(lái)保證音頻 和元數(shù)據(jù)的一致性。此外,采用數(shù)據(jù)庫(kù)明顯地促進(jìn)了波場(chǎng)合成場(chǎng)景的 再現(xiàn)。這樣,優(yōu)選釆用考慮到用于在數(shù)據(jù)庫(kù)中找到特定數(shù)據(jù)的搜索機(jī) 制。據(jù)此,產(chǎn)生了音頻對(duì)象的交叉場(chǎng)景的可復(fù)用性。例如,可以在多 個(gè)場(chǎng)景中同等地使用音頻數(shù)據(jù),而不必在創(chuàng)建新場(chǎng)景時(shí)再次將它們導(dǎo) 入。此外,在數(shù)據(jù)庫(kù)的幫助下,可以實(shí)現(xiàn)音頻和元數(shù)據(jù)的版本化。這 允許用戶獲得對(duì)他們的場(chǎng)景描述的較舊版本的訪問(wèn),這也促進(jìn)了產(chǎn)生 過(guò)程。在這點(diǎn)上應(yīng)指出,存儲(chǔ)設(shè)備不必必須是中心數(shù)據(jù)庫(kù),而是可以具
體化為純標(biāo)準(zhǔn)文件服務(wù)器。然而優(yōu)選地采用音頻數(shù)據(jù)庫(kù),這在使用來(lái) 自各種不同場(chǎng)景的特定音頻材料的情況下尤其有利。這樣,音頻數(shù)據(jù) 庫(kù)獲知了所有場(chǎng)景,并獲知了哪個(gè)場(chǎng)景使用哪個(gè)音頻材料、以及何時(shí) 使用該音頻材料。此外,音頻數(shù)據(jù)庫(kù)訪問(wèn)了音頻數(shù)據(jù),并可以確定硬 盤上音頻數(shù)據(jù)的存儲(chǔ)序列。此外,音頻數(shù)據(jù)庫(kù)可以為音頻數(shù)據(jù)創(chuàng)建最 佳交叉場(chǎng)景存儲(chǔ)順序。最后,音頻數(shù)據(jù)庫(kù)還可以在存儲(chǔ)音頻文件時(shí)發(fā) 現(xiàn)瓶頸,并相應(yīng)地對(duì)其做出反應(yīng)。根據(jù)本發(fā)明,可選地,這也可以通過(guò)將所有場(chǎng)景文件存儲(chǔ)于中心 位置并實(shí)現(xiàn)讀出所有場(chǎng)景文件的程序、并從中推導(dǎo)出服務(wù)器上音頻文 件的存儲(chǔ)順序,來(lái)有利地實(shí)現(xiàn)。然而,數(shù)據(jù)庫(kù)強(qiáng)制對(duì)于音頻文件存儲(chǔ) 順序的優(yōu)化優(yōu)選場(chǎng)景文件的中心存儲(chǔ)。根據(jù)本發(fā)明,執(zhí)行音頻源的時(shí)間和空間設(shè)置、以及從中產(chǎn)生的存 儲(chǔ)介質(zhì)上的音頻文件存儲(chǔ)順序的優(yōu)化。為此,使用數(shù)據(jù)的交叉場(chǎng)景優(yōu) 化,這優(yōu)選地使用中心存儲(chǔ)和場(chǎng)景管理。接下來(lái),參照?qǐng)D2,圖2指出了音頻對(duì)象應(yīng)當(dāng)有利地具有的信息。 因此,音頻對(duì)象要規(guī)定音頻文件,從而使音頻文件表示虛擬源的音頻 內(nèi)容。但是,音頻對(duì)象并不必包括音頻文件,而是可以具有指向在存 儲(chǔ)了實(shí)際音頻文件的數(shù)據(jù)庫(kù)中的所定義位置的索引。此外,音頻對(duì)象優(yōu)選包括虛擬源的識(shí)別,例如,這可以是源編號(hào) 或有意義的文件名等。此外,在本發(fā)明中,音頻對(duì)象規(guī)定了虛擬源(即, 音頻文件)的開始和結(jié)束的時(shí)間間隔。如果僅規(guī)定了開始的時(shí)間間隔, 則這表示可以在該時(shí)間間隔內(nèi)由呈現(xiàn)器來(lái)改變?cè)撐募某尸F(xiàn)的實(shí)際起 點(diǎn)。如果另外給出了結(jié)束的時(shí)間間隔,則這表示該結(jié)尾也可以在時(shí)間 間隔內(nèi)改變,依據(jù)實(shí)施方式,這將共同導(dǎo)致音頻文件關(guān)于其長(zhǎng)度的變 化。任何實(shí)施方式都是可能的,如音頻文件開始/結(jié)束時(shí)間的定義,從 而實(shí)際上允許起點(diǎn)發(fā)生平移,但在任何情況下,必須不改變長(zhǎng)度,從 而音頻文件的結(jié)束也自動(dòng)地發(fā)生平移。然而,具體地,對(duì)于噪聲,由 于典型地,例如風(fēng)聲將早一些或晚一些開始、還是早一些或晚一些結(jié) 束都不成問(wèn)題,所以優(yōu)選使結(jié)束可變。依據(jù)實(shí)施方式,其它的規(guī)定也 是可以的和/或所期望的,如實(shí)際上允許起點(diǎn)改變而不允許終點(diǎn)改變的
規(guī)定等。優(yōu)選地,音頻對(duì)象還包括用于位置的位置間隔。因此,對(duì)于特定 音頻對(duì)象,它們是來(lái)自例如左前、還是前中、還是相對(duì)于再現(xiàn)室中的 參考點(diǎn)移動(dòng)了某個(gè)(小)角度都不重要。然而,如已經(jīng)解釋的,還存 在再次來(lái)自噪聲區(qū)域的音頻對(duì)象,它們可以位于任何任意的位置并因而具有最大位置間隔,例如,可以通過(guò)音頻對(duì)象中的"任意"代碼或 不通過(guò)代碼(隱性)來(lái)規(guī)定。音頻對(duì)象可以包括其它信息,如虛擬源類型的指示,即,虛擬源 必須是聲波的點(diǎn)源、還是必須是平面波的源、還是必須是產(chǎn)生任意波 陣面的源(只要呈現(xiàn)模塊能夠處理這種信息)。圖3示例性地示出了場(chǎng)景描述的示意性示例,其中,示出了各種音頻對(duì)象AOl.....AOn+l的時(shí)間序列。具體地,如圖3所示,指出了定義了時(shí)間間隔的音頻對(duì)象A03。因此,圖3中的音頻對(duì)象A03 的起點(diǎn)和終點(diǎn)可以平移時(shí)間間隔。然而,音頻對(duì)象A03的定義是,必 須不改變長(zhǎng)度,然而該定義對(duì)于不同音頻對(duì)象是可變的。因此,通過(guò)沿正時(shí)間方向平移音頻對(duì)象A03,可以看出,可以達(dá) 到以下的情況音頻對(duì)象A03直至音頻對(duì)象A02之后才會(huì)開始。如 果這兩個(gè)音頻對(duì)象均在相同的呈現(xiàn)器上播放,則可以通過(guò)該措施避免 否則將會(huì)出現(xiàn)的短重疊20。如果音頻對(duì)象A03己經(jīng)是在現(xiàn)有技術(shù)中 超過(guò)呈現(xiàn)器容量的音頻對(duì)象,則由于在呈現(xiàn)器上已經(jīng)要處理的所有其 它音頻對(duì)象(如音頻對(duì)象A02和AOl),所以在沒有本發(fā)明的情況下, 將會(huì)出現(xiàn)音頻對(duì)象A03的完全抑制,但是時(shí)間間隔20非常小。根據(jù) 本發(fā)明,通過(guò)音頻對(duì)象處理裝置3來(lái)平移音頻對(duì)象A03,從而沒有超 過(guò)容量,因而不再出現(xiàn)對(duì)音頻對(duì)象A03的抑制。在本發(fā)明的優(yōu)選實(shí)施例中,使用具有相對(duì)指示的場(chǎng)景描述。因此, 不再以絕對(duì)時(shí)間點(diǎn)給出、而是以相對(duì)于音頻對(duì)象A01的相對(duì)時(shí)間段來(lái) 給出音頻對(duì)象A02的開始,增加了靈活性。因此,位置指示的相關(guān)描 述是優(yōu)選的,即,不是要在再現(xiàn)室內(nèi)的特定位置xy處設(shè)置音頻對(duì)象的 事實(shí),而是例如,將另一音頻對(duì)象或參考對(duì)象偏移一矢量。從而,可以非常有效地提供時(shí)間間隔信息和/或位置間隔信息,即
簡(jiǎn)單地通過(guò)固定時(shí)間間隔,從而音頻對(duì)象A03可以在音頻對(duì)象AOl 開始之后的兩分鐘與兩分鐘二十秒之間的時(shí)間段內(nèi)開始。這種空間和時(shí)間條件的相對(duì)定義導(dǎo)致了如在例如"Modeling Output Constraints in Multimedia Database Systems", T. Heimlich, 1th International Multimedia Modelling Conference, IEEE, 2005年1月2日 至2005年1月14日,Melbourne中所描述的約束條件(constrain)形 式的數(shù)據(jù)庫(kù)有效表達(dá)。這里,示出了數(shù)據(jù)庫(kù)系統(tǒng)中約束條件的使用, 以定義連續(xù)的數(shù)據(jù)庫(kù)狀態(tài)。具體地,使用Allen關(guān)系來(lái)描述時(shí)間約束 條件,并使用空間關(guān)系來(lái)描述空間約束條件。由此,可以針對(duì)同步目 的來(lái)定義有利的輸出約束條件。這種輸出約束條件包括對(duì)象之間的時(shí) 間或空間條件,在違反約束條件的情況下的反應(yīng)、以及在必須檢査這 種約束條件時(shí)的檢查時(shí)間。在本發(fā)明的優(yōu)選實(shí)施例中,相對(duì)于彼此,對(duì)每個(gè)場(chǎng)景的空間/時(shí)間 輸出對(duì)象進(jìn)行建模。音頻對(duì)象處理裝置實(shí)現(xiàn)了這些相對(duì)和可變定義至 絕對(duì)空間和時(shí)間順序的轉(zhuǎn)譯。該順序表示在圖1中示出的系統(tǒng)的輸出 6a處獲得的、并定義了如何對(duì)波場(chǎng)合成系統(tǒng)中的呈現(xiàn)模塊進(jìn)行特別尋 址的輸出調(diào)度。因此,該調(diào)度是在與輸出條件相對(duì)應(yīng)的音頻數(shù)據(jù)中設(shè) 置的輸出計(jì)劃。接下來(lái),基于圖4,將會(huì)提出這種輸出調(diào)度的優(yōu)選實(shí)施例。具體 地,圖4示出了根據(jù)圖4從左至右傳輸?shù)臄?shù)據(jù)流,g卩,從圖l的音頻 對(duì)象處理裝置3傳輸至圖1的波場(chǎng)系統(tǒng)0的一個(gè)或多個(gè)波場(chǎng)合成呈現(xiàn) 器的數(shù)據(jù)流。具體地,對(duì)于在圖4中示出的實(shí)施例中的每個(gè)音頻對(duì)象, 數(shù)據(jù)流包括首先是位置信息和時(shí)間信息所在的報(bào)頭H,以及特定音 頻對(duì)象的下游音頻文件,在圖4中,以AOl指示第一音頻對(duì)象,A02 指示第二音頻對(duì)象等。然后,波場(chǎng)合成呈現(xiàn)器獲得數(shù)據(jù)流,并根據(jù)例如出現(xiàn)并一致同意 的同步信息識(shí)別出報(bào)頭的到來(lái)。然后,基于另一同步信息,呈現(xiàn)器識(shí) 別出報(bào)頭結(jié)束??蛇x地,對(duì)于每個(gè)報(bào)頭,可以同意以比特為單位的固 定長(zhǎng)度。在接收了報(bào)頭之后,圖4中示出的本發(fā)明的優(yōu)選實(shí)施例中的音頻
呈現(xiàn)器自動(dòng)得知后續(xù)音頻文件(即,AOl)屬于音頻對(duì)象(即,在報(bào) 頭中識(shí)別的源位置)。圖4示出了串行數(shù)據(jù)至波場(chǎng)合成呈現(xiàn)器的傳輸。當(dāng)然,同時(shí)在呈現(xiàn)器中播放多個(gè)音頻對(duì)象。為此,呈現(xiàn)器在數(shù)據(jù)流讀取裝置之后需要 輸入緩沖器,以對(duì)數(shù)據(jù)流進(jìn)行解析。然后,數(shù)據(jù)流讀取裝置將解譯報(bào) 頭并相應(yīng)地存儲(chǔ)伴隨的音頻文件,從而當(dāng)要呈現(xiàn)音頻對(duì)象時(shí),呈現(xiàn)器 從輸入緩沖器中讀取正確的音頻文件和正確的源位置。當(dāng)然,也可以 是用于數(shù)據(jù)流的其它數(shù)據(jù)。還可以使用時(shí)間/位置信息和實(shí)際音頻數(shù)據(jù) 的單獨(dú)傳輸。然而,由于通過(guò)位置/時(shí)間信息與音頻文件的串聯(lián)而消除 了數(shù)據(jù)一致性問(wèn)題,由于總是確保了呈現(xiàn)器還具有音頻數(shù)據(jù)的正確源 位置、并仍不呈現(xiàn)例如先前源的音頻文件、而是使用新源的位置信息來(lái)呈現(xiàn),所以在圖4中示出的組合傳輸是優(yōu)選的。因此,本發(fā)明基于面向?qū)ο蟮姆绞?,即將單?dú)的虛擬源理解為特 征在于音頻對(duì)象和空間中虛擬位置、以及可能的源類型(即,它是聲 波的點(diǎn)源、還是平面波的源、還是其它形狀的源)的對(duì)象。如已經(jīng)提出的,波場(chǎng)的計(jì)算是計(jì)算時(shí)間密集的,并且需要所使用 的硬件(如聲卡和計(jì)算機(jī))能力與計(jì)算算法的效率結(jié)合。在要同時(shí)表 示多個(gè)所要求的聲音事件時(shí),甚至基于最佳配置的PC的解決方案也 會(huì)在波場(chǎng)合成計(jì)算過(guò)程中迅速到達(dá)它的限制。因此,在混頻和再現(xiàn)過(guò) 程中,所使用的軟件和硬件的能力限制給出了相對(duì)于虛擬源個(gè)數(shù)的限 制。圖6示出了能力受限的已知波場(chǎng)合成概念,包括創(chuàng)作工具60、控 制呈現(xiàn)模塊62和音頻服務(wù)器64,其中,控制呈現(xiàn)模塊形成用于向揚(yáng) 聲器陣列66提供數(shù)據(jù),從而揚(yáng)聲器陣列66通過(guò)各個(gè)揚(yáng)聲器70的各個(gè) 波的疊加來(lái)產(chǎn)生所期望的波陣面68。創(chuàng)作工具60使用戶能夠創(chuàng)建并 編輯場(chǎng)景,并控制基于波場(chǎng)合成的系統(tǒng)。因此,場(chǎng)景包括與各個(gè)虛擬 音頻源有關(guān)的信息和音頻數(shù)據(jù)。將音頻源的屬性和對(duì)音頻數(shù)據(jù)的引用 存儲(chǔ)在XML場(chǎng)景文件中。音頻數(shù)據(jù)本身被提交到音頻服務(wù)器64上, 并從此處被傳輸至呈現(xiàn)模塊。同時(shí),呈現(xiàn)模塊從創(chuàng)作工具中獲得控制 數(shù)據(jù),從而以集中化方式具體化的控制呈現(xiàn)模塊62可以產(chǎn)生用于各個(gè)揚(yáng)聲器的合成信號(hào)。圖6中示出的概念在"Authoring System for Wave Field Synthesis" , F. Melchior, T. R6der, S. Brix, S. Wabnik and C. Riegel, AES Convention Paper, 115th AES convention, 2003年10月10日,紐纟匁中有所描述。如果波場(chǎng)合成系統(tǒng)利用多個(gè)呈現(xiàn)器模塊進(jìn)行操作,則向每個(gè)呈現(xiàn) 器提供相同的音頻數(shù)據(jù),無(wú)論呈現(xiàn)器是否由于與之關(guān)聯(lián)的有限個(gè)數(shù)的 揚(yáng)聲器而需要該數(shù)據(jù)用于再現(xiàn)。由于當(dāng)前計(jì)算機(jī)中的每個(gè)能夠計(jì)算32 個(gè)音頻源,所以這表示對(duì)于系統(tǒng)的限制。另一方面,要以有效的方式 顯著增加可以在整個(gè)系統(tǒng)中呈現(xiàn)的源的個(gè)數(shù)。這是復(fù)雜應(yīng)用(如電影)、 具有融入式氛圍的場(chǎng)景(如雨或歡呼)、或者其它復(fù)雜音頻場(chǎng)景的實(shí)質(zhì) 性先決條件之一。根據(jù)本發(fā)明,在波場(chǎng)合成多呈現(xiàn)器系統(tǒng)中實(shí)現(xiàn)了冗余數(shù)據(jù)傳輸過(guò) 程和數(shù)據(jù)處理過(guò)程的減少,這導(dǎo)致了計(jì)算能力和/或同時(shí)可計(jì)算的音頻 源個(gè)數(shù)的增加。為了減小對(duì)多呈現(xiàn)器系統(tǒng)的各個(gè)呈現(xiàn)器的音頻和元數(shù)據(jù)的冗余 傳輸和處理,通過(guò)數(shù)據(jù)輸出裝置擴(kuò)展音頻服務(wù)器,這能夠確定哪個(gè)呈 現(xiàn)器需要哪些音頻和元數(shù)據(jù)。在優(yōu)選實(shí)施例中,可能由數(shù)據(jù)管理器來(lái)進(jìn)行幫助的數(shù)據(jù)輸出裝置 需要多條信息。該信息首先是音頻數(shù)據(jù),然后是源的時(shí)間和位置數(shù)據(jù), 最后是呈現(xiàn)器的配置,即與所連接的揚(yáng)聲器和它們的位置、以及它們 的容量有關(guān)的信息。在數(shù)據(jù)管理技術(shù)和輸出條件的定義的幫助下,利用音頻對(duì)象的時(shí)間和空向設(shè)置,通過(guò)數(shù)據(jù)輸出裝置來(lái)產(chǎn)生輸出調(diào)度。 根據(jù)空間設(shè)置、時(shí)間調(diào)度和呈現(xiàn)器配置,數(shù)據(jù)管理模塊計(jì)算在特定時(shí) 刻哪個(gè)源與哪個(gè)呈現(xiàn)器相關(guān)。圖5中示出了優(yōu)選的整體概念。通過(guò)輸出側(cè)上的數(shù)據(jù)輸出裝置24 來(lái)補(bǔ)充數(shù)據(jù)庫(kù)22,其中,也將數(shù)據(jù)輸出裝置稱為調(diào)度器。然后,該調(diào) 度器在輸出20a、20b、20c處生成用于各種呈現(xiàn)器50的呈現(xiàn)輸入信號(hào), 從而提供給揚(yáng)聲器陣列的相應(yīng)揚(yáng)聲器。優(yōu)選地,為了通過(guò)RAID系統(tǒng)和相應(yīng)的數(shù)據(jù)結(jié)構(gòu)缺省值來(lái)配置數(shù) 據(jù)庫(kù)42,由存儲(chǔ)管理器52來(lái)幫助調(diào)度器24。
在輸入側(cè),存在數(shù)據(jù)生成器54,例如,可以是用于以面向?qū)ο蠓绞浇;蛎枋龅囊纛l場(chǎng)景的音響大師或音頻工程師。這里,給出了包括相應(yīng)輸出條件56的場(chǎng)景描述,如果必要,在轉(zhuǎn)換58之后,將這些 輸出條件與音頻數(shù)據(jù)一起共同存儲(chǔ)在數(shù)據(jù)庫(kù)22中。可以通過(guò)插入/更 新工具59來(lái)處理和更新音頻數(shù)據(jù)。依據(jù)條件,可以以硬件或軟件來(lái)實(shí)現(xiàn)本發(fā)明的方法。可以在數(shù)字 存儲(chǔ)介質(zhì)、尤其是軟盤或CD上,利用能夠與可編程計(jì)算機(jī)系統(tǒng)合作 的電可讀控制信號(hào)來(lái)實(shí)現(xiàn),從而執(zhí)行本發(fā)明的方法。通常,本發(fā)明還 包括一種計(jì)算機(jī)程序產(chǎn)品,具有存儲(chǔ)在機(jī)器可讀載體上的程序代碼, 當(dāng)在計(jì)算機(jī)上執(zhí)行計(jì)算機(jī)產(chǎn)品時(shí),用于執(zhí)行本方法。換言之,本發(fā)明 還可以實(shí)現(xiàn)為一種具有程序代碼的計(jì)算機(jī)程序,當(dāng)在計(jì)算機(jī)上執(zhí)行計(jì) 算機(jī)程序時(shí),用于執(zhí)行本方法。
權(quán)利要求
1、一種設(shè)備,用于利用寫入裝置和讀取裝置(2),將音頻片段的音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備(1)中,其中,所述音頻片段要由波場(chǎng)合成系統(tǒng)(3)的呈現(xiàn)器呈現(xiàn),所述音頻片段包括多個(gè)場(chǎng)景,針對(duì)每個(gè)場(chǎng)景提供場(chǎng)景描述,場(chǎng)景定義了場(chǎng)景的音頻對(duì)象的時(shí)間序列,所述音頻對(duì)象包括與虛擬源有關(guān)的信息和與所述音頻對(duì)象相關(guān)聯(lián)的音頻文件的標(biāo)識(shí),所述設(shè)備包括檢查裝置(4),用于檢查場(chǎng)景描述,并用于確定第一場(chǎng)景需要比第二場(chǎng)景更高的波場(chǎng)合成系統(tǒng)的處理能力;以及控制裝置(5),用于控制寫入裝置(2),從而將由第一場(chǎng)景的場(chǎng)景描述所標(biāo)識(shí)的音頻文件寫在存儲(chǔ)設(shè)備(1)上,使得讀取裝置(2)能夠比將第一場(chǎng)景的音頻文件隨機(jī)存儲(chǔ)在存儲(chǔ)設(shè)備(1)上的情況更加快速地讀出第一場(chǎng)景的音頻文件。
2、 如權(quán)利要求l所述的設(shè)備,其中,第一場(chǎng)景的音頻對(duì)象和第 二場(chǎng)景的音頻對(duì)象標(biāo)識(shí)了相同的音頻文件,以及所述控制裝置(5)形成用于控制寫入裝置(2),從而將音頻文 件存儲(chǔ)在存儲(chǔ)設(shè)備()中,使得當(dāng)讀取在第一場(chǎng)景中標(biāo)識(shí)的音頻文件 時(shí),讀取裝置(2)能夠以比在讀取第二場(chǎng)景的音頻文件時(shí)讀取音頻文 件所花費(fèi)的訪問(wèn)時(shí)間短的訪問(wèn)時(shí)間來(lái)讀取音頻文件。
3、 如權(quán)利要求1或2所述的設(shè)備,其中,所述存儲(chǔ)設(shè)備(1)包 括軌道(7),所述讀取裝置(2)沿所述軌道(7)移動(dòng),以及所述控制裝置(5)形成用于控制寫入裝置,從而沿所述軌道寫 入第一場(chǎng)景的音頻文件。
4、 如前述權(quán)利要求之一所述的設(shè)備,其中,所述存儲(chǔ)設(shè)備(1) 是具有單個(gè)存取介質(zhì)的并行存儲(chǔ)設(shè)備,所述控制裝置(5)形成用于控 制寫入裝置(2),從而將要由呈現(xiàn)器并行呈現(xiàn)的第一場(chǎng)景的音頻文件 存儲(chǔ)在不同的單個(gè)存取介質(zhì)上。
5、 如權(quán)利要求3所述的設(shè)備,其中,所述控制裝置(5)形成用 于控制寫入裝置(2),從而根據(jù)標(biāo)識(shí)了音頻文件的第一場(chǎng)景的音頻對(duì) 象的出現(xiàn)時(shí)間順序,沿所述軌道(7)存儲(chǔ)第一場(chǎng)景的音頻文件。
6、 如權(quán)利要求2所述的設(shè)備,其中,所述存儲(chǔ)設(shè)備(1)包括軌 道(7),所述讀取裝置(2)沿所述軌道(7)移動(dòng),以及所述控制裝置(5)形成用于控制寫入裝置(2),從而將音頻文 件存儲(chǔ)在緊鄰另一音頻文件之前或之后的軌道上,所述另一音頻文件 標(biāo)識(shí)了要由呈現(xiàn)器與標(biāo)識(shí)了所述音頻文件的所述一個(gè)音頻對(duì)象并行呈 現(xiàn)的音頻對(duì)象。
7、 如前述權(quán)利要求之一所述的設(shè)備,其中,檢查裝置(4)形成 用于將包括要由呈現(xiàn)器同時(shí)呈現(xiàn)的音頻對(duì)象比另一場(chǎng)景的音頻對(duì)象多 的音頻對(duì)象的場(chǎng)景確定為第一場(chǎng)景。
8、 如前述權(quán)利要求之一所述的設(shè)備,其中,檢查裝置(4)形成 用于僅在波場(chǎng)合成系統(tǒng)的場(chǎng)景引起的利用率達(dá)到最大利用率的預(yù)定 比例時(shí),才將場(chǎng)景確定為第一場(chǎng)景。
9、 如前述權(quán)利要求之一所述的設(shè)備,其中,所述控制裝置(5) 形成用于控制寫入裝置(2),從而在將第一場(chǎng)景的音頻文件存儲(chǔ)在存 儲(chǔ)設(shè)備(1)上之后,將第二場(chǎng)景的音頻文件存儲(chǔ)在仍保持空白的存儲(chǔ) 設(shè)備(1)的位置處。
10、 如前述權(quán)利要求之一所述的設(shè)備,其中,所述存儲(chǔ)設(shè)備(1) 是具有一個(gè)存儲(chǔ)盤或多個(gè)存儲(chǔ)盤的硬盤,其中,為每個(gè)存儲(chǔ)盤提供寫/ 讀頭(2)。
11、 如前述權(quán)利要求之一所述的設(shè)備,其中,所述寫入裝置和讀 取裝置形成為同一個(gè)物理組件(2)。
12、 如前述權(quán)利要求之一所述的設(shè)備,其中,所述控制裝置(5) 形成用于控制寫入裝置(2),從而將由第一場(chǎng)景的音頻對(duì)象所標(biāo)識(shí)的 音頻文件連續(xù)地寫在存儲(chǔ)設(shè)備(1 )上,在讀取第一場(chǎng)景的音頻文件時(shí), 讀取裝置不必跳躍。
13、 一種方法,用于利用寫入裝置和讀取裝置(2),將音頻片段 的音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備(1)中,其中,所述音頻片段要由波場(chǎng)合 成系統(tǒng)(3)的呈現(xiàn)器呈現(xiàn),所述音頻片段包括多個(gè)場(chǎng)景,針對(duì)每個(gè)場(chǎng)景提供場(chǎng)景描述,場(chǎng)景定義了場(chǎng)景的音頻對(duì)象的時(shí)間序列,所述音頻 對(duì)象包括與虛擬源有關(guān)的信息和與所述音頻對(duì)象相關(guān)聯(lián)的音頻文件的 標(biāo)識(shí),所述方法包括檢査(4)場(chǎng)景描述并確定第一場(chǎng)景需要比第二場(chǎng)景更高的波場(chǎng) 合成系統(tǒng)(3)的處理能力;以及控制(5)寫入裝置(2),從而將由第一場(chǎng)景的場(chǎng)景描述所標(biāo)識(shí) 的音頻文件寫在存儲(chǔ)設(shè)備(1)上,使得讀取裝置(2)能夠比將第一 場(chǎng)景的音頻文件隨機(jī)存儲(chǔ)在存儲(chǔ)設(shè)備(1)上的情況更加快速地讀出第 一場(chǎng)景的音頻文件。
14、 一種具有程序代碼的計(jì)算機(jī)程序,當(dāng)在計(jì)算機(jī)上執(zhí)行計(jì)算機(jī) 程序時(shí),用于執(zhí)行如權(quán)利要求13所述的方法。
全文摘要
以交叉場(chǎng)景優(yōu)化方式來(lái)存儲(chǔ)(4)音頻片段的音頻文件,從而在讀出(1,2)用于需要波場(chǎng)合成系統(tǒng)高利用率的場(chǎng)景的音頻文件時(shí),實(shí)現(xiàn)了非常短的存儲(chǔ)器存取時(shí)間,而對(duì)于不需要這么高的波場(chǎng)合成系統(tǒng)利用率的場(chǎng)景,接受較長(zhǎng)的存儲(chǔ)器存取時(shí)間。
文檔編號(hào)H04S7/00GK101133454SQ200680005933
公開日2008年2月27日 申請(qǐng)日期2006年2月16日 優(yōu)先權(quán)日2005年2月23日
發(fā)明者加布里埃爾·加茨舍, 卡特里·賴歇爾特, 桑德拉·布里克斯 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1