存儲(chǔ)音頻文件的設(shè)備和方法

文檔序號(hào)：7636280閱讀：352來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：存儲(chǔ)音頻文件的設(shè)備和方法
技術(shù)領(lǐng)域：
本發(fā)明涉及波場(chǎng)合成領(lǐng)域，更具體地，涉及利用要處理的數(shù)據(jù)對(duì) 波場(chǎng)合成呈現(xiàn)裝置的控制。本發(fā)明涉及波場(chǎng)合成概念，具體涉及結(jié)合多呈現(xiàn)器系統(tǒng)的有效波場(chǎng)合成概念。
背景技術(shù)：
對(duì)于在娛樂(lè)電子設(shè)備領(lǐng)域中的新技術(shù)和創(chuàng)新產(chǎn)品有著日益增長(zhǎng) 的需求。對(duì)于新多媒體系統(tǒng)的成功來(lái)說(shuō)，提供最佳功能或容量是非常重要的先決條件。這通過(guò)使用數(shù)字技術(shù)、特別是使用計(jì)算機(jī)技術(shù)來(lái)實(shí) 現(xiàn)。其示例是提供了增強(qiáng)的接近現(xiàn)實(shí)的視聽印象的應(yīng)用。在先前的音頻系統(tǒng)中，實(shí)質(zhì)性缺點(diǎn)在于自然以及虛擬環(huán)境的三維聲音再現(xiàn)的質(zhì)量。許多年來(lái)，己知音頻信號(hào)的多信道揚(yáng)聲器再現(xiàn)的方法并對(duì)該方法進(jìn)行了標(biāo)準(zhǔn)化。所有常用技術(shù)具有以下缺點(diǎn)揚(yáng)聲器的地點(diǎn)和收聽者的位置已經(jīng)在傳輸格式中有所體現(xiàn)。揚(yáng)聲器相對(duì)于收聽者的錯(cuò)誤設(shè)置使音頻質(zhì)量顯著下降。僅在再現(xiàn)空間的小區(qū)域內(nèi)(所謂有效點(diǎn)(sweet spot))可能有最佳聲音。在新技術(shù)的幫助下，可以實(shí)現(xiàn)較好的自然空間感以及音頻再現(xiàn)的更大范圍或包層。TU Delft處已經(jīng)研究了所謂波場(chǎng)合成(WFS)的技術(shù)原理，并首次在80年代后期提出(Berkout,A丄；deVries，D.; Vogel, R: Acoustic control by Wave field Synthesis. JASA93, 1993 )。由于該方法對(duì)于計(jì)算機(jī)功率和傳輸速率的極大需求，波場(chǎng)合成直到現(xiàn)在在實(shí)際中也很少采用。目前，只有微處理器技術(shù)領(lǐng)域中的進(jìn)步和音頻編碼允許在具體應(yīng)用中采用該技術(shù)。期望明年出現(xiàn)在專業(yè)領(lǐng)域中的第一個(gè)成果。設(shè)想在一些年后，消費(fèi)領(lǐng)域內(nèi)的第一波場(chǎng)合成應(yīng)用
開始投放市場(chǎng)。WFS的基本思想基于波動(dòng)說(shuō)的惠更斯原理的應(yīng)用波所捕獲的每一點(diǎn)是以球或圓方武傳播的元波的起點(diǎn)。應(yīng)用于聲學(xué)，通過(guò)彼此相鄰設(shè)置的大量揚(yáng)聲器(所謂揚(yáng)聲器陣列)，來(lái)復(fù)制每個(gè)到來(lái)的波陣面(wave front)的任意形狀。在最簡(jiǎn)單的情況下，即要再現(xiàn)單個(gè)點(diǎn)源并且揚(yáng)聲器按照線性設(shè)置，則每個(gè)揚(yáng)聲器的音頻信號(hào)必須以時(shí)間延遲的方式饋入，并進(jìn)行振幅縮放，從而各個(gè)揚(yáng)聲器的輻射聲場(chǎng)適當(dāng)?shù)刂丿B。利用多個(gè)聲源，對(duì)于每個(gè)源，單獨(dú) 地計(jì)算對(duì)于每個(gè)揚(yáng)聲器的貢獻(xiàn)，并將所產(chǎn)生的信號(hào)相加。如果要再現(xiàn) 的源在具有反射壁的室內(nèi)，則也必須作為附加源，經(jīng)由揚(yáng)聲器陣列來(lái) 再現(xiàn)反射。因此，在計(jì)算中的消耗很大程度上取決于聲源的個(gè)數(shù)、錄音室的反射屬性和揚(yáng)聲器的個(gè)數(shù)。具體地，該技術(shù)的優(yōu)點(diǎn)在于，可以在大區(qū)域的再現(xiàn)空間上有自然的三維聲音印象。與已知技術(shù)相反，以非常精確的方式再現(xiàn)聲源的方向和距離。在有限程度上，甚至可以在真實(shí)的揚(yáng)聲器陣列與收聽者之間定位虛擬聲源。盡管波場(chǎng)合成很好地用于具有己知屬性的環(huán)境，但是如果屬性改變或基于不匹配環(huán)境實(shí)際屬性的環(huán)境屬性而執(zhí)行波場(chǎng)合成，則會(huì)出現(xiàn) 紊亂。周圍環(huán)境的屬性還可以由周圍環(huán)境的脈沖響應(yīng)來(lái)進(jìn)行描述。這將基于后續(xù)的示例更加詳細(xì)地提出。假設(shè)揚(yáng)聲器朝墻壁發(fā)出聲音信號(hào)，但不希望有反射。使用波場(chǎng)合成的空間補(bǔ)償將包括以下事實(shí) 首先，確定該墻壁的反射，以確定在已從墻壁反射回來(lái)的聲音信號(hào)何時(shí)再次到達(dá)揚(yáng)聲器、以及該反射的聲音信號(hào)具有多大振幅。如果不期望來(lái)自該墻壁的反射，則可以利用波場(chǎng)合成，通過(guò)施加具有相應(yīng)振幅、并具有與揚(yáng)聲器上的反射信號(hào)相反相位的信號(hào)來(lái)消除來(lái)自該墻壁的反射，從而傳播補(bǔ)償波抵消反射波，使得在所考慮的周圍環(huán)境中消除了來(lái)自該墻壁的反射。這可以通過(guò)以下實(shí)現(xiàn)首先計(jì)算周圍環(huán)境的脈沖響應(yīng)，然后基于該周圍環(huán)境的脈沖響應(yīng)來(lái)確定墻壁的屬性和位置，其中，將墻壁當(dāng)作鏡面源，即反射入射聲音的聲源。
如果首先測(cè)量該周圍環(huán)境的脈沖響應(yīng)，然后計(jì)算必須以在音頻信號(hào)上疊加的方式施加于揚(yáng)聲器上的補(bǔ)償信號(hào)，則將會(huì)發(fā)生來(lái)自該墻壁反射的抵消，從而在該周圍環(huán)境中的收聽者具有該墻壁根本不存在的聲音印象。然而，對(duì)于反射波的最佳補(bǔ)償，關(guān)鍵是精確地確定房間的脈沖響應(yīng)，從而不會(huì)出現(xiàn)過(guò)補(bǔ)償或欠補(bǔ)償。因此，波場(chǎng)合成允許在大的再現(xiàn)區(qū)域上恰當(dāng)?shù)赜成涮摂M聲源。同時(shí)，在非常復(fù)雜的聲音場(chǎng)景的創(chuàng)建過(guò)程中，向音響大師(sound master) 和錄音師提供了新技術(shù)和創(chuàng)造潛力。80年代末在TUDdft開發(fā)的波場(chǎng) 合成(WFS，或者也稱為聲場(chǎng)合成)表示聲音再現(xiàn)的全息方式。 Kirchhoff-Helmholtz積分用作該方式的基礎(chǔ)。它闡述了可以通過(guò)封閉體積表面上的單極和雙極聲源(揚(yáng)聲器陣列)的分布來(lái)產(chǎn)生該體積內(nèi) 的任意聲場(chǎng)。在波場(chǎng)合成中，根據(jù)在虛擬位置處發(fā)出虛擬源的音頻信號(hào)來(lái)計(jì)算揚(yáng)聲器陣列的每個(gè)揚(yáng)聲器的合成信號(hào)，其中，關(guān)于振幅和相位來(lái)形成合成信號(hào)，從而從出現(xiàn)在揚(yáng)聲器陣列中的揚(yáng)聲器所輸出的各個(gè)聲波的疊加而產(chǎn)生的波與在虛擬位置處的虛擬源是具有真實(shí)位置的真實(shí)源的情況下由虛擬位置處的虛擬源所產(chǎn)生的波相對(duì)應(yīng)。典型地，多個(gè)虛擬源出現(xiàn)在各個(gè)虛擬位置上。針對(duì)每個(gè)虛擬位置的每個(gè)虛擬源來(lái)執(zhí)行合成信號(hào)的計(jì)算，從而典型地，一個(gè)虛擬源產(chǎn)生了多個(gè)揚(yáng)聲器的合成信號(hào)。因而，從揚(yáng)聲器角度來(lái)看，該揚(yáng)聲器接收返回各個(gè)虛擬源的多個(gè)合成信號(hào)。然后，由于線性疊加原理而導(dǎo)致的這些源的可能疊加產(chǎn)生了實(shí)際從揚(yáng)聲器發(fā)出的再現(xiàn)信號(hào)。揚(yáng)聲器陣列越大，即提供了越多的各個(gè)揚(yáng)聲器，越可以更好地利用波場(chǎng)合成。然而，為此，由于典型地還必須考慮信道信息，所以波場(chǎng)合成單元所必需的計(jì)算能力必須增加。詳細(xì)地，在原理上，這表示出現(xiàn)從每個(gè)虛擬源至每個(gè)揚(yáng)聲器的自身的傳輸信道，以及原理上，可以是以下情況每個(gè)虛擬源產(chǎn)生了每個(gè)揚(yáng)聲器的合成信號(hào)，和/或每個(gè) 揚(yáng)聲器獲得了等于虛擬源個(gè)數(shù)的多個(gè)合成信號(hào)。如果特別地，在影院應(yīng)用中的波場(chǎng)合成可能要用在虛擬源也可移動(dòng)的情況下，則可以看出，由于合成信號(hào)的計(jì)算、信道信息的計(jì)算以及通過(guò)信道信息和合成信號(hào)的組合的再現(xiàn)信號(hào)的生成，而導(dǎo)致要運(yùn)用相當(dāng)強(qiáng)的計(jì)算能力。此外，應(yīng)注意，此時(shí)，音頻再現(xiàn)的質(zhì)量隨著可用揚(yáng)聲器的個(gè)數(shù)而增加。這表示音頻再現(xiàn)質(zhì)量變得越好并且越逼真，則在揚(yáng)聲器陣列中存在的揚(yáng)聲器越多。在上述場(chǎng)景中，例如，可以將各個(gè)揚(yáng)聲器的完全呈現(xiàn)并進(jìn)行了模數(shù)轉(zhuǎn)換的再現(xiàn)信號(hào)從波場(chǎng)合成中心單元經(jīng)由雙線線路傳輸至各個(gè)揚(yáng)聲器。這確實(shí)具有以下優(yōu)點(diǎn)幾乎確保了所有揚(yáng)聲器同步工作，從而在這里不再需要其它措施用于同步目的。另一方面，總是可以僅針對(duì)特定再現(xiàn)室或針對(duì)利用固定個(gè)數(shù)的揚(yáng)聲器的再現(xiàn)，對(duì)波場(chǎng)合成中央單元進(jìn)行再現(xiàn)。這表示，由于必須至少部分并行且實(shí)時(shí)地進(jìn)行音頻再現(xiàn)信號(hào)的計(jì)算(尤其對(duì)于許多揚(yáng)聲器和/或許多虛擬源的情況)，所以對(duì)于每個(gè)再現(xiàn)室，必須構(gòu)造它自己的波場(chǎng)合成中央單元，而這必須執(zhí)行相當(dāng)大的計(jì)算能力。德國(guó)專利DE 10254404 B4公開了如圖7所示的系統(tǒng)。一個(gè)部分是中心波場(chǎng)合成模塊10。另一部分包括各個(gè)揚(yáng)聲器模塊12a、12b、12c、 12d、 12e，它們與實(shí)際的物理?yè)P(yáng)聲器14a、 14b、 14c、 14d、 14e (例如，如圖l所示)連接。應(yīng)注意，多個(gè)揚(yáng)聲器14a-14e位于大于50的范圍中，以及典型地，在典型應(yīng)用中甚至在遠(yuǎn)大于IOO的范圍中。如果將特有的揚(yáng)聲器與每個(gè)揚(yáng)聲器相關(guān)聯(lián)，則也需要相應(yīng)個(gè)數(shù)的揚(yáng)聲器模塊。然而，依據(jù)該應(yīng)用，優(yōu)選對(duì)來(lái)自揚(yáng)聲器模塊的鄰接揚(yáng)聲器小組進(jìn)行選址。在這個(gè)連接中，任意地，例如與四個(gè)揚(yáng)聲器連接的揚(yáng)聲器模塊以相同的再現(xiàn)信號(hào)饋入四個(gè)揚(yáng)聲器，或者針對(duì)四個(gè)揚(yáng)聲器計(jì)算相應(yīng)不同的合成信號(hào)，從而這種揚(yáng)聲器模塊實(shí)際包括多個(gè)單獨(dú)的揚(yáng)聲器模塊，然而這些揚(yáng)聲器模塊物理上概括于一個(gè)單元中。在波場(chǎng)合成模塊IO和每個(gè)單獨(dú)的揚(yáng)聲器12a-12e之間，存在特有的傳輸路徑16a-16e，每個(gè)傳輸路徑與中心波場(chǎng)合成模塊和自己的揚(yáng)聲器模塊連接。將提供了高數(shù)據(jù)速率的串行傳輸格式(如，所謂Firewire傳輸格
式或USB數(shù)據(jù)格式)優(yōu)選作為用于將數(shù)據(jù)從波場(chǎng)合成模塊傳輸至揚(yáng)聲器模塊的數(shù)據(jù)傳輸模式。大于每秒100兆比特的數(shù)據(jù)傳輸速率是有利的。因此，根據(jù)在波場(chǎng)合成模塊中選擇的數(shù)據(jù)格式，來(lái)相應(yīng)地對(duì)從波場(chǎng)合成模塊10傳輸至揚(yáng)聲器模塊的數(shù)據(jù)流進(jìn)行格式化，并提供在常用的串行數(shù)據(jù)格式中提供的同步信息。由各個(gè)揚(yáng)聲器模塊從該同步信息中提取該同步信息，并將該同步信息用于使各個(gè)揚(yáng)聲器模塊相對(duì)于它們的再現(xiàn)同步，即最終用于獲得模擬揚(yáng)聲器信號(hào)和為此而提供的采樣 (再采樣)的模數(shù)轉(zhuǎn)換。中心波場(chǎng)合成模塊用作主模塊，而所有揚(yáng)聲器模塊用作客戶端，其中，單獨(dú)的數(shù)據(jù)流全部都獲得經(jīng)由各個(gè)傳輸路徑16a-16e來(lái)自中心模塊10的相同的同步信息。這確保了所有揚(yáng)聲器模塊同步工作，即與主模塊10同步，這對(duì)于音頻再現(xiàn)系統(tǒng)不會(huì)遭受音頻質(zhì)量的損失來(lái)說(shuō)非常重要，從而不會(huì)在相應(yīng)的音頻呈現(xiàn)之后以與各個(gè)揚(yáng)聲器在時(shí)間上有偏移的方式來(lái)輻射通過(guò)波場(chǎng)合成模塊所計(jì)算的合成信號(hào)。所描述的概念給波場(chǎng)合成系統(tǒng)提供了顯著的靈活性，該靈活性對(duì)于各種方式的應(yīng)用是可縮放的。但是仍然存在以下問(wèn)題執(zhí)行實(shí)際主呈現(xiàn)(即，依據(jù)虛擬源的位置和揚(yáng)聲器位置，計(jì)算揚(yáng)聲器的各個(gè)合成信號(hào))的中心波場(chǎng)合成模塊表示整個(gè)系統(tǒng)的"瓶頸"。盡管在該系統(tǒng)中，已經(jīng)以分散方式執(zhí)行了"后呈現(xiàn)"(即，具有信道傳輸功能等的合成信號(hào)的強(qiáng)加)，因而巳經(jīng)通過(guò)選擇具有比所確定的閾值能量小的能量的合成信號(hào)，減小了中心呈現(xiàn)模塊與單獨(dú)的揚(yáng)聲器模塊之間的必要數(shù)據(jù)傳輸能力，但是，仍必須針對(duì)所有揚(yáng)聲器模塊，呈現(xiàn)所有虛擬源，即轉(zhuǎn) 換為合成信號(hào)，其中，僅在呈現(xiàn)之后才進(jìn)行選擇。這表示，呈現(xiàn)仍確定了系統(tǒng)的整個(gè)容量。例如，如果中央呈現(xiàn)單元能夠同時(shí)呈現(xiàn)32個(gè)虛擬源，即同時(shí)計(jì)算這32個(gè)虛擬源的合成信號(hào)，則如果在一個(gè)音頻場(chǎng)景中一次有多于32個(gè)源是有效的，則出現(xiàn)了嚴(yán)重的容量瓶頸。對(duì)于簡(jiǎn)單場(chǎng)景，這是足夠的。對(duì)于較復(fù)雜的場(chǎng)景，尤其具有融入式的聲音印象，即例如在下雨時(shí)，許多雨點(diǎn)表示單獨(dú)的源，則直接顯而易見地，具有最多為32個(gè)源的容量將不再是足夠的。如果存在大管弦樂(lè)隊(duì)，以及實(shí)際期望對(duì)每個(gè)管弦樂(lè)隊(duì)演奏者或至少每個(gè)樂(lè) 器組，作為在自己位置上的自身源進(jìn)行處理，也存在相應(yīng)的情形。這里，32個(gè)虛擬源可以非常迅速地變得較少。典型地，在己知的波場(chǎng)合成概念中，使用了場(chǎng)景描述，其中，共同定義了各個(gè)音頻對(duì)象，從而使用場(chǎng)景描述中的數(shù)據(jù)和用于各個(gè)虛擬源的音頻數(shù)據(jù)，呈現(xiàn)器或多呈現(xiàn)裝置可以呈現(xiàn)完整的場(chǎng)景。這里，針對(duì)每個(gè)音頻對(duì)象，精確地定義了音頻對(duì)象必須從哪里開始并在哪里結(jié) 束。此外，對(duì)于每個(gè)音頻對(duì)象，精確地指出要成為虛擬源的虛擬源的位置，即要進(jìn)入波場(chǎng)合成呈現(xiàn)裝置的位置，從而針對(duì)每個(gè)揚(yáng)聲器生成相應(yīng)的合成信號(hào)。這導(dǎo)致了以下的事實(shí)通過(guò)作為對(duì)合成信號(hào)的作用，將從單獨(dú)的揚(yáng)聲器輸出的聲波疊加，對(duì)于收聽者的印象如同聲源位于再現(xiàn)室內(nèi)或再現(xiàn)室外，這通過(guò)虛擬源的源位置來(lái)定義。典型地，波場(chǎng)合成系統(tǒng)的容量是有限的。這導(dǎo)致了每個(gè)呈現(xiàn)器具有有限的計(jì)算能力。典型地，呈現(xiàn)器能夠同時(shí)處理32個(gè)音頻源。此外，從音頻服務(wù)器至呈現(xiàn)器的傳輸路徑具有有限的傳輸帶寬，即提供了以每秒比特為單位的最大傳輸速率。對(duì)于例如僅有兩個(gè)虛擬源存在的簡(jiǎn)單場(chǎng)景，如果考慮對(duì)話，除背景噪聲之外，還存在另一虛擬源，則事實(shí)上可以同時(shí)處理例如32個(gè)源的呈現(xiàn)器的處理能力不存在問(wèn)題。此外，在這種情況下，到呈現(xiàn)器的傳輸量非常小，使得傳輸路徑的容量是足夠的。然而，在再現(xiàn)更加復(fù)雜的場(chǎng)景(即，具有多于32個(gè)虛擬源的場(chǎng) 景)時(shí)，將出現(xiàn)問(wèn)題。在這種情況下，例如在正確再現(xiàn)雨中的場(chǎng)景、或者自然再現(xiàn)歡呼場(chǎng)景的情況下，限于32個(gè)虛擬源的呈現(xiàn)器的最大計(jì)算能力很快將不再是足夠的。這是由于以下事實(shí)因?yàn)槔缭诼牨娭校?在原理上可以將正在歡呼的每個(gè)收聽者理解為在自身虛擬位置上的自身虛擬源，所以存在許多單獨(dú)的虛擬源。為了解決這個(gè)限制，存在多種可能性。因此，一種可能性是在創(chuàng)建場(chǎng)景描述時(shí)已經(jīng)注意到呈現(xiàn)器從來(lái)不必同時(shí)處理32個(gè)音頻對(duì)象。具體地，當(dāng)考慮波場(chǎng)合成處理的能力增加時(shí)，即當(dāng)要由單獨(dú)或多個(gè)呈現(xiàn)器模塊呈現(xiàn)大量虛擬源時(shí)，有時(shí)將會(huì)到達(dá)容量瓶頸。這是由于
典型的呈現(xiàn)器僅可以同時(shí)處理特定最大個(gè)數(shù)的虛擬源的這一事實(shí)。例如，該個(gè)數(shù)可以是32。然而，呈現(xiàn)器的最大處理能力不是系統(tǒng)的唯一瓶頸。例如，如果要同時(shí)處理32個(gè)虛擬源，則還必須同時(shí)向呈現(xiàn)器提供32個(gè)虛擬源的相應(yīng)音頻文件。典型地，呈現(xiàn)器具有輸入緩沖器，它確實(shí)稍微改善了對(duì)數(shù)據(jù)傳輸?shù)男枨?，但是也必須相?yīng)迅速地被填充，尤其在呈現(xiàn)器正在同時(shí)處理非常多的源時(shí)，即從緩沖器中取出非常多的數(shù)據(jù)時(shí)。如果設(shè)計(jì)數(shù)據(jù)傳輸結(jié)構(gòu)使它不再趕上數(shù)據(jù)傳遞的速度，則呈現(xiàn)器會(huì)用盡用于呈現(xiàn)的數(shù)據(jù)。呈現(xiàn)器仍可以通過(guò)簡(jiǎn)單的重復(fù)最后的數(shù)據(jù)直至新數(shù)據(jù)到達(dá)，來(lái)稍微補(bǔ)償這種情況。然而，這在數(shù)據(jù)管理中是加強(qiáng) (intensive)的，并且會(huì)導(dǎo)致可聽到的人為信號(hào)(artifact)。如果虛擬源是具有確定性信息(如，語(yǔ)音、音樂(lè)等)的源，則這些人為信號(hào)將更差。如果虛擬源是噪聲源、或者一般所稱的聲源，則當(dāng)前數(shù)據(jù)的這種重復(fù)將不太關(guān)鍵。但是這里區(qū)分也是存在問(wèn)題的，尤其當(dāng)呈現(xiàn)器已經(jīng)以最大利用率(工作負(fù)載)限制運(yùn)行(這是"用盡"要呈現(xiàn)的音頻數(shù)據(jù)的原因)時(shí)，但實(shí)際上呈現(xiàn)器必須確切地執(zhí)行這種"附加"任務(wù) 的上下文中。發(fā)明內(nèi)容本發(fā)明的目的是提供了一種用于存儲(chǔ)音頻文件的概念，實(shí)現(xiàn)了更高質(zhì)量和更易于實(shí)現(xiàn)的波場(chǎng)合成。通過(guò)如權(quán)利要求1所述的用于存儲(chǔ)音頻文件的設(shè)備、如權(quán)利要求 13所述的用于存儲(chǔ)音頻文件的方法、或者如權(quán)利要求14所述的計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)本發(fā)明的目的。本發(fā)明基于以下發(fā)現(xiàn)有效的數(shù)據(jù)結(jié)構(gòu)是決定性的，從而甚至在呈現(xiàn)器工作在利用率限制下時(shí)，也向呈現(xiàn)器提供足夠的數(shù)據(jù)。典型地，從存儲(chǔ)設(shè)備(如PC或工作站的硬盤)中讀出向呈現(xiàn)器提供的數(shù)據(jù)。然而發(fā)現(xiàn)，對(duì)音頻文件的存取時(shí)間實(shí)質(zhì)上取決于音頻文件如何存儲(chǔ)在存儲(chǔ)設(shè)備中的存儲(chǔ)介質(zhì)上。硬盤的寫/讀頭的連續(xù)跳躍導(dǎo)致了以下事實(shí)存儲(chǔ)設(shè)備的讀出性能極速降低，從而在特定情況下，不再能夠確保向呈現(xiàn)器提供充足的數(shù)據(jù)。此外發(fā)現(xiàn)了，在呈現(xiàn)器正以利用率限制工作、或者接近于它的利用率限制的場(chǎng)景中，正是這種情況。相反地，當(dāng)在另一場(chǎng)景中呈現(xiàn)器并不工作在接近于它的利用率限制下時(shí)，沒有太多的問(wèn)題。因此，在這里，可以很好地接受存儲(chǔ)設(shè)備的寫/讀頭的跳躍。根據(jù)本發(fā)明，在某種意義上，作為波場(chǎng)合成再現(xiàn)的準(zhǔn)備，因而對(duì) 音頻文件進(jìn)行有效存儲(chǔ)，其中，應(yīng)用了交叉場(chǎng)景存儲(chǔ)器優(yōu)化。這樣，檢查場(chǎng)景描述以發(fā)現(xiàn)第一場(chǎng)景需要的波場(chǎng)合成系統(tǒng)的處理能力比另一第二場(chǎng)景更高。然后，控制存儲(chǔ)設(shè)備的寫入裝置，從而將由第一場(chǎng)景的場(chǎng)景描述所標(biāo)識(shí)的音頻文件寫入存儲(chǔ)設(shè)備，使得存儲(chǔ)設(shè)備的讀取裝置可以比將第一場(chǎng)景的音頻文件以純隨機(jī)方式存儲(chǔ)于存儲(chǔ)設(shè)備上的情況更加快速地讀出第一場(chǎng)景的音頻文件。與通常的硬盤環(huán)境(其中，文件總是存儲(chǔ)在硬盤上讀取頭當(dāng)前正處于的位置，即以某種隨機(jī)方式) 相反，根據(jù)本發(fā)明，以優(yōu)化方式寫入強(qiáng)加載在波場(chǎng)合成系統(tǒng)上的場(chǎng)景的音頻文件，這當(dāng)然導(dǎo)致了不會(huì)以最佳方式寫入其它場(chǎng)景的音頻文件。然而，由于在其它場(chǎng)景中，存儲(chǔ)設(shè)備可以具有更多的存取時(shí)間，由于其它場(chǎng)景所需的數(shù)據(jù)傳輸速率無(wú)論如何不會(huì)那么高，由于要并行處理更少的虛擬源，所以這不成問(wèn)題。在本發(fā)明的優(yōu)選實(shí)施例中，尤其對(duì)于用于多個(gè)場(chǎng)景中的音頻文件，將音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備上，從而以最佳方式寫入對(duì)需要波場(chǎng) 合成系統(tǒng)最高利用率的場(chǎng)景的存儲(chǔ)存取，同時(shí)接受用于存取相同音頻文件的其它場(chǎng)景的多個(gè)跳動(dòng)。在具有多個(gè)可以并行使用的單獨(dú)的存儲(chǔ)介質(zhì)(如，RAID陣列) 的存儲(chǔ)設(shè)備中，優(yōu)選地，在并行的單獨(dú)存儲(chǔ)介質(zhì)上存儲(chǔ)要并行使用的音頻文件，從而可以針對(duì)存在容量問(wèn)題的場(chǎng)景，以最大速度來(lái)讀出這些音頻文件，而對(duì)于其它場(chǎng)景，同時(shí)要處理的音頻文件并不在獨(dú)立的盤上，而是在例如同一個(gè)磁盤上，然而，這對(duì)于利用率來(lái)說(shuō)并不關(guān)鍵，在這里無(wú)論如何不會(huì)那樣高。

將參照附圖，在以下對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行更加詳細(xì)的描述，其中圖1是用于存儲(chǔ)音頻文件的本發(fā)明概念的電路框圖；圖lb示出了具有不同波場(chǎng)合成系統(tǒng)利用率的場(chǎng)景的示例性音頻片段；圖lc示出了優(yōu)化的交叉場(chǎng)景存儲(chǔ)器的第一示例；圖ld示出了優(yōu)化的交叉場(chǎng)景存儲(chǔ)器的第二示例；圖2示出了示例性音頻對(duì)象；圖3示出了示例性場(chǎng)景描述；圖4示出了比特流，其中具有當(dāng)前時(shí)間數(shù)據(jù)和位置數(shù)據(jù)的報(bào)頭與每個(gè)音頻對(duì)象相關(guān)聯(lián)；圖5示出了嵌入到了整個(gè)波場(chǎng)合成系統(tǒng)中的本發(fā)明概念；圖6是已知波場(chǎng)合成概念的示意性示例；以及圖7是已知波場(chǎng)合成概念的另一示例。
具體實(shí)施方式
圖1示出了本發(fā)明的設(shè)備，該設(shè)備利用形成為圖la中示出的實(shí) 施例中的公共寫/讀頭2的寫入裝置和讀取裝置，將音頻片段的音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備中。音頻片段要由波場(chǎng)合成系統(tǒng)3的呈現(xiàn)器來(lái)呈現(xiàn)。具體地，音頻片段包括多個(gè)場(chǎng)景，具有為每個(gè)場(chǎng)景所提供的自身場(chǎng)景描述，以及包括場(chǎng)景的音頻對(duì)象的時(shí)間序列的場(chǎng)景。具體地，音頻對(duì) 象包括與虛擬源有關(guān)的信息、以及與音頻對(duì)象相關(guān)聯(lián)的音頻文件的標(biāo) 識(shí)。根據(jù)本發(fā)明，提供了裝置4，用于檢査場(chǎng)景描述和用于確定第一場(chǎng)景需要比第二場(chǎng)景更高的波場(chǎng)合成系統(tǒng)的處理能力。為此，如圖la 所示，可以向裝置4提供與波場(chǎng)合成系統(tǒng)3有關(guān)的信息，以及尤其是與波場(chǎng)合成系統(tǒng)中呈現(xiàn)器的當(dāng)前利用率有關(guān)的信息。裝置4控制控制裝置5?？刂蒲b置5形成用于控制寫/讀頭2，從而將由第一場(chǎng)景的場(chǎng) 景描述所標(biāo)識(shí)的音頻文件(即，具有更高利用率的場(chǎng)景的音頻文件) 寫入存儲(chǔ)設(shè)備1上，使得讀取裝置2可以比將第一場(chǎng)景的音頻文件隨機(jī)存儲(chǔ)在存儲(chǔ)設(shè)備上的情況更加快速地讀出第一場(chǎng)景的音頻文件。優(yōu)選地，音頻文件來(lái)自另一存儲(chǔ)設(shè)備6 (可以是CD或DVD)，并直接經(jīng)由控制裝置寫在存儲(chǔ)設(shè)備上，或者以控制裝置5所確定的正確順序，通過(guò)由控制裝置控制的方式直接從附加存儲(chǔ)器6提供給存儲(chǔ)設(shè)備1的寫/讀頭2。具體地，控制裝置5形成用于對(duì)存儲(chǔ)設(shè)備1 (例如硬盤)寫入，以便在任何情況下不會(huì)出現(xiàn)分段，即連續(xù)地寫入所有音頻文件。此外，控制裝置形成用于將音頻文件寫入硬盤中的特定位置。這樣，存儲(chǔ)(即，物理硬盤的實(shí)際寫入)不再單獨(dú)遺留給硬盤控制器、或者出現(xiàn)類似于傳統(tǒng)硬盤的情況。作為替代，控制裝置5形成用于精確地控制存儲(chǔ)設(shè) 備1的寫/讀頭2，從而將音頻文件以特定順序和布置存儲(chǔ)在存儲(chǔ)設(shè)備上。據(jù)此，確保了在波場(chǎng)合成系統(tǒng)要播放音頻片段時(shí)，至少針對(duì)波場(chǎng) 合成系統(tǒng)工作在利用率限制下的場(chǎng)景，讀取頭可以盡可能迅速地讀出，例如可以在其間不進(jìn)行跳躍的情況下沿軌道逐一讀出音頻文件，并將它們提供給波場(chǎng)合成系統(tǒng)3。相反，對(duì)于其它場(chǎng)景，如將參照?qǐng)Dld所描述的，接受跳躍，然而，由于要傳輸至呈現(xiàn)器的數(shù)據(jù)無(wú)論如何不會(huì) 那么龐大，所以接受跳躍對(duì)于這些場(chǎng)景來(lái)說(shuō)不那么嚴(yán)重。在此點(diǎn)上應(yīng)指出，由于音頻片段的固有動(dòng)態(tài)，尤其是在苛求的音頻場(chǎng)景中，所以在要根據(jù)本發(fā)明對(duì)它們進(jìn)行處理時(shí)，波場(chǎng)合成系統(tǒng)的利用率根本不恒定。而是，利用率簡(jiǎn)檔(profile)將以極高的動(dòng)態(tài)為特征。這樣，將會(huì)存在利用率非常低的場(chǎng)景或部分，而直接在此之后，利用率可以立即到達(dá)最大限制。對(duì)于這種情況，可以很好地想像當(dāng)樂(lè) 器演奏的一段音樂(lè)(僅一個(gè)源)消逝，然后觀眾的歡呼(非常多的不同源)立即開始時(shí)的場(chǎng)景。根據(jù)本發(fā)明，以最佳和交叉場(chǎng)景的方式來(lái)存儲(chǔ)音頻文件。為此，在播放具有高利用率的場(chǎng)景時(shí)，檢査需要那些音頻文件，以便在之后以優(yōu)化方式精確地存儲(chǔ)這些音頻文件。如圖la所示，波場(chǎng)合成系統(tǒng)3包括呈現(xiàn)器或多個(gè)呈現(xiàn)器模塊，作為中心元件。典型地，由調(diào)度器來(lái)控制呈現(xiàn)器，優(yōu)選地，調(diào)度器形成用于使用可能提供的音頻對(duì)象處理來(lái)生成數(shù)據(jù)流。因此，調(diào)度器負(fù) 責(zé)迅速地從存儲(chǔ)設(shè)備1中讀出數(shù)據(jù)，并將該數(shù)據(jù)提供給下游的呈現(xiàn)器，然后呈現(xiàn)器根據(jù)音頻文件來(lái)產(chǎn)生提供給揚(yáng)聲器陣列中的各個(gè)揚(yáng)聲器的合成信號(hào)。因此，本發(fā)明的以交叉場(chǎng)景的優(yōu)化方式存儲(chǔ)音頻文件用于為實(shí)際的波場(chǎng)合成呈現(xiàn)(在圖la中也被稱為"播放")做準(zhǔn)備。因此，本發(fā) 明的交叉場(chǎng)景的優(yōu)化存儲(chǔ)器用于以下事實(shí)可以在播放時(shí)進(jìn)行快速的數(shù)據(jù)讀取，這非?？欤沟弥辽俅鎯?chǔ)器接口將不會(huì)成為波場(chǎng)合成處理的瓶頸。圖lb示出了具有第一場(chǎng)景和第二場(chǎng)景的示例性音頻片段，其中，在第一場(chǎng)景中，必須并行呈現(xiàn)四個(gè)源和/或四個(gè)音頻文件ADl、 AD2、 AD3、 AD4，其中，必須在第二場(chǎng)景中并行呈現(xiàn)不多于三個(gè)音頻文件，即AD6、 AD7禾Q AD1。根據(jù)本發(fā)明，基于圖lc，將在接下來(lái)示出針對(duì)多個(gè)并行盤所形成的存儲(chǔ)器優(yōu)化。這樣，將以最佳方式存儲(chǔ)第一場(chǎng)景的音頻文件作為優(yōu) 先級(jí)，這導(dǎo)致了將音頻文件AD1、 AD2存儲(chǔ)在盤1上、以及將音頻文件AD3、 AD4存儲(chǔ)在盤2上。如從圖lc可以看出的，該存儲(chǔ)器對(duì)于第二場(chǎng)景是不利的，這是由于在第二場(chǎng)景中，AD1和AD7彼此并行呈現(xiàn)，所以同時(shí)需要這兩個(gè)音頻文件。然而，這兩個(gè)文件均存儲(chǔ)于相同的盤1上，并由音頻文件AD2而將它們彼此分離。為了讀出第二場(chǎng) 景的音頻文件，因而硬盤將必須進(jìn)行一些跳躍，并且也不能從盤l和盤2的并行設(shè)置中受益。但是，這也并不是關(guān)鍵的，這是由于第二場(chǎng) 景中波場(chǎng)合成系統(tǒng)的利用率低于第一場(chǎng)景中波場(chǎng)合成系統(tǒng)的利用率，因而第二場(chǎng)景中的數(shù)據(jù)需求低于第一場(chǎng)景中的數(shù)據(jù)需求。圖d示出了在諸如硬盤之類的存儲(chǔ)介質(zhì)上的軌道7上的音頻文件的設(shè)置。圖ld示意性地示出了與圖lc的并行存儲(chǔ)介質(zhì)相反的、在單個(gè)存儲(chǔ)介質(zhì)上的串行設(shè)置。這樣，可以看出，連續(xù)地存儲(chǔ)第一場(chǎng)景的音頻文件，從而讀取頭不必跳躍以讀取第一場(chǎng)景的第一文件。這導(dǎo) 致了音頻文件AD1至AD4的非?？焖俚臄?shù)據(jù)提供。然而，為了讀取第二場(chǎng)景的音頻文件，需要多次跳躍。因此，存
儲(chǔ)設(shè)備的讀取頭必須在讀取了音頻文件AD5之后跳躍至音頻文件 AD2，然后在讀取了音頻文件AD2之后跳回音頻文件AD6。這種情況與必須要在音頻文件AD7之后讀取音頻文件AD1時(shí)的情況類似。這樣可以看出，在圖ld中示出的實(shí)施例中，讀取第一場(chǎng)景不需要讀取頭的跳躍，而對(duì)于讀取第二場(chǎng)景，已經(jīng)需要讀取頭的四次跳躍，這減緩了對(duì)存儲(chǔ)設(shè)備中的數(shù)據(jù)的存取，但是這實(shí)質(zhì)上對(duì)第二場(chǎng)景不比對(duì)第一場(chǎng)景關(guān)鍵，其中，對(duì)于第一場(chǎng)景而言，平緩地讀出數(shù)據(jù)非常重要，從而呈現(xiàn)器不會(huì)用盡用于呈現(xiàn)第一場(chǎng)景的數(shù)據(jù)。根據(jù)本發(fā)明，考慮數(shù)據(jù)結(jié)構(gòu)對(duì)于有效的數(shù)據(jù)輸出是決定性的這一事實(shí)。在許多實(shí)施例中，對(duì)于不同介質(zhì)(CD或DVD)，不能保證饋入呈現(xiàn)器的必要傳輸速率。因此，基于硬盤的管理是必要的。根據(jù)本發(fā)明，對(duì)于復(fù)雜的場(chǎng)景進(jìn)行存儲(chǔ)器布局的優(yōu)化，以保證對(duì)時(shí)間需求的觀察。根據(jù)本發(fā)明，因而一方面實(shí)現(xiàn)了音頻和元數(shù)據(jù)的有效傳遞，另一方面實(shí)現(xiàn)了有效的數(shù)據(jù)結(jié)構(gòu)。這樣，可以經(jīng)由與面向?qū)ο蟮膱?chǎng)景描述相對(duì)應(yīng)的元數(shù)據(jù)來(lái)固定音頻數(shù)據(jù)的播放順序。如果已知播放順序，則可以優(yōu)化在播放時(shí)對(duì)音頻數(shù)據(jù)的存取。計(jì)算機(jī)不再必須在硬盤或其它存儲(chǔ)介質(zhì)的任意位置處"搜索"音頻數(shù)據(jù)，而是能夠連續(xù)地讀取音頻數(shù)據(jù)，而在存儲(chǔ)器中讀取訪問(wèn)不需要多次跳躍。通過(guò)降低對(duì)音頻數(shù)據(jù) 的讀取訪問(wèn)過(guò)程中的努力，可以更加有效地利用資源，因而同時(shí)實(shí)時(shí) 處理更多的音頻對(duì)象。在數(shù)據(jù)組織中，優(yōu)選使用中心數(shù)據(jù)庫(kù)。通過(guò)中心組織來(lái)保證音頻和元數(shù)據(jù)的一致性。此外，采用數(shù)據(jù)庫(kù)明顯地促進(jìn)了波場(chǎng)合成場(chǎng)景的再現(xiàn)。這樣，優(yōu)選釆用考慮到用于在數(shù)據(jù)庫(kù)中找到特定數(shù)據(jù)的搜索機(jī) 制。據(jù)此，產(chǎn)生了音頻對(duì)象的交叉場(chǎng)景的可復(fù)用性。例如，可以在多個(gè)場(chǎng)景中同等地使用音頻數(shù)據(jù)，而不必在創(chuàng)建新場(chǎng)景時(shí)再次將它們導(dǎo) 入。此外，在數(shù)據(jù)庫(kù)的幫助下，可以實(shí)現(xiàn)音頻和元數(shù)據(jù)的版本化。這允許用戶獲得對(duì)他們的場(chǎng)景描述的較舊版本的訪問(wèn)，這也促進(jìn)了產(chǎn)生過(guò)程。在這點(diǎn)上應(yīng)指出，存儲(chǔ)設(shè)備不必必須是中心數(shù)據(jù)庫(kù)，而是可以具
體化為純標(biāo)準(zhǔn)文件服務(wù)器。然而優(yōu)選地采用音頻數(shù)據(jù)庫(kù)，這在使用來(lái) 自各種不同場(chǎng)景的特定音頻材料的情況下尤其有利。這樣，音頻數(shù)據(jù) 庫(kù)獲知了所有場(chǎng)景，并獲知了哪個(gè)場(chǎng)景使用哪個(gè)音頻材料、以及何時(shí) 使用該音頻材料。此外，音頻數(shù)據(jù)庫(kù)訪問(wèn)了音頻數(shù)據(jù)，并可以確定硬盤上音頻數(shù)據(jù)的存儲(chǔ)序列。此外，音頻數(shù)據(jù)庫(kù)可以為音頻數(shù)據(jù)創(chuàng)建最佳交叉場(chǎng)景存儲(chǔ)順序。最后，音頻數(shù)據(jù)庫(kù)還可以在存儲(chǔ)音頻文件時(shí)發(fā) 現(xiàn)瓶頸，并相應(yīng)地對(duì)其做出反應(yīng)。根據(jù)本發(fā)明，可選地，這也可以通過(guò)將所有場(chǎng)景文件存儲(chǔ)于中心位置并實(shí)現(xiàn)讀出所有場(chǎng)景文件的程序、并從中推導(dǎo)出服務(wù)器上音頻文件的存儲(chǔ)順序，來(lái)有利地實(shí)現(xiàn)。然而，數(shù)據(jù)庫(kù)強(qiáng)制對(duì)于音頻文件存儲(chǔ) 順序的優(yōu)化優(yōu)選場(chǎng)景文件的中心存儲(chǔ)。根據(jù)本發(fā)明，執(zhí)行音頻源的時(shí)間和空間設(shè)置、以及從中產(chǎn)生的存儲(chǔ)介質(zhì)上的音頻文件存儲(chǔ)順序的優(yōu)化。為此，使用數(shù)據(jù)的交叉場(chǎng)景優(yōu) 化，這優(yōu)選地使用中心存儲(chǔ)和場(chǎng)景管理。接下來(lái)，參照?qǐng)D2，圖2指出了音頻對(duì)象應(yīng)當(dāng)有利地具有的信息。因此，音頻對(duì)象要規(guī)定音頻文件，從而使音頻文件表示虛擬源的音頻內(nèi)容。但是，音頻對(duì)象并不必包括音頻文件，而是可以具有指向在存儲(chǔ)了實(shí)際音頻文件的數(shù)據(jù)庫(kù)中的所定義位置的索引。此外，音頻對(duì)象優(yōu)選包括虛擬源的識(shí)別，例如，這可以是源編號(hào) 或有意義的文件名等。此外，在本發(fā)明中，音頻對(duì)象規(guī)定了虛擬源(即，音頻文件)的開始和結(jié)束的時(shí)間間隔。如果僅規(guī)定了開始的時(shí)間間隔，則這表示可以在該時(shí)間間隔內(nèi)由呈現(xiàn)器來(lái)改變?cè)撐募某尸F(xiàn)的實(shí)際起點(diǎn)。如果另外給出了結(jié)束的時(shí)間間隔，則這表示該結(jié)尾也可以在時(shí)間間隔內(nèi)改變，依據(jù)實(shí)施方式，這將共同導(dǎo)致音頻文件關(guān)于其長(zhǎng)度的變化。任何實(shí)施方式都是可能的，如音頻文件開始/結(jié)束時(shí)間的定義，從而實(shí)際上允許起點(diǎn)發(fā)生平移，但在任何情況下，必須不改變長(zhǎng)度，從而音頻文件的結(jié)束也自動(dòng)地發(fā)生平移。然而，具體地，對(duì)于噪聲，由于典型地，例如風(fēng)聲將早一些或晚一些開始、還是早一些或晚一些結(jié) 束都不成問(wèn)題，所以優(yōu)選使結(jié)束可變。依據(jù)實(shí)施方式，其它的規(guī)定也是可以的和/或所期望的，如實(shí)際上允許起點(diǎn)改變而不允許終點(diǎn)改變的
規(guī)定等。優(yōu)選地，音頻對(duì)象還包括用于位置的位置間隔。因此，對(duì)于特定音頻對(duì)象，它們是來(lái)自例如左前、還是前中、還是相對(duì)于再現(xiàn)室中的參考點(diǎn)移動(dòng)了某個(gè)(小)角度都不重要。然而，如已經(jīng)解釋的，還存在再次來(lái)自噪聲區(qū)域的音頻對(duì)象，它們可以位于任何任意的位置并因而具有最大位置間隔，例如，可以通過(guò)音頻對(duì)象中的"任意"代碼或不通過(guò)代碼(隱性)來(lái)規(guī)定。音頻對(duì)象可以包括其它信息，如虛擬源類型的指示，即，虛擬源必須是聲波的點(diǎn)源、還是必須是平面波的源、還是必須是產(chǎn)生任意波陣面的源(只要呈現(xiàn)模塊能夠處理這種信息)。圖3示例性地示出了場(chǎng)景描述的示意性示例，其中，示出了各種音頻對(duì)象AOl.....AOn+l的時(shí)間序列。具體地，如圖3所示，指出了定義了時(shí)間間隔的音頻對(duì)象A03。因此，圖3中的音頻對(duì)象A03 的起點(diǎn)和終點(diǎn)可以平移時(shí)間間隔。然而，音頻對(duì)象A03的定義是，必須不改變長(zhǎng)度，然而該定義對(duì)于不同音頻對(duì)象是可變的。因此，通過(guò)沿正時(shí)間方向平移音頻對(duì)象A03，可以看出，可以達(dá) 到以下的情況音頻對(duì)象A03直至音頻對(duì)象A02之后才會(huì)開始。如果這兩個(gè)音頻對(duì)象均在相同的呈現(xiàn)器上播放，則可以通過(guò)該措施避免否則將會(huì)出現(xiàn)的短重疊20。如果音頻對(duì)象A03己經(jīng)是在現(xiàn)有技術(shù)中超過(guò)呈現(xiàn)器容量的音頻對(duì)象，則由于在呈現(xiàn)器上已經(jīng)要處理的所有其它音頻對(duì)象(如音頻對(duì)象A02和AOl)，所以在沒有本發(fā)明的情況下，將會(huì)出現(xiàn)音頻對(duì)象A03的完全抑制，但是時(shí)間間隔20非常小。根據(jù) 本發(fā)明，通過(guò)音頻對(duì)象處理裝置3來(lái)平移音頻對(duì)象A03，從而沒有超過(guò)容量，因而不再出現(xiàn)對(duì)音頻對(duì)象A03的抑制。在本發(fā)明的優(yōu)選實(shí)施例中，使用具有相對(duì)指示的場(chǎng)景描述。因此，不再以絕對(duì)時(shí)間點(diǎn)給出、而是以相對(duì)于音頻對(duì)象A01的相對(duì)時(shí)間段來(lái) 給出音頻對(duì)象A02的開始，增加了靈活性。因此，位置指示的相關(guān)描述是優(yōu)選的，即，不是要在再現(xiàn)室內(nèi)的特定位置xy處設(shè)置音頻對(duì)象的事實(shí)，而是例如，將另一音頻對(duì)象或參考對(duì)象偏移一矢量。從而，可以非常有效地提供時(shí)間間隔信息和/或位置間隔信息，即
簡(jiǎn)單地通過(guò)固定時(shí)間間隔，從而音頻對(duì)象A03可以在音頻對(duì)象AOl 開始之后的兩分鐘與兩分鐘二十秒之間的時(shí)間段內(nèi)開始。這種空間和時(shí)間條件的相對(duì)定義導(dǎo)致了如在例如"Modeling Output Constraints in Multimedia Database Systems", T. Heimlich, 1th International Multimedia Modelling Conference, IEEE, 2005年1月2日至2005年1月14日，Melbourne中所描述的約束條件(constrain)形式的數(shù)據(jù)庫(kù)有效表達(dá)。這里，示出了數(shù)據(jù)庫(kù)系統(tǒng)中約束條件的使用，以定義連續(xù)的數(shù)據(jù)庫(kù)狀態(tài)。具體地，使用Allen關(guān)系來(lái)描述時(shí)間約束條件，并使用空間關(guān)系來(lái)描述空間約束條件。由此，可以針對(duì)同步目的來(lái)定義有利的輸出約束條件。這種輸出約束條件包括對(duì)象之間的時(shí) 間或空間條件，在違反約束條件的情況下的反應(yīng)、以及在必須檢査這種約束條件時(shí)的檢查時(shí)間。在本發(fā)明的優(yōu)選實(shí)施例中，相對(duì)于彼此，對(duì)每個(gè)場(chǎng)景的空間/時(shí)間輸出對(duì)象進(jìn)行建模。音頻對(duì)象處理裝置實(shí)現(xiàn)了這些相對(duì)和可變定義至絕對(duì)空間和時(shí)間順序的轉(zhuǎn)譯。該順序表示在圖1中示出的系統(tǒng)的輸出 6a處獲得的、并定義了如何對(duì)波場(chǎng)合成系統(tǒng)中的呈現(xiàn)模塊進(jìn)行特別尋址的輸出調(diào)度。因此，該調(diào)度是在與輸出條件相對(duì)應(yīng)的音頻數(shù)據(jù)中設(shè) 置的輸出計(jì)劃。接下來(lái)，基于圖4，將會(huì)提出這種輸出調(diào)度的優(yōu)選實(shí)施例。具體地，圖4示出了根據(jù)圖4從左至右傳輸?shù)臄?shù)據(jù)流，g卩，從圖l的音頻對(duì)象處理裝置3傳輸至圖1的波場(chǎng)系統(tǒng)0的一個(gè)或多個(gè)波場(chǎng)合成呈現(xiàn) 器的數(shù)據(jù)流。具體地，對(duì)于在圖4中示出的實(shí)施例中的每個(gè)音頻對(duì)象，數(shù)據(jù)流包括首先是位置信息和時(shí)間信息所在的報(bào)頭H，以及特定音頻對(duì)象的下游音頻文件，在圖4中，以AOl指示第一音頻對(duì)象，A02 指示第二音頻對(duì)象等。然后，波場(chǎng)合成呈現(xiàn)器獲得數(shù)據(jù)流，并根據(jù)例如出現(xiàn)并一致同意的同步信息識(shí)別出報(bào)頭的到來(lái)。然后，基于另一同步信息，呈現(xiàn)器識(shí) 別出報(bào)頭結(jié)束?？蛇x地，對(duì)于每個(gè)報(bào)頭，可以同意以比特為單位的固定長(zhǎng)度。在接收了報(bào)頭之后，圖4中示出的本發(fā)明的優(yōu)選實(shí)施例中的音頻
呈現(xiàn)器自動(dòng)得知后續(xù)音頻文件(即，AOl)屬于音頻對(duì)象(即，在報(bào) 頭中識(shí)別的源位置)。圖4示出了串行數(shù)據(jù)至波場(chǎng)合成呈現(xiàn)器的傳輸。當(dāng)然，同時(shí)在呈現(xiàn)器中播放多個(gè)音頻對(duì)象。為此，呈現(xiàn)器在數(shù)據(jù)流讀取裝置之后需要輸入緩沖器，以對(duì)數(shù)據(jù)流進(jìn)行解析。然后，數(shù)據(jù)流讀取裝置將解譯報(bào) 頭并相應(yīng)地存儲(chǔ)伴隨的音頻文件，從而當(dāng)要呈現(xiàn)音頻對(duì)象時(shí)，呈現(xiàn)器從輸入緩沖器中讀取正確的音頻文件和正確的源位置。當(dāng)然，也可以是用于數(shù)據(jù)流的其它數(shù)據(jù)。還可以使用時(shí)間/位置信息和實(shí)際音頻數(shù)據(jù) 的單獨(dú)傳輸。然而，由于通過(guò)位置/時(shí)間信息與音頻文件的串聯(lián)而消除了數(shù)據(jù)一致性問(wèn)題，由于總是確保了呈現(xiàn)器還具有音頻數(shù)據(jù)的正確源位置、并仍不呈現(xiàn)例如先前源的音頻文件、而是使用新源的位置信息來(lái)呈現(xiàn)，所以在圖4中示出的組合傳輸是優(yōu)選的。因此，本發(fā)明基于面向?qū)ο蟮姆绞?，即將單?dú)的虛擬源理解為特征在于音頻對(duì)象和空間中虛擬位置、以及可能的源類型(即，它是聲波的點(diǎn)源、還是平面波的源、還是其它形狀的源)的對(duì)象。如已經(jīng)提出的，波場(chǎng)的計(jì)算是計(jì)算時(shí)間密集的，并且需要所使用的硬件(如聲卡和計(jì)算機(jī))能力與計(jì)算算法的效率結(jié)合。在要同時(shí)表示多個(gè)所要求的聲音事件時(shí)，甚至基于最佳配置的PC的解決方案也會(huì)在波場(chǎng)合成計(jì)算過(guò)程中迅速到達(dá)它的限制。因此，在混頻和再現(xiàn)過(guò) 程中，所使用的軟件和硬件的能力限制給出了相對(duì)于虛擬源個(gè)數(shù)的限制。圖6示出了能力受限的已知波場(chǎng)合成概念，包括創(chuàng)作工具60、控制呈現(xiàn)模塊62和音頻服務(wù)器64，其中，控制呈現(xiàn)模塊形成用于向揚(yáng) 聲器陣列66提供數(shù)據(jù)，從而揚(yáng)聲器陣列66通過(guò)各個(gè)揚(yáng)聲器70的各個(gè) 波的疊加來(lái)產(chǎn)生所期望的波陣面68。創(chuàng)作工具60使用戶能夠創(chuàng)建并編輯場(chǎng)景，并控制基于波場(chǎng)合成的系統(tǒng)。因此，場(chǎng)景包括與各個(gè)虛擬音頻源有關(guān)的信息和音頻數(shù)據(jù)。將音頻源的屬性和對(duì)音頻數(shù)據(jù)的引用存儲(chǔ)在XML場(chǎng)景文件中。音頻數(shù)據(jù)本身被提交到音頻服務(wù)器64上，并從此處被傳輸至呈現(xiàn)模塊。同時(shí)，呈現(xiàn)模塊從創(chuàng)作工具中獲得控制數(shù)據(jù)，從而以集中化方式具體化的控制呈現(xiàn)模塊62可以產(chǎn)生用于各個(gè)揚(yáng)聲器的合成信號(hào)。圖6中示出的概念在"Authoring System for Wave Field Synthesis" ， F. Melchior, T. R6der, S. Brix， S. Wabnik and C. Riegel, AES Convention Paper, 115th AES convention, 2003年10月10日，紐纟匁中有所描述。如果波場(chǎng)合成系統(tǒng)利用多個(gè)呈現(xiàn)器模塊進(jìn)行操作，則向每個(gè)呈現(xiàn) 器提供相同的音頻數(shù)據(jù)，無(wú)論呈現(xiàn)器是否由于與之關(guān)聯(lián)的有限個(gè)數(shù)的揚(yáng)聲器而需要該數(shù)據(jù)用于再現(xiàn)。由于當(dāng)前計(jì)算機(jī)中的每個(gè)能夠計(jì)算32 個(gè)音頻源，所以這表示對(duì)于系統(tǒng)的限制。另一方面，要以有效的方式顯著增加可以在整個(gè)系統(tǒng)中呈現(xiàn)的源的個(gè)數(shù)。這是復(fù)雜應(yīng)用(如電影)、具有融入式氛圍的場(chǎng)景(如雨或歡呼)、或者其它復(fù)雜音頻場(chǎng)景的實(shí)質(zhì) 性先決條件之一。根據(jù)本發(fā)明，在波場(chǎng)合成多呈現(xiàn)器系統(tǒng)中實(shí)現(xiàn)了冗余數(shù)據(jù)傳輸過(guò) 程和數(shù)據(jù)處理過(guò)程的減少，這導(dǎo)致了計(jì)算能力和/或同時(shí)可計(jì)算的音頻源個(gè)數(shù)的增加。為了減小對(duì)多呈現(xiàn)器系統(tǒng)的各個(gè)呈現(xiàn)器的音頻和元數(shù)據(jù)的冗余傳輸和處理，通過(guò)數(shù)據(jù)輸出裝置擴(kuò)展音頻服務(wù)器，這能夠確定哪個(gè)呈現(xiàn)器需要哪些音頻和元數(shù)據(jù)。在優(yōu)選實(shí)施例中，可能由數(shù)據(jù)管理器來(lái)進(jìn)行幫助的數(shù)據(jù)輸出裝置需要多條信息。該信息首先是音頻數(shù)據(jù)，然后是源的時(shí)間和位置數(shù)據(jù)，最后是呈現(xiàn)器的配置，即與所連接的揚(yáng)聲器和它們的位置、以及它們的容量有關(guān)的信息。在數(shù)據(jù)管理技術(shù)和輸出條件的定義的幫助下，利用音頻對(duì)象的時(shí)間和空向設(shè)置，通過(guò)數(shù)據(jù)輸出裝置來(lái)產(chǎn)生輸出調(diào)度。根據(jù)空間設(shè)置、時(shí)間調(diào)度和呈現(xiàn)器配置，數(shù)據(jù)管理模塊計(jì)算在特定時(shí) 刻哪個(gè)源與哪個(gè)呈現(xiàn)器相關(guān)。圖5中示出了優(yōu)選的整體概念。通過(guò)輸出側(cè)上的數(shù)據(jù)輸出裝置24 來(lái)補(bǔ)充數(shù)據(jù)庫(kù)22，其中，也將數(shù)據(jù)輸出裝置稱為調(diào)度器。然后，該調(diào) 度器在輸出20a、20b、20c處生成用于各種呈現(xiàn)器50的呈現(xiàn)輸入信號(hào)，從而提供給揚(yáng)聲器陣列的相應(yīng)揚(yáng)聲器。優(yōu)選地，為了通過(guò)RAID系統(tǒng)和相應(yīng)的數(shù)據(jù)結(jié)構(gòu)缺省值來(lái)配置數(shù) 據(jù)庫(kù)42，由存儲(chǔ)管理器52來(lái)幫助調(diào)度器24。
在輸入側(cè)，存在數(shù)據(jù)生成器54，例如，可以是用于以面向?qū)ο蠓绞浇；蛎枋龅囊纛l場(chǎng)景的音響大師或音頻工程師。這里，給出了包括相應(yīng)輸出條件56的場(chǎng)景描述，如果必要，在轉(zhuǎn)換58之后，將這些輸出條件與音頻數(shù)據(jù)一起共同存儲(chǔ)在數(shù)據(jù)庫(kù)22中。可以通過(guò)插入/更新工具59來(lái)處理和更新音頻數(shù)據(jù)。依據(jù)條件，可以以硬件或軟件來(lái)實(shí)現(xiàn)本發(fā)明的方法。可以在數(shù)字存儲(chǔ)介質(zhì)、尤其是軟盤或CD上，利用能夠與可編程計(jì)算機(jī)系統(tǒng)合作的電可讀控制信號(hào)來(lái)實(shí)現(xiàn)，從而執(zhí)行本發(fā)明的方法。通常，本發(fā)明還包括一種計(jì)算機(jī)程序產(chǎn)品，具有存儲(chǔ)在機(jī)器可讀載體上的程序代碼，當(dāng)在計(jì)算機(jī)上執(zhí)行計(jì)算機(jī)產(chǎn)品時(shí)，用于執(zhí)行本方法。換言之，本發(fā)明還可以實(shí)現(xiàn)為一種具有程序代碼的計(jì)算機(jī)程序，當(dāng)在計(jì)算機(jī)上執(zhí)行計(jì) 算機(jī)程序時(shí)，用于執(zhí)行本方法。
權(quán)利要求
1、一種設(shè)備，用于利用寫入裝置和讀取裝置(2)，將音頻片段的音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備(1)中，其中，所述音頻片段要由波場(chǎng)合成系統(tǒng)(3)的呈現(xiàn)器呈現(xiàn)，所述音頻片段包括多個(gè)場(chǎng)景，針對(duì)每個(gè)場(chǎng)景提供場(chǎng)景描述，場(chǎng)景定義了場(chǎng)景的音頻對(duì)象的時(shí)間序列，所述音頻對(duì)象包括與虛擬源有關(guān)的信息和與所述音頻對(duì)象相關(guān)聯(lián)的音頻文件的標(biāo)識(shí)，所述設(shè)備包括檢查裝置(4)，用于檢查場(chǎng)景描述，并用于確定第一場(chǎng)景需要比第二場(chǎng)景更高的波場(chǎng)合成系統(tǒng)的處理能力；以及控制裝置(5)，用于控制寫入裝置(2)，從而將由第一場(chǎng)景的場(chǎng)景描述所標(biāo)識(shí)的音頻文件寫在存儲(chǔ)設(shè)備(1)上，使得讀取裝置(2)能夠比將第一場(chǎng)景的音頻文件隨機(jī)存儲(chǔ)在存儲(chǔ)設(shè)備(1)上的情況更加快速地讀出第一場(chǎng)景的音頻文件。
2、如權(quán)利要求l所述的設(shè)備，其中，第一場(chǎng)景的音頻對(duì)象和第二場(chǎng)景的音頻對(duì)象標(biāo)識(shí)了相同的音頻文件，以及所述控制裝置(5)形成用于控制寫入裝置(2)，從而將音頻文件存儲(chǔ)在存儲(chǔ)設(shè)備()中，使得當(dāng)讀取在第一場(chǎng)景中標(biāo)識(shí)的音頻文件時(shí)，讀取裝置(2)能夠以比在讀取第二場(chǎng)景的音頻文件時(shí)讀取音頻文件所花費(fèi)的訪問(wèn)時(shí)間短的訪問(wèn)時(shí)間來(lái)讀取音頻文件。
3、如權(quán)利要求1或2所述的設(shè)備，其中，所述存儲(chǔ)設(shè)備(1)包括軌道(7)，所述讀取裝置(2)沿所述軌道(7)移動(dòng)，以及所述控制裝置(5)形成用于控制寫入裝置，從而沿所述軌道寫入第一場(chǎng)景的音頻文件。
4、如前述權(quán)利要求之一所述的設(shè)備，其中，所述存儲(chǔ)設(shè)備(1) 是具有單個(gè)存取介質(zhì)的并行存儲(chǔ)設(shè)備，所述控制裝置(5)形成用于控制寫入裝置(2)，從而將要由呈現(xiàn)器并行呈現(xiàn)的第一場(chǎng)景的音頻文件存儲(chǔ)在不同的單個(gè)存取介質(zhì)上。
5、如權(quán)利要求3所述的設(shè)備，其中，所述控制裝置(5)形成用于控制寫入裝置(2)，從而根據(jù)標(biāo)識(shí)了音頻文件的第一場(chǎng)景的音頻對(duì) 象的出現(xiàn)時(shí)間順序，沿所述軌道(7)存儲(chǔ)第一場(chǎng)景的音頻文件。
6、如權(quán)利要求2所述的設(shè)備，其中，所述存儲(chǔ)設(shè)備(1)包括軌道(7)，所述讀取裝置(2)沿所述軌道(7)移動(dòng)，以及所述控制裝置(5)形成用于控制寫入裝置(2)，從而將音頻文件存儲(chǔ)在緊鄰另一音頻文件之前或之后的軌道上，所述另一音頻文件標(biāo)識(shí)了要由呈現(xiàn)器與標(biāo)識(shí)了所述音頻文件的所述一個(gè)音頻對(duì)象并行呈現(xiàn)的音頻對(duì)象。
7、如前述權(quán)利要求之一所述的設(shè)備，其中，檢查裝置(4)形成用于將包括要由呈現(xiàn)器同時(shí)呈現(xiàn)的音頻對(duì)象比另一場(chǎng)景的音頻對(duì)象多的音頻對(duì)象的場(chǎng)景確定為第一場(chǎng)景。
8、如前述權(quán)利要求之一所述的設(shè)備，其中，檢查裝置(4)形成用于僅在波場(chǎng)合成系統(tǒng)的場(chǎng)景引起的利用率達(dá)到最大利用率的預(yù)定比例時(shí)，才將場(chǎng)景確定為第一場(chǎng)景。
9、如前述權(quán)利要求之一所述的設(shè)備，其中，所述控制裝置(5) 形成用于控制寫入裝置(2)，從而在將第一場(chǎng)景的音頻文件存儲(chǔ)在存儲(chǔ)設(shè)備(1)上之后，將第二場(chǎng)景的音頻文件存儲(chǔ)在仍保持空白的存儲(chǔ) 設(shè)備(1)的位置處。
10、如前述權(quán)利要求之一所述的設(shè)備，其中，所述存儲(chǔ)設(shè)備(1) 是具有一個(gè)存儲(chǔ)盤或多個(gè)存儲(chǔ)盤的硬盤，其中，為每個(gè)存儲(chǔ)盤提供寫/ 讀頭(2)。
11、如前述權(quán)利要求之一所述的設(shè)備，其中，所述寫入裝置和讀取裝置形成為同一個(gè)物理組件(2)。
12、如前述權(quán)利要求之一所述的設(shè)備，其中，所述控制裝置(5) 形成用于控制寫入裝置(2)，從而將由第一場(chǎng)景的音頻對(duì)象所標(biāo)識(shí)的音頻文件連續(xù)地寫在存儲(chǔ)設(shè)備(1 )上，在讀取第一場(chǎng)景的音頻文件時(shí)，讀取裝置不必跳躍。
13、一種方法，用于利用寫入裝置和讀取裝置(2)，將音頻片段的音頻文件存儲(chǔ)于存儲(chǔ)設(shè)備(1)中，其中，所述音頻片段要由波場(chǎng)合成系統(tǒng)(3)的呈現(xiàn)器呈現(xiàn)，所述音頻片段包括多個(gè)場(chǎng)景，針對(duì)每個(gè)場(chǎng)景提供場(chǎng)景描述，場(chǎng)景定義了場(chǎng)景的音頻對(duì)象的時(shí)間序列，所述音頻對(duì)象包括與虛擬源有關(guān)的信息和與所述音頻對(duì)象相關(guān)聯(lián)的音頻文件的標(biāo)識(shí)，所述方法包括檢査(4)場(chǎng)景描述并確定第一場(chǎng)景需要比第二場(chǎng)景更高的波場(chǎng) 合成系統(tǒng)(3)的處理能力；以及控制(5)寫入裝置(2)，從而將由第一場(chǎng)景的場(chǎng)景描述所標(biāo)識(shí) 的音頻文件寫在存儲(chǔ)設(shè)備(1)上，使得讀取裝置(2)能夠比將第一場(chǎng)景的音頻文件隨機(jī)存儲(chǔ)在存儲(chǔ)設(shè)備(1)上的情況更加快速地讀出第一場(chǎng)景的音頻文件。
14、一種具有程序代碼的計(jì)算機(jī)程序，當(dāng)在計(jì)算機(jī)上執(zhí)行計(jì)算機(jī) 程序時(shí)，用于執(zhí)行如權(quán)利要求13所述的方法。
全文摘要
以交叉場(chǎng)景優(yōu)化方式來(lái)存儲(chǔ)(4)音頻片段的音頻文件，從而在讀出(1，2)用于需要波場(chǎng)合成系統(tǒng)高利用率的場(chǎng)景的音頻文件時(shí)，實(shí)現(xiàn)了非常短的存儲(chǔ)器存取時(shí)間，而對(duì)于不需要這么高的波場(chǎng)合成系統(tǒng)利用率的場(chǎng)景，接受較長(zhǎng)的存儲(chǔ)器存取時(shí)間。
文檔編號(hào)H04S7/00GK101133454SQ200680005933
公開日2008年2月27日申請(qǐng)日期2006年2月16日優(yōu)先權(quán)日2005年2月23日
發(fā)明者加布里埃爾·加茨舍, 卡特里·賴歇爾特, 桑德拉·布里克斯申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：卡特里.賴歇爾特;加布里埃爾.加茨舍;桑德拉.布里克斯
技術(shù)所有人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

海量音視頻文件存儲(chǔ)相關(guān)技術(shù)

usb存儲(chǔ)設(shè)備中無(wú)文件相關(guān)技術(shù)

文件的存儲(chǔ)方法依賴于相關(guān)技術(shù)

音頻存儲(chǔ)相關(guān)技術(shù)

音視頻存儲(chǔ)數(shù)據(jù)庫(kù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

存儲(chǔ)音頻文件的設(shè)備和方法