專利名稱:處理音頻數(shù)據(jù)的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于處理音頻數(shù)據(jù)的設(shè)備。 除此之外,本發(fā)明涉及處理音頻數(shù)據(jù)的方法。 并且,本發(fā)明涉及程序單元。 進(jìn)一步地,本發(fā)明涉及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
音頻重放(playback)設(shè)備變得越來越重要。特別地,越來越多的用 戶購買基于頭戴式耳機(jī)的音頻播放器和基于揚(yáng)聲器的音頻環(huán)繞系統(tǒng)。
當(dāng)通過音頻播放器逐個(gè)重放不同的音頻項(xiàng)目時(shí),期望在兩個(gè)相繼的軌 道之間具有明顯無縫的轉(zhuǎn)換(transition )。這可一皮表示為"混音(mix)"。 在"交叉漸變(cross-fade)"期間,可能在從一個(gè)軌道到另 一個(gè)軌道的轉(zhuǎn)換 階段期間交叉漸變軌道。在自動化系統(tǒng)中,為了提供軌道間的無縫轉(zhuǎn)換, 離去的軌道的放大率(amplification)典型地將以與進(jìn)來的軌道的放大率 增大相同的速率減小。
包括混音和交叉漸變以實(shí)現(xiàn)連續(xù)歌曲間平滑轉(zhuǎn)換的、允許歌曲能夠自 動重放的方法是已知的。這樣的技術(shù)可被表示為自動DJ。當(dāng)提供了播放 列表時(shí),不可能根據(jù)定義播放在播放列表中的所有歌曲,使得在轉(zhuǎn)換期間 音頻質(zhì)量的主觀感知是合適的。
傳統(tǒng)的自動DJ系統(tǒng)允許盲目地執(zhí)行交叉漸變,允許節(jié)奏和和聲的沖 突。這可能給出感知上地令人不愉快("差勁的DJ")的體驗(yàn)。在普通用 戶定義的播放列表的情況下,不相稱轉(zhuǎn)換的出現(xiàn)率(occurrence)甚至比 由專業(yè)的唱片選播者(discjockey)制作的播放列表中的更大。
另 一種傳統(tǒng)系統(tǒng)基于在兩個(gè)重放項(xiàng)目間留出短暫停頓的規(guī)則,使得和 聲的混音不會發(fā)生,并且節(jié)奏的連續(xù)性被破壞。即,聲音被減弱。該方法 有效地使兩個(gè)重放列表項(xiàng)目在時(shí)間上分離,并且如果暫停足夠長,不會有 旋律或和聲的不連續(xù)的體驗(yàn)。任何自動DJ效果在這樣的概念中明顯不存 在。
當(dāng)聽音頻播放列表、記錄或其他音樂收藏品時(shí),用戶通常做的是例如 通過分別按播放器上的"下一首"或"上一首"按鈕從一個(gè)項(xiàng)目向前或向后跳轉(zhuǎn)到另一個(gè)項(xiàng)目。這可以在音頻項(xiàng)目的開頭和結(jié)尾之間的任何地方實(shí) 施。這在音頻播放器中實(shí)現(xiàn)的方式是當(dāng)前項(xiàng)目的聲音被減弱而新的軌道開 始播放。
從一個(gè)音頻軌道移動到另 一個(gè)的更先進(jìn)的方法是旨在以以下方式混
音兩個(gè)軌道的自動DJ系統(tǒng)類似于舞曲唱片選碌番者如何將一個(gè)項(xiàng)目的結(jié) 尾結(jié)合到另一個(gè)的開頭來完成從一個(gè)軌道移動到另一個(gè)。這兩個(gè)信號可一皮 同步并且信號逐漸地被交叉漸變,以給出從一個(gè)項(xiàng)目到另一個(gè)平滑轉(zhuǎn)換的 印象。
US 2005/0047614 Al公開了 一種用于在諸如環(huán)繞環(huán)境這樣的多聲道 (mult卜channel)音頻環(huán)境中加強(qiáng)歌曲間轉(zhuǎn)換的系統(tǒng)和方法。在該方法中, 通過在轉(zhuǎn)換期間獨(dú)立操縱(manipulate)每個(gè)節(jié)目的各個(gè)聲道的音量,給 正在結(jié)束的節(jié)目運(yùn)動的錯(cuò)覺(illusion of motion )以創(chuàng)建歌曲正在退出的印 象,而給正在開始的節(jié)目運(yùn)動(motion)以創(chuàng)建歌曲正在進(jìn)入的印象。
然而,根據(jù)US 2005/0047614 Al的兩段音頻之間的轉(zhuǎn)換因?yàn)橐苿颖?以過分簡單化的方法模擬的緣故對于人類收聽者來說聽上去仍然可能顯 得不自然。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是提供一種允許音頻項(xiàng)目的開頭或結(jié)尾處的適當(dāng) 音頻體驗(yàn)的音頻系統(tǒng)。
為了達(dá)到上述目標(biāo),提供了根據(jù)獨(dú)立權(quán)利要求的用于處理音頻數(shù)據(jù)的 設(shè)備、處理音頻數(shù)據(jù)的方法、程序單元和計(jì)算機(jī)可讀介質(zhì)。有益的實(shí)施例 在從屬權(quán)利要求中限定。
根據(jù)本發(fā)明的示例性實(shí)施例,提供了 一種用于處理音頻數(shù)據(jù)的設(shè)備, 其中該設(shè)備包括操縱單元(特別地,重采樣單元),適用于以修改音頻數(shù) 據(jù)第一音頻項(xiàng)目的轉(zhuǎn)換部分的與時(shí)間有關(guān)的音頻屬性的方式選擇性地操 縱(特別地,重采樣)音頻數(shù)據(jù)第一音頻項(xiàng)目的轉(zhuǎn)換部分(特別地,也可 以以逼真的方式?jīng)_莫擬移動的時(shí)間延遲效果)。
根據(jù)本發(fā)明的另 一個(gè)示例性實(shí)施例,提供了 一種處理音頻數(shù)據(jù)的方 法,其中該方法包括以修改音頻數(shù)據(jù)的第一音頻項(xiàng)目的轉(zhuǎn)換部分的與時(shí)間 有關(guān)的音頻屬性的方式選擇性地操縱音頻數(shù)據(jù)的第一音頻項(xiàng)目的轉(zhuǎn)換部 分。
根據(jù)本發(fā)明的又一個(gè)示例性實(shí)施例,提供了一種程序單元(例如源代碼或可執(zhí)行代碼形式的軟件程序),當(dāng)被處理器執(zhí)行時(shí),其適用于控制或 實(shí)施具有上述特征的數(shù)據(jù)處理方法。
根據(jù)本發(fā)明的再一個(gè)示例性實(shí)施例,提供了一種計(jì)算機(jī)可讀介質(zhì)(例
如CD、 DVD、 USB棒、軟盤或硬盤),在其中存儲了計(jì)算機(jī)程序,當(dāng)它 被處理器執(zhí)行時(shí),適用于控制或完成具有上述特征的數(shù)據(jù)處理方法。
才艮據(jù)本發(fā)明實(shí)施例被實(shí)施的用于音頻節(jié)奏操縱(tempo manipulation) 和/或頻率改變(frequency alteration)目的的數(shù)據(jù)處理可通過計(jì)算機(jī)程序 即通過軟件實(shí)現(xiàn),或者通過使用 一個(gè)或多個(gè)特殊的電子優(yōu)化電路即以硬件 實(shí)現(xiàn),或者以混合的形式即借助于軟件部件和硬件部件來實(shí)現(xiàn)。
在本申請的上下文中,術(shù)語"操縱"可特別地表示重新計(jì)算音頻數(shù)據(jù)流 或音頻數(shù)據(jù)片段(audio data piece)特定部分以選4f性地修改這個(gè)部分的 時(shí)間或頻率相關(guān)的屬性,即對關(guān)于聲音表現(xiàn)的節(jié)奏和音高的可聽體驗(yàn)有影 響的參數(shù)。因此,諸如節(jié)奏和/或音高這樣的屬性可通過這樣的操縱得以 修改,特別地以獲得多普勒效應(yīng)。因此,操縱或重采樣可通過重新計(jì)算具 有與原始記錄的文件中的屬性不同的屬性的聲音文件中的樣本來進(jìn)行。這 可包括以某種方式移除樣本、修改可獲得的頻率范圍、引入暫停、增加或 減少音調(diào)的再現(xiàn)次數(shù)等以改善音頻片段間轉(zhuǎn)換的感知。特別地,因?yàn)樵试S 結(jié)尾和開頭軌道的感知解耦的音高轉(zhuǎn)換效果可避免相繼的音頻片段間的 節(jié)奏和和聲沖突。
音頻項(xiàng)目的術(shù)語"轉(zhuǎn)換部分"可特別地表示該音頻項(xiàng)目的開頭部分和/ 或結(jié)尾部分,在所述部分,轉(zhuǎn)換發(fā)生在所述音頻項(xiàng)目與另一個(gè)(在前的或 隨后的)音頻項(xiàng)目之間或者該音頻項(xiàng)目與無聲時(shí)間間隔之間。
術(shù)語"與時(shí)間有關(guān)的音頻屬性"可特別地表示可以以特定方式調(diào)整時(shí) 間特性和相應(yīng)的音頻參數(shù),例如以強(qiáng)調(diào)淡入(fading m )或淡出(fading out) 音頻片段的印象。這可以包括被稱為所謂的聲學(xué)多普勒效應(yīng)的、用于指示 音頻項(xiàng)目淡入或淡出的直X1測量的頻率變化。
根據(jù)本發(fā)明的 一個(gè)示例性實(shí)施例,音頻片段的轉(zhuǎn)換部分可選擇地被處 理以改善對于人耳來說的該音頻項(xiàng)目和在前或隨后的音頻信息之間轉(zhuǎn)換 的感知。通過在淡入和/或淡出期間改變與時(shí)間有關(guān)的音頻重放屬性,可 以生成接近或離開聲源的印象,這在心理上可分別被關(guān)聯(lián)為新歌曲的開始 或當(dāng)前^皮重方文歌曲的結(jié)束。
因此,根據(jù)示例性實(shí)施例,可以使用于自動地選播音樂(DJmg)的 動態(tài)混音(mixing)成為可能。在自動唱片選播系統(tǒng)中,可以使歌曲轉(zhuǎn)換不出現(xiàn)令人煩人的中斷。這一般可以通過交叉漸變兩首連續(xù)的歌曲來完 成。為了獲得平滑的轉(zhuǎn)換,要求歌曲的節(jié)奏和旋律在混音區(qū)域被調(diào)準(zhǔn),并 且這些歌曲具有在混音區(qū)域中匹配的和聲屬性。這通常在可在另一首之后 播放的歌曲上施加約束。根據(jù)一個(gè)示例性實(shí)施例,調(diào)準(zhǔn)節(jié)奏、旋律和和聲 的需要通過在轉(zhuǎn)換期間對每首歌曲施加采樣頻率的不同的滑動的變化而 得以克服?;瑒拥尼姌宇l率可創(chuàng)建被混音的兩首歌曲的自然解耦,使得節(jié) 奏、旋律和和聲沖突不重要。因此,本發(fā)明的實(shí)施例可克服不是每個(gè)播放
列表(或者每對歌曲)都能采用自動DJ方法來交叉漸變這一限制。本發(fā)
明實(shí)施例所依據(jù)的認(rèn)識是除了通過暫停的時(shí)間上的分離之外,還有其他可 能的方法使兩個(gè)播放列表項(xiàng)目感知上分離。出于這個(gè)目的,可以使用一個(gè) 或兩個(gè)音頻信號的頻語的動態(tài)系統(tǒng)的操縱。特別地,可以執(zhí)行一種方法, 其中在歌曲的混音區(qū)域中,執(zhí)行歌曲的操縱/重采樣,使得一首歌曲具有 滑動下降的頻率和節(jié)奏,而另一首歌曲具有滑動上升的節(jié)奏和頻率。因此,
自動DJ應(yīng)用和強(qiáng)制轉(zhuǎn)換中音頻項(xiàng)目的時(shí)間上的操縱可得以使用,并且可 基于這樣的考慮可引起導(dǎo)致頻率滑移效果的足夠強(qiáng)大的多普勒頻移效 應(yīng)。因此,使得自動DJ應(yīng)用的動態(tài)混音成為可能??墒乖谧詣覦J系統(tǒng) 中被混音的兩首歌曲的自然解耦成為可能,使得這些歌曲不需要在節(jié)奏、 旋律、和聲內(nèi)容等方面相似。這可以通過在轉(zhuǎn)換期間操縱這兩首歌曲而得 以創(chuàng)建,使得正在結(jié)束的歌曲的節(jié)奏和/或頻率從原始頻率滑動地下降到 較低的頻率,而正在開始的歌曲的節(jié)奏和/或頻率平滑地向具有不同頻率 輪廓(frequency contour)的原始頻率下降。這也能作為空間轉(zhuǎn)換效果的 副產(chǎn)品而得以實(shí)現(xiàn)??梢詣?chuàng)建兩首歌曲的虛擬源的移動錯(cuò)覺,并且可以生 成多普勒效應(yīng)。取決于創(chuàng)建源移動錯(cuò)覺的方法,這常常還可以產(chǎn)生多普勒 效應(yīng),即多普勒效應(yīng)是移動效果的結(jié)果。
接下來,將解釋用于處理音頻數(shù)據(jù)的設(shè)備的另一個(gè)示例性實(shí)施例。然 而,這些實(shí)施例也應(yīng)用于處理音頻數(shù)據(jù)的方法、程序元件和計(jì)算機(jī)可讀介
第一音頻項(xiàng)目的轉(zhuǎn)換部分可以是第一音頻項(xiàng)目的結(jié)尾部分。換句話 說,通過以漸進(jìn)或逐步的方式調(diào)節(jié)時(shí)間屬性,可以執(zhí)行操縱以平滑地淡出 第一音頻項(xiàng)目的結(jié)尾。
附加地或可選地,第一音頻項(xiàng)目的轉(zhuǎn)換部分可以是第一音頻項(xiàng)目的開 頭部分。換句話說,通過以漸進(jìn)或逐步的方式調(diào)節(jié)時(shí)間屬性,可以執(zhí)行操 縱以淡入第一音頻項(xiàng)目的開頭。因此,可以僅才喿縱音頻項(xiàng)目的開頭部分、僅處理音頻項(xiàng)目的結(jié)尾部分或者處理音頻項(xiàng)目的開頭部分和結(jié)尾部分這 兩者。也可以以這樣的方式處理音頻項(xiàng)目的中間部分,例如,用戶可以在 第一首歌曲的中間停止重放,并從第二首歌曲的開頭或從其中間的任何地 方開始播放第二首歌曲。換句話說,音頻項(xiàng)目的自然開頭或自然結(jié)尾可以 或不可以與轉(zhuǎn)換部分一致/結(jié)合在一起。因此,根據(jù)本發(fā)明示例性實(shí)施例 的選4,性的時(shí)間操縱也可以在歌曲的中間進(jìn)行。
特別地,操縱單元可適用于以由第一音頻項(xiàng)目受操縱的結(jié)尾部分的節(jié)
奏和頻率組成的組中的至少一個(gè)滑出(glide out)的方式操縱第一音頻項(xiàng) 目的結(jié)尾部分。因此,通過考慮當(dāng)重放這樣的音頻內(nèi)容時(shí)對音頻感知有影 響的這樣的與時(shí)間有關(guān)的音頻參數(shù),可以獲得聲學(xué)多普勒效應(yīng)的印象,正 如從離開的救護(hù)車?yán)瓤芍?,它不僅幅度下降,而且頻率也下降(應(yīng)當(dāng)注 意,離開的救護(hù)車?yán)嚷曇舻念l率比接近的救護(hù)車的聲音低,但是頻率沒 有減小(滑動),除非救護(hù)車正相對于觀察者加速或減速)。特別地,當(dāng)操 縱淡出音頻項(xiàng)目的結(jié)尾部分時(shí),節(jié)奏和/或頻率可被減小。
雖然本發(fā)明的實(shí)施例可以專注于提供接連再現(xiàn)的音頻項(xiàng)目間的平滑 轉(zhuǎn)換,^旦可以處理確切地^義一個(gè)音頻項(xiàng)目,例如將在結(jié)尾部分輕柔地減弱 的音頻項(xiàng)目。
然而,操縱單元也可以適用于以修改第二音頻項(xiàng)目(可能接在第一音 頻項(xiàng)目之后)的轉(zhuǎn)換部分的與時(shí)間有關(guān)的音頻屬性的方式操縱第二音頻項(xiàng) 目(可能接在第一音頻項(xiàng)目之后)的轉(zhuǎn)換部分。因此,可以通過考慮兩個(gè) 轉(zhuǎn)換部分之間的與時(shí)間有關(guān)的音頻屬性來使第一音頻項(xiàng)目和第二音頻項(xiàng) 目之間的轉(zhuǎn)換平滑。在轉(zhuǎn)換部分(一個(gè)或多個(gè))期間,第一音頻項(xiàng)目和第 二音頻項(xiàng)目這兩者可以都被同時(shí)重放,但是具有不同的音頻參數(shù)。
特別地,第二音頻項(xiàng)目的轉(zhuǎn)換部分可以是第二音頻項(xiàng)目的開頭部分。 則操縱單元可適用于以使由第二音頻項(xiàng)目受操縱的開頭部分的節(jié)奏和頻 率組成的組中的至少一個(gè)滑入/淡入的方式操縱第二音頻項(xiàng)目的開頭部 分。為了這樣的淡入效果,(以漸進(jìn)或逐步的方式)增大節(jié)奏和頻率直到 第二音頻項(xiàng)目的轉(zhuǎn)換部分已被完成可以是合適的。
操縱單元可適用于選擇性地操縱第一音頻項(xiàng)目的僅一個(gè)轉(zhuǎn)換部分(開 頭部分或結(jié)尾部分)或多個(gè)轉(zhuǎn)換部分(開頭部分和結(jié)尾部分),而第一音 頻項(xiàng)目的剩余(中央)部分將保持不被采樣,即是說不改變。因此,在平 滑地淡入隨后將被重放的音頻信號后,原始數(shù)據(jù)將被重放,使得在轉(zhuǎn)換區(qū) (regime)完成后不發(fā)生音頻失真(audio artefact )。操縱單元可適用于以協(xié)同方式操縱第一音頻項(xiàng)目的轉(zhuǎn)換部分和第二 音頻項(xiàng)目的轉(zhuǎn)換部分。因此,淡出項(xiàng)目的節(jié)奏和頻率的降低(引起離開音 頻源的多普勒效應(yīng))可以以協(xié)調(diào)的方式與其中節(jié)奏和頻率^f皮增大(接近的 音頻源的多普勒效應(yīng))的隨后音頻信號的淡入相結(jié)合。這可以允許甚至在 起源非常不同的音頻內(nèi)容之間的聽覺上合適的轉(zhuǎn)換部分,使得將被混音的 兩首歌曲不必在節(jié)奏、旋律或和聲沖突方面彼此對應(yīng)。
操縱單元還可用作運(yùn)動體驗(yàn)(motion experience)生成單元,其適用 于以生成再現(xiàn)第一音頻項(xiàng)目的音頻源在轉(zhuǎn)換期間正在移動的可聽體驗(yàn)的 方式處理第一音頻項(xiàng)目。然而,這樣的移動音頻源印象不必受限于音頻項(xiàng) 目響度的簡單變化(對于接近的對象增大響度,對于離開的對象減小響 度),但是可以通過考慮產(chǎn)生與音頻源的實(shí)際運(yùn)動有關(guān)的交叉聲道時(shí)延的 時(shí)間修改來進(jìn)一步改進(jìn)這樣的運(yùn)動感知。特別地,聲學(xué)多普勒效應(yīng)不僅修 改離開或接近的聲音源的響度,還修改頻率、節(jié)奏和其他與時(shí)間有關(guān)的音 頻參數(shù)。通過考慮這樣的與時(shí)間有關(guān)的屬性,與簡單的響度調(diào)節(jié)系統(tǒng)相比, 被重放的音頻數(shù)據(jù)的移動將被感知為顯著地更加自然,或者更明確地更加 接近移動的聲音源的感知。
這樣的運(yùn)動體驗(yàn)生成單元可適用于生成再現(xiàn)第一音頻項(xiàng)目的音頻源 在第一音頻項(xiàng)目的結(jié)尾部分期間正在離開的可聽體驗(yàn)。因此,相應(yīng)音頻項(xiàng) 目部分的操縱可以以模擬離開的聲音源的聲學(xué)多普勒效應(yīng)的方式來進(jìn)行。
運(yùn)動體驗(yàn)生成單元可進(jìn)一步適用于以生成再現(xiàn)第二音頻項(xiàng)目的音頻 源在轉(zhuǎn)換部分期間正在移動(特別地,在第二音頻數(shù)據(jù)的開頭部分期間正 在接近)的可聽體驗(yàn)的方式處理第二音頻項(xiàng)目。換句話說,在這樣的實(shí)施 例中,第二音頻項(xiàng)目的開頭部分的處理可以以人耳能夠感知到接近的音頻 源的聲學(xué)多普勒效應(yīng)的印象的方式來進(jìn)行。
從心理學(xué)視角看來,淡出與離開的聲音源有關(guān)以及淡入與接近的聲音 源有關(guān)是非常直觀的。
運(yùn)動體驗(yàn)生成單元可適用于根據(jù)下面的測量生成第一音頻項(xiàng)目結(jié)尾 部分和第二音頻項(xiàng)目開頭部分之間的轉(zhuǎn)換。首先,可處理第二音頻項(xiàng)目轉(zhuǎn)
換部分的第一部分,使得第二音頻項(xiàng)目轉(zhuǎn)換部分的再現(xiàn)可感知為源于遙遠(yuǎn) 的開始位置。換句話說,第二音頻項(xiàng)目被打開并且將被感知為來自位于遠(yuǎn) 處的聲音源,這可以通過小音量和相應(yīng)的方向?qū)傩詠砟M。隨后,第一音 頻項(xiàng)目轉(zhuǎn)換部分的第一部分可以以第一音頻項(xiàng)目轉(zhuǎn)換部分的再現(xiàn)可感知 為源于從中央位置移動到遙遠(yuǎn)的最終位置的位置的方式來處理。換句話說,在第一音頻項(xiàng)目的中央部分的重放期間,該音頻數(shù)據(jù)將以人類聽眾具 有發(fā)出第一音頻項(xiàng)目的聲音源位于中央位置的印象的方式來配置。為了指
示第一音頻項(xiàng)目隨后將淡出,可以虛擬地(virtually)將在轉(zhuǎn)換部分的第 一部分中發(fā)出第一音頻項(xiàng)目的聲音源從該中央位置移動到遙遠(yuǎn)的最終位 置。該運(yùn)動可以逐漸地來進(jìn)行。同時(shí),隨著發(fā)出第一音頻項(xiàng)目的虛擬聲音 源的離開,第二音頻項(xiàng)目的第二轉(zhuǎn)換部分可以以第二音頻項(xiàng)目的轉(zhuǎn)換部分 的第二部分的再現(xiàn)可感知為源于正從遙遠(yuǎn)的開始位置(例如逐漸地)移動
到中央位置的位置(與發(fā)出第一音頻項(xiàng)目的(虛擬)聲音源預(yù)先所處位置 相同的位置,或者另一個(gè)位置)的方式來處理。因此,由于第二音頻項(xiàng)目 將被淡入,人類聽眾將獲得發(fā)出指示第二音頻項(xiàng)目的聲波的虛擬音頻源正 在接近第二音頻項(xiàng)目的主要部分將被再現(xiàn)的位置的印象。隨后,處理第一 音頻項(xiàng)目的轉(zhuǎn)換部分的第三部分,使得第一音頻項(xiàng)目的轉(zhuǎn)換部分的聲音被 減弱。因此,在第二音頻項(xiàng)目已(虛擬地)接近最終或中間的位置后,可 以(漸進(jìn)地或以逐步的方式)降低第一音頻項(xiàng)目的音量,從而完成淡出過 程??蛇x地,然后發(fā)出第二音頻項(xiàng)目的主要部分的虛擬聲音源可被再次重 新定位,或者可維持在中央位置。
"中央位置"可指頭戴式耳機(jī)信號如何在音頻的"中央部分"期間從原 始音頻信號生成的方式。例如,當(dāng)沒有進(jìn)行轉(zhuǎn)換時(shí),左信號未經(jīng)處理地到 達(dá)左耳,而右信號未經(jīng)處理地到達(dá)右耳。在音頻軌道的"中央部分",可使 用被表示為"中央位置(重現(xiàn)/再現(xiàn)/)"的處理模型。在中央位置,表現(xiàn)(立 體聲信號的)原始左、右音頻聲道的信號可典型地被直接發(fā)送至左、右頭 戴式耳機(jī),或者對信號施加某個(gè)與轉(zhuǎn)換期間的處理無關(guān)的處理。這種類型 的附加處理可與頻語均衡、空間擴(kuò)展(spatial widening )、動態(tài)壓縮、多聲 道—立體聲變換(在原始音頻數(shù)據(jù)具有非立體聲格式的情況下)、或者在音 頻軌道的中央部分期間獨(dú)立于在轉(zhuǎn)換部分期間所使用的轉(zhuǎn)換方法施加的 其他類型的音頻處理效果和增強(qiáng)相關(guān)。
設(shè)備可包括適用于再現(xiàn)經(jīng)處理的音頻數(shù)據(jù)的音頻再現(xiàn)單元。這樣的 (物理的或真實(shí)的)音頻再現(xiàn)單元可以是例如頭戴式耳機(jī)、耳機(jī)或揚(yáng)聲器, 其被提供用于重放的經(jīng)處理的音頻數(shù)據(jù)。音頻數(shù)據(jù)可以以收聽重放的音頻 數(shù)據(jù)的用戶得到(虛擬的)音頻重放單元被置于另 一個(gè)位置的印象的方式 來處理。
第 一音頻項(xiàng)目可以是音樂項(xiàng)目(例如音樂剪輯或CD上的音樂軌道)、 語音項(xiàng)目(例如電話對話的一部分)或者可以是一見頻M見聽項(xiàng)目(例如音樂視頻、電影等)。因此,本發(fā)明的實(shí)施例可被實(shí)施于所有其中必須處理 音頻數(shù)據(jù)的領(lǐng)域中,特別是實(shí)施于其中將以平滑方式把兩個(gè)音頻項(xiàng)目相互 連接的領(lǐng)域中。
本發(fā)明示例性實(shí)施例的示例性應(yīng)用領(lǐng)域?yàn)樽詣映x播系統(tǒng)、用于在 播放列表中搜索音頻項(xiàng)目的系統(tǒng)、廣播頻道切換系統(tǒng)、公共因特網(wǎng)頁面切 換系統(tǒng)、電話信道切換系統(tǒng)、音頻項(xiàng)目重放開始系統(tǒng)和音頻項(xiàng)目重放停止 系統(tǒng)。用于在播放列表中搜索音頻項(xiàng)目的系統(tǒng)可允許針對特定的音頻項(xiàng)目 搜索或掃描播放列表,并隨后重放這樣的音頻項(xiàng)目。在兩個(gè)相繼的這樣的 音頻項(xiàng)目之間的轉(zhuǎn)換部分,可實(shí)施本發(fā)明的實(shí)施例。另外,當(dāng)在不同電一見 或無線電頻道之間切換時(shí),即在廣播頻道切換系統(tǒng)中切換時(shí),可根據(jù)本發(fā) 明的示例性實(shí)施例來進(jìn)行在前頻道的淡出和隨后頻道的淡入。當(dāng)操作計(jì)算
也可以才艮據(jù)本發(fā)明的示例性實(shí)施例來進(jìn)行相同的淡出、淡入。在電話對話 期間,當(dāng)進(jìn)行不同信道或通信方之間的切換時(shí),可以針對這樣的電話信道 切換系統(tǒng)實(shí)施本發(fā)明的實(shí)施例。同樣針對簡單地開始或停止音頻重放,即 針對無聲的重放模式和高聲的重放^^式之間的切換,可以實(shí)施本發(fā)明的實(shí)施例。
本發(fā)明的實(shí)施例可與附加的可能性相結(jié)合以使用空間轉(zhuǎn)換結(jié)果來創(chuàng) 建兩首歌曲之間空間分離的錯(cuò)覺。"交叉漸變"的兩首歌曲可具有不同的移 動軌跡,使得現(xiàn)存的源(第一首歌曲)向例如左側(cè)離開,而新的歌曲(第
二源)從右邊移動進(jìn)聲像(sound image )。
在使兩個(gè)項(xiàng)目分離中使用上升和聲模式(harmonic pattern )和下降和 聲模式可以也具有來自實(shí)驗(yàn)心理學(xué)的有力支持,其中觀察到兩個(gè)音調(diào)綜合 體的不同頻率調(diào)制軌跡引起這兩個(gè)音調(diào)綜合體分離為兩個(gè)不同的感知流 (例如參見A.S. Bregman (1990), "Auditory Scheme Analysis: The Perceptual Organization of Sound", Cambridge, MA: Bradford Books, MIT Press )。
操縱與時(shí)間有關(guān)的音頻參數(shù)的效果是歌曲在混音區(qū)域中被在感知上 解耦,使得它們不再被感知為不和諧的。因此,使用該方法,對于確保節(jié) 奏、旋律或和聲匹配,只需給予較低的特別關(guān)注。這允許任何任意歌曲對 的混音,進(jìn)而允許需要通過根據(jù)本發(fā)明示例性實(shí)施例的自動DJ方法重放 的任何播放列表。
本發(fā)明的示例性實(shí)施例可以應(yīng)用于通過混音兩首連續(xù)歌曲的開頭和結(jié)尾來創(chuàng)建歌曲轉(zhuǎn)換以獲得平滑轉(zhuǎn)換的應(yīng)用中,例如應(yīng)用于自動DJ應(yīng)用 中。
根據(jù)本發(fā)明的另 一個(gè)示例性實(shí)施例,可使轉(zhuǎn)換效果和普通收聽之間的 空間轉(zhuǎn)換成為可能??臻g轉(zhuǎn)換效果可被用于音頻項(xiàng)目之間的強(qiáng)制轉(zhuǎn)換。所 述轉(zhuǎn)換效果基于典型地在基于模型的重現(xiàn)場景中的音頻流的動態(tài)專門化
(dynamic specialisation )。不期望在普通頭戴式耳機(jī)收聽中運(yùn)行基于才莫型 的空間處理,因此可以定義轉(zhuǎn)換,用于普通收聽到轉(zhuǎn)換重現(xiàn)以及返回。
因此,可使用音頻信號的空間操縱來完成從一個(gè)軌道到另 一個(gè)軌道的 移動。目標(biāo)可以是給出一個(gè)軌道物理地離開而另一個(gè)l九道進(jìn)入的感知。例 如,以這樣的方式當(dāng)前音樂4九道文件遠(yuǎn)離地飛到右手側(cè)而另一個(gè)軌道,人 左手側(cè)滑進(jìn)。當(dāng)在音頻播放器列表的情境下完成了該操作時(shí),它給出了對 播放列表的非常強(qiáng)烈的空間印象。在空間坐標(biāo)中的這種類型的音頻播放列 表項(xiàng)目的表現(xiàn)將在音頻技術(shù)中提供新的應(yīng)用。
在頭戴式耳機(jī)收聽中,清楚地定義了什么是左、什么是右。 一個(gè)明顯 的解決方案是使用例如標(biāo)準(zhǔn)的幅度平移規(guī)則(amplitude panning rule ),以 立體聲圖像(stereo image )逐漸衰減并4義移動到右耳信號、并同時(shí)增大始 于左耳的另一個(gè)軌道的音量的方式改變平衡的立體聲圖像。然而,以這種 方式獲得的轉(zhuǎn)換效果既不是非常令人感興趣,又沒有給出軌道改變的非常 強(qiáng)烈的空間印象。 一個(gè)問題可能是,立體聲音頻記錄的兩個(gè)聲道可以包含 取決于記錄的生產(chǎn)的類型非常不同的聽覺線索。
通常,立體聲音頻項(xiàng)目的兩個(gè)聲道是關(guān)聯(lián)的。然而,例如在幅度平移 或立體聲混響中創(chuàng)建的這個(gè)關(guān)聯(lián)并不具有與任何可識別的空間屬性(例如 音頻源的距離,或者例如個(gè)體音樂樂器的聲音到達(dá)的明確角度)的直接關(guān) 系。因此,產(chǎn)生令人信服的空間音頻軌道變化的挑戰(zhàn)在于,因?yàn)橐纛l軌道 在第一地方(place)中沒有空間位置,則將它遠(yuǎn)遠(yuǎn)地扔到右邊的某處是不 合適的。使用基于虛擬揚(yáng)聲器收聽者系統(tǒng)的重現(xiàn)場景可能遇到這樣的挑 戰(zhàn)。然而,可以考慮普通收聽場景(在頭戴式耳機(jī)中,或立體聲或多聲道 揚(yáng)聲器再現(xiàn)場景)和軌道轉(zhuǎn)換效果之間的轉(zhuǎn)換。
接下來,將解釋與音頻項(xiàng)目之間的空間轉(zhuǎn)換相關(guān)的實(shí)施例??梢蕴峁?一種用于在頭戴式耳機(jī)收聽中實(shí)施從一個(gè)音頻流到另一個(gè)的強(qiáng)制轉(zhuǎn)換中 的直觀空間音頻效果的方法。例如當(dāng)用戶在全面檢查播放列表或?yàn)g覽無線 電頻道列表中按"下一首"或"上一首"按扭時(shí),所建議的效果向收聽體驗(yàn)提 供新的空間維度。該方法基于將立體聲信號映射至虛擬揚(yáng)聲器收聽者模
14型,其中能夠使空間轉(zhuǎn)換直觀和清楚。
可提供一種使用音頻信號的空間操縱來從一個(gè)軌道移動到另 一個(gè)軌 道的方法,以給出一個(gè)軌道物理地離開而另一個(gè)進(jìn)入的感知。例如,以這
樣的方式當(dāng)前的音樂軌道朝第一方向離去,而另一個(gè)軌道從可與第一方
向相反的第二方向滑進(jìn)。當(dāng)在音頻播放列表的情境中執(zhí)行該方法時(shí),它給 出了非常強(qiáng)烈的播放列表空間印象。例如,用戶可記得第一首歌曲就在第 二首歌曲的左手側(cè),而另一首歌曲很遠(yuǎn)地在右邊的某處。自然地,該場景 可直接延伸到諸如北、東、南和西這樣的方向以給用戶音頻材料的兩維的
表現(xiàn)。因此,可使一維、兩維或者甚至三維的空間效果成為可能。因此, 可以將立體聲音頻材料的兩個(gè)音頻聲道定位至其中揚(yáng)聲器和收聽者耳朵
具有明確幾何位置的模擬揚(yáng)聲器收聽者場景。 一旦執(zhí)行該操作,可以將虛 擬揚(yáng)聲器移動到任意位置以創(chuàng)建期望的空間效果。在從一個(gè)音頻項(xiàng)目換到 另一個(gè)中,可執(zhí)行模擬,使得兩個(gè)播放第一音頻項(xiàng)目的虛擬揚(yáng)聲器從用戶 耳朵遠(yuǎn)遠(yuǎn)地移動到左邊,而播放另一個(gè)項(xiàng)目的另一對揚(yáng)聲器可從右邊被帶 入到合適的或最優(yōu)的重放位置。因此,可以提供不同空間音頻收聽場景的 幾何特性,并且可使用虛擬聲學(xué)環(huán)境中的聲音傳播的模擬。
當(dāng)一個(gè)音頻項(xiàng)目必須結(jié)束,而另一個(gè)必須開始時(shí),創(chuàng)建了第一音頻項(xiàng) 目朝一個(gè)方向遠(yuǎn)離收聽者而移動、第二音頻項(xiàng)目朝向收聽者而移動的聽覺 圖像。可提供一種在強(qiáng)制轉(zhuǎn)換和頭戴式耳機(jī)收聽期間轉(zhuǎn)換音頻的方法。該 方法可包括通過模擬虛擬揚(yáng)聲器在某個(gè)位置開始新項(xiàng)目,將當(dāng)前項(xiàng)目從頭 戴式耳機(jī)移動到虛擬揚(yáng)聲器配置,將當(dāng)前項(xiàng)目移動到目標(biāo)位置,以及同時(shí) 將新項(xiàng)目的揚(yáng)聲器位置移動到該虛擬揚(yáng)聲器位置,將新項(xiàng)目從揚(yáng)聲器位置 移動到頭戴式耳機(jī)收聽,并減弱當(dāng)前項(xiàng)目的聲音。
當(dāng)在播放列表上預(yù)覽項(xiàng)目以便項(xiàng)目(虛擬地)傳遞到收聽者前面時(shí), 或當(dāng)暫時(shí)減弱一個(gè)項(xiàng)目的聲音時(shí),也可以使用該方法。
用于處理音頻數(shù)據(jù)的設(shè)備可被實(shí)現(xiàn)為由音頻環(huán)繞系統(tǒng)、移動電話、頭 戴耳機(jī)、揚(yáng)聲器、助聽器、電視設(shè)備、錄像機(jī)、監(jiān)視器、游戲設(shè)備、膝上
型電腦、音頻播放器、DVD播放器、CD播放器、基于硬盤的媒體播放器、 互聯(lián)網(wǎng)無線電設(shè)備、公共娛樂設(shè)備、MP3播放器、hi-fi系統(tǒng)、車載娛樂設(shè) 備、汽車娛樂設(shè)備、醫(yī)療通信系統(tǒng)、體佩式(body-worn)設(shè)備、語音通 信設(shè)備、家庭影院系統(tǒng)、家庭劇場系統(tǒng)、平板電視、氣氛創(chuàng)建設(shè)備、亞低 音揚(yáng)聲器(subwoofer)和音樂廳系統(tǒng)組成的組中的至少一個(gè)。其他應(yīng)用 也是可能的。然而,雖然根據(jù)本發(fā)明實(shí)施例的系統(tǒng)主要意欲改善聲音或音頻數(shù)據(jù)的 質(zhì)量,但也可以將該系統(tǒng)應(yīng)用于音頻數(shù)據(jù)和視覺數(shù)據(jù)的結(jié)合。例如,本發(fā) 明的實(shí)施例可被實(shí)現(xiàn)在一見聽?wèi)?yīng)用中, 一見聽?wèi)?yīng)用例如一見頻播放器或家庭影院 系統(tǒng),其中發(fā)生不同視聽項(xiàng)目(例如音樂剪輯或視頻序列)間的轉(zhuǎn)換。
根據(jù)下文將要描述的實(shí)施例的實(shí)例,本發(fā)明的上述方面和其他方面將 變得清楚明白,并且將參考這些實(shí)施例的實(shí)例進(jìn)行闡述。
下面將參考實(shí)施例的實(shí)例更詳細(xì)地描述本發(fā)明,本發(fā)明不限于實(shí)施例 的實(shí)例圖1圖解了根據(jù)本發(fā)明示例性實(shí)施例的音頻數(shù)據(jù)處理設(shè)備。
圖2至圖5圖解了轉(zhuǎn)換至和自轉(zhuǎn)換模型,該模型通過基于本發(fā)明示例 性實(shí)施例的轉(zhuǎn)換模型的聲音重現(xiàn)的參數(shù)操縱來實(shí)現(xiàn)。
圖6圖解了作為揚(yáng)聲器收聽者模型的特殊情形的通用頭戴式耳機(jī)的 幾何描述。
圖7圖解了以兩聲道揚(yáng)聲器收聽配置對收聽者的模擬。 圖8示出了表現(xiàn)從虛擬麥克風(fēng)對移開的一個(gè)音頻軌道的揚(yáng)聲器對,以 及播放另 一個(gè)軌道的新的揚(yáng)聲器對被移動到收聽位置。
圖9圖解了根據(jù)本發(fā)明示例性實(shí)施例的立體聲揚(yáng)聲器收聽中的軌道轉(zhuǎn)換。
具體實(shí)施例方式
附圖中的圖解是示意性的。在不同的附圖中,為類似或相同的元件提 供相同的附圖標(biāo)記。
在下文中,參考圖1,將說明根據(jù)本發(fā)明一個(gè)示例性實(shí)施例的用于處 理音頻數(shù)據(jù)101、 102的設(shè)備100。
圖1中所示的設(shè)備100包括諸如CD、硬盤等的音頻數(shù)據(jù)源107。在 音頻數(shù)據(jù)源107上存儲了多個(gè)音樂軌道,例如第一音頻項(xiàng)目104、第二音 頻項(xiàng)目105和第三音頻項(xiàng)目106 (例如三個(gè)音樂片l殳)。
一旦接收到相應(yīng)的控制信號,音頻數(shù)據(jù)101、 102(例如用于揚(yáng)聲器 左側(cè)和右側(cè)的數(shù)據(jù))可從音頻數(shù)據(jù)源107發(fā)送到諸如微處理器或中央處理 單元(CPU)這樣的控制單元103。
控制單元103與用戶接口單元114雙向通信,并且能夠與用戶接口單 元114交換信號115。用戶接口單元114包括諸如LCD顯示器或等離子體設(shè)備這樣的顯示元件,并且包括諸如按鈕、小鍵盤、操縱桿或者甚至話音 識別系統(tǒng)的麥克風(fēng)這樣的輸入元件。人類用戶能夠控制控制單元103的操 作,并且因此可以調(diào)節(jié)設(shè)備100的用戶偏好。例如,人類用戶可以完全地
對播放列表的項(xiàng)目進(jìn)行切換。并且,控制單元103能夠輸出相應(yīng)的重放或
經(jīng)處理的信息。
在以下文將更詳細(xì)地描述的方式處理音頻數(shù)據(jù)101、 102之后,第一 經(jīng)處理的音頻數(shù)據(jù)112被應(yīng)用于第一揚(yáng)聲器108以供重放,由此生成聲波 110,獲得第二經(jīng)處理的音頻數(shù)據(jù)113,音頻數(shù)據(jù)113可由連接的第二揚(yáng)聲 器109再現(xiàn),第二揚(yáng)聲器109能夠生成聲波111。
在第一音頻項(xiàng)目104將被再現(xiàn)并且隨后第二音頻項(xiàng)目105將被再現(xiàn)的 場景中,期望在在前的第一音頻項(xiàng)目104和隨后的第二音頻項(xiàng)目105之間 具有平滑或無縫的轉(zhuǎn)換部分。出于這個(gè)目的,控制單元103可作為操縱單 元,用于以修改第一音頻項(xiàng)目104和第二音頻項(xiàng)目105之間的轉(zhuǎn)換部分的 與時(shí)間有關(guān)的音頻屬性的方式操縱第一音頻項(xiàng)目104和第二音頻項(xiàng)目105 之間的轉(zhuǎn)換部分。更特別地,可以處理第一音頻項(xiàng)目104的結(jié)尾部分和第 二音頻項(xiàng)目105的起始部分或開頭部分。因此,可獲得第一音頻項(xiàng)目104 滑出或淡出、第二音頻項(xiàng)目105滑入或淡入的可聽感知。出于這個(gè)目的, 第一和第二音頻項(xiàng)目104、 105的時(shí)間屬性^又在轉(zhuǎn)換部分可纟皮調(diào)整,而第 一和第二音頻項(xiàng)目104、 105的中央部分可不加修改地被重放。這可包括 修改音頻數(shù)據(jù)101、 102的頻率和節(jié)奏值,使得滑出的第一音頻項(xiàng)目104 將根據(jù)聲學(xué)多普勒效應(yīng)得以操縱,從而人類收聽者對經(jīng)操縱的第 一音頻項(xiàng) 目104的感知是音量和頻率/節(jié)奏兩者在結(jié)尾部分都被減小。
因此,根據(jù)聲學(xué)多普勒效應(yīng)操縱第二音頻項(xiàng)目105的起始部分,使得 第二音頻項(xiàng)目105的開頭部分的感知的可聽效果是增大的響度和增大的 頻率/節(jié)奏。通過采取這種措施,可獲得非常直觀的淡入特性。
可同時(shí)或以重疊的方式重放第一音頻項(xiàng)目104的經(jīng)操縱的結(jié)尾部分 和第二音頻項(xiàng)目105的經(jīng)操縱的開頭部分。
協(xié)調(diào)或調(diào)整第一音頻項(xiàng)目104的結(jié)尾部分和第二音頻項(xiàng)目105的開頭 部分的時(shí)間特性的變化,以獲得合適的聲音。
特別地,控制單元103還可以生成這樣的感知在重放第一音頻項(xiàng)目 104的結(jié)尾部分的期間根據(jù)第一音頻項(xiàng)目104的結(jié)尾部分發(fā)出聲波的虛擬 音頻源離開了。更特別地,這樣的運(yùn)動實(shí)驗(yàn)(experiment)生成特征可生 成重放第二音頻項(xiàng)目105的開頭部分的虛擬重放設(shè)備接近人類收聽者的可聽感知。
圖1的系統(tǒng)可被用作自動DJ系統(tǒng)。
本發(fā)明的實(shí)施例基于這樣的領(lǐng)悟(insight):任何空間轉(zhuǎn)換效杲都隱 含地或明顯地基于揚(yáng)聲器-收聽者系統(tǒng)的模型。該模型可被用來控制由音 頻作品的原始音頻信號的數(shù)字濾波實(shí)現(xiàn)的動態(tài)重現(xiàn)操作。在普通收聽場景 中,音頻信號可通過再現(xiàn)系統(tǒng)的揚(yáng)聲器直接重放。根據(jù)一個(gè)示例性實(shí)施例, 揚(yáng)聲器系統(tǒng)可以是從立體聲耳機(jī)到諸如5.1環(huán)繞音頻系統(tǒng)或波場合成系統(tǒng) (wave field synthesis system )這樣的多聲道揚(yáng)聲器系統(tǒng)范圍內(nèi)的任何配 置。
根據(jù) 一 個(gè)示例性實(shí)施例,提供了 一種用于從普通收聽到在空間軌道轉(zhuǎn) 換效果中使用的重現(xiàn)模型的轉(zhuǎn)換以及反轉(zhuǎn)換回普通收聽模式的通用方法。 在這樣的實(shí)施例中,可能的是,普通收聽場景通??梢宰R別為在空間轉(zhuǎn)換 效果中使用的重現(xiàn)模型的特殊情形。因此,到和從轉(zhuǎn)換模式的轉(zhuǎn)換可以通 過基于轉(zhuǎn)換模型的聲音重現(xiàn)的參數(shù)操縱來進(jìn)行。這在圖2至圖5中得以解 釋并且將在下文中更詳細(xì)地描述。
圖2示出了方案200。
方案200示出了音頻作品201,它在普通收聽202中的音頻再現(xiàn)路徑 中被重放。音頻再現(xiàn)系統(tǒng)用附圖標(biāo)記203表示,可被實(shí)現(xiàn)為頭戴式耳機(jī)、 立體聲系統(tǒng)或5.1系統(tǒng)。
另外,虛擬揚(yáng)聲器-收聽者模型用附圖標(biāo)記204表示,并且包括代表 普通收聽的模型的特殊情形205、轉(zhuǎn)換效果的音頻再現(xiàn)路徑206和轉(zhuǎn)換效 果的另 一個(gè)音頻再現(xiàn)路徑207。
圖3顯示了方案300。在方案300中,還顯示了第二音頻作品301。
從圖3可以得出,在轉(zhuǎn)換開始時(shí),第一音頻作品201通過代表轉(zhuǎn)換模 型的普通收聽的模型的特殊情形205而被發(fā)送。從代表普通收聽的模型的 特殊情形205到轉(zhuǎn)換效果的音頻再現(xiàn)路徑206的轉(zhuǎn)換開始,并且它基于虛 擬揚(yáng)聲器_收聽者模型204的參數(shù)的參數(shù)操縱。第二音頻作品301的動態(tài) 轉(zhuǎn)換重現(xiàn)可在這個(gè)階段通過轉(zhuǎn)換效果的另一個(gè)音頻再現(xiàn)路徑207開始。
圖4隨后示出了方案400。
在連續(xù)的轉(zhuǎn)換中,采用虛擬揚(yáng)聲器_收聽者模型204重現(xiàn)第一音頻作 品201和第二音頻作品301這兩者以實(shí)現(xiàn)期望的動態(tài)空間轉(zhuǎn)換效果。典型 地,以第一音頻作品201似乎遠(yuǎn)離收聽者而第二音頻作品301正在接近收 聽者的方式再現(xiàn)第一音頻作品201。在圖5中示出隨后的方案500。
參考圖5,以其結(jié)束代表普通收聽場景的等同才莫式的方式修改第二音頻作品301的動態(tài)重現(xiàn)。換句話說,第二音頻作品301從轉(zhuǎn)換效果的音頻再現(xiàn)路徑207被移動到代表普通收聽的模式的特殊情形205。最終,對于第二音頻作品301,再現(xiàn)被從虛擬揚(yáng)聲器收聽者重現(xiàn)場景的特殊模式轉(zhuǎn)換到圖2的普通音頻再現(xiàn)場景。
根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例,可以使用一種模型,在該模型中,使用虛擬的麥克風(fēng)來捕獲從虛擬揚(yáng)聲器播放的信號x (n),使得所捕獲的信號由下式給出
y(n)=x(n)*S(dT)/d2和T=F/c ,
其中星號表示巻積,d是虛擬揚(yáng)聲器和麥克風(fēng)之間以米為單位的距離,其中F是采樣頻率,c是聲音的速度。實(shí)際上,對應(yīng)于分?jǐn)?shù)時(shí)間指數(shù)(fractionaltime index) dT的信號值可使用諸如拉格朗日插值濾波器(Lagrangeinterpolator filter )這樣的分?jǐn)?shù)延遲濾波器來實(shí)現(xiàn)。
圖6示出了涉及作為揚(yáng)聲器-收聽者模型的特殊情形的通用頭戴式耳機(jī)收聽的幾何描述的排列610。
圖6顯示了用于再現(xiàn)音頻內(nèi)容的頭戴式耳機(jī)600。還示出了左虛擬揚(yáng)聲器601和右虛擬揚(yáng)聲器602。進(jìn)一步地,示出了左虛擬麥克風(fēng)603和右虛擬麥克風(fēng)604。無窮大的距離由附圖標(biāo)記605表示。
基于前面的討論,立體聲聲道之間的串音(crosstalk )或關(guān)聯(lián)(correlation)被看作是同時(shí)發(fā)生的,使得幾何聲學(xué)意義上信號間的關(guān)聯(lián)不被建^t為從一個(gè)音頻聲道到另 一個(gè)音頻聲道的泄漏。
在本發(fā)明的一個(gè)實(shí)施例中的普通收聽模式是頭戴式耳機(jī)收聽。圖6中圖示了作為提出的揚(yáng)聲器-收聽者模型的特殊情形的根據(jù)排列610的這樣的通用頭戴式音頻收聽場景的幾何描述。聲音從左、右虛擬揚(yáng)聲器601、 602播放,理論上左、右虛擬揚(yáng)聲器601、 602彼此相離無窮遠(yuǎn)地放置。聲音被放置在左、右虛擬揚(yáng)聲器601、 602附近的左、右虛擬麥克風(fēng)603、 604捕獲。捕獲的信號然后通過頭戴式耳機(jī)600向用戶重放。來自原始左、右聲道的立體聲記錄的合成在頭戴式耳機(jī)收聽中準(zhǔn)確地產(chǎn)生了原始信號。該幾何描述的無窮大的距離僅是建立沒有兩個(gè)信號間串音的模型的一個(gè)實(shí)施例,可以通過給予麥克風(fēng)(或揚(yáng)聲器,或兩者)減少或消除串音的方向性屬性(directivity property )來獲得相似的結(jié)果。根據(jù)一個(gè)示例性實(shí)施例,僅考慮了自由場(free field)中的全方向虛擬揚(yáng)聲器和麥克風(fēng)。然而,本發(fā)明的實(shí)施例還包括方向性和聲場模擬的使用。技術(shù)人員已知將更多的實(shí)際方向性屬性和房間模型包括在聲學(xué)模型中所需的措施。實(shí)際上,不需要或不可能在即使具有全方向換能器(transducer )的源之間具有無窮大的距離。自由聲場條件下和對于全方向
源的聲音(單位為分貝)的衰減由下式給出LR=20 log10(R)
例如,20米的間隔已經(jīng)給出了 26dB的串音衰減,這對在典型的立體聲音頻材料中的空間圖像具有可忽略的影響。這樣的表現(xiàn)在感知上類似于原始立體聲再現(xiàn),并且也不立即提供直觀的特殊軌道轉(zhuǎn)換方法。然而,可以做出另一個(gè)變換,該變換將左、右虛擬揚(yáng)聲器601、 602和左、右虛擬麥克風(fēng)603、 604的位置移動至圖7中圖示的另一個(gè)設(shè)置700,圖7附加地顯示了人類收聽者的頭701。
在圖7中,左、右虛擬揚(yáng)聲器601、 602被移動至典型的揚(yáng)聲器收聽中左、右揚(yáng)聲器的位置。左、右虛擬麥克風(fēng)603、 604被移動至典型的收
聽情形下表示收聽者耳朵位置的位置。
因此,圖7示出了對在兩聲道的揚(yáng)聲器收聽系統(tǒng)中收聽者頭701的模
擬》
在從圖6場景到圖7場景的轉(zhuǎn)換中左虛擬揚(yáng)聲器601和左虛擬麥克風(fēng)603之間的距離保持不變。因此,立體聲音頻再現(xiàn)的整個(gè)音量保持近似相同。然而,這對于當(dāng)前的實(shí)施例不絕對必要。
圖8示意性地顯示了方案800,其包括將被重放的音頻數(shù)據(jù)的第一音頻項(xiàng)目04和第二音頻項(xiàng)目105。
表現(xiàn)第一音頻項(xiàng)目104的左、右虛擬揚(yáng)聲器601、 602對將被從左、右虛擬麥克風(fēng)603、604轉(zhuǎn)移走,與第二音頻項(xiàng)目105有關(guān)的新?lián)P聲器801、802對被移向收聽位置。
在典型的應(yīng)用中,乂人一個(gè)音頻項(xiàng)目A 3兆到音頻項(xiàng)目B可以進(jìn)^"如下步驟。該序列可從其中用戶正在收聽項(xiàng)目A的情形開始。
1. 將項(xiàng)目B的揚(yáng)聲器裝置放置到開始位置。該開始位置可以例如是在右側(cè)遠(yuǎn)離用戶耳朵的位置。
2. 將項(xiàng)目A從頭戴式耳機(jī)收聽(圖6 )移動到揚(yáng)聲器收聽(圖7 ),并將虛擬揚(yáng)聲器放置于收聽位置。3. 將項(xiàng)目A移動到目標(biāo)位置(例如左邊遠(yuǎn)離用戶耳朵的某處),并且同時(shí)將項(xiàng)目B從開始位置移動到收聽位置。
4. 將表現(xiàn)項(xiàng)目B的揚(yáng)聲器從揚(yáng)聲器模擬移動到頭戴式耳機(jī)模擬配置。
5. 減弱項(xiàng)目A的聲音。
類似的算法也可被用于在播放列表中快速地掃描或搜索音頻項(xiàng)目。在這種情況下,音頻項(xiàng)目序列從右邊流向左邊(或者反之亦然)以給予用戶播放列表內(nèi)容的概覽(預(yù)覽),或幫助識別特定項(xiàng)目。在這個(gè)特殊的應(yīng)用中,發(fā)出頭戴式耳機(jī)收聽模擬是有用的,使得項(xiàng)目在揚(yáng)聲器重放配置中被重放。該選擇提供了傳遞給收聽者的音頻項(xiàng)目的平滑流。在這種類型的場景中,播放列表也可以被表示為二維或三維圖,在該圖上用戶自由地在左/右、前/后、上/下或它們的組合的方向上導(dǎo)4元。
類似的實(shí)施例也可以被直接應(yīng)用于涉及不同音頻流間轉(zhuǎn)換的其他可能應(yīng)用。例如,可以在改變無線電或TV頻道、具有背景音頻的因特網(wǎng)頁面中應(yīng)用所述類似實(shí)施例,可以在在個(gè)人計(jì)算才幾中從一個(gè)音頻應(yīng)用改變到另一個(gè)中應(yīng)用所述類似實(shí)施例,等等。
類似的場景也可以被用來為僅涉及一個(gè)項(xiàng)目的轉(zhuǎn)換創(chuàng)建新類型的效果。例如,當(dāng)開始和停止音頻項(xiàng)目的重放時(shí),或在暫時(shí)減弱音頻項(xiàng)目的聲音時(shí),可使用空間轉(zhuǎn)換效果。
以在不同通話者(talker )之間切換。
在另一個(gè)實(shí)施例中,再現(xiàn)系統(tǒng)可以是如圖9中所示的立體聲揚(yáng)聲器系統(tǒng)900。
圖9顯示了重放第二音頻項(xiàng)目105的虛擬揚(yáng)聲器901、 902和重放第二音頻項(xiàng)目105的虛擬揚(yáng)聲器903、 904。并且顯示了左、右附加揚(yáng)聲器905、 906。因此圖9顯示了在立體聲揚(yáng)聲器收聽中的軌道轉(zhuǎn)換。通過使用本領(lǐng)域技術(shù)人員已知的3D音頻重現(xiàn)技術(shù)處理供給左、右附加揚(yáng)聲器905、906的音頻信號來創(chuàng)建虛擬揚(yáng)聲器90]至904。
在圖9的場景中,通過以使重現(xiàn)的虛擬揚(yáng)聲器的位置和方向?qū)傩耘c真實(shí)的揚(yáng)聲器一致的方式移動包含虛擬揚(yáng)聲器901至904的"泡(bubble )",獲得到其中直接通過左、右附加揚(yáng)聲器905、 906播放信號的普通音頻收聽的轉(zhuǎn)換。
就處理而言,對于從通過虛擬揚(yáng)聲器收聽者系統(tǒng)的第二音頻項(xiàng)目105的重放到通過立體聲裝置的真實(shí)左、右附加揚(yáng)聲器905、 906的重放的轉(zhuǎn)換,可以給出以下描述。動態(tài)重現(xiàn)算法基于輸入信號的線性數(shù)字濾波,其可由以下不同的方程式描述
y(n)f x(n)1*h(n,t)11+ x(n)r*h(n,t)rly(n)r= x(n)1*h(n,t)rl+ x(n),h(n,t、
其中星號表示巻積,重現(xiàn)濾波器(rendering filter)由沖激響應(yīng)表示。該重現(xiàn)模型的一個(gè)特殊情形是直接的左到左(11)和右到右(rr)濾波器被減小至單位增益并且串音項(xiàng)(左到右(lr)和右到左(rl))消失。該特殊的情況與使用揚(yáng)聲器的普通收聽相同。在動態(tài)重現(xiàn)中,轉(zhuǎn)換因此能通過使用實(shí)施系數(shù)從原始重現(xiàn)濾波器到代表特殊情形的函數(shù)的平滑演變的動態(tài)轉(zhuǎn)換路徑從任何空間重現(xiàn)場景得以實(shí)現(xiàn)。
應(yīng)當(dāng)注意術(shù)語"包括"不排除其他元件或特征,"一"或"一個(gè)"不排除多個(gè)。同樣,聯(lián)合不同實(shí)施例而描述的元件可被組合。
還應(yīng)當(dāng)注意在權(quán)利要求中的附圖標(biāo)記將不被解釋為限制權(quán)利要求的范圍。
2權(quán)利要求
1.一種用于處理音頻數(shù)據(jù)(101,102)的設(shè)備(100),其中該設(shè)備(100)包括操縱單元(103),其適用于以在所述音頻數(shù)據(jù)(101,102)的第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分中選擇性地修改所述音頻數(shù)據(jù)(101,102)的第一音頻項(xiàng)目(104)的與時(shí)間有關(guān)的音頻屬性的方式操縱所述音頻數(shù)據(jù)(101,102)的第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分。
2. 根據(jù)權(quán)利要求1的設(shè)備(100),其中所述第一音頻項(xiàng)目(104) 的轉(zhuǎn)換部分是所述第一音頻項(xiàng)目(104 )的結(jié)尾部分。
3. 根據(jù)權(quán)利要求2的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以減小由所述第一音頻項(xiàng)目(104)的經(jīng)操縱的結(jié)尾部分的節(jié)奏、音高 和頻率組成的組中的至少一個(gè)的方式操縱所述第一音頻項(xiàng)目(104)的結(jié) 尾部分。
4. 根據(jù)權(quán)利要求1的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以在所述音頻數(shù)據(jù)(101, 102)的第二音頻項(xiàng)目(105)的轉(zhuǎn)換部分中 選4奪性地修改所述音頻數(shù)據(jù)(101, 102)的第二音頻項(xiàng)目(105)的與時(shí) 間有關(guān)的音頻屬性的方式操縱所述音頻數(shù)據(jù)(101, 102)的第二音頻項(xiàng)目(105)的轉(zhuǎn)換部分。
5. 根據(jù)權(quán)利要求4的設(shè)備(100),其中所述第二音頻項(xiàng)目(105 ) 的轉(zhuǎn)換部分是所述第二音頻項(xiàng)目(105)的開頭部分。
6. 根據(jù)權(quán)利要求5的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以增大由所述第二音頻項(xiàng)目(105)的經(jīng)操縱的開頭部分的節(jié)奏和頻率 組成的組中的至少一個(gè)的方式操縱所述第二音頻項(xiàng)目(105)的開頭部分。
7. 根據(jù)權(quán)利要求1的設(shè)備(100),其中所述操縱單元(103 )適用 于排他地操縱所迷第一音頻項(xiàng)目(104)的所述轉(zhuǎn)換部分或多個(gè)轉(zhuǎn)換部分, 而所述第一音頻項(xiàng)目(104)的剩余部分保持未,皮操縱。
8. 根據(jù)權(quán)利要求4的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以協(xié)同方式操縱所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分和所述第二音頻 項(xiàng)目(105)的轉(zhuǎn)換部分,以便再現(xiàn)所述第一音頻項(xiàng)目(104)和隨后的第 二音頻項(xiàng)目(105 )。
9. 根據(jù)權(quán)利要求1的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以生成再現(xiàn)所述第一音頻項(xiàng)目(104)的音頻源在所述轉(zhuǎn)換部分期間正 在移動的可聽體驗(yàn)的方式處理所述第一音頻項(xiàng)目(104)。
10. 根據(jù)權(quán)利要求9的設(shè)備(100 ),其中所述操縱單元(103 )適用 于生成再現(xiàn)所述第一音頻項(xiàng)目(104)的音頻源在所述第一音頻項(xiàng)目(104) 的結(jié)尾部分期間正在離開的可聽體驗(yàn)。
11. 根據(jù)權(quán)利要求4和9的設(shè)備(100),其中所述操縱單元(103 ) 適用于以生成再現(xiàn)所述第二音頻項(xiàng)目(105)的音頻源在所述轉(zhuǎn)換部分期 間正在移動的可聽體一瞼的方式處理所述第二音頻項(xiàng)目(105 )。
12. 根據(jù)權(quán)利要求11的設(shè)備(100),其中所述操縱單元(103)適 用于生成再現(xiàn)所述第二音頻項(xiàng)目(105)的音頻源在所述第二音頻項(xiàng)目(105 )的開頭部分期間正在接近的可聽體H
13. 根據(jù)權(quán)利要求11的設(shè)備(100),其中所述操縱單元(103)適 用于按照以下順序生成所述第一音頻項(xiàng)目(104)的結(jié)尾部分和所述第二 音頻項(xiàng)目(105 )的開頭部分之間的轉(zhuǎn)換處理所述第二音頻項(xiàng)目(105)的轉(zhuǎn)換部分,使得所述第二音頻項(xiàng)目 (105)的轉(zhuǎn)換部分的再現(xiàn)為可感知為源于遙遠(yuǎn)的起始位置;處理所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分,使得所述第一音頻項(xiàng)目 (104)的轉(zhuǎn)換部分的再現(xiàn)可感知為源于正在從中央位置移動到遙遠(yuǎn)的最 終位置的位置;在處理所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分的同時(shí),處理所述第二 音頻項(xiàng)目U05)的轉(zhuǎn)換部分,使得所述第二音頻項(xiàng)目(]05)的轉(zhuǎn)換部分 的再現(xiàn)可感知為源于正在從遙遠(yuǎn)的起始位置移動到中央位置的位置;隨后處理所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分,使得所述第一音頻 項(xiàng)目(104 )的轉(zhuǎn)換部分的聲音被減弱。
14. 根據(jù)權(quán)利要求1的設(shè)備(100),其中所述操縱單元(103 )適用 于以在所述轉(zhuǎn)換部分內(nèi)逐漸修改所述音頻數(shù)據(jù)(101, 102)的與時(shí)間有關(guān) 的音頻屬性的方式操縱所述轉(zhuǎn)換部分。
15. 根據(jù)權(quán)利要求1的設(shè)備(100),其中所述操縱單元(103 )適用 于以修改所述音頻數(shù)據(jù)(101, 102)的與時(shí)間有關(guān)的音頻屬性的方式操縱 所述轉(zhuǎn)換部分,以在所述轉(zhuǎn)換部分中生成與聲學(xué)多普勒效應(yīng)一致的可聽體 驗(yàn)。
16. 根據(jù)權(quán)利要求1的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以實(shí)現(xiàn)所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分和中央部分間的平滑連接 的方式操縱所述轉(zhuǎn)換部分。
17. 根據(jù)權(quán)利要求1的設(shè)備(100 ),其中所述操縱單元(103 )適用于以附加地在所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分中選擇性地修改所述 音頻數(shù)據(jù)(101, 102)的響度的方式操縱所述第一音頻項(xiàng)目(104)的轉(zhuǎn) 換部分。
18. 根據(jù)權(quán)利要求1的設(shè)備(100 ),其中所述操縱單元(103 )適用 于以在所述第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分中選擇性地修改所述音頻數(shù)據(jù)(IOI, 102)的時(shí)間延遲音頻屬性的方式操縱所述第一音頻項(xiàng)目(104) 的轉(zhuǎn)換部分。
19. 根據(jù)權(quán)利要求1的設(shè)備(100),包括適用于再現(xiàn)經(jīng)處理的音頻數(shù) 據(jù)(112, 113 )的音頻再現(xiàn)單元(108, 109),特別地包括由頭戴式耳機(jī)、 耳塞和揚(yáng)聲器組成的組中的一個(gè)。
20. 根椐權(quán)利要求1的設(shè)備(100),其中所述第一音頻項(xiàng)目(104) 包括由音樂項(xiàng)目、語音項(xiàng)目和視聽項(xiàng)目組成的組中的至少一個(gè)。
21. 根據(jù)權(quán)利要求1的設(shè)備(00),適用于由自動唱片選播系統(tǒng)、用 于在播放列表中搜索音頻項(xiàng)目的系統(tǒng)、廣播頻道切換系統(tǒng)、公共因特網(wǎng)網(wǎng) 頁切換系統(tǒng)、電話信道切換系統(tǒng)、音頻項(xiàng)目重放開始系統(tǒng)和音頻項(xiàng)目重放 停止系統(tǒng)組成的組中的至少 一個(gè)。
22. 根據(jù)權(quán)利要求1的設(shè)備(100),實(shí)現(xiàn)為由音頻環(huán)繞系統(tǒng)、移動電 話、頭戴耳機(jī)、頭戴式耳機(jī)重放裝置、揚(yáng)聲器重放裝置、助聽器、電視設(shè) 備、錄像機(jī)、監(jiān)視器、游戲設(shè)備、膝上型計(jì)算機(jī)、音頻播放器、DVD播 放器、CD播放器、基于硬盤的媒體播放器、無線電設(shè)備、互聯(lián)網(wǎng)無線電 設(shè)備、公共娛樂設(shè)備、MP3播放器、hi-fi系統(tǒng)、車載娛樂設(shè)備、汽車娛樂 設(shè)備、醫(yī)療通信系統(tǒng)、體佩式設(shè)備、語音通信設(shè)備、家庭影院系統(tǒng)、家庭 劇場系統(tǒng)、平板電視裝置、氣氛創(chuàng)建設(shè)備、亞低音揚(yáng)聲器和音樂廳系統(tǒng)組 成的組中的至少一個(gè)。
23. 處理音頻數(shù)據(jù)(101, 102)的方法,其中該方法包括以在所述 音頻數(shù)據(jù)(101, 102)的第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分中選擇性地修 改所述音頻數(shù)據(jù)(101, 102)的第一音頻項(xiàng)目(104)的與時(shí)間有關(guān)的音 頻屬性的方式操縱所述音頻數(shù)據(jù)(101, 102)的第一音頻項(xiàng)目(104)的 轉(zhuǎn)換部分。
24. —種計(jì)算機(jī)可讀介質(zhì),其中存儲了處理音頻數(shù)據(jù)(101, 102) 的計(jì)算機(jī)程序,當(dāng)被處理器(103 )執(zhí)行時(shí),所述計(jì)算機(jī)程序適合于完成 或控制根據(jù)權(quán)利要求23的方法。
25. —種處理音頻數(shù)據(jù)(101, 102)的程序元件,其中當(dāng)被處理器(103 )執(zhí)行時(shí),所述程序元件適合于完成或控制根據(jù)權(quán)利要求23的方法。
全文摘要
根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例,提供了一種用于處理音頻數(shù)據(jù)(101,102)的設(shè)備(100),其中該設(shè)備(100)包括操縱單元(103)(特別地,重采樣單元),其適用于以修改第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分的與時(shí)間有關(guān)的音頻屬性的方式選擇性地操縱(特別地,重采樣)第一音頻項(xiàng)目(104)的轉(zhuǎn)換部分(特別地,也可以以逼真的方式模擬運(yùn)動的時(shí)間延遲效果)。
文檔編號G11B27/038GK101681663SQ200880016796
公開日2010年3月24日 申請日期2008年5月21日 優(yōu)先權(quán)日2007年5月22日
發(fā)明者A·S·哈馬, S·L·J·D·E·范德帕 申請人:皇家飛利浦電子股份有限公司