用于產生音頻成分的方法和設備的制作方法

文檔序號：2821443閱讀：186來源：國知局

專利名稱：用于產生音頻成分的方法和設備的制作方法
技術領域：
本發(fā)明涉及一種產生輸出音頻信號的方法，其通過將預定的第一頻率范圍中的輸出成分添加到輸入信號，通過執(zhí)行預定的計算產生該輸出成分。
本發(fā)明也涉及一種用于在輸出音頻信號的預定第一頻率范圍中產生輸出成分的設備，包括用于計算輸出成分的計算裝置。
本發(fā)明也涉及一種音頻播放器，包括用于提供輸入音頻信號的音頻數據輸入裝置，和用于輸出最終輸出音頻信號的音頻信號輸出裝置，并且包含該設備。
本發(fā)明也涉及一種通過處理器執(zhí)行的計算機程序，其描述一種方法。
本發(fā)明也涉及一種存儲有通過處理器執(zhí)行的計算機程序的數據載體，該計算機程序描述該方法。
已知在US-A-6111960的開始段落中描述了該方法的實施例。該已知方法通過對該輸入信號中的第一成分，例如應用平方函數產生高頻輸出成分。例如，如果想要輸出成分位于10-12kHz之間的第一頻率范圍中，它們可以通過平方函數將位于5-6kHz的預定第二頻率范圍的第一成分的頻率翻倍而產生。當對其中不存在高頻信息，例如對諸如MP3音頻的壓縮音頻進行解壓縮而得到輸入音頻信號的時候，這樣是有用的。缺少高頻成分導致音頻聽起來不自然。平方函數從技術上是一種產生高頻音頻成分的簡單方法。
已知方法的不利之處在于，由于輸出成分的能量直接由所平方的第一輸入成分的能量確定，輸出音頻信號還是聽起來不自然，并且因此其不是所預期出現的自然發(fā)聲中的高頻成分。
本發(fā)明的第一目的是提供一種在開始段落中所描述種類的方法，其產生聽起來要比較自然的輸出音頻成分。本發(fā)明的第二目的是提供一種在開始段落中所描述種類的設備，其能夠執(zhí)行該方法，并產生聽起來要比較自然的輸出音頻成分。
實現該第一目的在于，在該輸入音頻信號的預定第三頻率范圍中，根據在第二成分的預定第二時間間隔期間所計算的第一輸入能量測量，在預定第一時間間隔期間設置所產生的該輸出成分的第一輸出能量測量。本發(fā)明除此之外則是根據如下發(fā)現自然音頻信號中的高頻成分的能量，并且更具體的是能量隨時間的波動模式不同于低頻成分的能量。低頻成分的能量變換緩慢，而高頻成分的能量變化迅速。這是由于諸如該成分周期的因素，以及環(huán)境對不同成分的不同反射和散射特征。
如果將低頻成分平方，所得到的翻倍頻率成分的幅度唯一取決于低頻成分的幅度。類似地，輸出成分的能量取決于第一輸入成分的能量。這就導致高頻成分的能量波動模式，其具有低頻成分的波動模式特征。
本發(fā)明的方法在第一預定時間間隔期間將輸出成分的能量設置為更實際的值，其優(yōu)選地選擇的足夠小，以能夠當它們典型地出現在輸出成分的頻率范圍中時快速地設置波動能量模式。這最好通過在預定的第三頻率范圍中分析輸入信號的，例如第二輸入成分的能量波動模式而完成。從現有技術中得知輸出成分的固定標定，但是卻沒有使用預選的第二輸入成分的快速波動能量模式進行調制。
在實施例中，根據預定的頻率范圍距離公式從預定的許多頻率范圍中選擇第三頻率范圍，作為最接近第一頻率范圍的頻率范圍。由于低、中、高頻成分通常都表現出不同的波動模式，當設置輸出成分的能量使其等于靠近所產生的輸出成分頻率范圍的頻率中的成分的能量時，可以進一步改善所得到的結果。例如，如果在輸入音頻信號中缺少高頻并因此而產生高頻，來自包含輸入音頻信號成分的多個有效頻率范圍的最高頻率范圍將具有與輸出成分自然的模式最相似的能量波動模式。
在根據該方法或其前述實施例的變形中，進一步通過在該輸入音頻信號的預定第四頻率范圍中，使用在第三輸入成分的預定第三時間間隔期間的第二輸入能量測量，設置該第一輸出能量測量。當測量到各個頻率范圍的多個能量，甚至有可能沿該頻率軸為連續(xù)頻率范圍估計能量波動模式的改變。例如，假定從一個頻率范圍到下一個的波動速度線性增加。然后該前一實施例只對輸出成分的所需能量執(zhí)行所謂的零階保持估計，而使用兩個或多個能量測量就可以進行其它估計，諸如多項式估計。
有利地，如果該預定的計算包括對輸入音頻信號的預定第二頻率范圍中的第一輸入成分應用非線性函數。這從技術上是一種產生輸出成分的簡單方法。優(yōu)選地例如通過帶通濾波將輸入音頻信號劃分成相鄰的頻率范圍，并且對每一頻率范圍中帶通濾波的信號應用非線性函數。另一選項是使用頻率合成器，以合成具有預定幅度的輸出成分。
實現本發(fā)明第二目的在于包括濾波裝置，用于獲得該輸入音頻信號的第三頻率范圍中的第二輸入成分；包括能量計算裝置，用于獲得在第二輸入成分的第二預定時間間隔期間第一輸入能量測量，并從其中得出第一輸出能量測量；和包括能量設置裝置，用于設置在第一預定時間間隔期間輸出成分的能量，使其基本上等于該第一輸出能量測量。
如果在該設備中通過多個帶通濾波器對輸入信號進行帶通濾波，由濾波器輸出的帶限信號的能量可以用于獲得為包含所產生輸出成分的多個頻率范圍的該輸出能量測量。
參照此后所描述的實施方式和實施例，并結合附圖可以明顯看到和闡述根據本發(fā)明的方法、設備、音頻播放器、計算機程序以及數據載體的這些和其它方面，這些僅僅用作非限制性的說明。其中

圖1示意性的所示為應用根據本發(fā)明的方法之前和之后的音頻信號；圖2示意性的所示為根據本發(fā)明的方法的流程圖；圖3示意性的所示為按時間帶通濾波后的信號；圖4示意性的所示為根據本發(fā)明的方法，其用于在輸入成分之間的間隙中重構丟失的成分；圖5示意性的所示為根據本發(fā)明的設備；圖6示意性的所示為音頻播放器。
圖7示意性的所示為數據載體。
在這些附圖中，虛線劃出的部分是可選的或可替換的。
在圖1中，所示的輸入音頻信號100象征性地包含第二頻率范圍R2中的第一輸入成分102、第三頻率范圍R3中的第二輸入成分104以及第四頻率范圍R4中的第三輸入成分103。頻率范圍R2、R3和R4基本上包括在高質量頻率范圍O中。輸入音頻信號100也包含低質量頻率范圍L中的低質量成分110，其在高質量頻率范圍O之外。這種輸入音頻信號100例如是對所壓縮音頻源解壓后的結果，諸如MPEG-1音頻第三層音頻(MP3)、高級音頻編碼(AAC)、視窗媒體音頻(WMA)或者實際音頻。
例如根據輸入音頻信號100源、或者根據對實現根據本發(fā)明的方法或設備的特定實施例所做出的有關選擇，通過不同的標記技術將成分標記為低質量或高質量的成分。在第一類標記技術中，由實施例的設計者先驗地將某些頻率范圍標記為高質量頻率范圍O，或者相反標記為低質量頻率范圍L。例如，輸入音頻信號100源可能是這樣的，即在高質量頻率范圍O之外不存在信號，或者只存在噪聲，其與高質量頻率范圍O中的輸入成分102、103、104無關。例如，當從MP3源中解壓出該輸入音頻信號100時會出現這種情況，為此選擇不編碼高于例如11kHz的頻率。對于編碼例如低于64bps的音頻信號的有效比特總量較低的情況，對高于11kHz的成分使用比特將意味著比特不夠編碼低于11kHz的成分，其將導致討厭的可聽到的人為成分。因此對頻率高于11kHz的成分不進行編碼，并丟失。對于該MP3源，設計者將高于11kHz的成分標記為低質量成分110，并且頻率范圍R2、R3和R4明顯地低于11kHz并位于高質量頻率范圍O中。可以這樣的方式設計第一頻率范圍R1，使得該方法產生高達例如16kHz的輸出成分。換言之，該設計者通過這種方式實現他的想法，即各成分應存在直到16kHz的頻率，其在從11kHz至16kHz的第一頻率范圍R1中由人工產生。
第二類的標記技術實時分析該輸入音頻信號。這通過質量測量的方式實現，其表明低質量頻率范圍L中的成分質量劣于高質量頻率范圍O中的成分質量?？赡艿馁|量測量是低質量頻率范圍中的成分所花費的比特數目，將其與已知比特的預定閾值進行比較以給出良好的感知質量。例如可以通過聽者面板測試的方式確定這種閾值。特別地，如果低質量頻率范圍L中的成分質量低于根據本發(fā)明方法人工產生的輸出成分125的質量，最好可以至少在第一頻率范圍R1中用該輸出成分125替代低質量成分110。
圖1b所示為應用根據本發(fā)明的方法而得到的輸出音頻信號120。優(yōu)選地，該輸出音頻信號120包含原始成分122，其基本上與該輸入音頻信號100的高質量頻率范圍O中的成分102、103、104相同?？商鎿Q地，優(yōu)選地例如可以替換與第一頻率范圍R1相鄰的第三頻率范圍R3中的某些第二輸入成分104，從而在原始成分122與輸出成分125之間存在更好的匹配，其是通過執(zhí)行預定的計算200而產生的(參見圖2)，例如將輸出成分與預定的單一幅度合成。該輸入成分102、103、104也可以進行多個預定的變換，諸如在拷貝為原始成分122之前進行濾波。
可以通過多個變形的計算200產生輸出成分125。例如，MP3編碼音頻信號中高頻成分的丟失是明顯可以聽到的，并且因此優(yōu)選產生例如11kHz以上的頻率。第一變形是該方法優(yōu)選實施例的變形，為此圖5中示意性地所示為對應的設備，其根據該輸入音頻信號100的預定第二頻率范圍R2中的第一輸入成分102，通過例如作為非線性函數計算的計算裝置506，在DSP上或者作為對第一輸入成分102應用非線性函數的電路產生輸出成分125。當該非線性函數例如是平方時，根據等式1如下產生相比于第一輸入成分I(t)102的頻率，翻倍頻率的輸出成分O(t)125O(t)=f[I(t)=sinwt]=sin2wt=12(1-cos2wt)]]>[等式1]。
因此當需要第一頻率范圍R1中的輸出成分時，第二頻率范圍R2可以定義為頻率范圍R1的一半頻率范圍。另一選項是濾波出預定第一頻率范圍R1之外的第二諧波。其它非線性函數可以產生其它更高的諧波，例如三倍頻率。應用到第一輸入成分102上的有意思的非線性函數是絕對值。應用平方函數的缺點在于輸出成分125的幅度是第一輸入成分102的幅度的平方，其引入了可感知的人為成分。為了修正所平方的幅度相關性，優(yōu)選地應該計算輸出成分125的平方根?？梢詫⒃撈椒胶推椒礁瘮到M合成為絕對值操作。
計算200的第二變形并沒有使用該輸入音頻信號100的第一輸入成分102。當例如在數字信號處理器(DSP)上執(zhí)行該方法，通過信號合成器580將具有預定幅度的第一頻率范圍中的輸出成分合成，如本領域所熟知的。使用這種變形，輸入音頻信號100并不用來產生該輸出成分125，但是其在該方法的設置部分201(參見圖2)中會用到。
在該方法的設置部分201中，在如圖3所示的第二預定時間間隔dt2期間為第二輸入成分104計算第一輸入能量測量E1。可以通過產生帶限信號300獲得該第二輸入成分104，其是輸入音頻信號100限制在第三頻率范圍R3的頻率，即例如在使用帶通濾波器諸如503對輸入音頻信號100進行濾波之后得到的一部分。然后，例如通過等式2計算某一時刻t的第一輸入能量測量E1E1(t)=&Integral;t-dt2/2t+dt2/2PBL(t)dt]]>[等式2]，其中PBL(t)是帶限信號300的瞬時音頻功率。不是對輸入音頻信號進行多帶分解，而是也可以使用離散傅立葉變換，在這種情況下例如可以通過等式3計算該第一輸入能量測量E1E1(t)=&Integral;t-dt2/2t+dt2/2&Integral;f3lf3uPBL(t,f)dfdt]]>[等式3]，其中f31和f3u是第三頻率范圍R3的低頻和高頻。第二預定時間間隔dt2應該選擇的足夠小，使得可以精確地跟蹤輸入音頻信號100的能量波動。例如，如果輸入音頻信號100包含音樂，其第三頻率范圍R3中的能量每百分之一秒有可觀的變化，第二預定時間間隔dt2應該不大于百分之一秒。從第一輸入能量測量E1可以得到預定第一時間間隔dt1期間的第一輸出能量測量S1。在一簡單的實施例中，第一時間間隔dt1等于第二時間間隔dt2，并且第一輸出能量測量S1等于第一輸入能量測量E1。
在音頻信號中，不同頻率范圍中的成分表現出不同的能量波動模式。例如，低頻典型地波動緩慢，而高頻波動迅速。由于在計算200的第一變形中，輸出成分125是從第一輸入成分102得出的，其在圖1中為低頻，沒有應用設置部分201的輸出成分125的能量波動模式基本上是第一輸入成分102的能量波動模式，因此在低頻中是典型的，而不是如自然發(fā)聲輸出信號120所期望的高頻能量波動模式。因此，為了讓輸出音頻信號120聽起來更自然，第一輸出能量測量S1(t)必須設置為在高頻中更典型的值。第一輸出能量測量選擇變形對其處置具有預定數目的頻率范圍，如R2、R3和R4。用于確定第一輸出能量測量S1的優(yōu)選頻率范圍是第三頻率范圍R3，由于其是包含最高頻率的預定頻率范圍其中之一，包含高質量音頻成分。對于輸出成分的第一頻率范圍R1中的甚至更高頻率，其能量波動模式可能是最類似于自然能量波動模式的。如果通過例如對第三頻率范圍R3中的第二輸入成分104進行平方產生第二輸出成分126，R3還是獲得其第二輸出能量測量S2(t)的良好選擇。在這種變形中，通過使用最靠近的頻率范圍，也就是第三頻率范圍R3，采用了輸出成分125、126的輸出能量測量S1、S2所謂的一階保持估計。
為了確定哪一頻率范圍最靠近，可以使用多個頻率范圍距離公式。如果頻率范圍不交疊，上邊界和下邊界可以用來計算距離D，如例如在等式4中D＝f1RX-fuR1如果頻率范圍RX包含高于R1中的頻率D＝fuR1-f1RX如果RX包含低于R1中的頻率等式4其中符號1和u分別表示范圍中的最低和最高頻率。在使用交疊范圍的情況下，可以使用兩個頻率范圍的中間、中點或平均頻率之間的差。上邊界和下邊界也可以用于交疊范圍。最靠近的頻率范圍可替換地可以先驗地由該方法的設計者定義。
在圖4所示的輸入音頻信號100的情況下，必須在包含高質量音頻的兩個頻率范圍R2與R2′之間產生輸出成分125。R3與R3′現在是最靠近頻率范圍的候選，其具有的能量波動最類似于緊靠它們的輸出成分125的第一輸出能量測量S1(t)所期望的能量波動。在相等距離的情況下，試探法例如可以優(yōu)選包含最低頻率的一個。例如可以通過從第一頻率范圍R1之外的頻率范圍R2和R2′部分中的輸入音頻信號100拷貝成分，并根據來自R2和R2′的成分產生第一頻率范圍R1中的輸出成分，而形成輸出音頻信號120。
如果在輸入音頻信號100的預定第四頻率范圍R4中測量了第三輸入成分103的預定第三時間間隔dt3期間的第二輸入能量測量E2，不是對輸出成分125和126的輸出能量測量S1和S2使用零階保持估計，而可以為更高的頻率使用自然能量波動模式的更高級估計。如果頻率范圍R2、R4和R3中波動的時間間隔dtF例如存在線性降低趨勢，可以預期該趨勢是連續(xù)的，并因此設置R1和R5。dtF例如可以定義為時間間隔，其中按照等式2計算的頻率范圍的輸入能量測量已經改變了10％。也可以跟蹤頻率范圍相互之間其它參數的變化，諸如輸入能量測量的標準偏差，并將其用于為更高頻率設置自然發(fā)聲的能量波動模式，例如為輸出成分125的S1(t)。也可以使用更加復雜的非線性估計。
不脫離本發(fā)明的范圍，設置部件201和計算200可以組合成為單個部件。
圖5示意性地所示為根據本發(fā)明的設備500。有利地在對輸入音頻信號100，例如對上采樣至44.1kHz的64kbps的MP3流，應用非線性函數獲得輸出成分125之前，首先將輸入信號劃分成多個帶通濾波的子信號。等式1只對單個頻率有效。如果對包含多個頻率的信號應用平方函數，就引入產生失真的混合項。例如在音樂的情況下，引入存在的樂器的諧波是可以接受的，但是引入其它頻率就使得該音樂聽起來走調了。因此有利地，對通過帶通濾波器501、502和503創(chuàng)建相鄰的相對窄頻帶中的子信號應用多個非線性函數506、507和508。可以根據IEX1260標準選擇濾波器的通帶，包含例如中央頻率為5kHz、6.3kHz和8kHz的三度音(tierce)。濾波器可以是固定的或自適應的，在這種情況下可以存在提供單元595、例如包含固定值的存儲器的范圍，或者提供計算值的算法。進一步可以存在濾波器509、510和511，以通過對應的倍頻帶10kHz、12.5kHz和16kHz中的信號。如果非線性函數是絕對值函數，產生多個諧波，但是只有第二諧波才是所想要的，因為其它諧波只使得該輸出音頻信號120失真，在這種情況下通過濾波器509、510和511將其它諧波濾出去。可以按照現有技術在硬件中實施該非線性函數，或者作為在DSP上運行的算法實施。不是作為非線性函數的組，計算裝置也可以實現為信號合成器580，其例如是合成第一頻率范圍R1中所有頻率的相等幅度的成分的算法。濾波器590產生對應于第二輸入成分104的帶限信號，例如作為帶通濾波器，并且與能量計算單元525一部分的第一能量測量單元521連接?？商鎿Q地出于經濟的原因，也可以從子信號中選擇第二輸入成分104，例如通過在由第三帶通濾波器503輸出的帶限子信號與第一能量測量單元521之間提供信號通路504。第一能量測量單元521例如根據等式2測量第一輸入能量測量E1，其在硬件或軟件中實施。由輸出能量指定單元520通過計算從該第一輸入能量測量E 1可以得出第一輸出能量測量S1，其中如果想要考慮進一步的輸入能量測量，諸如第二輸入能量測量E2，可以由第二能量測量單元522例如根據由第二帶通濾波器502輸出的信號得出?？梢灶愃频姆绞降玫降诙敵瞿芰繙y量S2。
如下產生該輸出成分125以及如果想要的第二輸出成分126。從計算裝置506和507分別得到，并可能通過濾波器509和510分別濾波的第一中間信號593和594分別通過歸一化單元512和513歸一為單元能量。然后能量設置單元515和516分別在所有想要的時間t將輸出成分125和第二輸出成分126的能量分別設置為所想要的值S1和S2。因此能量設置單元515和516分別用作幅度調制器。它們可以在軟件中實施為分別使用因子S1和S2標定每一樣本的算法，或者在硬件中實施為乘法器或受控的放大器。通過加法器519將所產生的輸出成分125和第二輸出成分126相加到輸入信號100的高質量成分?？蛇x地，可以通過調節(jié)單元540處理該輸入信號，其例如包括濾波出低頻范圍L中的成分。
在圖6所示的音頻播放器600的范例中包括根據本發(fā)明的設備。圖6中的音頻播放器600是便攜MP3播放器，但是例如也可以是互聯(lián)網無線電設備。包括該設備或應用根據本申請的方法的另一個產品是音頻播放器，其從CD信號產生例如類似于超級音頻CD(SACD)的信號。該音頻播放器600包括音頻數據輸入601，例如讀盤器，或者與互聯(lián)網連接，從其中下載壓縮音樂到存儲器。該音頻播放器600也包括音頻信號輸出602，用于在處理之后輸出最終的輸出音頻信號603，其可以與耳機604連接。
應該注意到，上述實施例只是描述而不是限制本發(fā)明，并且本領域的熟練技術人員不脫離權利要求書的范圍可以設計替換形式。離開按照權利要求書中所組合的本發(fā)明各要素(element)的組合，本領域的熟練技術人員在本發(fā)明的范圍內認識得到的要素的其它組合被本發(fā)明所覆蓋?？梢栽趩蝹€專用要素中實施要素的任何組合。權利要求中圓括號之間的任何附圖標記不限制該權利要求。詞語“包括”并不排除存在未列入權利要求中的要素或方面。要素前面的詞語“a”或“an”并不排除存在多個這種要素。
可以通過硬件的方式或者通過計算機上運行的軟件的方式實施本發(fā)明。
權利要求
1.一種通過將預定第一頻率范圍中的輸出成分相加到輸入信號，產生輸出音頻信號的方法，通過執(zhí)行預定的計算產生該輸出成分，其特征在于在該輸入音頻信號的預定第三頻率范圍中，根據在第二輸入成分的預定第二時間間隔期間所計算的第一輸入能量測量，在預定第一時間間隔期間設置所產生的該輸出成分的第一輸出能量測量。
2.如權利要求1中所述的方法，其中根據預定頻率范圍距離公式從預定的許多頻率范圍中選擇第三頻率范圍，作為最接近第一頻率范圍的頻率范圍。
3.如權利要求1中所述的方法，其中進一步通過在該輸入音頻信號的預定第四頻率范圍中，使用在第三輸入成分的預定第三時間間隔期間的第二輸入能量測量，設置該第一輸出能量測量。
4.如權利要求1中所述的方法，其中該預定計算包括對輸入音頻信號的預定第二頻率范圍中的第一輸入成分應用非線性函數。
5.一種通過將預定第一頻率范圍中的輸出成分相加到輸入音頻信號，產生輸出音頻信號的設備，包括用于計算該輸出成分的計算裝置，其特征在于包括濾波裝置，用于獲得該輸入音頻信號的第三頻率范圍中的第二輸入成分；包括能量計算裝置，用于在第二輸入成分的第二預定時間間隔期間獲得第一輸入能量測量，并從其中得出第一輸出能量測量；和包括能量設置裝置，用于在第一預定時間間隔期間設置輸出成分的能量，使其基本上等于該第一輸出能量測量。
6.一種音頻播放器，包括音頻數據輸入裝置，用于向如權利要求5中所述的設備提供輸入音頻信號，該設備向信號輸出裝置傳送輸出音頻信號。
7.一種用于通過處理器執(zhí)行的計算機程序，其描述了如權利要求1中所述的方法。
8.一種數據載體，用于存儲通過處理器執(zhí)行的計算機程序，該計算機程序描述了如權利要求1至4其中之一所述的方法。
全文摘要
一種通過將預定第一頻率范圍(R1)中丟失的輸出成分(125)相加到輸入信號(100)而產生自然發(fā)聲的輸出音頻信號(120)的方法和設備，其在該輸入音頻信號(100)的預定第三頻率范圍(R3)中，根據在第二輸入成分(104)的預定第二時間間隔(dt2)期間所計算的第一輸入能量測量(E1)，在預定第一時間間隔(dt1)期間設置所產生的該輸出成分(125)的第一輸出能量測量(S1)。
文檔編號G10L21/00GK1711592SQ200380103030
公開日2005年12月21日申請日期2003年10月20日優(yōu)先權日2002年11月12日
發(fā)明者S·M·J·威廉斯申請人:皇家飛利浦電子股份有限公司

完整全部詳細技術資料下載