專利名稱:根據(jù)頻率變換重建具有不完全頻譜的音頻信號的頻譜的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及音頻信號的傳輸和記錄。更具體地,本發(fā)明提供對于發(fā)送或存儲(chǔ)給定的音頻信號所需要的信息的減小,而同時(shí)保持輸出信號的給定的感知質(zhì)量水平。
背景技術(shù):
許多通信系統(tǒng)面對這樣的問題,對于信息傳輸和存儲(chǔ)容量的要求常常超過可提供的容量。結(jié)果,在廣播和記錄領(lǐng)域中相當(dāng)大的興趣是減小對于發(fā)送或記錄打算供人們感知的音頻信號所需要的信息量,而不惡化它的主觀質(zhì)量。同樣地,需要對于給定的帶寬或存儲(chǔ)容量改進(jìn)輸出信號的質(zhì)量。
兩個(gè)主要考慮推進(jìn)打算用于音頻傳輸和存儲(chǔ)的系統(tǒng)的設(shè)計(jì)對于減小信息需求的需要和對于保證輸出信號中特定程度的感知量的需要。這兩個(gè)考慮沖突之處在于,減小發(fā)送的信息量會(huì)減小輸出信號的感知量。雖然客觀約束條件,諸如數(shù)據(jù)速率,通常是由通信系統(tǒng)本身加上的,但主觀感知要求通常是由應(yīng)用規(guī)定的。
用于減小信息需求的傳統(tǒng)的方法包括只發(fā)送或記錄輸入信號的選擇的部分,其余部分被丟棄。優(yōu)選地,只有被認(rèn)為是冗余的或與感知無關(guān)的部分被丟棄。如果需要額外的減小,優(yōu)選地只有被認(rèn)為是具有最小感知重要性的信號部分被丟棄。
強(qiáng)調(diào)超過保真度的清晰度的語音應(yīng)用,諸如語音編碼,只發(fā)送或記錄一部分信號,這里稱為“基帶信號”,它只包含信號頻譜的感知上最相關(guān)的部分。接收機(jī)可以從被包含在基帶信號內(nèi)的信息再生話音信號的省略的部分。再生的信號通常在感知上不等同于原先的信號,但對于許多應(yīng)用,近似的再現(xiàn)是足夠的。另一方面,被設(shè)計(jì)成達(dá)到高保真度的應(yīng)用,諸如高質(zhì)量音樂應(yīng)用,通常需要較高的質(zhì)量的輸出信號。為了達(dá)到較高質(zhì)量的輸出信號,通常必須發(fā)送更大量的信息或利用更復(fù)雜的生成輸出信號的方法。
在語音信號譯碼方面使用的一個(gè)技術(shù)被稱為高頻再生(“HFR”)。只包含信號的低頻分量的基帶信號被發(fā)送或存儲(chǔ)。接收機(jī)根據(jù)接收的基帶信號的內(nèi)容再生省略的高頻分量,以及組合基帶信號與再生的高頻分量,產(chǎn)生輸出信號。雖然再生的高頻分量通常不等同于原先信號的高頻分量,但這個(gè)技術(shù)可以產(chǎn)生比起不使用HFR的其他技術(shù)更滿意的輸出信號。在語音編碼和譯碼領(lǐng)域中開發(fā)了這個(gè)技術(shù)的許多變例。被使用于HFR的三個(gè)通用的方法是頻譜折疊、頻譜變換、和整流。這些技術(shù)的說明可以在以下文章中找到Makhoul和Berouti在ICASSP 1979 IEEE International Conf.on Acoust.,Speech and SignalProc.,1979年4月2-4日著的”High-Frequency Regeneration inSpeech Coding Systems”。
雖然實(shí)施起來簡單,但這些HFR技術(shù)通常不適用于高質(zhì)量再現(xiàn)系統(tǒng),諸如用于高質(zhì)量音樂的再現(xiàn)系統(tǒng)。頻譜折疊和頻譜變換會(huì)產(chǎn)生不想要的背景音。整流往往產(chǎn)生覺察到刺耳的結(jié)果。本發(fā)明人注意到,在這些技術(shù)產(chǎn)生不滿意的結(jié)果的許多情形下,技術(shù)被使用于其中HFR被限于對于5kHz的分量的變換的限帶的語音編碼譯碼器。
本發(fā)明人還注意到由于HFR技術(shù)的使用引起的兩個(gè)其他的問題。第一個(gè)問題涉及到信號的音調(diào)和噪聲特性,以及第二個(gè)問題涉及到再生信號的時(shí)間形狀或包絡(luò)。許多自然的信號包含噪聲分量,它的幅度作為頻率的函數(shù)增加。已知的HFR技術(shù)從基帶信號再生高頻分量,但無法在更高的頻率上再現(xiàn)在再生信號中像音調(diào)的和像噪聲的分量的正確的混合。再生的信號常常包含由于用基帶中像音調(diào)的分量替換原先的、更像噪聲的高頻分量引起的不同的高頻“蜂音”。而且,已知的HFR技術(shù)無法以再生的信號的時(shí)間包絡(luò)保持或至少類似于原先的信號的時(shí)間包絡(luò)的方式再生頻譜分量。
已開發(fā)了多種更復(fù)雜的、提供改進(jìn)的結(jié)果的HFR技術(shù);然而,這些技術(shù)往往是特定于語音的,依賴于語音的特征,其不適合于音樂和其他的音頻形式,或需要很大的、不能經(jīng)濟(jì)地實(shí)施的計(jì)算資源。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是提供音頻信號的處理,以便減小在傳輸或存儲(chǔ)期間代表一個(gè)信號所需要的信息量而同時(shí)保持信號的感覺的質(zhì)量。雖然本發(fā)明具體地針對音樂信號的再現(xiàn),但它也可以應(yīng)用于各種各樣的音頻信號,包括話音。
按照本發(fā)明的一個(gè)方面,在發(fā)射機(jī)中,輸出信號被通過如下生成得出具有音頻信號的某些但不是全部頻譜分量的基帶信號的頻域代表;得出具有不在基帶信號中的音頻信號的頻譜分量的剩余信號的估值的頻譜包絡(luò);從剩余信號的噪聲內(nèi)容的度量導(dǎo)出噪聲混淆參數(shù);以及把代表基帶信號的頻域代表的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)組裝到輸出信號。
按照本發(fā)明的另一個(gè)方面,在接收機(jī)中,音頻信號被通過如下重建接收包含代表基帶信號的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)的信號;從數(shù)據(jù)得出基帶信號的頻域代表;通過在頻率上變換基帶的頻譜分量而得到包括再生的頻譜分量的再生的信號;調(diào)節(jié)再生的頻譜分量的相位以保持再生信號內(nèi)的相位相干性;藉助于響應(yīng)噪聲混淆參數(shù)得出噪聲信號、通過按照估值的頻譜包絡(luò)和噪聲混淆參數(shù)調(diào)節(jié)再生的頻譜分量的幅度而修正再生信號、和組合修正的再生信號與噪聲信號,而得到調(diào)節(jié)的再生的信號;以及得出相應(yīng)于調(diào)節(jié)的再生信號中的頻譜分量與基帶信號的頻域代表中的頻譜分量的組合的重建的信號的時(shí)域代表。
本發(fā)明的其他方面在下面說明,以及在權(quán)利要求中闡述。
通過參照附圖和以下的說明可以更好地了解本發(fā)明的各種特征和它的優(yōu)選實(shí)施方案,其中相同的標(biāo)號是指幾個(gè)圖上相同的單元。以下的討論和附圖的內(nèi)容僅僅作為例子闡述,而不應(yīng)當(dāng)理解為代表對于本發(fā)明的范圍的限制。
圖1顯示通信系統(tǒng)中的主要部件。
圖2是發(fā)射機(jī)的方框圖。
圖3A和3B是音頻信號和相應(yīng)的基帶信號的假設(shè)的示意圖。
圖4是接收機(jī)的方框圖。
圖5A-5D是基帶信號和通過基帶信號的變換生成的信號的假設(shè)的示意圖。
圖6A-6G是通過使用頻譜變換和噪聲混淆再生高頻分量得到的信號的假設(shè)的示意圖。
圖6H是圖6G的信號在增益調(diào)節(jié)后的圖形。
圖7是圖6B所示的基帶信號與圖6H所示的再生信號相組合的圖形。
圖8A是信號的時(shí)間形狀的圖形。
圖8B顯示通過從圖8A的信號得出基帶信號與通過頻譜變換的處理再生信號而產(chǎn)生的輸出信號的時(shí)間形狀。
圖8C顯示圖8B的信號在執(zhí)行時(shí)間包絡(luò)控制后的時(shí)間形狀。
圖9是通過使用時(shí)域技術(shù)提供對于時(shí)間包絡(luò)控制所需要的信息的發(fā)射機(jī)的方框圖。
圖10是通過使用時(shí)域技術(shù)提供時(shí)間包絡(luò)控制的接收機(jī)的方框圖。
圖11是通過使用頻域技術(shù)提供對于時(shí)間包絡(luò)控制所需要的信息的發(fā)射機(jī)的方框圖。
圖12是通過使用頻域技術(shù)提供時(shí)間包絡(luò)控制的接收機(jī)的方框圖。
具體實(shí)施例方式
A.總述圖1顯示在通信系統(tǒng)的一個(gè)例子中的主要部件。信息源112沿路徑115生成音頻信號,它代表基本上任何類型的音頻信息,諸如語音或音樂。發(fā)射機(jī)136接收來自路徑115的音頻信號,以及把該信息處理成適合于通過信道140傳輸?shù)男问?。發(fā)射機(jī)136可以準(zhǔn)備好信號以與信道140的物理特性相匹配。信道140可以是諸如電線或光纖那樣的傳輸路徑,或它可以是通過空間的無線通信路徑。信道140也可包括記錄信號在存儲(chǔ)媒體上的存儲(chǔ)裝置,諸如磁帶或磁盤或光盤,供接收機(jī)142以后使用。接收機(jī)142可以執(zhí)行各種各樣的處理功能,諸如解調(diào)或譯碼從信道140接收的信號。接收機(jī)142的輸出沿著路徑145被傳送到換能器147,它把該輸出變換成適合于用戶的輸出信號152。在傳統(tǒng)的音頻播放系統(tǒng)中,例如,揚(yáng)聲器用作為換能器,把電信號變換成聲音信號。
被限制于通過具有有限帶寬的信道進(jìn)行發(fā)送或在具有有限容量的媒體上進(jìn)行記錄的通信系統(tǒng),在對于信息的要求超過這個(gè)可提供的帶寬或容量時(shí)遇到問題。結(jié)果,在廣播和記錄領(lǐng)域中不斷需要減小對于發(fā)送或記錄打算供人們感知的音頻信號所需要的信息量,而不惡化它的主觀質(zhì)量。同樣地,需要對于給定的傳輸帶寬或存儲(chǔ)容量改進(jìn)輸出信號的質(zhì)量。
在語音編碼方面使用的一個(gè)技術(shù)被稱為高頻再生(“HFR”)。只包含語音信號的低頻分量的基帶信號被發(fā)送或存儲(chǔ)。接收機(jī)142根據(jù)接收的基帶信號的內(nèi)容再生省略的高頻分量,以及組合基帶信號與再生的高頻分量,產(chǎn)生輸出信號。然而,通常,已知的HFR技術(shù)產(chǎn)生的再生高頻分量容易與原先信號中的高頻分量不同。本發(fā)明提供改進(jìn)的用于頻譜分量再生的技術(shù),它產(chǎn)生的再生頻譜分量比起由其他已知的技術(shù)提供的分量,在感覺上更加類似于原先的信號中的相應(yīng)的頻譜分量。重要的是指出,雖然這里描述的技術(shù)有時(shí)被稱為高頻再生,但本發(fā)明并不限于再生信號的高頻分量。下面描述的技術(shù)也可被利用來再生頻譜的任何部分中的頻譜分量。
B.發(fā)射機(jī)圖2是按照本發(fā)明的一個(gè)方面的發(fā)射機(jī)136的方框圖。輸入音頻信號從路徑115被接收以及由分析濾波器庫705進(jìn)行處理,得到輸入信號的頻域代表?;鶐盘柗治銎?10確定輸入信號的哪些頻譜分量要被丟棄。濾波器715去除要被丟棄的頻譜分量,產(chǎn)生包含剩余的頻譜分量的基帶信號。頻譜包絡(luò)估值器720得到輸入信號頻譜包絡(luò)的估值。頻譜分析器722分析估值的頻譜包絡(luò),以確定信號的噪聲混淆參數(shù)。信號格式化器725把估值的頻譜包絡(luò)信息,噪聲混淆參數(shù),和基帶信號組合成具有適合于傳輸或存儲(chǔ)的形式的輸出信號。
1.分析濾波器庫分析濾波器庫705可以通過基本上任何時(shí)域到頻域的變換而被實(shí)施。在本發(fā)明的優(yōu)選實(shí)施例中使用的變換在以下文章中描述Princen,Johnson和Bradley著的”Subband/Transform Coding Using FilterBank Designs Based on Time Domain Aliasing Cancellation”,ICASSP1987 Conf.Proc.,1987年5月,第2161-64頁。這種變換是具有時(shí)域混抵銷的奇數(shù)堆疊的臨界采樣的單邊帶分析-合成系統(tǒng)的時(shí)域等價(jià)物,這里被稱為”O(jiān)-TDAC”。
按照O-TDAC技術(shù),音頻信號被采樣,量化,和分組為一系列重疊的時(shí)域信號樣本塊。每個(gè)樣本塊被分析窗口函數(shù)加權(quán),這等價(jià)于信號樣本塊的逐個(gè)樣本的乘法。O-TDAC技術(shù)把修正的離散余弦變換(”DCT”)施加到加權(quán)的時(shí)域信號樣本塊,產(chǎn)生變換系數(shù)組,這里被稱為“變換塊”。為了達(dá)到臨界采樣,技術(shù)只在傳輸或存儲(chǔ)之前保持頻譜系數(shù)的一半。不幸地,僅僅一半的頻譜系數(shù)的保持,使得互補(bǔ)的逆變換生成時(shí)域混淆分量。O-TDAC技術(shù)可以抵銷混疊以及精確地恢復(fù)輸入信號。塊的長度可以通過使用本領(lǐng)域已知的技術(shù)響應(yīng)于信號特性而變化;然而,由于下面討論的原因應(yīng)當(dāng)注意相位相干性。通過參考美國專利5,394,473,可以得到O-TDAC技術(shù)的其它細(xì)節(jié)。
為了從變換塊恢復(fù)原先的輸入信號塊,O-TDAC技術(shù)利用逆修正的DCT。由逆變換產(chǎn)生的信號塊由合成窗口函數(shù)加權(quán),被重疊和相加,以重建輸入信號。為了抵銷時(shí)域混疊和精確地恢復(fù)輸入信號,分析和合成窗口必須被設(shè)計(jì)成滿足嚴(yán)格的準(zhǔn)則。
在用于傳輸或記錄以44.1千樣本/秒的速率采樣的輸入數(shù)字信號的系統(tǒng)的一個(gè)優(yōu)選實(shí)施例中,從分析濾波器庫705得到的頻譜分量被劃分成四個(gè)子頻帶,具有如表I所示的頻率范圍。
表I2.基帶信號分析器基帶信號分析器710選擇哪些頻譜分量被丟棄,以及哪些頻譜分量被保持用于基帶信號。這個(gè)選擇可根據(jù)輸入信號特性改變,或它可按照應(yīng)用的需要保持固定;然而,本發(fā)明人通過實(shí)驗(yàn)確定,如果一個(gè)或多個(gè)信號的基波頻率被丟棄,音頻信號的感覺質(zhì)量惡化。所以,優(yōu)選地,保留包含信號的基波頻率的頻譜的這些部分。因?yàn)樵捯艉痛蠖鄶?shù)自然樂器的基波頻率通常不高于約5kHz,打算用于音樂應(yīng)用的發(fā)射機(jī)136的優(yōu)選實(shí)施方案使用處于或約5kHz的固定的截止頻率,以及丟棄大于該頻率的所有的頻譜分量。在固定的截止頻率的情形下,基帶信號分析器只要提供固定的截止頻率到濾波器715和頻譜分析器722。在替換實(shí)施方案中,基帶信號分析器710被取消,以及濾波器715和頻譜分析器722按照固定的截止頻率運(yùn)行。在以上表I所示的子頻帶結(jié)構(gòu)中,例如,僅僅子頻帶0中的頻譜分量保持用于基帶信號。這個(gè)選擇也是合適的,因?yàn)槿硕蝗菀讌^(qū)分5kHz以上的音調(diào)的差別,所以不容易分辨在這個(gè)頻率以上的再生分量中的不精確性。
截止頻率的選擇影響基帶信號的帶寬,它又影響由發(fā)射機(jī)136生成的輸出信號的信息容量要求與由接收機(jī)142重建的信號的感覺的質(zhì)量之間的折衷。由接收機(jī)142重建的信號的感覺質(zhì)量受三個(gè)因素影響,這在以下的段落中討論。
第一個(gè)因素是被發(fā)送或存儲(chǔ)的基帶信號代表的精確性。通常,如果基帶信號的帶寬保持為恒定的,則當(dāng)基帶信號代表的精確性提高時(shí),重建的信號的感覺質(zhì)量將提高。如果不精確性足夠大,不精確性代表在重建的信號中可聽見的噪聲。噪聲將降低基帶信號和由基帶信號再生的頻譜分量的感覺質(zhì)量。在示例性實(shí)施例中,基帶信號代表是一組頻域變換系數(shù)。這個(gè)代表的精確性由被使用來表示每個(gè)變換系數(shù)的比特?cái)?shù)控制。編碼技術(shù)可被使用來以較少的比特傳送給定水平的精確性;然而,對于任何給定的編碼技術(shù),存在有基帶信號精確性與信息容量要求之間的基本折衷。
第二個(gè)因素是被發(fā)送或存儲(chǔ)的基帶信號的帶寬。通常,如果基帶信號代表的精確性保持為恒定的,則當(dāng)基帶信號的帶寬提高時(shí),重建的信號的感覺質(zhì)量將提高。較寬的帶寬的基帶信號的使用允許接收機(jī)142限制再生頻譜分量到更高的頻率,在更高的頻率人的聽覺系統(tǒng)對于時(shí)間和頻譜形狀的差別不太敏感。在上述的示例性實(shí)施方案中,基帶信號的帶寬由代表中的變換系數(shù)的數(shù)目控制。編碼技術(shù)可被使用來以較少的比特傳送給定的數(shù)目的系數(shù);然而,對于任何給定的編碼技術(shù),存在有基帶信號帶寬與信息容量要求之間的基本折衷。
第三個(gè)因素是對于發(fā)送或存儲(chǔ)基帶信號表示所需要的信息容量。如果信息容量要求保持為恒定的,則基帶信號精確性將隨基帶信號的帶寬相反地變化。應(yīng)用的需要通常將為由發(fā)射機(jī)136生成的輸出信號規(guī)定特定的信息容量要求。這個(gè)容量必須分配給輸出信號的各個(gè)部分,諸如基帶信號代表和估值的頻譜包絡(luò)。分配必須平衡對于通信系統(tǒng)熟知的多個(gè)沖突的利益的需要。在這個(gè)分配內(nèi),基帶信號的帶寬應(yīng)當(dāng)被選擇成平衡與編碼精確性的折衷,使得重建的信號的感覺質(zhì)量最佳化。
3.頻譜包絡(luò)估值器頻譜包絡(luò)估值器720分析音頻信號,提取關(guān)于信號的頻譜包絡(luò)的信息。如果可提供的信息容量許可,發(fā)射機(jī)136的實(shí)施方案優(yōu)選地通過把信號的頻譜劃分成具有近似于人耳的臨界頻帶的帶寬的頻帶,和提取關(guān)于在每個(gè)頻帶中信號幅度的信息,而得到信號的頻譜包絡(luò)的估值。然而,在具有有限的信息容量的大多數(shù)應(yīng)用中,優(yōu)選地把頻譜劃分成較小的數(shù)目的子頻帶,諸如以上在表I中所顯示的安排。也可以使用其他變例,諸如計(jì)算功率譜密度或提取每個(gè)頻帶中平均的或最大的幅度。更復(fù)雜的技術(shù)可以提供輸出信號的更高的質(zhì)量,但通常需要更大的計(jì)算資源。被使用來得到估值的頻譜包絡(luò)的方法的選擇通常具有實(shí)際的意義,因?yàn)樗ǔS绊懲ㄐ畔到y(tǒng)的感覺的質(zhì)量;然而,方法的選擇在原則上不是嚴(yán)格的??梢园葱枰褂脦缀跞魏渭夹g(shù)。
在使用表I所示的子頻帶結(jié)構(gòu)的一個(gè)實(shí)施方案中,頻譜包絡(luò)估值器720只對于子頻帶0,1,和2得到頻譜包絡(luò)的估值。子頻帶3被排除,以便減小對于表示估值的頻譜包絡(luò)所需要的信息量。
4.頻譜分析器頻譜分析器722分析從頻譜包絡(luò)估值器720接收的估值的頻譜包絡(luò)和來自基帶信號分析器710的信息,它識(shí)別要從基帶信號中丟棄的頻譜分量,以及計(jì)算要由接收機(jī)142使用的一個(gè)或多個(gè)噪聲混淆參數(shù),以生成變換的頻譜分量的噪聲分量。優(yōu)選實(shí)施方案通過計(jì)算和發(fā)送要被接收機(jī)142加到所有的變換分量的單個(gè)噪聲混淆參數(shù),而使得數(shù)據(jù)速率要求最小化。噪聲混淆參數(shù)可以通過多個(gè)不同的方法的任何一個(gè)方法進(jìn)行計(jì)算。優(yōu)選的方法導(dǎo)出等于頻譜平坦度度量的單個(gè)噪聲混淆參數(shù),這是從短時(shí)間功率譜的幾何平均值對算術(shù)平均值的比值計(jì)算的。該比值給出對于頻譜的平坦度的粗略的表示。表示更平坦的頻譜的更高的頻譜平坦度度量,也表示更高的噪聲混淆水平是適當(dāng)?shù)摹?br>
在發(fā)射機(jī)136的替換的實(shí)施方案中,頻譜分量被分組成多個(gè)子頻帶,諸如表I顯示的,以及發(fā)射機(jī)136發(fā)送每個(gè)子頻帶的噪聲混淆參數(shù)。這更加精確地規(guī)定要與變換的頻率內(nèi)容混合的噪聲量,但也需要更高的數(shù)據(jù)速率來發(fā)送額外的噪聲混淆參數(shù)。
5.基帶信號濾波器濾波器715接收來自基帶信號分析器710的信息,它標(biāo)識(shí)從基帶信號中被選擇為丟棄的頻譜分量,以及消除選擇的頻率分量,以得出基帶信號的頻域代表,用于傳輸或存儲(chǔ)。圖3A和3B是音頻信號和相應(yīng)的基帶信號的假設(shè)的示意圖。圖3A顯示假設(shè)的音頻信號的頻域代表600的頻譜包絡(luò)。圖3B顯示在音頻信號被處理成消除選擇的高頻分量之后剩余的基帶信號610的頻譜包絡(luò)。
濾波器715可以以有效地去除被選擇為丟棄的頻率分量的基本上任何方式實(shí)施。在一個(gè)實(shí)施方案中,濾波器715把頻域窗口函數(shù)施加到輸入音頻信號的頻域代表上。窗口函數(shù)的形狀被選擇為提供對于接收機(jī)142最終生成的輸出音頻信號的時(shí)域結(jié)果的頻率選擇性與衰減之間的適當(dāng)?shù)恼壑浴?br>
6信號格式化器信號格式化器725通過把估值的頻譜包絡(luò)信息,一個(gè)或多個(gè)參數(shù)混淆參數(shù),和基帶信號的代表組合成具有適合于傳輸或存儲(chǔ)的形式的輸出信號,而生成沿通信信道140的輸出信號,各個(gè)信號可以以基本上任何方式被組合。在許多應(yīng)用中,格式化器725把各個(gè)信號復(fù)用成串行比特流,該比特流具有適當(dāng)?shù)耐礁窕?,檢錯(cuò)和糾錯(cuò)碼,以及與傳輸或存儲(chǔ)操作有關(guān)的或與其中使用音頻信息的應(yīng)用有關(guān)的其他信息。信號格式化器725也可編碼全部或部分輸出信號,以減小信息容量要求,提供安全性,或把輸出信號放在便于以后使用的格式中。
C.接收機(jī)圖4是按照本發(fā)明的一個(gè)方面的接收機(jī)142的方框圖。去格式化器805接收來自通信信道140的信號,以及從這個(gè)信號得出基帶信號,估值的頻譜包絡(luò)信息和一個(gè)或多個(gè)噪聲混淆參數(shù)。這些信息單元被發(fā)送到信號處理器808,它包括頻譜再生器810,相位調(diào)節(jié)器815,混淆濾波器818,和增益調(diào)節(jié)器820。頻譜分量再生器810確定在基帶信號中哪些頻譜分量丟失,以及通過把基帶信號的全部或至少某些頻譜分量變換到丟失的頻譜分量的位置來再生它們。變換的分量被傳送到相位調(diào)節(jié)器815,它調(diào)節(jié)組合信號內(nèi)一個(gè)或多個(gè)頻譜分量的相位,以保證相位相干性。混淆濾波器818按照隨基帶信號接收的一個(gè)或多個(gè)噪聲混淆參數(shù),把一個(gè)或多個(gè)噪聲分量加到變換的分量。增益調(diào)節(jié)器820按照隨基帶信號接收的估值的頻譜包絡(luò)信息,調(diào)節(jié)再生信號中頻譜分量的幅度。變換的和調(diào)節(jié)的頻譜分量與基帶信號相組合,產(chǎn)生輸出信號的頻域代表。合成濾波器庫825處理該信號,得出輸出信號的時(shí)域代表,它沿路徑145傳送。
1.去格式化器去格式化器805以與信號格式化器725提供的格式化過程互補(bǔ)的方式處理從通信信道140接收的信號。在許多應(yīng)用中,去格式化器805從信道140接收串行比特流,使用比特流內(nèi)的同步格式來同步它的處理,使用糾錯(cuò)和檢錯(cuò)碼,以識(shí)別和校正在傳輸或存儲(chǔ)期間引入到比特流中的錯(cuò)誤,以及作為解復(fù)用器運(yùn)行,提取基帶信號的代表,估值的頻譜包絡(luò)信息,一個(gè)或多個(gè)噪聲混淆參數(shù),以及可與應(yīng)用有關(guān)的任何其他信息。去格式化器805也可以譯碼全部或部分串行比特流,逆反發(fā)射機(jī)136提供的任何編碼的效果。基帶信號的頻域代表被傳送到頻譜分量再生器810,噪聲混淆參數(shù)被傳送到混淆濾波器818,以及頻譜包絡(luò)信息被傳送到增益調(diào)節(jié)器820。
2.頻譜分量再生器頻譜分量再生器810通過復(fù)制或變換基帶信號的全部或至少某些頻譜分量到信號的丟失的分量的位置,而再生丟失的頻譜分量。頻譜分量可被復(fù)制到一個(gè)以上的頻率間隔,由此允許生成具有比基帶信號的帶寬的兩倍大的帶寬的輸出信號。
在只使用上面如表I所示的子頻帶0和1的接收機(jī)142的實(shí)施方案中,基帶信號不包含大于處于或約5.5kHz的截止頻率的頻譜分量。基帶信號的頻譜分量被復(fù)制或變換到從約5.5kHz到約11.0kHz的頻率范圍。如果16.5kHz的帶寬是想要的,例如,基帶信號的頻譜分量也可被變換到從約11.0kHz到約16.5kHz的頻率范圍。一般地,頻譜分量被變換到非重疊的頻率范圍,這樣,在包括基帶信號和全部復(fù)制的頻譜分量的頻譜中不存在縫隙;然而,這個(gè)特性不是重要的。頻譜分量可被變換到重疊的頻率范圍和/或按想要的基本上任何方式被變換到頻譜中具有縫隙的頻率范圍。
關(guān)于應(yīng)當(dāng)復(fù)制哪些頻譜分量的選擇可加以改變,以適合于具體的應(yīng)用。例如,被復(fù)制的頻譜分量不需要在基帶的下部邊緣開始,以及不需要在基帶的上部邊緣結(jié)束。被接收機(jī)142重建的信號的感覺質(zhì)量有時(shí)可以通過排除話音和樂器的基波頻率以及只復(fù)制諧波而被改進(jìn)。通過從變換中排除低于約1kHz的這些基帶頻譜分量,可以把這方面合并到一個(gè)實(shí)施方案。參照以上表I所示的子頻帶結(jié)構(gòu)作為例子,只有從約1kHz到約5.5kHz的頻譜分量被變換。
如果要被再生的所有的頻譜分量的帶寬比起要被復(fù)制的基帶頻譜分量的帶寬更寬,則基帶頻譜分量可以以循環(huán)方式被復(fù)制,從最低的頻率分量開始直到最高的頻率分量,以及如果必要的話,圍繞最低的頻率分量循環(huán)并以最低的頻率分量繼續(xù)進(jìn)行。例如,參照表I所示的子頻帶結(jié)構(gòu),如果只有從約1kHz到5.5kHz的基帶頻譜分量被復(fù)制和對于跨過從約5.5kHz到16.5kHz的頻率的子頻帶1和2再生頻譜分量,則從約1kHz到約5.5kHz的基帶頻譜分量被復(fù)制到從約5.5kHz到10kHz的各個(gè)頻率,從約1kHz到約5.5kHz的相同的基帶頻譜分量再次被復(fù)制到從約10kHz到14.5kHz的各個(gè)頻率,以及從約1kHz到約3kHz的基帶頻譜分量被復(fù)制到從約14.5kHz到16.5kHz的各個(gè)頻率。替換地,通過復(fù)制基帶的最低的頻率分量到各個(gè)子頻帶的下部邊緣以及如果必要的話,在整個(gè)基帶頻譜分量上以循環(huán)方式繼續(xù)進(jìn)行,以完成該子頻帶的變換,而可以為再生的分量的每個(gè)單獨(dú)的子頻帶進(jìn)行這個(gè)復(fù)制過程。
圖5A到5D是基帶信號的頻譜包絡(luò)與通過在基帶信號內(nèi)頻譜分量的變換而生成的信號的頻譜包絡(luò)的假設(shè)的示意圖。圖5A顯示假設(shè)的譯碼的基帶信號900。圖5B顯示被變換到較高的頻率的基帶信號905的頻譜分量。圖5C顯示被變換多次到較高的頻率的基帶信號分量910。圖5D顯示通過組合變換的分量915與基帶信號920而得到的信號。
3,相位調(diào)節(jié)器頻譜分量的變換可能在再生的分量的相位上產(chǎn)生不連續(xù)性。上述的O-TDAC變換實(shí)施方案,例如以及許多其他可能的實(shí)施方案,提供被安排在變換系數(shù)塊中的頻域代表。變換的頻譜分量也被安排在塊中。如果通過變換再生的頻譜分量在接連的塊之間具有相位不連續(xù)性,則在輸出音頻信號中多半出現(xiàn)可聽見的人為產(chǎn)物。
相位調(diào)節(jié)器815調(diào)節(jié)每個(gè)再生的頻譜分量的相位,以保持一致的或相干的相位。在采用上述的O-TDAC變換的接收機(jī)142的實(shí)施方案中,每個(gè)再生的頻譜分量被乘以復(fù)數(shù)值ejΔω,其中Δω代表每個(gè)各個(gè)頻譜分量被變換的頻率間隔,表示為相應(yīng)于該頻率間隔的變換系數(shù)的數(shù)目。例如,如果頻譜分量被變換到相鄰的分量的頻率,則變換間隔Δω等于1。替換的實(shí)施方案可需要適合于合成濾波器庫825的具體的實(shí)施方案的不同的相位調(diào)節(jié)技術(shù)。
變換處理過程可以適于把再生的分量與基帶信號內(nèi)重要的頻譜分量的諧波相匹配。變換可被調(diào)整的兩個(gè)方法是改變要被復(fù)制的特定的頻譜分量,或者改變變換的量。如果使用自適應(yīng)過程,應(yīng)當(dāng)特別注意相位相干性,如果頻譜分量被安排在塊內(nèi)的話。如果再生的頻譜分量從不同的基波分量逐個(gè)塊地被復(fù)制,或如果頻率變換的量逐個(gè)塊地被改變,則非??赡茉偕姆至繉⒉皇窍辔幌喔傻?。有可能調(diào)整頻譜分量的變換,但必須注意保證由相位不相干性造成的人為產(chǎn)物的聽見的程度是不顯著的。采用多通道技術(shù)或前向技術(shù)的系統(tǒng)能識(shí)別其間可以調(diào)整變換的時(shí)間間隔。代表其間再生的頻譜分量被認(rèn)為是聽不見的音頻信號的間隔的塊通常是用于調(diào)整變換過程的良好的候選者。
4.噪聲混淆濾波器混淆濾波器818通過使用從去格式化器805接收的噪聲混淆參數(shù)生成用于變換的頻譜分量的噪聲分量。混淆濾波器818生成噪聲信號,通過使用噪聲混淆參數(shù)計(jì)算噪聲混淆函數(shù),以及利用噪聲混淆函數(shù)組合噪聲信號與變換的頻譜分量。
噪聲信號可以通過各種各樣的方式的任何一種方式被生成。在優(yōu)選實(shí)施方案中,通過生成具有0的中值和1的方差的分布的隨機(jī)數(shù)序列,而產(chǎn)生噪聲信號?;煜秊V波器818通過把噪聲信號乘以噪聲混淆函數(shù)而調(diào)節(jié)噪聲信號。如果使用單個(gè)噪聲混淆參數(shù),則噪聲混淆函數(shù)通常應(yīng)當(dāng)調(diào)節(jié)噪聲信號成在更高的頻率上具有更高的幅度。這從以上討論的假設(shè)得出,話音和自然樂器信號往往在更高的頻率上包含更多的噪聲。在優(yōu)選實(shí)施方案中,當(dāng)頻譜分量被變換到較高的頻率時(shí),噪聲混淆函數(shù)在較高的頻率上具有最大的幅度,以及在噪聲被混淆的最低的頻率上平滑地衰減到最小值。
一個(gè)實(shí)施方案使用噪聲混淆函數(shù)N(k),如以下的表達(dá)式表示N(k)=max(k-kMINkMAX-kMIN+B-1,0)]]>對于kMIN≤k≤kMAX(1)其中max(x,y)=x和y中的較大者;B=基于SFM的噪聲混淆參數(shù);k=再生的頻譜分量的系數(shù);kMAX=用于頻譜分量再生的最高頻率;以及kMIN=用于頻譜分量再生的最低頻率。
在這個(gè)實(shí)施方案中,B的數(shù)值從0變到1,其中1表示平坦頻譜,它典型地是像噪聲那樣的信號,以及0表示不平坦的頻譜形狀,它典型地是像音調(diào)那樣的信號。公式(1)中商的數(shù)值在k從kMIN增加到kMAX時(shí)從0改變到1。如果B等于0,”max”函數(shù)中的第一項(xiàng)從-1改變到0,所以,N(k)在再生的頻譜中等于0,以及沒有噪聲加到再生的頻譜分量。如果B等于1,”max”函數(shù)中的第一項(xiàng)從1改變到0;所以,N(k)從在最低的再生頻率kMIN時(shí)的0線性地增加到在最大的再生頻率kMAX時(shí)的1。如果B具有在0與1之間的數(shù)值,則N(k)在從kMIN直到在kMIN與kMAX之間的某個(gè)頻率,都等于0,以及對于其余的再生頻譜,線性地增加。再生的頻譜分量的幅度通過把再生分量與噪聲混淆函數(shù)相乘而被調(diào)節(jié)。調(diào)節(jié)的噪聲信號與調(diào)節(jié)的再生頻譜分量相組合。
上述的這個(gè)具體的實(shí)施方案僅僅是一個(gè)適當(dāng)?shù)睦?。其他噪聲混淆技術(shù)也可以按需要被使用。
圖6A到6G是通過使用頻譜變換與噪聲混淆再生高頻分量而得到的信號的頻譜包絡(luò)的假設(shè)的示意圖。圖6A顯示要被發(fā)送的假設(shè)的輸入信號410。圖6B顯示通過丟棄高頻分量產(chǎn)生的基帶信號420。圖6C顯示再生的高頻分量431,432和433。圖6D顯示可能的噪聲混淆函數(shù)440,給予在較高的頻率的噪聲分量更大的權(quán)重。圖6E是與噪聲混淆函數(shù)440相乘的噪聲信號445的示意圖。圖6F顯示通過把再生的高頻分量431,432和433與噪聲混淆函數(shù)440的倒數(shù)相乘而生成的信號450。圖6G是通過把調(diào)節(jié)的噪聲信號445加到調(diào)節(jié)的高頻分量450而得出的組合信號460的示意圖。圖6G用來示意地顯示,高頻部分430包含變換的高頻分量431,432和433與噪聲的混合物的高頻部分430。
5.增益調(diào)節(jié)器增益調(diào)節(jié)器820按照從去格式化器805接收的估值的頻譜包絡(luò)信息調(diào)節(jié)再生信號的幅度。圖6H是在增益調(diào)節(jié)后圖6G所示的信號460的頻譜包絡(luò)的假設(shè)的圖形。包含變換的頻譜分量與噪聲的混合物的信號的部分510,被給予近似于圖6A所示的原先的信號410的頻譜包絡(luò)。以細(xì)刻度再現(xiàn)頻譜包絡(luò)通常是不必要的,因?yàn)樵偕念l譜分量沒有精確地再現(xiàn)原先的信號的頻譜分量。變換的諧波系列通常不等于諧波系列;所以,通常不可能保證再生的輸出信號在細(xì)刻度時(shí)等同于原先的輸入信號。與幾個(gè)關(guān)鍵的或更少的頻帶內(nèi)的頻譜能量相匹配的粗略近似被發(fā)現(xiàn)為很行得通。應(yīng)當(dāng)指出,通常寧愿使用頻譜形狀的粗估值,而不是更細(xì)的近似,因?yàn)榇止乐祵τ趥鬏斝诺篮痛鎯?chǔ)介質(zhì)提出較低的信息容量要求。然而,在具有一個(gè)以上的信道的音頻應(yīng)用中,通過使用頻譜形狀的更細(xì)的近似以使得可以進(jìn)行更精確的增益調(diào)節(jié),來保證信道之間的正確的平衡,而可以改進(jìn)聲音圖像。
6.合成濾波器庫由增益調(diào)節(jié)器820提供的增益調(diào)節(jié)的噪聲頻譜分量與從去格式化器805接收的基帶信號的頻域代表相組合,形成重建的信號的頻域代表。這可以通過把再生的分量加到基帶信號的相應(yīng)的分量而完成。圖7顯示通過把圖6B所示的基帶信號與圖6H所示的再生的分量相組合而得到的假設(shè)的重建的信號。
合成濾波器庫825把頻域代表變換成重建的信號的時(shí)域代表。這個(gè)濾波器庫可以以基本上任何方式來實(shí)施,但應(yīng)當(dāng)是與發(fā)射機(jī)136中使用的濾波器庫705相反的。在以上討論的優(yōu)選實(shí)施方案中,接收機(jī)142使用O-TDAC合成,它采用逆修正的DCT。
D.本發(fā)明的替換實(shí)施方案基帶信號的寬度和位置可以以基本上任何方式被建立,以及例如可以按照輸入信號特性動(dòng)態(tài)地改變。在一個(gè)替換實(shí)施方案中,發(fā)射機(jī)136通過丟棄多個(gè)頻帶的頻譜分量,由此造成基帶信號頻譜中的縫隙而生成基帶信號。在頻譜分量再生期間,部分基帶信號被變換,再生丟失的頻譜分量。
變換的方向也可變化。在另一個(gè)實(shí)施方案中,發(fā)射機(jī)136丟棄在低頻的頻譜分量,產(chǎn)生處在相對較高的頻率的基帶信號。接收機(jī)142把部分的高頻基帶信號向下變換到較低的頻率位置,再生丟失的頻譜分量。
E.時(shí)間包絡(luò)控制以上討論的再生技術(shù)能夠生成重建信號,基本上保留輸入音頻信號的頻譜包絡(luò);然而,通常沒有保留輸入信號的時(shí)間包絡(luò)。圖8A顯示音頻信號860的時(shí)間形狀。圖8B顯示通過從圖8A的信號860得出基帶信號和通過頻譜分量變換的處理過程再生丟棄的頻譜分量,而產(chǎn)生的重建的輸出信號870的時(shí)間形狀。重建的輸出信號870的時(shí)間形狀與原先的信號860的時(shí)間形狀有很大的不同。時(shí)間形狀的改變對于再生的音頻信號的感覺質(zhì)量有很大影響。下面討論用于保留時(shí)間包絡(luò)的兩種方法。
1.時(shí)域技術(shù)在第一種方法中,發(fā)射機(jī)136在時(shí)域中確定輸入音頻信號的時(shí)間形狀,以及接收機(jī)142在時(shí)域中在重建的信號中恢復(fù)相同的或基本上相同的時(shí)間形狀。
(a)發(fā)射機(jī)圖9顯示在通過使用時(shí)域技術(shù)提供時(shí)間包絡(luò)的通信系統(tǒng)中的發(fā)射機(jī)136的一個(gè)實(shí)施方案的方框圖。分析濾波器庫205接收來自路徑115的輸入信號,以及把信號劃分成多個(gè)子頻帶信號。圖上為了說明簡明起見只顯示兩個(gè)子頻帶;然而,分析濾波器庫205可以把輸入信號劃分成大于1的任何整數(shù)個(gè)子頻帶。
分析濾波器庫205可以以實(shí)際上任何方式來實(shí)施,諸如級聯(lián)連接的一個(gè)或多個(gè)正交鏡像濾波器(QMF),或優(yōu)選地,通過準(zhǔn)QMF技術(shù),它在一個(gè)濾波器級中把輸入信號劃分成任何整數(shù)個(gè)子頻帶。有關(guān)準(zhǔn)QMF技術(shù)的附加信息可以從以下專著中得到Vaidyanathan,”Muitirate Systems and Filter Banks(多速率系統(tǒng)和濾波器庫)”,Prentice Hall,New Jersey,1993,pp.354-373。
一個(gè)或多個(gè)子頻帶信號被使用來形成基帶信號。其余的子頻帶信號包含被丟棄的輸入信號的頻譜分量。在許多應(yīng)用中,基帶信號從代表輸入信號的最低頻率頻譜分量的一個(gè)子頻帶信號被形成,但這在原理上不是必須的。在用于發(fā)送或記錄以44.1千樣本/每秒速度采樣的輸入數(shù)字信號的系統(tǒng)的一個(gè)優(yōu)選實(shí)施方案中,分析濾波器庫205把輸入信號劃分成四個(gè)子頻帶,具有如以上表I中顯示的頻率范圍。最低頻率子頻帶被使用來形成基帶信號。
參照圖9所示的實(shí)施方案,分析濾波器庫205把較低頻率子頻帶信號作為基帶信號傳送到時(shí)間包絡(luò)估值器213和調(diào)制器214。時(shí)間包絡(luò)估值器213把基帶信號的估值的時(shí)間包絡(luò)提供到調(diào)制器214和信號格式化器225,優(yōu)選地,低于約500Hz的基帶信號頻譜分量或者被排除在估值時(shí)間包絡(luò)的處理過程以外,或者被衰減,以使得它們對于估值的時(shí)間包絡(luò)的形狀沒有多大影響。這可以通過把適當(dāng)?shù)母咄V波器施加到由時(shí)間包絡(luò)估值器213分析的信號上而被完成。調(diào)制器214把基帶信號的幅度除以估值的時(shí)間包絡(luò),并把時(shí)間上平坦的基帶信號的代表傳送到分析濾波器庫215。分析濾波器庫215生成平坦的基帶信號的頻域代表,它被傳送到編碼器220用于編碼。分析濾波器庫215,以及下面討論的分析濾波器庫212,可以通過基本上任何的時(shí)域到頻域變換被實(shí)施;然而,通常寧愿采用像實(shí)施臨界采樣濾波器庫的O-TDAC變換那樣的變換。編碼器220是任選的;然而,它的使用是優(yōu)選的,因?yàn)榫幋a通常可被使用來減小平坦的基帶信號的信息要求。平坦的基帶信號,無論是否編碼,被傳送到信號格式化器225。
分析濾波器庫205把高頻子頻帶信號傳送到時(shí)間包絡(luò)估值器210和調(diào)制器211。時(shí)間包絡(luò)估值器210把較高頻率子頻帶信號的估值時(shí)間包絡(luò)提供到輸出信號格式化器225。調(diào)制器211把較高頻率子頻帶信號的幅度除以估值的時(shí)間包絡(luò),并把時(shí)間上平坦的、較高頻率的子頻帶信號的代表傳送到分析濾波器庫212。分析濾波器庫212生成平坦的較高的頻率的子頻帶信號的頻域代表。頻譜包絡(luò)估值器720和頻譜分析儀722以基本上與以上描述的相同的方式分別提供估值的頻譜包絡(luò)和一個(gè)或多個(gè)噪聲混淆參數(shù),用于較高的頻率的子頻帶信號,以及把這個(gè)信息傳送到信號格式化器225。
信號格式化器225通過把平坦的基帶信號的代表,基帶信號的估值的時(shí)間包絡(luò)和較高頻率子頻帶信號組裝成輸出信號,而沿著通信信道140提供輸出信號。通過使用如上述的用于信號格式化器725的、基本上任何想要的格式化技術(shù),各個(gè)信號和信息被組裝成具有適合于傳輸或存儲(chǔ)的形式的信號。
(b)時(shí)間包絡(luò)估值器時(shí)間包絡(luò)估值器210和213可以以各種各樣的方式被實(shí)施。在一個(gè)實(shí)施方案中,每個(gè)這些估值器處理被劃分成子頻帶信號樣本塊的子頻帶信號。這些子頻帶信號樣本塊也通過分析濾波器庫212或215被處理。在許多實(shí)際的實(shí)施方案中,這些塊被安排成包含的樣本數(shù)是2的冪,以及大于256個(gè)樣本。這樣的塊的尺寸通常被優(yōu)選為提高被使用來實(shí)施分析濾波器庫212和215的變換的效率和頻率分辨率。塊的長度也可根據(jù)輸入信號特性,諸如大的瞬態(tài)是否發(fā)生而被適配。每個(gè)塊還被劃分成256樣本的組,用于時(shí)間包絡(luò)估值。組的尺寸被選擇為平衡在估值的精確度性與在輸出信號中對于傳送估值所需要的信息量之間的折衷。
在一個(gè)實(shí)施方案中,時(shí)間包絡(luò)估值器計(jì)算在每個(gè)組的子頻帶信號樣本中樣本的功率。子頻帶信號樣本塊的一組功率值是對于該塊的估值的時(shí)間包絡(luò)。在另一個(gè)實(shí)施方案中,時(shí)間包絡(luò)估值器計(jì)算在每個(gè)組中子頻帶信號樣本幅度的平均值。該塊的一組平均值是對于該塊的估值的時(shí)間包絡(luò)。
在估值的包絡(luò)中的一組數(shù)值可以以各種各樣的方式被編碼。在一個(gè)例子中,每個(gè)塊的包絡(luò)由該塊的第一組樣本的初始值以及表示以后的組的相對值的一組差分值代表。在另一個(gè)例子中,差分的或絕對的代碼以自適應(yīng)方式被使用,以減小對于傳送該數(shù)值所需要的信息量。
(c)接收機(jī)圖10顯示通過使用時(shí)域技術(shù)提供時(shí)間包絡(luò)控制的、通信系統(tǒng)中的接收機(jī)的一個(gè)實(shí)施方案的方框圖。去格式化器265接收來自通信信道140的信號,以及從這個(gè)信號得到平坦的基帶信號的代表,基帶信號和較高的頻率子頻帶信號的估值的時(shí)間包絡(luò),估值的頻譜包絡(luò)和一個(gè)或多個(gè)噪聲混淆參數(shù)。譯碼器267是可任選的,但應(yīng)當(dāng)被使用來顛倒發(fā)射機(jī)136中執(zhí)行的任何編碼的效果,以得到平坦的基帶信號的頻域代表。
合成濾波器庫280接收平坦的基帶信號的頻域代表,以及通過使用與在發(fā)射機(jī)136中的分析濾波器庫215使用的、相反的技術(shù),生成時(shí)域代表。調(diào)制器281從去格式化器265接收基帶信號的估值的時(shí)間包絡(luò),以及使用這個(gè)估值來調(diào)制從合成濾波器庫280接收的平坦的基帶信號。這種調(diào)制提供基本上與在原先的基帶信號被發(fā)射機(jī)136中的調(diào)制器214平坦化之前它的時(shí)間形狀相同的時(shí)間形狀。
信號處理器808接收來自去格式化器265的平坦的基帶信號的頻域代表,估值的時(shí)間包絡(luò),和一個(gè)或多個(gè)噪聲混淆參數(shù),以及以與以上對于圖4所示的信號處理器808討論的相同的方式再生頻譜分量。再生的頻譜分量被傳送到合成濾波器庫283,它通過使用與由發(fā)射機(jī)136中的分析濾波器庫212和215使用的相反的技術(shù)生成時(shí)域代表。調(diào)制器284接收來自去格式化器265的較高頻率子頻帶信號的估值的時(shí)間包絡(luò),以及使用這個(gè)估值的包絡(luò)來調(diào)制從合成濾波器庫283接收的再生的頻譜分量信號。這個(gè)調(diào)制提供基本上與在原先的較高頻率子頻帶信號被發(fā)射機(jī)136中的調(diào)制器211平坦化之前它的時(shí)間形狀相同的時(shí)間形狀。
調(diào)制的子頻帶信號和調(diào)制的較高頻率子頻帶信號被組合,形成重建的信號,并把它傳送到合成濾波器庫287。合成濾波器庫287使用與在發(fā)射機(jī)136中的分析濾波器庫205使用的相反的技術(shù),提供沿著路徑145的輸出信號,它們在感覺上與由發(fā)射機(jī)136從路徑115接收的原先的輸入信號不可區(qū)分的或幾乎不可區(qū)分的。
2.頻域技術(shù)在第二種方法中,發(fā)射機(jī)136確定在頻域中輸入音頻信號的時(shí)間包絡(luò),以及接收機(jī)142在頻域中恢復(fù)與重建的信號相同的或基本上相同的時(shí)間包絡(luò)。
(a)發(fā)射機(jī)圖11顯示通過使用頻域技術(shù)提供時(shí)間包絡(luò)控制的、通信系統(tǒng)中的發(fā)射機(jī)136的一個(gè)實(shí)施方案的方框圖。這個(gè)發(fā)射機(jī)的實(shí)施方案非常類似于圖2所示的發(fā)射機(jī)的實(shí)施方案。主要的差別是時(shí)間包絡(luò)估值器707。其他的部件不在這里詳細(xì)討論,因?yàn)樗鼈兊倪\(yùn)行基本上是與以上結(jié)合圖2描述的相同的。
參照圖11,時(shí)間包絡(luò)估值器707從分析濾波器庫705接收輸入信號的頻域代表,該輸入信號由分析濾波器庫分析而得出輸入信號的時(shí)間包絡(luò)的估值。優(yōu)選地,低于約500Hz的頻譜分量或者從頻域代表被排除,或者被衰減,以使得它們對于估值時(shí)間包絡(luò)的處理過程沒有重大的影響。時(shí)間包絡(luò)估值器707通過對于估值的時(shí)間包絡(luò)的頻域代表和輸入信號的頻域代表進(jìn)行去卷積而得出輸入信號的時(shí)間平坦的版本的頻域代表,這個(gè)去卷積可以通過用估值的時(shí)間包絡(luò)的頻域代表的倒數(shù)卷積輸入信號的頻域代表而完成。輸入信號的時(shí)間平坦的版本的頻域代表被傳送到濾波器715,基帶信號分析器710,和頻譜包絡(luò)估值器720。估值的時(shí)間包絡(luò)的頻域代表的說明被傳送到信號格式化器725,用于組裝成輸出信號,沿著通信信道140被傳送。
(b)時(shí)間包絡(luò)估值器時(shí)間包絡(luò)估值器707可以以多種方式實(shí)施。用于時(shí)間包絡(luò)估值器的一個(gè)實(shí)施方案的技術(shù)基礎(chǔ)可以通過公式2所示的線性系統(tǒng)進(jìn)行說明y(t)=h(t)·x(t)(2)其中y(t)=要被發(fā)送的信號;h(t)=要被發(fā)送的信號的時(shí)間包絡(luò);點(diǎn)符號(.)表示乘法;以及x(t)=信號y(t)的時(shí)間平坦的版本。
公式2可被重寫為Y[k]=H[k]*X[k] (3)其中Y[k]=輸入信號y(t)的頻域代表;H[k]=h(t)的頻域代表;星符號(*)表示卷積;以及X[k]=x(t)的頻域代表。
參照圖11,信號y(t)是發(fā)射機(jī)136從路徑115接收的音頻信號。分析濾波器庫705提供信號y(t)的頻域代表Y[k]。時(shí)間包絡(luò)估值器707通過求解從X[k]和Y[k]的自回歸移動(dòng)平均(ARMA)模型得到的方程組而得出信號的時(shí)間包絡(luò)h(t)的頻域代表H[k]的估值。關(guān)于ARMA模型的使用的附加信息可以從以下專著得出Proakis and Manolakis,“Digital Signal ProcessingPrinciples,Algorithms andApplications(數(shù)字信號處理原理,算法和應(yīng)用)”,MacMillanPublishing Co.,New York,1988。具體見pp.818-821。
在發(fā)射機(jī)136的優(yōu)選實(shí)施方案中,濾波器庫705對于代表信號y(t)的樣本塊實(shí)施變換,提供頻域代表Y[k],被安排在變換系數(shù)塊中。每個(gè)變換系數(shù)塊表示信號y(t)的短時(shí)間信號頻譜。頻域代表X[k]也被安排在變換系數(shù)塊中。頻域代表X[k]中每個(gè)系數(shù)塊代表假設(shè)為廣義平穩(wěn)(WSS)的時(shí)間平坦的信號的樣本塊。還假設(shè),在每個(gè)X代表塊中的系數(shù)是獨(dú)立分布的(ID)。給出這些假設(shè)后,信號可通過ARMA模型被表示為如下Y[k]+Σl=1LalY[k-l]=Σq=0QbqX[k-q]---(4)]]>通過求解Y[k]的自相關(guān)函數(shù),可以解方程4求出al和bq
E{Y[k]·Y[k-m]}=-Σl=1LalE{Y[k-l]·Y[k-m]}+Σq=0QbqE{X[k-q]·Y[k-m]}---(5)]]>其中E{}表示期望值函數(shù);L=ARMA模型的自部分的長度;Q=ARMA模型的移動(dòng)平均部分的長度。
方程5可被重寫為RYY[m]=-Σl=1LalRYY[m-l]+Σq=0QbqRXY[m-q]---(6)]]>其中RYY[n]表示Y[n]的自相關(guān)函數(shù);以及RXY[n]表示Y[n]和X[n]的互相關(guān)函數(shù)。
如果我們進(jìn)一步假設(shè)由H[k]代表的線性系統(tǒng)僅僅是自回歸的,則方程6的右面的第二項(xiàng)等于X[k]的方差。方程6然后可被重寫為 通過求逆以下的線性方程組,可求解方程7 給出這個(gè)基礎(chǔ)知識(shí)后,現(xiàn)在有可能描述使用頻域技術(shù)的時(shí)間包絡(luò)估值器的一個(gè)實(shí)施方案。在這個(gè)實(shí)施方案中,時(shí)間包絡(luò)估值器707接收輸入信號y(t)的頻域代表Y[k]和計(jì)算自相關(guān)序列RXX[m],對于-L≤m≤L。這些數(shù)值被使用來構(gòu)建公式8中顯示的矩陣。然后對矩陣求逆,解出系數(shù)ai。因?yàn)楣?中的矩陣是Toeplitz的,它可以通過Levinson-Durbin算法求逆。對于信息可參閱Proakis and Manolakis,pp.458-462。
通過矩陣求逆,得到的方程組不能直接解出,因?yàn)閄[k]的方差2X是未知的;然而,對于某些適宜的方差,諸如數(shù)值1,方程組可以求解。一旦對于這個(gè)適宜的數(shù)值被解出,方程組就產(chǎn)生一組非歸一化的系數(shù){a’0,...a’L}。這些系數(shù)是非歸一化的,因?yàn)榉匠淌菍τ谶m宜的方差求解的。通過把每個(gè)系數(shù)除以第一非歸一化系數(shù)值,系數(shù)可被歸一化,它可被表示為ai=aia0]]>對于0<i≤L (9)方程可以從以下公式得出σx2=1a0---(10)]]>歸一化系數(shù)組{1,a1,...,aL}代表平坦的濾波器FF的零,它們可以用輸入信號y(t)的頻域代表進(jìn)行卷積,得到輸入信號的時(shí)間平坦的版本x(t)的頻域代表。歸一化系數(shù)組代表重建的濾波器FR的極點(diǎn),得到該平坦信號的頻域代表,具有基本上等于輸入信號y(t)的時(shí)間包絡(luò)的修正的時(shí)間形狀。
時(shí)間包絡(luò)估值器707用從濾波器庫705接收的頻域代表Y[k]對平坦的濾波器FF進(jìn)行卷積,以及把時(shí)間平坦的結(jié)構(gòu)傳送到濾波器715,基帶信號分析器710,和頻譜包絡(luò)估值器720。在平坦濾波器FF中的系數(shù)的說明被傳送到信號格式化器725,用于組裝成輸出信號,沿路徑140傳送。
(c)接收機(jī)圖12顯示通過使用頻域技術(shù)提供時(shí)間包絡(luò)控制的、通信系統(tǒng)中的接收機(jī)142的一個(gè)實(shí)施方案的方框圖。這個(gè)接收機(jī)的實(shí)施方案非常類似于圖4所示的接收機(jī)的實(shí)施方案。主要的差別是時(shí)間包絡(luò)再生器807。其他的部件不在這里詳細(xì)討論,因?yàn)樗鼈兊倪\(yùn)行基本上是與以上結(jié)合圖4描述的相同的。
參照圖12,時(shí)間包絡(luò)再生器807從去格式化器805接收估值的時(shí)間包絡(luò)的說明,它是用重建的信號的頻域代表進(jìn)行卷積。從卷積得出的結(jié)果被傳送到合成濾波器庫825,它提供沿著路徑145的輸出信號,它們在感覺上與由發(fā)射機(jī)136從路徑115接收的原先的輸入信號是很難區(qū)分的或接近很難區(qū)分的。
時(shí)間包絡(luò)再生器807可以以多種方式實(shí)施。在與以上討論的包絡(luò)估值器的實(shí)施方案相兼容的實(shí)施方案中,去格式化器805提供代表重建濾波器FR的極點(diǎn)的一組系數(shù),它是與重建的信號的頻域代表進(jìn)行卷積。
(d)替換實(shí)施方案替換實(shí)施方案是可能的。在用于發(fā)射機(jī)136的替換例中,從濾波器庫705接收的頻域代表的頻譜分量被分組為子頻帶。表I所示的子頻帶組是一個(gè)適當(dāng)?shù)睦?。等于每個(gè)子頻帶得出一個(gè)平坦濾波器FF,把它與每個(gè)子頻帶的頻域代表進(jìn)行卷積,以使得它在時(shí)間上平坦化。信號格式化器725把每個(gè)子頻帶的估值的時(shí)間包絡(luò)的標(biāo)識(shí)組裝成輸出信號。接收機(jī)142接收每個(gè)子頻帶的估值的時(shí)間包絡(luò),得出每個(gè)子頻帶的適當(dāng)?shù)脑偕鸀V波器FR,以及把它與在重建的信號中的相應(yīng)的子頻帶的頻域代表進(jìn)行卷積。
在另一個(gè)替換例中,多組系數(shù){Ci}j被存儲(chǔ)在表中。對于輸入信號,計(jì)算用于平坦濾波器FF的系數(shù){1,a1,...,aL},以及把計(jì)算的系數(shù)與被存儲(chǔ)在表中的多組系數(shù)的每組系數(shù)進(jìn)行比較。選擇表中的、似乎最接近于計(jì)算的系數(shù)的組{Ci}j,以及被使用來使得輸入信號平坦化。從表中選擇的該組{Ci}j的標(biāo)識(shí)被傳送到信號格式化器725,被組裝成輸出信號。接收機(jī)142接收該組{Ci}j的標(biāo)識(shí),查詢存儲(chǔ)的系數(shù)組的表以得出適當(dāng)?shù)南禂?shù)組{Ci}j,得出相應(yīng)于該系數(shù)的再生濾波器FR,以及把該濾波器與重建的信號的頻域代表進(jìn)行卷積。這個(gè)替換例也可以應(yīng)用于以上討論的子頻帶。
用來選擇表中的一組系數(shù)的一個(gè)方法是在L維空間中規(guī)定具有等于輸入信號或輸入信號的子頻帶的的計(jì)算的系數(shù)(a1,...,aL)的、歐幾里得坐標(biāo)的一個(gè)目標(biāo)點(diǎn)。被存儲(chǔ)在表中的每個(gè)組規(guī)定L維空間的各個(gè)點(diǎn)。其相關(guān)的點(diǎn)具有離目標(biāo)點(diǎn)最短的歐幾里得距離的、被存儲(chǔ)在表中的組被認(rèn)為最接近于計(jì)算的系數(shù)。如果該表例如存儲(chǔ)256組系數(shù),則8比特?cái)?shù)被傳送到信號格式化器725,以識(shí)別選擇的系數(shù)組。
F.實(shí)施方案本發(fā)明可以以各種各樣的方式實(shí)施??梢园葱枰褂媚M和數(shù)字技術(shù)。各個(gè)方面例如可以通過分立的電子元件,集成電路,可編程邏輯陣列,ASIC,和其他類型的電子元件,以及通過執(zhí)行指令的程序的設(shè)備來實(shí)施。指令的程序可以通過基本上任何設(shè)備可讀的媒體,諸如磁和光存儲(chǔ)媒體,只讀存儲(chǔ)器和可編程存儲(chǔ)器來傳送。
權(quán)利要求
1.一種處理音頻信號的方法,包括獲得具有音頻信號的、某些但不是全部頻譜分量的基帶信號的頻域代表;獲得具有不在基帶信號中的音頻信號的頻譜分量的剩余信號的估值的頻譜包絡(luò);從剩余信號的噪聲含量的度量導(dǎo)出噪聲混淆參數(shù);以及把代表基帶信號的頻域代表的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)組裝成適合于傳輸或存儲(chǔ)的輸出信號。
2.權(quán)利要求1的方法,其中基帶信號的頻域代表被獲得,以代表長度上變化的信號分段。
3.權(quán)利要求2的方法,還包括應(yīng)用時(shí)域混疊抵銷分析變換,以獲得基帶信號的頻域代表。
4.權(quán)利要求1的方法,包括獲得音頻信號的頻域代表;以及從音頻信號的頻域代表的一部分獲得基帶信號的頻域代表。
5.權(quán)利要求1的方法,包括獲得代表音頻信號的多個(gè)子頻帶信號;通過把第一分析濾波器庫應(yīng)用到包括多個(gè)子頻帶信號的某些但不是全部的第一組的一個(gè)或多個(gè)子頻帶信號上,而獲得基帶信號的頻域代表;以及藉助于分析通過把第二分析濾波器庫應(yīng)用到不被包括在第一組子頻帶信號中的第二組的一個(gè)或多個(gè)子頻帶信號上而獲得的信號,獲得剩余信號的估值的頻譜包絡(luò)。
6.權(quán)利要求5的方法,包括通過按照第二組子頻帶信號的估值的時(shí)間包絡(luò)的倒數(shù),修正第二組子頻帶信號,而獲得第二組子頻帶信號的時(shí)間上平坦的代表,其中響應(yīng)第二組子頻帶信號的時(shí)間上平坦的代表,獲得剩余信號的估值的頻譜包絡(luò)與噪聲混淆參數(shù);以及把數(shù)據(jù)組裝成代表第二組子頻帶信號的估值的時(shí)間包絡(luò)的輸出信號。
7.權(quán)利要求6的方法,包括通過按照第一組子頻帶信號的估值的時(shí)間包絡(luò)的倒數(shù),修正第一組子頻帶信號,而獲得第一組子頻帶信號的時(shí)間上平坦的代表,其中響應(yīng)第一組子頻帶信號的時(shí)間上平坦的代表,獲得基帶信號的頻域代表;以及把數(shù)據(jù)組裝成代表第一組子頻帶信號的估值的時(shí)間包絡(luò)的輸出信號。
8.一種處理音頻信號的方法,包括獲得代表音頻信號的多個(gè)子頻帶信號;通過把第一分析濾波器庫應(yīng)用到包括多個(gè)子頻帶信號的某些但不是全部的第一組的一個(gè)或多個(gè)子頻帶信號上,而獲得基帶信號的頻域代表;通過按照第二組子頻帶信號的估值的時(shí)間包絡(luò)的倒數(shù),修正第二組子頻帶信號,而獲得不被包括在第一組子頻帶信號的第二組的一個(gè)或多個(gè)子頻帶信號的時(shí)間上平坦的代表;獲得第二組子頻帶信號的時(shí)間上平坦的代表的估值的頻譜包絡(luò);從第二組子頻帶信號的時(shí)間上平坦的代表的噪聲含量的度量獲得噪聲混淆參數(shù);以及把代表基帶信號的頻域代表的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)組裝成適合于傳輸或存儲(chǔ)的輸出信號。
9.一種生成重建的音頻信號的方法,包括接收包含代表從音頻信號獲得的基帶信號、估值的頻譜包絡(luò)和從音頻信號的噪聲含量的度量獲得的噪聲混淆參數(shù)的數(shù)據(jù)的信號;從該數(shù)據(jù)獲得基帶信號的頻域代表;通過在頻率上變換基帶的頻譜分量而獲得包括再生的頻譜分量的再生的信號;調(diào)節(jié)再生的頻譜分量的相位以保持再生信號內(nèi)的相位相干性;藉助于響應(yīng)噪聲混淆參數(shù)獲得噪聲信號,通過按照估值的頻譜包絡(luò)和噪聲混淆參數(shù)調(diào)節(jié)再生的頻譜分量的幅值而修正再生信號,并組合修正的再生信號與噪聲信號,而獲得調(diào)節(jié)的再生信號;以及獲得相應(yīng)于調(diào)節(jié)的再生信號中的頻譜分量與基帶信號的頻域代表中的頻譜分量的組合的重建的信號的時(shí)域代表。
10.權(quán)利要求9的方法,其中重建信號的時(shí)域代表被獲得,以代表長度上變化的重建信號分段。
11.權(quán)利要求10的方法,還包括應(yīng)用時(shí)域混疊抵銷合成變換,以獲得重建信號的時(shí)域代表。
12.權(quán)利要求9的方法,包括通過改變被變換的那些頻譜分量或通過改變頻譜分量被變換的頻率量而調(diào)節(jié)頻譜分量的變換,其中基帶信號的頻域代表被安排成塊,以及當(dāng)由于調(diào)節(jié)的變換而得到的再生的頻譜分量被認(rèn)為是聽不見的時(shí),頻譜分量的變換被調(diào)節(jié)。
13.權(quán)利要求9的方法,該方法獲得以這樣的方式噪聲信號、它的頻譜分量具有基本上與頻率成反比地變化的幅值。
14.權(quán)利要求9的方法,包括通過組合調(diào)節(jié)的再生信號的頻譜分量與在基帶信號的頻域代表中的頻譜分量,而獲得重建的信號;以及通過把合成濾波器庫應(yīng)用到重建的信號,而獲得重建信號的時(shí)域代表。
15.權(quán)利要求9的方法,包括通過把第一合成濾波器庫應(yīng)用到基帶信號的頻域代表,而獲得基帶信號的時(shí)域代表;通過把第二合成濾波器庫應(yīng)用到調(diào)節(jié)的再生信號,而獲得調(diào)節(jié)的再生信號的時(shí)域代表;以及得到重建信號的時(shí)域代表,以使它代表基帶信號的時(shí)域代表和調(diào)節(jié)的再生信號的時(shí)域代表的組合。
16.權(quán)利要求15的方法,包括按照從該數(shù)據(jù)獲得的估值的時(shí)間包絡(luò)修正調(diào)節(jié)的再生信號的時(shí)域代表;以及通過組合基帶信號的時(shí)域代表和調(diào)節(jié)的再生信號的修正的時(shí)域代表,而獲得重建信號。
17.權(quán)利要求16的方法,包括按照從該數(shù)據(jù)獲得的另一個(gè)估值的時(shí)間包絡(luò)修正基帶信號的時(shí)域代表;以及通過組合基帶信號的修正的時(shí)域代表和調(diào)節(jié)的再生信號的修正的時(shí)域代表,而獲得重建信號。
18.一種生成重建的音頻信號的方法,包括接收包含代表從音頻信號獲得的基帶信號、估值的頻譜包絡(luò)、估值的時(shí)間包絡(luò)和噪聲混淆參數(shù)的數(shù)據(jù)的信號;從該數(shù)據(jù)獲得基帶信號的頻域代表;通過在頻率上變換基帶的頻譜分量而獲得包括再生的頻譜分量的再生信號;調(diào)節(jié)再生的頻譜分量的相位以保持再生信號內(nèi)的相位相干性;響應(yīng)噪聲混淆參數(shù)獲得噪聲信號;通過按照估值的頻譜包絡(luò)調(diào)節(jié)再生頻譜分量的幅值和把它們與噪聲信號相組合,而獲得調(diào)節(jié)的再生信號;通過把第一合成濾波器庫應(yīng)用到基帶信號的頻域代表,而獲得基帶信號的時(shí)域代表;通過把第二合成濾波器庫應(yīng)用到調(diào)節(jié)的再生信號和按照估值的時(shí)間包絡(luò)應(yīng)用調(diào)制,而得到調(diào)節(jié)的再生信號的時(shí)域代表;以及得到重建信號的時(shí)域代表,以使它代表基帶信號的時(shí)域代表和調(diào)節(jié)的再生信號的修正為時(shí)域代表的組合。
19.一種設(shè)備可讀的并傳送由設(shè)備執(zhí)行的以實(shí)現(xiàn)處理音頻信號的方法的一個(gè)或多個(gè)指令程序的媒體,其中該方法包括獲得具有音頻信號的某些但不是全部頻譜分量的基帶信號的頻域代表;獲得具有不在基帶信號中的音頻信號的頻譜分量的剩余信號的估值的頻譜包絡(luò);從剩余信號的噪聲含量的度量導(dǎo)出噪聲混淆參數(shù);以及把代表基帶信號的頻域代表的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)組裝成適合于傳輸或存儲(chǔ)的輸出信號。
20.權(quán)利要求19的媒體,其中該方法包括獲得音頻信號的頻域代表;以及從音頻信號的頻域代表的一部分獲得基帶信號的頻域代表。
21.權(quán)利要求19的媒體,其中該方法包括獲得代表音頻信號的多個(gè)子頻帶信號;通過把第一分析濾波器庫應(yīng)用到包括某些但不是全部多個(gè)子頻帶信號的第一組的一個(gè)或多個(gè)子頻帶信號上,而獲得基帶信號的頻域代表;以及藉助于分析通過把第二分析濾波器庫應(yīng)用到不被包括在第一組子頻帶信號中的第二組的一個(gè)或多個(gè)子頻帶信號上而獲得的信號,而獲得剩余信號的估值的頻譜包絡(luò)。
22.權(quán)利要求21的媒體,其中該方法包括通過按照第二組子頻帶信號的估值的時(shí)間包絡(luò)的倒數(shù),修正第二組子頻帶信號,而獲得第二組子頻帶信號的時(shí)間上平坦的代表,其中響應(yīng)第二組子頻帶信號的時(shí)間上平坦的代表,獲得剩余信號的估值的頻譜包絡(luò)與噪聲混淆參數(shù);以及把數(shù)據(jù)組裝成代表第二組子頻帶的估值的時(shí)間包絡(luò)的輸出信號。
23.權(quán)利要求22的媒體,其中該方法包括通過按照第一組子頻帶信號的估值的時(shí)間包絡(luò)的倒數(shù),修正第一組子頻帶信號,而獲得第一組子頻帶信號的時(shí)間上平坦的代表,其中響應(yīng)第一組子頻帶信號的時(shí)間上平坦的代表,獲得基帶信號的頻域代表;以及把數(shù)據(jù)組裝到代表第一組子頻帶信號的估值的時(shí)間包絡(luò)的輸出信號。
24.一種設(shè)備可讀的并傳送由設(shè)備執(zhí)行以實(shí)現(xiàn)處理音頻信號的方法的一個(gè)或多個(gè)指令程序的媒體,其中該方法包括獲得代表音頻信號的多個(gè)子頻帶信號;通過把第一分析濾波器庫應(yīng)用到包括某些但不是全部多個(gè)子頻帶信號的第一組的一個(gè)或多個(gè)子頻帶上,而獲得基帶信號的頻域代表;通過按照第二組子頻帶信號的估值的時(shí)間包絡(luò)的倒數(shù),修正第二組子頻帶信號,而獲得不被包括在第一組子頻帶信號的、第二組的一個(gè)或多個(gè)子頻帶信號的時(shí)間上平坦的代表;獲得第二組子頻帶信號的時(shí)間上平坦的代表的估值的頻譜包絡(luò);從第二組子頻帶信號的時(shí)間上平坦的代表的噪聲含量的度量獲得噪聲混淆參數(shù);以及把代表基帶信號的頻域代表的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)組裝成適合于傳輸或存儲(chǔ)的輸出信號。
25.一種設(shè)備可讀的并傳送由設(shè)備執(zhí)行以實(shí)現(xiàn)產(chǎn)生重建音頻信號的方法的一個(gè)或多個(gè)指令程序的媒體,其中該方法包括接收包含代表從音頻信號獲得的基帶信號、估值的頻譜包絡(luò)和從音頻信號的噪聲含量的度量獲得的噪聲混淆參數(shù)的數(shù)據(jù)的信號;從該數(shù)據(jù)獲得基帶信號的頻域代表;通過在頻率上變換基帶的頻譜分量而獲得包括再生的頻譜分量的再生信號;調(diào)節(jié)再生的頻譜分量的相位以保持再生信號內(nèi)的相位相干性;藉助于響應(yīng)噪聲混淆參數(shù)獲得噪聲信號、通過按照估值的頻譜包絡(luò)和噪聲混淆參數(shù)調(diào)節(jié)再生的頻譜分量的幅值而修正再生信號、和組合修正的再生信號與噪聲信號,而獲得調(diào)節(jié)的再生的信號;以及獲得相應(yīng)于調(diào)節(jié)的再生信號中的頻譜分量與基帶信號的頻域代表中的頻譜分量的組合的重建的信號的時(shí)域代表。
26.權(quán)利要求25的媒體,其中該方法以這樣的方式獲得噪聲信號、使得它的頻譜分量具有基本上隨頻率成反比變化的幅值。
27.權(quán)利要求25的媒體,其中該方法包括通過組合調(diào)節(jié)的再生信號的頻譜分量與在基帶信號的頻域代表中的頻譜分量,而獲得重建的信號;以及通過把合成濾波器庫應(yīng)用到重建的信號,而獲得重建信號的時(shí)域代表。
28.權(quán)利要求25的媒體,其中該方法包括通過把第一合成濾波器庫應(yīng)用到基帶信號的頻域代表,而獲得基帶信號的時(shí)域代表;通過把第二合成濾波器庫應(yīng)用到調(diào)節(jié)的再生信號,而獲得調(diào)節(jié)的再生信號的時(shí)域代表;以及獲得重建信號的時(shí)域代表,以使它代表基帶信號的時(shí)域代表和調(diào)節(jié)的再生信號的時(shí)域代表的組合。
29.權(quán)利要求28的媒體,其中該方法包括按照從該數(shù)據(jù)獲得的估值的時(shí)間包絡(luò)修正調(diào)節(jié)的再生信號的時(shí)域代表;以及通過組合基帶信號的時(shí)域代表和調(diào)節(jié)的再生信號的修正的時(shí)域代表,而獲得重建信號。
30.權(quán)利要求29的媒體,其中該方法包括按照從該數(shù)據(jù)獲得的另一個(gè)估值的時(shí)間包絡(luò)修正基帶信號的時(shí)域代表;以及通過組合基帶信號的修正的時(shí)域代表和調(diào)節(jié)的再生信號的修正的時(shí)域代表,而獲得重建信號。
31.一種設(shè)備可讀的并傳送由設(shè)備執(zhí)行以實(shí)現(xiàn)產(chǎn)生重建音頻信號的方法的一個(gè)或多個(gè)指令程序的媒體,其中該方法包括接收包含代表從音頻信號獲得的基帶信號、估值的頻譜包絡(luò)、估值的時(shí)間包絡(luò)和噪聲混淆參數(shù)的數(shù)據(jù)的信號;從該數(shù)據(jù)獲得基帶信號的頻域代表;通過在頻率上變換基帶的頻譜分量而獲得包括再生的頻譜分量的再生的信號;調(diào)節(jié)再生的頻譜分量的相位以保持再生信號內(nèi)的相位相干性;響應(yīng)噪聲混淆參數(shù)獲得噪聲信號;通過按照估值的頻譜包絡(luò)調(diào)節(jié)再生頻譜分量的幅值和把它們與噪聲信號相組合,而獲得調(diào)節(jié)的再生信號;通過把第一合成濾波器庫應(yīng)用到基帶信號的頻域代表,而獲得基帶信號的時(shí)域代表;通過把第二合成濾波器庫應(yīng)用到調(diào)節(jié)的再生信號和按照估值的時(shí)間包絡(luò)應(yīng)用調(diào)制,而獲得調(diào)節(jié)的再生信號的時(shí)域代表;以及獲得重建信號的時(shí)域代表,以使它代表基帶信號的時(shí)域代表和調(diào)節(jié)的再生信號的時(shí)域代表的組合。
32.一種傳送由處理音頻信號的方法生成的輸出信號的媒體,其中該方法包括獲得具有音頻信號的某些但不是全部頻譜分量的基帶信號的頻域代表;獲得具有不在基帶信號中的音頻信號的頻譜分量的剩余信號的估值的頻譜包絡(luò);從剩余信號的噪聲含量的度量獲得噪聲混淆參數(shù);以及把代表基帶信號的頻域代表的數(shù)據(jù)、估值的頻譜包絡(luò)和噪聲混淆參數(shù)組裝成由媒體傳送的輸出信號。
33.權(quán)利要求32的媒體,其中該方法包括按照估值的時(shí)間包絡(luò)的倒數(shù),獲得時(shí)間上平坦化的至少一部分音頻信號的時(shí)間上平坦的代表,其中響應(yīng)時(shí)間上平坦的代表,獲得估值的頻譜包絡(luò)與噪聲混淆參數(shù);以及把數(shù)據(jù)組裝成代表估值的頻譜包絡(luò)的輸出信號。
全文摘要
通過發(fā)送或記錄具有估值的頻譜包絡(luò)和從信號的像噪聲那樣的質(zhì)量的度量得出的噪聲混淆參數(shù)的信號的基帶,音頻信號可以更加有效地傳送。信號是通過把基帶信號的頻譜分量變換到基帶以外的頻率,調(diào)節(jié)再生分量的相位以保持相位相關(guān)性,按照估值的頻譜包絡(luò)調(diào)節(jié)頻譜形狀,以及按照噪聲混淆參數(shù)加上噪聲,而被重建的。優(yōu)選地,發(fā)送的或記錄的信號也包括被使用來調(diào)節(jié)重建信號的時(shí)間形狀的估值的時(shí)間包絡(luò)。
文檔編號G10L21/00GK1639770SQ03805096
公開日2005年7月13日 申請日期2003年3月21日 優(yōu)先權(quán)日2002年3月28日
發(fā)明者邁克爾·M·杜魯門, 馬克·S·文頓 申請人:杜比實(shí)驗(yàn)室特許公司