專利名稱:用于對(duì)背景噪聲信息進(jìn)行解碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于對(duì)在語音信號(hào)編碼方法中的背景噪聲信息進(jìn)行解碼的方法和裝置。
背景技術(shù):
從電信的開始階段起,對(duì)于電話通話規(guī)定模擬語音傳輸?shù)膸捪拗啤T?00Hz至 3400Hz的有限制的頻段上進(jìn)行語音傳輸。也在用于當(dāng)今的數(shù)字電信的許多語音信號(hào)編碼方法中規(guī)定這種有限制的頻段。為 此,在編碼過程之前執(zhí)行模擬信號(hào)的帶寬限制。在此,將編解碼器用于編碼和用于解碼,根 據(jù)在300Hz和3400Hz之間的頻段中的所述帶寬限制,該編解碼器以下也稱為窄帶語音編解 碼器(Narrow Band Speech Codec,窄帶語音編解碼器)。在此,應(yīng)將編解碼器的概念既理 解為用于對(duì)音頻信號(hào)進(jìn)行數(shù)字編碼的編碼規(guī)范,也理解為以重建音頻信號(hào)為目標(biāo)對(duì)數(shù)據(jù)進(jìn) 行解碼的解碼規(guī)范。例如從ITU-T推薦標(biāo)準(zhǔn)G. 729中公知一種窄帶語音編解碼器。借助那里所述的編 碼規(guī)范,提供數(shù)據(jù)速率為8kbit/s的窄帶語音信號(hào)的傳輸。此外公知所謂的寬帶語音編解碼器(Wide Band Speech Codec,寬帶語音編解碼 器),這些寬帶語音編解碼器為了改善聽覺印象提供在擴(kuò)展的頻段中的編碼。這種擴(kuò)展的頻 段例如位于50Hz和7000Hz的頻率之間。例如從ITU-T推薦標(biāo)準(zhǔn)G. 729. EV中公知一種寬
帶語音編解碼器。通常以可縮放的方式配置用于寬帶語音編解碼器的編碼方法??煽s放性在這里指 的是,所傳輸?shù)木幋a數(shù)據(jù)含有不同的分界的塊,這些塊含有所編碼的語音信號(hào)的窄帶份額、 寬帶份額和/或全帶寬。這種可縮放的配置一方面允許接收機(jī)側(cè)的向下兼容性,并且另一 方面在傳輸信道中的數(shù)據(jù)傳輸容量有限制的情況下,該可縮放的配置提供在發(fā)送機(jī)側(cè)和接 收機(jī)側(cè)調(diào)整數(shù)據(jù)速率和所傳輸?shù)臄?shù)據(jù)幀大小的簡(jiǎn)單可能性。為了通過編解碼器降低數(shù)據(jù)傳輸速率,通常規(guī)定對(duì)要傳輸?shù)臄?shù)據(jù)進(jìn)行壓縮。例如 通過編碼方法來達(dá)到壓縮,在這些編碼方法中,為了對(duì)語音數(shù)據(jù)進(jìn)行編碼而確定激勵(lì)信號(hào) 的參數(shù)和濾波參數(shù)。然后向接收機(jī)傳輸濾波參數(shù)以及說明激勵(lì)信號(hào)的參數(shù)。在接收機(jī)處借 助編解碼器合成在主觀聽覺印象方面盡可能與原來的語音信號(hào)相似的合成語音信號(hào)。借助 該也稱為“Analysis-by-Synthesis (合成分析)”的方法,不傳輸所確定的和數(shù)字化的掃描 值(采樣)本身,而是傳輸所確定的實(shí)現(xiàn)語音信號(hào)在接收機(jī)側(cè)的合成的參數(shù)。用于降低數(shù)據(jù)傳輸速率的另一措施提供一種在專業(yè)領(lǐng)域也以概念DTX為人熟悉 的用于不連續(xù)傳輸(Discontinuous Transmission,不連續(xù)傳輸)的方法。DTX的基本目標(biāo) 是在語音間歇的情況下降低數(shù)據(jù)傳輸速率。為此在發(fā)送機(jī)側(cè)采用語音間歇識(shí)別(Voice Activity Detection,VAD,語音活動(dòng) 檢測(cè)),在低于特定信號(hào)電平的情況下,該語音間歇識(shí)別識(shí)別出語音間歇。通常,接收機(jī)在語音間歇期間不期望完全的靜音。相反地,完全的靜音在接收機(jī)側(cè)會(huì)導(dǎo)致誤解,或者甚至?xí)?dǎo)致連接中斷的猜測(cè)。由于該原因,應(yīng)用用于生成所謂的舒適噪聲 (Comfort Noise,舒適噪聲)的方法。舒適噪聲是為了填充接收機(jī)側(cè)上的靜音階段而合成的噪聲。舒適噪聲用于繼續(xù)存 在連接的主觀印象,而不要求用于語音信號(hào)的傳輸所提供的數(shù)據(jù)傳輸速率。換言之,在發(fā)送 機(jī)側(cè)對(duì)噪聲進(jìn)行編碼比對(duì)語音數(shù)據(jù)進(jìn)行編碼耗費(fèi)更小的成本。為了以在接收機(jī)側(cè)仍感知為 真實(shí)的方式對(duì)舒適噪聲進(jìn)行合成、即解碼,以低得多的數(shù)據(jù)速率來傳輸數(shù)據(jù)。在此情況下所 傳輸?shù)臄?shù)據(jù)在專業(yè)領(lǐng)域中也稱為SID (Silence Insertion Description,靜音插入描述)。在現(xiàn)有技術(shù)中,在用于采用諸如ITU-T G. 729. UG. 722. 2或3GPPAMR-WB的寬帶語 音編解碼器的情況下進(jìn)行不連續(xù)傳輸?shù)姆椒ㄖ写嬖趩栴}。所述可縮放的寬帶語音編解碼器 通常支持在50至7000Hz的寬帶范圍中的不同的數(shù)據(jù)傳輸速率。用于語音信息的編碼的可能數(shù)據(jù)速率例如是例如在標(biāo)準(zhǔn)G. 729. 1中所采用的8, 12,14,16,…,32kbit/s。8和12kbit/s的數(shù)據(jù)速率應(yīng)用于窄帶信號(hào)(50Hz至4kHz)。大 于12kbit/s的數(shù)據(jù)速率應(yīng)用于4至7kHz的高頻帶。在傳輸期間可以在所述的數(shù)據(jù)速率之間變換。在此,從窄帶數(shù)據(jù)速率突然變換 到寬帶數(shù)據(jù)速率眾所周知地引起對(duì)于人體接收器官的干擾效應(yīng)。例如由于數(shù)據(jù)流的切 斷(Bitstream Truncation,位流切斷)實(shí)現(xiàn)這種過渡,該過渡例如通過發(fā)送機(jī)和接收 機(jī)之間的傳輸網(wǎng)絡(luò)引起,例如由于建立其它附加的連接或由于該傳輸網(wǎng)絡(luò)中的數(shù)據(jù)擁塞 (Congestion,擁塞)。所述切斷導(dǎo)致數(shù)據(jù)速率的變化,并最終導(dǎo)致語音信號(hào)從寬帶傳輸向窄 帶傳輸?shù)倪^渡。如果在編碼器中應(yīng)用不連續(xù)傳輸或DTX方法的方法,則可以節(jié)省傳輸各個(gè)數(shù)據(jù)幀 的數(shù)據(jù)傳輸速率。當(dāng)將相應(yīng)的幀表征為語音間歇時(shí),則恰好采用DTX方法。在DTX方法的 應(yīng)用中,由于兩個(gè)因素達(dá)到了在所傳輸?shù)膸系慕档偷臄?shù)據(jù)傳輸速率。首先,在編碼器側(cè)不 必向解碼器發(fā)送所有的無效幀。其次,所發(fā)送的SID幀或無效幀比語音數(shù)據(jù)幀占用少得多 的位。這種方法在編碼器側(cè)要求語音間歇識(shí)別(VAD)的參與。借助語音間歇檢測(cè)器來 通知發(fā)送機(jī)側(cè)的編碼器含有掃描值和要編碼的當(dāng)前的幀是否含有語音信號(hào)或者是否含 有具有背景噪聲的語音間歇。借助該特征在編碼器中采取確定無效幀(Inactive Speech Frame,無效語音幀)的感知特征(Perceptional Characteristics,感知特征)的措施。例 如平均的能量以及頻譜和時(shí)間的特征屬于這種感知特征。編碼器隨即向解碼器發(fā)送專門標(biāo)記的幀、即SID幀(Silencelnsertion Descriptor,靜音插入描述符)。解碼器基于在SID幀中所含有的信息合成舒適噪聲,其中 解碼器可以根據(jù)SID幀確定,所含有的噪聲信息是否涉及窄帶信息或?qū)拵畔?。在窄帶信息和寬帶信息之間的數(shù)據(jù)速率的變換(“BitrateSwitching”,位速率轉(zhuǎn) 換)是每個(gè)可縮放的寬帶語音編解碼器的常見情形。雖然在文獻(xiàn)中已充分描述對(duì)在正常語 音階段期間一即不存在語音間歇一的數(shù)據(jù)速率變換的處理,然而目前還不知道在進(jìn)入DTX 階段時(shí)的處理。因此產(chǎn)生了緊迫的需求,所述需求是說明一種用于在DTX階段期間和/或在進(jìn)入 DTX階段時(shí)的數(shù)據(jù)速率變換的方法,以便在過渡到DTX階段之前或期間,最佳地對(duì)在窄帶數(shù) 據(jù)速率和寬帶數(shù)據(jù)速率之間的變換做出反應(yīng)。
在語音間歇期間,數(shù)據(jù)速率的切斷是不太可能的,因?yàn)镾ID幀的數(shù)據(jù)占用 (Bitstream Relocation,位流的重定位)無論如何比在“正常的”編解碼器操作一即在專 有的語音階段期間的編解碼器操作一中的有效語音數(shù)據(jù)幀需要更少的位。這導(dǎo)致一種可能的情形,其中數(shù)據(jù)速率在有效的語音階段期間被改變,但是在語 音間歇中,也就是在DTX階段期間該數(shù)據(jù)速率保留在寬帶模式中。在此,由于對(duì)解碼器側(cè)的 人體接收器官的強(qiáng)烈干擾,在這種狀況下推薦以窄帶方式對(duì)有效語音幀進(jìn)行解碼并且以寬 帶方式再現(xiàn)語音間歇中的背景噪聲。這種狀況例如以高概率出現(xiàn)在如下情況中在所述情況中,編碼器側(cè)所發(fā)送的語 音數(shù)據(jù)幀被傳輸網(wǎng)絡(luò)切斷,但是在傳輸網(wǎng)絡(luò)側(cè)仍剩余足夠的容量以傳輸寬帶SID幀。迄今沒有公知用于在語音間歇期間變換SID幀的數(shù)據(jù)速率的方法。用于變換數(shù)據(jù) 速率的已有方法僅僅涉及在有效語音階段期間的正常的編解碼器運(yùn)行。
發(fā)明內(nèi)容
本發(fā)明的任務(wù)是說明一種用于在語音間歇期間變換SID幀的數(shù)據(jù)速率的方法,該 方法具有改善了的在解碼器上合成的信號(hào)質(zhì)量的結(jié)果。通過獨(dú)立權(quán)利要求的主題來解決該任務(wù)。本發(fā)明的基本思想在于,對(duì)在有效語音階段期間關(guān)于帶寬轉(zhuǎn)換(Bitrate Switching,位速率轉(zhuǎn)換)過程的信息進(jìn)行確定。在此,根據(jù)本發(fā)明所采用的語音信號(hào)編碼 方法或編解碼器的可縮放特性已經(jīng)表達(dá)了編解碼器用于帶寬轉(zhuǎn)換的可能性。根據(jù)本發(fā)明在語音階段期間,在解碼器側(cè),關(guān)于寬帶有效語音幀與窄帶有效語音 幀相比的百分比份額的信息被采集。換言之,不像迄今在現(xiàn)有技術(shù)中提議的那樣,在變換到 語音間歇的時(shí)刻才采集關(guān)于背景噪聲特性的信息。在此,寬帶有效語音幀的高百分比份額 顯示出,在編解碼器側(cè)優(yōu)選寬帶應(yīng)用,因此存在在DTX階段期間以寬帶方式合成噪聲信息、 即對(duì)噪聲信息進(jìn)行解碼的需求。如果相反地確定低的百分比份額,甚至當(dāng)所接收的SID幀 可能允許合成一即解碼一寬帶噪聲時(shí),也在解碼器側(cè)在進(jìn)入DTX階段時(shí)生成窄帶噪聲。利用這里所介紹的本發(fā)明方法足以解決本發(fā)明的任務(wù),即說明一種用于在語音間 歇期間變換SID幀的數(shù)據(jù)速率的方法。根據(jù)這里所介紹的發(fā)明解決方案,根據(jù)所述任務(wù)要 解決的在具有不同數(shù)據(jù)速率的噪聲信息之間的變換,被細(xì)化為確定具有不同數(shù)據(jù)速率的噪 聲信息的份額。與變換相反地,所述份額可以用在具有不同數(shù)據(jù)速率的噪聲信息之間的任 意比例來調(diào)節(jié)。通過將噪聲信號(hào)質(zhì)量調(diào)節(jié)或匹配到以前所采集的語音信號(hào)質(zhì)量(窄帶/寬帶)上 的可調(diào)節(jié)性或可匹配性,對(duì)于整個(gè)信號(hào),也就是噪聲信號(hào)和語音信號(hào),在接收機(jī)側(cè)整體上得 出顯著提高的信號(hào)質(zhì)量。因此,根據(jù)本發(fā)明的方法解決了本發(fā)明的任務(wù),即獲得改善了的在 解碼器上合成的信號(hào)的質(zhì)量。根據(jù)本發(fā)明方法的這種方案證明對(duì)于本發(fā)明的作為從屬權(quán)利要求主題的有利改 進(jìn)方案是基本性的。如果根據(jù)本發(fā)明方法做出如下決策、即在語音間歇期間以特定質(zhì)量(即寬帶或窄 帶地)合成噪聲信號(hào),則可能出現(xiàn)以下的情況在有效語音階段期間的最后幾個(gè)幀中,在網(wǎng) 絡(luò)側(cè)發(fā)生對(duì)有效數(shù)據(jù)幀的切斷。
為了解釋首先假設(shè),所采用的編解碼器優(yōu)選寬帶再現(xiàn)方式,并且過去通過傳輸網(wǎng) 絡(luò)也大多數(shù)確保寬帶傳輸方式。這可能導(dǎo)致以下的情況在接收解碼器上接收到首批SID 幀之前,少數(shù)有效語音幀作為窄帶語音幀到達(dá)該接收解碼器。在此情況下,在沒有附加措施的情況下,在首批少數(shù)SID幀期間可能進(jìn)行從窄帶 語音信號(hào)到寬帶噪聲信號(hào)的突然過渡。用于重新調(diào)節(jié)到寬帶接收條件的這種過渡一般是如 此重要,但是該過渡對(duì)于接收者則感覺為有干擾性的。因此,根據(jù)本發(fā)明的擴(kuò)展方案規(guī)定,在進(jìn)入DTX階段時(shí),首先對(duì)背景噪聲信息進(jìn)行 主要是窄帶的解碼,該主要是窄帶的解碼在可調(diào)節(jié)時(shí)間段之后過渡到主要是寬帶的解碼。 因此優(yōu)選準(zhǔn)連續(xù)地進(jìn)行這種過渡,其中按照特定的份額因子在離散的時(shí)刻一因此“準(zhǔn)”連續(xù) 地一來調(diào)節(jié)過渡。根據(jù)本發(fā)明的擴(kuò)展方案,建議一種用于快速轉(zhuǎn)換的方法,在該方法中在IOOms的 特定時(shí)間幀之內(nèi),執(zhí)行從窄帶(份額因子=0)噪聲信號(hào)質(zhì)量到寬帶(份額因子=1)噪聲 信號(hào)質(zhì)量的準(zhǔn)連續(xù)過渡。在解碼器側(cè)執(zhí)行該過渡。根據(jù)本發(fā)明的擴(kuò)展方案,份額因子的以下值已證明對(duì)于主觀的人體聽覺感受為特 別有利的在進(jìn)入DTX階段的時(shí)刻份額因子為0,因而僅有窄帶噪聲;在進(jìn)入DTX階段之后20ms的時(shí)刻,份額因子為0. 09525986892242 ;在進(jìn)入DTX階段之后40ms的時(shí)刻,份額因子為0. 19753086419753 ;在進(jìn)入DTX階段之后60ms的時(shí)刻,份額因子為0. 36595031245237 ;在進(jìn)入DTX階段之后80ms的時(shí)刻,份額因子為0. 62429507696997 ;禾口在進(jìn)入DTX階段之后IOOms的時(shí)刻,份額因子為1,因而僅有寬帶噪聲。氺氺氺根據(jù)本發(fā)明的擴(kuò)展方案假設(shè),所采用的編解碼器優(yōu)選窄帶的再現(xiàn)方式和/或過去 不能通過傳輸網(wǎng)絡(luò)確保寬帶傳輸方式。這可導(dǎo)致以下的情況在接收的解碼器中接收到首 批SID幀之前,少數(shù)有效語音幀作為寬帶語音幀到達(dá)該接收的解碼器。根據(jù)本發(fā)明的擴(kuò)展方案規(guī)定,在進(jìn)入DTX階段時(shí),首先對(duì)背景噪聲信息進(jìn)行主要 是寬帶的解碼,該主要是寬帶的解碼在可調(diào)節(jié)時(shí)間段之后過渡到主要是窄帶的解碼。類似 于上述擴(kuò)展方案,優(yōu)選準(zhǔn)連續(xù)地進(jìn)行這種過渡,其中按照特定的份額因子在離散時(shí)刻來調(diào) 節(jié)過渡。根據(jù)本發(fā)明的擴(kuò)展方案建議一種用于快速轉(zhuǎn)換(Fast Switching,快速轉(zhuǎn)換)的 方法,在該方法中在IOOms的特定時(shí)間幀之內(nèi),執(zhí)行從寬帶(份額因子=1)噪聲信號(hào)質(zhì)量 到窄帶(份額因子=0)噪聲信號(hào)質(zhì)量的準(zhǔn)連續(xù)過渡。在解碼器側(cè)執(zhí)行該過渡。為了準(zhǔn)連續(xù)地從寬帶噪聲信號(hào)質(zhì)量過渡到窄帶噪聲信號(hào)質(zhì)量,調(diào)節(jié)具有像上面那 樣的不過以相反順序的值的份額因子。
以下借助附圖詳細(xì)闡述本發(fā)明的具有其它優(yōu)點(diǎn)和擴(kuò)展方案的實(shí)施例。圖1示出具有多次帶寬轉(zhuǎn)換和一次進(jìn)入語音間歇的在發(fā)送機(jī)和接收機(jī)之間的數(shù) 據(jù)速率的時(shí)間示圖,其中SID幀被發(fā)送;
圖2A示出帶寬轉(zhuǎn)換的第一情形的示意圖;圖2B示出帶寬轉(zhuǎn)換的第二情形的示意圖;和圖3示出在解碼器側(cè)實(shí)施的轉(zhuǎn)換過程,該轉(zhuǎn)換過程具有從窄帶噪聲信號(hào)質(zhì)量到寬 帶噪聲信號(hào)質(zhì)量的準(zhǔn)連續(xù)過渡。
具體實(shí)施例方式圖1中示出具有各數(shù)據(jù)速率DR的語音數(shù)據(jù)幀的時(shí)間上的傳輸,以及從第三時(shí)刻t3 開始的SID幀的傳輸。在第一時(shí)刻tl之前用32kbit/s的數(shù)據(jù)速率進(jìn)行寬帶有效語音幀的傳輸。從時(shí)刻 tl開始進(jìn)行到22kb it/s的數(shù)據(jù)速率的轉(zhuǎn)換,并從第二時(shí)刻t2開始進(jìn)行到12kbit/s的數(shù) 據(jù)速率的轉(zhuǎn)換。12kbit/s的數(shù)據(jù)速率已經(jīng)相當(dāng)于窄帶語音幀。在第三時(shí)刻t3假設(shè),由于語音間歇在發(fā)送機(jī)側(cè)進(jìn)行到DTX階段的過渡。因此從第 三時(shí)刻t3開始,在確定的時(shí)間周期中發(fā)送SID幀SID?,F(xiàn)在從第三時(shí)刻t3開始出現(xiàn)之前所闡述的情況,在過去一在第二時(shí)刻t2和第三 時(shí)刻t3之間的時(shí)間階段期間一已傳送窄帶語音信號(hào),其中從第三時(shí)刻t3開始從現(xiàn)在起通 過相應(yīng)的SID幀提供寬帶噪聲信號(hào)。在每個(gè)SID幀的長(zhǎng)度為43位并且每個(gè)所發(fā)送SID幀 的周期為20ms的情況下,SID幀的數(shù)據(jù)速率對(duì)應(yīng)于43bit/20ms = 2. 15kbit/s。在此情況下出現(xiàn)如下狀況在解碼器側(cè)可能進(jìn)行從窄帶語音信號(hào)到寬帶噪聲信號(hào) 的直接的、即不連續(xù)的過渡。這種突然的過渡對(duì)于人體接收器官感覺為特別有干擾性的。圖2A和圖2B示出數(shù)據(jù)速率DR隨時(shí)間t的變化曲線的兩種可能情形。在圖2A中,由于網(wǎng)絡(luò)的限制或由于另外的情況,傳輸基本上以窄帶方式進(jìn)行,在 圖2A的示例中以8kbit/s進(jìn)行,而在第一時(shí)刻tl和第二時(shí)刻t2之間的少數(shù)的時(shí)刻,例外 地以32kbit/s進(jìn)行寬帶傳輸。在圖2B中又記錄了相反的情況,即在大多數(shù)時(shí)間以32kbit/s進(jìn)行的寬帶傳輸方 式和在第四時(shí)刻t4與第五時(shí)刻t5之間例外地短暫地進(jìn)行的窄帶傳輸方式。以下在圖2A示例的時(shí)刻t3以及在圖2B示例的時(shí)刻t6假設(shè),進(jìn)行到DTX階段的 進(jìn)入。根據(jù)本發(fā)明的方式,在解碼器側(cè)的語音階段期間,采集關(guān)于寬帶有效語音幀與窄 帶有效語音幀相比的份額的信息。在此對(duì)于圖2A的示例,應(yīng)將寬帶有效語音幀的百分比份額稱為很低的,而在圖2B 的示例中存在寬帶有效語音幀的高百分比份額。在圖2A的示例中在時(shí)刻t3進(jìn)入DTX階段時(shí),現(xiàn)在通過應(yīng)用本發(fā)明的方法來生成 窄帶噪聲,盡管從時(shí)刻t3開始所接收(沒有示出)的SID幀可能允許合成寬帶噪聲。相反在圖2B的示例中,在時(shí)刻t6隨著在時(shí)刻t6開始的DTX階段,優(yōu)選以寬帶方
式合成噪聲信息。在圖3中繪出關(guān)于以ms為單位給出的時(shí)間TIME的噪聲信號(hào)質(zhì)量HB-SHARE。在 此,圖3示出緊接在根據(jù)以上圖2B的情形之后的噪聲信號(hào)的配置,在該配置中,由于在解碼 器側(cè)所確定的寬帶有效語音幀的百分比份額,已確定在DTX階段期間以寬帶方式合成噪聲 信息的需求。
在圖3的示圖中,在所示時(shí)刻TIME為Oms時(shí)進(jìn)行到DTX階段中的過渡。為了準(zhǔn)連 續(xù)地配置該從窄帶語音信號(hào)到寬帶噪聲信號(hào)的過渡一這已證明是對(duì)于人體接收器官的主 觀聽覺感受最有利的擴(kuò)展方案,在該時(shí)刻TIME以僅僅窄帶的信號(hào)開始,即以寬帶噪聲的份 額HB-SHARE為0開始。在IOOms的時(shí)刻,寬帶噪聲份額是1或100%。在實(shí)踐中,為了從在 時(shí)刻TIME = Oms的僅僅窄帶的噪聲信號(hào)準(zhǔn)連續(xù)地過渡到在時(shí)刻TIME = IOOms的僅僅寬帶 的噪聲信號(hào),已經(jīng)證實(shí)在多個(gè)離散時(shí)刻TIME的份額HB-SHARE的下列值在時(shí)刻TIME = 20ms,份額 HB-SHARE 為 0. 09525986892242 ;在時(shí)刻TIME = 40ms,份額 HB-SHARE 為 0. 19753086419753 ;在時(shí)刻TIME = 60ms,份額 HB-SHARE 為 0. 36595031245237 ;在時(shí)刻TIME = 80ms,份額 HB-SHARE 為 0. 62429507696997。本發(fā)明的另一實(shí)施方式以相似的方式提供從寬帶語音信號(hào)到窄帶噪聲信號(hào)的過 渡。為此首先參照?qǐng)D2A假設(shè)一種輕微改變的情形,其中與圖2A中所示情形不同,在時(shí) 刻t3之前不久還對(duì)具有32kbit/s的寬帶傳輸(沒有示出)進(jìn)行改變。盡管有該“尖峰”, 但是寬帶有效語音幀的百分比份額仍然保持很低,使得從現(xiàn)在起在進(jìn)入到DTX階段的過渡 時(shí)仍要合成噪聲信號(hào),該噪聲信號(hào)以寬帶方式開始,但是一由于大多數(shù)的窄帶傳輸歷史和 因此未來期望窄帶傳輸特性的延續(xù)一將被轉(zhuǎn)化為窄帶噪聲信號(hào)。為了準(zhǔn)連續(xù)地配置從寬帶 語音信號(hào)到窄帶噪聲信號(hào)的這種過渡,在進(jìn)入到DTX階段時(shí)用僅僅寬帶的信號(hào)、即用份額 HB-SHARE為1的寬帶噪聲開始。在IOOms的時(shí)刻,窄帶噪聲份額為0。為了從在進(jìn)入DTX 階段時(shí)刻的僅僅寬帶的噪聲信號(hào)準(zhǔn)連續(xù)地過渡到在IOOms之后的時(shí)刻的僅僅窄帶的噪聲 信號(hào),有利地以相反的順序調(diào)節(jié)上面所建議的值。這對(duì)應(yīng)于根據(jù)圖3的在縱坐標(biāo)HB-SHARE 上鏡像的曲線。
權(quán)利要求
一種應(yīng)用可縮放的語音信號(hào)編碼方法來對(duì)用于傳送背景噪聲信息的SID幀(SID)進(jìn)行解碼的方法,具有以下的步驟確定在語音間歇期間所接收的寬帶語音幀與要接收的窄帶語音幀相比的份額,對(duì)在進(jìn)入DTX階段時(shí)在SID幀中所含有的背景噪聲信息進(jìn)行解碼,其中按照所確定的份額進(jìn)行解碼。
2.按照權(quán)利要求1的方法,其特征在于,在確定進(jìn)入DTX階段時(shí)所接收的寬帶語音幀的 高份額的情況下,對(duì)背景噪聲信息進(jìn)行主要是寬帶的解碼。
3.按照權(quán)利要求2的方法,其特征在于,在進(jìn)入DTX階段時(shí),首先對(duì)背景噪聲信息進(jìn)行 主要是窄帶的解碼,該主要是窄帶的解碼在可調(diào)節(jié)時(shí)間段之后過渡到主要是寬帶的解碼。
4.按照權(quán)利要求3的方法,其特征在于,能夠用表達(dá)寬帶噪聲信號(hào)質(zhì)量與窄帶噪聲信 號(hào)質(zhì)量之間的比例的份額因子(HB-SHARE)來調(diào)節(jié)到主要是寬帶的解碼的過渡。
5.按照權(quán)利要求4的方法,其特征在于,在進(jìn)入DTX階段的時(shí)刻,所述份額因子的大小 被確定為零。
6.按照權(quán)利要求4或5的方法,其特征在于,在進(jìn)入DTX階段之后IOOms的時(shí)刻,所述 份額因子的大小被確定為1。
7.按照權(quán)利要求4至6之一的方法,其特征在于,所述份額因子的大小 -在進(jìn)入DTX階段之后20ms的時(shí)刻被確定為0. 09525986892242 ;-在進(jìn)入DTX階段之后40ms的時(shí)刻被確定為0. 19753086419753 ; -在進(jìn)入DTX階段之后60ms的時(shí)刻被確定為0. 36595031245237 ;知 -在進(jìn)入DTX階段之后80ms的時(shí)刻被確定為0. 62429507696997。
8.按照權(quán)利要求1的方法,其特征在于,在確定進(jìn)入DTX階段時(shí)所接收的寬帶語音幀的 份額低的情況下,對(duì)背景噪聲信息進(jìn)行主要是窄帶的解碼。
9.按照權(quán)利要求8的方法,其特征在于,在進(jìn)入DTX階段時(shí),首先對(duì)背景噪聲信息進(jìn)行 主要是寬帶的解碼,該主要是寬帶的解碼在可調(diào)節(jié)時(shí)間段之后過渡到主要是窄帶的解碼。
10.按照權(quán)利要求9的方法,其特征在于,能夠用表達(dá)寬帶噪聲信號(hào)質(zhì)量與窄帶噪聲信 號(hào)質(zhì)量之間的比例的份額因子(HB-SHARE)來調(diào)節(jié)到主要是窄帶的解碼的過渡。
11.按照權(quán)利要求10的方法,其特征在于,在進(jìn)入DTX階段的時(shí)刻,所述份額因子的大 小被確定為1。
12.按照權(quán)利要求10或11的方法,其特征在于,在進(jìn)入DTX階段之后IOOms的時(shí)刻,所 述份額因子的大小被確定為零。
13.按照權(quán)利要求10至12之一的方法,其特征在于,所述份額因子的大小 -在進(jìn)入DTX階段之后20ms的時(shí)刻被確定為0. 62429507696997 ;-在進(jìn)入DTX階段之后40ms的時(shí)刻被確定為0. 36595031245237 ; -在進(jìn)入DTX階段之后60ms的時(shí)刻被確定為0. 19753086419753 ;和 -在進(jìn)入DTX階段之后80ms的時(shí)刻被確定為0. 09525986892242。
14.一種編解碼器,具有用于執(zhí)行按照權(quán)利要求1至13之一的方法的裝置。
15.按照權(quán)利要求14的編解碼器,其特征在于在本身公知的ITU-T標(biāo)準(zhǔn)G.729. 1中的 實(shí)施。
全文摘要
本發(fā)明的基本思想在于,對(duì)在有效語音階段期間關(guān)于帶寬轉(zhuǎn)換(Bitrate Switching,位速率轉(zhuǎn)換)過程的信息進(jìn)行確定。根據(jù)本發(fā)明在語音階段期間,在解碼器側(cè),關(guān)于寬帶有效語音幀與窄帶有效語音幀相比的百分比份額的信息被采集。在此,寬帶有效語音幀的高百分比份額顯示出,在編解碼器側(cè)優(yōu)選寬帶的應(yīng)用,因此存在在DTX階段期間以寬帶方式合成噪聲信息的需求。
文檔編號(hào)G10L19/00GK101946281SQ200980105637
公開日2011年1月12日 申請(qǐng)日期2009年2月2日 優(yōu)先權(quán)日2008年2月19日
發(fā)明者H·塔戴, P·塞蒂亞萬, S·尚德爾 申請(qǐng)人:西門子企業(yè)通訊有限責(zé)任兩合公司