專利名稱:通過分組交換網(wǎng)絡(luò)的傳輸?shù)闹谱鞣椒?br>
技術(shù)領(lǐng)域:
本發(fā)明涉及對數(shù)字化聲音信號的編碼和通過分組交換網(wǎng)絡(luò)對編碼數(shù)字化聲音信號的傳輸,其中,以提供分集的方式執(zhí)行編碼和傳輸。
因此,本發(fā)明還涉及對數(shù)據(jù)分組的接收和對其內(nèi)容的解碼,以提取原始傳輸?shù)臄?shù)字化聲音信號,其中,以利用由接收分組提供的分集的方式執(zhí)行解碼。
背景技術(shù):
和現(xiàn)有技術(shù)通過分組交換網(wǎng)絡(luò)如基于IP(Internet Protocol,網(wǎng)際協(xié)議)的網(wǎng)絡(luò)(主要是因特網(wǎng)或內(nèi)部網(wǎng))的電話由于很多特性而日益具有吸引力。這些特性包括諸如相對低的運(yùn)營成本、容易集成新業(yè)務(wù)以及一個(gè)網(wǎng)絡(luò)就可用于語音和數(shù)據(jù)。分組交換系統(tǒng)中的語音或音頻信號轉(zhuǎn)換為數(shù)字信號,即比特流,它分為多個(gè)具有適當(dāng)大小的部分,以通過分組交換網(wǎng)絡(luò)從發(fā)送器端傳輸?shù)浇邮掌鞫恕?br>
分組交換網(wǎng)絡(luò)最初設(shè)計(jì)為用于傳輸非實(shí)時(shí)數(shù)據(jù),并且通過這種網(wǎng)絡(luò)傳輸語音將導(dǎo)致一些問題。因?yàn)閿?shù)據(jù)分組會由于擁堵問題或傳輸錯(cuò)誤而被網(wǎng)絡(luò)有意丟棄,所以它們在傳輸期間會發(fā)生丟失。在非實(shí)時(shí)應(yīng)用中,這不是問題,因?yàn)閬G失的分組可以被重新傳輸。然而,重新傳輸對于實(shí)時(shí)應(yīng)用而言不是一個(gè)可能的解決方案。對于實(shí)時(shí)應(yīng)用,到達(dá)太遲的分組不能用來重構(gòu)相應(yīng)的信號,因?yàn)樵撔盘栆呀?jīng)或應(yīng)該已經(jīng)被傳送到接收揚(yáng)聲器。因此,到達(dá)太遲的分組相當(dāng)于丟失的分組。
IP網(wǎng)絡(luò)的一個(gè)特性是,如果一個(gè)分組到達(dá),則其內(nèi)容未被破壞。IP分組具有一個(gè)首標(biāo),其中包括CRC(Cyclic Redundancy Check,循環(huán)冗余校驗(yàn))字段。CRC用來檢查分組內(nèi)容是否未被破壞。如果CRC表示一個(gè)錯(cuò)誤,則丟棄該分組。換句話說,不存在比特錯(cuò)誤,只有分組丟失。
丟失或延遲的數(shù)據(jù)分組所帶來的主要問題是給重構(gòu)的語音或音頻信號帶來失真。失真是由于這一事實(shí)而產(chǎn)生的不能重構(gòu)由丟失或延遲的數(shù)據(jù)分組傳達(dá)的信號段?,F(xiàn)今所使用的語音編碼器最初設(shè)計(jì)用于其信道不存在錯(cuò)誤或信道具有比特錯(cuò)誤特性的電路交換網(wǎng)絡(luò)。因此,這些語音編碼器的問題是它們不能很好地處理分組丟失。
鑒于上述內(nèi)容以及分組交換網(wǎng)絡(luò)的其他細(xì)節(jié),所存在的問題就是如何在通過分組交換網(wǎng)絡(luò)的電話中提供與通過電路交換網(wǎng)絡(luò)的普通電話相同的質(zhì)量。為了解決這些問題,必須考慮分組交換網(wǎng)絡(luò)的特性。
在通過分組交換網(wǎng)絡(luò)傳輸數(shù)據(jù)的系統(tǒng)中,一個(gè)或多個(gè)首標(biāo)加到每個(gè)數(shù)據(jù)分組。這些首標(biāo)包含具有分組目的地、發(fā)送者地址、分組內(nèi)的數(shù)據(jù)大小信息的數(shù)據(jù)字段,以及其他與分組傳輸相關(guān)的數(shù)據(jù)字段。加到分組的首標(biāo)大小構(gòu)成必須加以考慮的開銷信息。為了保持小的數(shù)據(jù)分組的分組組裝延遲,數(shù)據(jù)分組的有效負(fù)荷具有有限大小。有效負(fù)荷是分組內(nèi)由一應(yīng)用所使用的信息。與包括開銷信息在內(nèi)的實(shí)際傳輸數(shù)據(jù)分組的大小相比,有效負(fù)荷的大小是一種考慮有效帶寬量時(shí)的重要尺度。傳輸若干相對小的數(shù)據(jù)分組的問題是首標(biāo)的大小與對應(yīng)用有用的信息的大小相比將是相當(dāng)大的。實(shí)際上,首標(biāo)的大小往往大于有用信息的大小。
為了減輕帶寬問題,最好通過對所要傳輸?shù)男畔⑦M(jìn)行適當(dāng)?shù)木幋a來減小比特速率。然而,通過編碼減小比特速率的優(yōu)點(diǎn)不大顯著,并且如果在傳輸數(shù)據(jù)分組之前將非常大的首標(biāo)形式的開銷加到應(yīng)用信息,帶寬仍然是一個(gè)問題。
一個(gè)經(jīng)常用來減小比特速率的方案是使用數(shù)據(jù)預(yù)測來對信息數(shù)據(jù)進(jìn)行編碼。這些預(yù)測是根據(jù)相同信息信號的前面信息數(shù)據(jù)來生成的。然而,由于在傳輸期間分組會丟失這一現(xiàn)象,插入不同分組之間的依賴性不是一個(gè)好主意。如果分組丟失并且后面信息段的重構(gòu)依賴于包含在丟失分組中的信息,則后面信息段的重構(gòu)將出現(xiàn)問題。避免這種誤差傳播是重要的。因此這種使用預(yù)測來減小語音或音頻信號的比特速率的普通方法對于這種傳輸信道而言是無效的,因?yàn)檫@種預(yù)測將導(dǎo)致誤差傳播。因此,存在一個(gè)問題是,當(dāng)傳輸具有語音或音頻信號信息的數(shù)據(jù)分組時(shí),如何在分組交換系統(tǒng)中提供預(yù)測。
為了克服實(shí)時(shí)傳輸期間的與丟失或延遲的數(shù)據(jù)分組相關(guān)聯(lián)的問題,通過分組交換網(wǎng)絡(luò)的傳輸引入分集是適合的。分集是在時(shí)間上(如在移動(dòng)電話的交織中)或通過一些物理實(shí)體(如當(dāng)使用多個(gè)接收天線時(shí))對信息進(jìn)行擴(kuò)展來提高傳輸穩(wěn)健性的方法。在分組傳輸中,最好通過找到某種方式來創(chuàng)建分組間的分集,在分組級別上引入分集。在分組交換網(wǎng)絡(luò)中創(chuàng)建分集的最簡單的方式是在兩個(gè)不同的分組中將相同的分組有效負(fù)荷傳輸兩次。采用這種方式,丟失或延遲的數(shù)據(jù)分組將不打擾有效負(fù)荷信息的傳輸,因?yàn)樽羁赡苓m時(shí)地接收具有相同有效負(fù)荷的另一分組。這種方式的缺點(diǎn)是在帶寬方面它不是非常高效,因?yàn)榫W(wǎng)絡(luò)或信道需要承載兩倍信息量。
使用分集以減小分組丟失對因特網(wǎng)電話應(yīng)用的音頻質(zhì)量的影響的一個(gè)例子由Bolot S.等人公開于“Adaptive FEC-Based Error Control forInteractive Audio in the Internet(對因特網(wǎng)交互式音頻的自適應(yīng)基于FEC的錯(cuò)誤控制)”,IEEE Infocom′99,紐約,美國,1999年3月。Bolot描述如何使用前向糾錯(cuò)(FEC,F(xiàn)orward Error Correction)方案來創(chuàng)建分集。在這些FEC方案中,音頻分組的冗余版本與后面分組的原始信息一起傳輸。如果具有原始信息的分組丟失,則后面分組中的冗余信息可以用來部分重構(gòu)表示原始信息的樣本。這是通過使用低速率編碼器(與原始編碼器相比速率低得多)對信號進(jìn)行編碼并且作為冗余信息傳輸該低碼率信號來實(shí)現(xiàn)的。然而,這種解決方案存在很多缺點(diǎn)。因?yàn)閷θ哂嘈畔⑿枰~外且不同的編碼方案,所以編碼系統(tǒng)的復(fù)雜性將提高。另外,編碼器對硬件的要求更高,以在低速率上提供合理的質(zhì)量。而且,接收端將相應(yīng)需要兩個(gè)不同類型的解碼器,并且在分組丟失的情況下,能夠根據(jù)來自這兩個(gè)不同類型解碼器的交織信息無縫地再現(xiàn)語音。
上述分集方案或分集系統(tǒng)存在這樣的缺點(diǎn)聲音信號的傳輸在正常工作狀態(tài)下不受益于所傳輸?shù)娜哂嘈畔⑺璧念~外帶寬。因此,對于大部分時(shí)間,當(dāng)不存在分組丟失或延遲時(shí),額外帶寬將只是用于傳輸開銷信息。
因?yàn)閹捊?jīng)常是有限資源,所以如果所傳輸?shù)穆曇粜盘柲軌蛞阅撤N方式受益于分集系統(tǒng)所需的額外帶寬,將是理想的。最好,如果額外的帶寬能夠用來在接收端改善解碼聲音信號的質(zhì)量,將是理想的。
在“Design of Multiple Description Scalar Quantizers(多描述分級量化器的設(shè)計(jì))”,V.A.Vaishampayan,IEEE Transactions on InformationTheory(IEEE信息理論學(xué)報(bào)),Vol.39,No.3,1993年5月中,公開在分集系統(tǒng)中對多描述的使用。編碼器通過兩個(gè)不同的信道發(fā)送相同源信號的兩個(gè)不同描述,并且解碼器根據(jù)從當(dāng)前工作的信道接收的信息重構(gòu)源信號。因此,如果只有一個(gè)信道工作,重構(gòu)信號的質(zhì)量將基于一個(gè)描述。如果兩個(gè)信道都工作,所再現(xiàn)的源信號將基于兩個(gè)描述,并且在接收端獲得更高的質(zhì)量。在該文章中,作者解決了索引分配問題,從而最大化分集系統(tǒng)中多個(gè)描述的好處。
在EP 0 856 956 A1中,公開了一種多描述編碼通信系統(tǒng)。該發(fā)明使用變換編碼,其中,采用對偶變換(pairing transform)對系數(shù)對進(jìn)行變換,以得到具有大致相等能量的新系數(shù)對。分別對這些系數(shù)進(jìn)行編碼,并且在不同的分組中進(jìn)行傳輸。通過這種方式,原始系數(shù)的信息在兩個(gè)分組中,并且獲得對丟失一個(gè)分組的穩(wěn)健性,因?yàn)榉磳ε甲儞Q(inverse pairingtransform)將根據(jù)所接收的一個(gè)系數(shù)產(chǎn)生兩個(gè)系數(shù),但是分辨率會小些。這種系統(tǒng)的一個(gè)缺點(diǎn)是效率低,因?yàn)閮H為了互補(bǔ)以達(dá)到冗余的目的,就使用兩個(gè)不同類型的量化器,并且當(dāng)接收到系數(shù)對時(shí),并不改善圖像質(zhì)量。
因此,關(guān)于通過分組交換網(wǎng)絡(luò)傳輸聲音信號,所要解決的問題是如何實(shí)現(xiàn)使用多描述、提供良好運(yùn)行特性、帶寬高效且保持復(fù)雜度低的分集系統(tǒng)。
發(fā)明概要本發(fā)明的一個(gè)目的是克服在通過分組交換網(wǎng)絡(luò)的實(shí)時(shí)通信傳輸期間丟失、丟棄或延遲數(shù)據(jù)分組的問題。
本發(fā)明的另一個(gè)目的是提供一種改進(jìn)方法,這種方法有助于當(dāng)對所要傳輸?shù)恼Z音或音頻信號使用多描述編碼時(shí)通過分組交換網(wǎng)絡(luò)的分集傳輸。
根據(jù)本發(fā)明,通過具有如所附權(quán)利要求所限定的特性的方法,實(shí)現(xiàn)這些目的。
本發(fā)明提供一種新型且有利的方式來使用語音或音頻信號的若干不同描述合并通過分組交換網(wǎng)絡(luò)的分集傳輸。因此,所提供的分集不是通過傳輸純粹的冗余信息而是通過傳輸同一信息的若干(兩個(gè)或多個(gè))表示來實(shí)現(xiàn)的。分集減小由于分組丟失或延遲而造成的失真,因?yàn)槊總€(gè)描述都可以提供再現(xiàn)語音/音頻信號的良好基礎(chǔ)。而且,當(dāng)所有分組都到達(dá)接收器端而沒有丟失/延遲時(shí),在再現(xiàn)語音/音頻信號之前將不同表示合并在一起,從而提供再現(xiàn)語音/音頻信號的改善質(zhì)量。所提供的分集是通過如下方式實(shí)現(xiàn)的時(shí)間分集在不同時(shí)間點(diǎn)在不同的分組中傳輸同一聲音段的不同編碼段描述,并且根據(jù)在預(yù)定時(shí)間間隔內(nèi)接收的那些段描述在接收端對聲音段進(jìn)行解碼。
根據(jù)本發(fā)明,提供很多不同的聲音編碼器和對應(yīng)的聲音解碼器,用于對數(shù)字化聲音信號進(jìn)行編碼/解碼。在本發(fā)明的不同實(shí)施例中所描述的這些聲音編碼器/解碼器以獲得高效的發(fā)送端和接收端之間信息分集傳輸?shù)姆绞?,使用多個(gè)描述工作。
在本發(fā)明中,多描述編碼器/解碼器是生成/接收至少兩個(gè)信號描述的編碼器/解碼器。不同的描述是通過對數(shù)字信號樣本進(jìn)行編碼由多描述編碼器產(chǎn)生的。術(shù)語段描述在此表示聲音信號段的描述,因?yàn)樗鶕?jù)其中一個(gè)描述的定義由多描述編碼器進(jìn)行編碼。而且,術(shù)語數(shù)字信號樣本在此應(yīng)解釋為實(shí)際樣本或者從一個(gè)或多個(gè)樣本獲得或提取的任何信號表示形式。
根據(jù)本發(fā)明的第一方面,提供一種方法,以提供分集的方式對數(shù)字化聲音信號進(jìn)行編碼,并且通過分組交換網(wǎng)絡(luò)傳輸該編碼數(shù)字化聲音信號。在發(fā)送端,數(shù)字化聲音信號的聲音段編碼為至少兩個(gè)不同的段描述,即聲音信號段的不同表示。這些段描述相互不同之處在于,它們提供數(shù)字聲音信號樣本的不同量化值。然后,在不同的時(shí)間點(diǎn)將這些不同的段描述分別在各自的數(shù)據(jù)分組中進(jìn)行傳輸。
因此,根據(jù)第二方面,提供一種方法,通過利用由接收分組提供的分集的方式對來自分組交換網(wǎng)絡(luò)的編碼數(shù)字化聲音信號進(jìn)行接收和解碼。在接收端,解碼器在預(yù)定時(shí)間周期內(nèi)等待接收具有聲音段的各個(gè)段描述的多個(gè)分組。然后根據(jù)在預(yù)定時(shí)間間隔之內(nèi)接收到的那些段描述的合并,對數(shù)字化聲音信號的聲音段進(jìn)行解碼。如果只接收到一個(gè)段描述,則根據(jù)那一個(gè)段描述對聲音段進(jìn)行解碼。然后仍然以足夠高的質(zhì)量再現(xiàn)聲音段。
因此,通過在不同時(shí)刻在不同數(shù)據(jù)分組中發(fā)送/接收相同聲音段的各個(gè)不同段描述,從多個(gè)描述提供分集。這些時(shí)刻是以受控方式進(jìn)行選擇的。當(dāng)在分組交換網(wǎng)絡(luò)中發(fā)生局部時(shí)間瓶頸時(shí),這一由在時(shí)刻之間并且因此在段描述之間的受控延遲提供的所謂時(shí)間分集尤其有利,因?yàn)楫?dāng)在不同的分組中以不同的時(shí)間點(diǎn)傳輸不同的段描述時(shí),接收特定聲音段的至少一個(gè)段描述的機(jī)會將提高。這些時(shí)刻是以引入在傳輸相同聲音段的兩個(gè)不同段描述之間的預(yù)定時(shí)間間隔的方式來選擇的。
根據(jù)本發(fā)明,還通過分組交換網(wǎng)絡(luò)中的不同路徑傳輸相同聲音段的各個(gè)段描述來增強(qiáng)分集,從而結(jié)合時(shí)間分集和路徑分集。
最好,屬于不同聲音信號描述并且與不同聲音段相關(guān)的段描述一起分在相同的分組中。至少兩個(gè)連續(xù)聲音段用來自不同聲音信號描述的各個(gè)段描述來表示。這是有利的,因?yàn)樗苊鈧鬏斖宦曇舳蔚牟煌蚊枋龅亩鄠€(gè)分組的首標(biāo)所需的額外開銷,同時(shí)當(dāng)分組丟失或延遲時(shí),仍然只有特定聲音段的一個(gè)段描述丟失或延遲。
根據(jù)本發(fā)明,數(shù)字化聲音信號可選地為n比特PCM編碼聲音信號,最好為遵循標(biāo)準(zhǔn)G.711的64k比特/秒PCM信號。n比特PCM編碼信號描述由多描述編碼器轉(zhuǎn)換為對于它的表示使用小于n比特的至少兩個(gè)描述,例如,兩個(gè)(n-1)比特表示,三個(gè)(n-1)比特表示或四個(gè)(n-2)比特表示。在接收器端,多描述解碼器將接收描述轉(zhuǎn)換回到單個(gè)n比特PCM編碼聲音信號。碼型轉(zhuǎn)換對應(yīng)于一個(gè)描述的碼字與至少兩個(gè)不同描述的各個(gè)碼字之間的譯碼。通過將PCM編碼信號轉(zhuǎn)換為多個(gè)描述,不需要對PCM編碼信號首先進(jìn)行解碼然后進(jìn)行重新編碼,就能夠提供多個(gè)描述。
最好,對每個(gè)不同段描述單獨(dú)執(zhí)行無損編碼/解碼。這將降低所傳輸?shù)亩鄠€(gè)描述所需的比特速率。而且,在發(fā)送和接收端對不同的描述分別使用相同類型的各自預(yù)測器。這將消除編碼器中的預(yù)測器與解碼器中的預(yù)測器之間的失步問題,當(dāng)在發(fā)送/接收端使用單個(gè)預(yù)測器進(jìn)行無損編碼/解碼時(shí),如果具有段描述的分組丟失,則會出現(xiàn)這一問題。
而且,當(dāng)對聲音段的開始處進(jìn)行無損編碼/解碼期間生成預(yù)測樣本時(shí),每個(gè)預(yù)測器的預(yù)測器狀態(tài)最好設(shè)為0。通過這種方式,避免通過聲音段邊界的誤差傳播。一般,在無損編碼/解碼操作期間生成預(yù)測樣本基于一個(gè)或多個(gè)量化數(shù)字聲音樣本。
需要理解的是,在此所使用的術(shù)語數(shù)字信號樣本應(yīng)解釋為實(shí)際樣本或者從一個(gè)或多個(gè)樣本中獲得或提取的任何信號表示形式。另外,預(yù)測樣本應(yīng)解釋為實(shí)際數(shù)字信號樣本的預(yù)測,或者從一個(gè)或多個(gè)數(shù)字信號樣本中獲得或提取的任何預(yù)測表示形式。
附圖簡述通過下面結(jié)合附圖對本發(fā)明的多個(gè)示例性實(shí)施例進(jìn)行詳細(xì)描述,本發(fā)明的其他特性和優(yōu)點(diǎn)將會變得更加清楚,其中相同的參考符號用于相同的部件,并且在其中
圖1示出根據(jù)現(xiàn)有技術(shù)實(shí)現(xiàn)多個(gè)描述的一個(gè)示例方式;圖2示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的概覽;圖3示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的接收部分的概覽;
圖4a示出根據(jù)本發(fā)明一個(gè)實(shí)施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的概覽;圖4b示出與圖4a所示對應(yīng)的根據(jù)本發(fā)明一個(gè)實(shí)施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的接收部分的概覽;圖5示出根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的概覽;圖6a和6b分別示出在圖5所示的實(shí)施例中兩個(gè)不同的丟失分組情況的結(jié)果;圖7a和7b分別示出根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分和接收部分的概覽;圖8a和8b分別示出根據(jù)本發(fā)明一個(gè)實(shí)施例在發(fā)送部分的多描述編碼器中對描述進(jìn)行無損編碼和在接收部分的多描述解碼器中對描述進(jìn)行無損解碼;和圖9a和9b分別示出根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分和接收部分的概覽。
優(yōu)選實(shí)施例在圖1中,示出實(shí)現(xiàn)源信號如聲音信號的多個(gè)描述的一個(gè)示例方式。該方法在本技術(shù)領(lǐng)域中是公知的,并且是可以由本發(fā)明使用的多個(gè)描述的一個(gè)例子。然而,實(shí)現(xiàn)多個(gè)描述的其他適當(dāng)方式可以同樣好地與本發(fā)明一起使用。在圖1中,示出分別來自兩個(gè)量化器的兩個(gè)不同描述100、110的量化電平。如圖所示,這兩個(gè)描述具有相同的量化步長Q,但是描述110的量化電平相對于描述100的量化電平偏移量化步長Q的一半。根據(jù)這兩個(gè)描述100、110,合并將導(dǎo)致具有更細(xì)量化步長Q/2的合并描述120。使用兩個(gè)粗量化器,需要2R比特速率來匹配比特速率為R+1的單個(gè)細(xì)量化器性能。例如,如果每個(gè)描述100、110具有4個(gè)量化電平,每個(gè)描述將需要2個(gè)比特來對這些電平進(jìn)行編碼,即,總共4個(gè)比特。如果對合并描述120使用更細(xì)的量化器,7個(gè)量化電平在編碼時(shí)將需要3個(gè)比特。對于大的R,當(dāng)使用兩個(gè)粗量化器來提供多個(gè)描述而不是使用一個(gè)更細(xì)的量化器來提供單個(gè)描述時(shí),這將導(dǎo)致比特速率顯著提高。
在圖2中,示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的方框圖。聲音由麥克風(fēng)210進(jìn)行拾取,以產(chǎn)生模擬電信號215,模擬電信號215由A/D轉(zhuǎn)換器220采樣并量化為數(shù)字格式。聲音信號的采樣率依賴于聲音信號的源和所需質(zhì)量。典型地,采樣率對于語音信號為8或16kHz,并且對于音頻信號,高至48kHz。數(shù)字信號的質(zhì)量還受A/D轉(zhuǎn)換器的量化器的精度的影響。對于語音信號,精度通常在每樣本8到16比特之間。在典型的系統(tǒng)中,發(fā)送端包括聲音編碼器230,以進(jìn)一步壓縮采樣數(shù)字信號。根據(jù)本發(fā)明,聲音編碼器230的一個(gè)額外目的是在傳輸之前修改聲音信號表示,從而提高對分組交換網(wǎng)絡(luò)中分組丟失和延遲的穩(wěn)健性。采樣信號225輸入到聲音編碼器230,它對采樣信號進(jìn)行編碼并且將所獲得的編碼信號組裝到數(shù)據(jù)分組中。數(shù)據(jù)分組235然后傳輸?shù)娇刂破?40,它將順序和目標(biāo)地址信息加到數(shù)據(jù)分組,從而使這些分組適于通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸。數(shù)據(jù)分組245然后通過分組交換網(wǎng)絡(luò)傳輸?shù)浇邮掌鞫恕?br>
在圖3中,示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的接收部分的方框圖??刂破?50從分組交換網(wǎng)絡(luò)接收數(shù)據(jù)分組,剔除地址信息,并且將數(shù)據(jù)分組355放在抖動(dòng)緩沖器360中。抖動(dòng)緩沖器360是一個(gè)存儲介質(zhì),典型地為RAM,它調(diào)整數(shù)據(jù)分組365離開抖動(dòng)緩沖器360的速率。抖動(dòng)緩沖器的物理容量是可以存儲進(jìn)入數(shù)據(jù)分組355的容量。離開抖動(dòng)緩沖器360的數(shù)據(jù)分組365輸入到聲音解碼器370。聲音解碼器370將數(shù)據(jù)分組中的信息解碼為數(shù)字聲音信號的再現(xiàn)樣本。然后,數(shù)字信號375由D/A轉(zhuǎn)換器380轉(zhuǎn)換為模擬電信號385,該模擬信號驅(qū)動(dòng)聲音再現(xiàn)系統(tǒng)390,例如揚(yáng)聲器,在接收器端產(chǎn)生聲音。
如前所述,本發(fā)明的聲音編碼器設(shè)計(jì)為在傳輸之前修改聲音信號的表示,從而提高分組交換網(wǎng)絡(luò)中對分組丟失和延遲的穩(wěn)健性,并且減小比特速率。因此,接收端的聲音解碼器設(shè)計(jì)為對該修改后的表示進(jìn)行解碼。本發(fā)明使用多個(gè)描述來表示聲音信號。從而,聲音編碼器包括多描述編碼器,并且因此聲音解碼器包括多描述解碼器?,F(xiàn)在將參照圖4a和4b對根據(jù)本發(fā)明一個(gè)實(shí)施例的聲音編碼器和聲音解碼器的設(shè)計(jì)和操作進(jìn)行更詳細(xì)的描述。除了下面對聲音編碼/解碼塊的描述之外,整體操作對應(yīng)于前面參照圖2和3所述。
在圖4a中,發(fā)送端的聲音編碼器430包括多描述編碼器410和分集控制器420。對應(yīng)地,接收端的圖4b所示的聲音解碼器470包括分集控制器450和多描述解碼器480。
現(xiàn)在參照圖4a,聲音編碼器430的多描述編碼器410以兩種不同的方式對采樣聲音信號425進(jìn)行編碼,從而獲得聲音信號的兩個(gè)不同比特流表示,即兩個(gè)不同描述。如前所述,每個(gè)描述都有其自己的一組量化電平,它是例如通過將其中一個(gè)描述的量化電平偏移一半量化步長而獲得的。對應(yīng)地,如果要提供三個(gè)描述,則第二描述的量化電平相對于第一描述偏移三分之一步長,并且第三描述相對于第二描述偏移三分之一步長。因此,如圖4a所示,可以使用多于兩個(gè)的描述對聲音信號進(jìn)行編碼,而不脫離本發(fā)明的范圍。然而,為方便描述起見,在此公開的本發(fā)明實(shí)施例中只使用兩個(gè)信號描述。
每個(gè)描述提供聲音信號的編碼聲音信號段的段描述。相同聲音段的不同段描述在各自的分組中傳輸?shù)椒旨刂破?20。在圖4a中,兩個(gè)描述用D1和D2表示。連續(xù)段n、n+1、n+2等用描述D1表示為段描述D1(n)、D1(n+1)、D1(n+2)…,這些段描述在各自的連續(xù)數(shù)據(jù)分組415、416和417中從多描述編碼器410傳輸?shù)椒旨刂破?20。對應(yīng)地,相同的段還用描述D2表示為段描述D2(n)、D2(n+1)、D2(n+2)…,并且也在各自的數(shù)據(jù)分組中傳輸?shù)椒旨刂破?。因此,聲音信?25的每個(gè)聲音段用每個(gè)描述的一個(gè)段描述來表示,例如,在圖4a中,聲音段n+1用描述D1的段描述D1(n+1)和描述D2的段描述D2(n+1)來表示。
分集控制器420根據(jù)所使用的分集方案調(diào)度從多描述編碼器410接收的分組。在圖4a中,分集控制器420將一個(gè)聲音段的每個(gè)段描述順序安排到不同的分組中。包含相同聲音段的不同段描述的分組在不同的時(shí)刻傳輸?shù)娇刂破?40。例如,如圖4a所示,聲音段n的兩個(gè)段描述D1(n)和D2(n)分別在不同的時(shí)間點(diǎn)t1與t2和不同的分組421與422中傳送到控制器440。因此引入t2-t1的延遲來創(chuàng)建時(shí)間分集。對于典型的聲音段長度20ms,可以使用的典型延遲t2-t1為10ms。當(dāng)從分集控制器420接收到分組時(shí),控制器440對分組進(jìn)行格式化,如加入順序和目標(biāo)地址信息,以隨即在分組交換網(wǎng)絡(luò)上傳輸。因此,控制器440將帶信息的首標(biāo)H加到每個(gè)分組。在使用UDP(User DatagramProtocol,用戶數(shù)據(jù)報(bào)協(xié)議)和RTP(Real Time Protocol,實(shí)時(shí)協(xié)議)的IPv4傳輸?shù)那闆r下,首標(biāo)大小為320比特。對于20ms的典型語音段長度,每個(gè)描述的首標(biāo)將占用320比特/20毫秒,即16k比特/秒。如果每個(gè)語音段用兩個(gè)段描述表示,則傳輸段描述的分組的首標(biāo)一起將需要2*16=32k比特/秒的比特速率。這可以與用于標(biāo)準(zhǔn)PCM(Pulse Code Modulation,脈沖編碼調(diào)制)電話的比特速率64k比特/秒相比。因此,開銷比特速率將為有效負(fù)荷速率的50%(32除以64)。
如前面參照圖3所述,由控制器350在接收器端接收分組??刂破鲃h除首標(biāo)信息,并且將分組傳輸?shù)蕉秳?dòng)緩沖器360,緩沖器360又將分組傳輸?shù)铰曇艚獯a器370?,F(xiàn)在參照圖4b,聲音解碼器470的分集控制器450從抖動(dòng)緩沖器接收具有不同段描述的分組。然后,分集控制器調(diào)度相同聲音段的不同段描述,以同時(shí)傳輸?shù)蕉嗝枋鼋獯a器480。因此,如圖4b所示,多描述解碼器480將例如同時(shí)接收分別具有聲音段n的段描述D1(n)和D2(n)的分組471和472,然后是分別具有聲音段n+1的段描述D1(n+1)和D2(n+1)的分組474和475,等等。多描述解碼器480從不同分組中為每個(gè)聲音段提取聯(lián)合信息(joint information),并且對聲音信號段進(jìn)行解碼,以傳輸?shù)紻/A轉(zhuǎn)換器。如果例如段描述D1(n)沒有到達(dá)接收器端或者到達(dá)太遲,分集控制器450將只把D2(n)(如果使用兩個(gè)描述)調(diào)度到多描述解碼器480,然后多描述解碼器480從所接收的單個(gè)段描述D2(n)中以足夠的質(zhì)量對聲音信號的聲音段n進(jìn)行解碼。
在圖5中,示出本發(fā)明的另一個(gè)實(shí)施例。本實(shí)施例與前面參照圖4a和4b所述的實(shí)施例不同的方面是在由分組交換網(wǎng)絡(luò)傳輸?shù)姆纸M中對段描述的組織。因此不同之處在于由聲音編碼器/解碼器的分集控制器在發(fā)送/接收端執(zhí)行的分組組裝/拆卸。下面將描述該不同之處。
如參照圖4a和4b所述,傳輸相同聲音段的不同段描述的不同分組的首標(biāo)所導(dǎo)致的開銷相當(dāng)大。為了減輕這一問題,在通過分組交換網(wǎng)絡(luò)傳輸分組之前,將屬于不同描述且與不同聲音段相關(guān)的段描述一起分在相同的分組中。如圖5所示,發(fā)送端的聲音編碼器的分集控制器520將分別屬于兩個(gè)連續(xù)聲音段的兩個(gè)段描述一起分在每個(gè)分組中。分組的兩個(gè)段描述屬于聲音信號的不同描述。例如,一個(gè)分組將包含聲音段n-1的段描述D2(n-1)和聲音段n的段描述D1(n)??刂破?40在通過分組交換網(wǎng)絡(luò)傳輸包含兩個(gè)段描述的分組之前,如前所述將首標(biāo)信息加到每個(gè)分組。
因此,如同圖4的實(shí)施例,本實(shí)施例的分集控制器520將聲音段的每個(gè)段描述順序安排到各自的分組中,并且如同圖4的實(shí)施例,包含相同聲音段的不同段描述的分組將在不同的時(shí)刻傳輸?shù)娇刂破?40。在圖5中,聲音段n和n+1的兩個(gè)段描述D2(n)和D1(n+1)在分組522中傳送到控制器540。因此,段n+1必須在段描述D2(n)可以傳輸?shù)娇刂破髦耙驯痪幋a。另一方面,段描述D1(n)在前一分組521中傳輸?shù)娇刂破?。如果聲音段?0ms,因?yàn)镈2(n)要調(diào)度到與D1(n+1)相同的分組522中,所以D2(n)的傳輸與D1(n)的傳輸相比必須延遲20ms。因此,該方案將自動(dòng)提供時(shí)間分集,因?yàn)橄嗤曇舳蔚牟煌蚊枋鰧⒁?0ms的間隔(假定聲音段的長度為20ms)傳輸?shù)娇刂破?40。因此,與圖4的實(shí)施例相比,使用在分組中組裝若干段描述的這一方案,將自動(dòng)引入相同聲音段的兩個(gè)不同段描述之間的額外延遲。段描述之間的這一額外延遲提供額外的時(shí)間分集優(yōu)點(diǎn),并且可以在傳輸鏈的后面進(jìn)行補(bǔ)償,例如,通過使接收端的抖動(dòng)緩沖器中的延遲設(shè)置更小。
而且,根據(jù)本實(shí)施例的一個(gè)分組中的有效負(fù)荷量對應(yīng)于從一個(gè)聲音段生成的總數(shù)據(jù)量,因此,當(dāng)采用這種方案創(chuàng)建時(shí)間分集時(shí),不增加開銷信息。
與上面所述相對應(yīng),本實(shí)施例的接收端的分集控制器在對應(yīng)于圖4b所示將段描述傳輸?shù)蕉嗝枋鼋獯a器之前將接收分組分為它們的段描述部分。
如果一個(gè)分組在通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸期間丟失或延遲,圖5所示的時(shí)間分集方案的效果是一樣的,在接收端仍然可以獲得所有聲音段的描述,并且將感覺不到任何聲音段的丟失。在圖6a中,示出分組丟失的場景。當(dāng)包含段描述D2(n+1)和D1(n+2)的分組603丟失時(shí),聲音段n+1將仍然用前一分組602中的段描述D1(n+1)來表示,并且聲音段n+2用后一分組604中的段描述D2(n+2)來表示。在圖6b中,示出丟失兩個(gè)連續(xù)分組的場景。在這種情況下,當(dāng)分組611和612丟失時(shí),將得不到段n+2的表示,并且段n+1和n+3將分別用分組610和613中的一個(gè)段描述來表示。因此,本實(shí)施例示例的分集方案由于總是可以獲得一個(gè)描述而能夠修復(fù)一個(gè)分組的丟失。兩個(gè)連續(xù)分組的丟失將導(dǎo)致一個(gè)聲音信號段所有信息的丟失。然而,在一般情況下,通過對于一個(gè)聲音信號段采用大于兩個(gè)的段描述,并且與之對應(yīng),將大于兩個(gè)的段描述分在一個(gè)分組中,可以在增加延遲的代價(jià)下獲得更大的分集好處。
如圖7a和7b所示,根據(jù)本發(fā)明另一個(gè)實(shí)施例,無損編碼/解碼加到用于通過分組交換網(wǎng)絡(luò)發(fā)送和接收數(shù)字化聲音信號的傳輸系統(tǒng)。在圖7a中,多描述編碼器710的每個(gè)描述在由聲音編碼器730的分集控制器720進(jìn)行接收之前經(jīng)過無損編碼。對應(yīng)地,在圖7b中,來自聲音解碼器770的分集控制器750的每個(gè)段描述在通過合并器775由多描述解碼器780進(jìn)行接收之前經(jīng)過無損解碼。在聲音解碼器770中包括合并器是為了保證相同聲音段的不同段描述同時(shí)到達(dá)多描述解碼器780。段描述的無損編碼/解碼分別由發(fā)送端和接收端的無損編碼器715、716、717和無損解碼器760、761、762執(zhí)行。
無損編碼的一般目的是找到一種更不浪費(fèi)比特的方式來描述數(shù)據(jù)而不損失任何信息。無損編碼器使用有關(guān)輸入信號的統(tǒng)計(jì)信息來減小平均比特速率。例如采用這樣的方式來執(zhí)行在得出輸入信號中的碼字出現(xiàn)頻率之后在一個(gè)表中對這些碼字進(jìn)行排序。然后,最常用的碼字用比其他碼字更少的比特來表示。一個(gè)使用這種思想的本領(lǐng)域公知的無損編碼器的例子是Huffman(哈夫曼)編碼器。
無損編碼只在接收數(shù)據(jù)中沒有比特錯(cuò)誤的網(wǎng)絡(luò)中正常工作。結(jié)合無損編碼所用的碼字具有不同的長度,并且如果發(fā)生比特錯(cuò)誤,則不可能知道碼字何時(shí)結(jié)束以及新碼字何時(shí)開始。因此,單個(gè)比特錯(cuò)誤不僅給當(dāng)前碼字的解碼還給整個(gè)數(shù)據(jù)塊引入錯(cuò)誤。當(dāng)分組交換網(wǎng)絡(luò)為IP(網(wǎng)際協(xié)議)網(wǎng)絡(luò)時(shí),所有被破壞的數(shù)據(jù)分組將被自動(dòng)丟棄。因此,在這種分組交換網(wǎng)絡(luò)中,在接收端所接收的數(shù)據(jù)分組中將不存在比特錯(cuò)誤。因此,根據(jù)本發(fā)明,無損編碼如分級或分塊Huffman編碼適用于分別對聲音信號段的多個(gè)段描述進(jìn)行單獨(dú)壓縮。而且,由于當(dāng)使用多個(gè)聲音描述時(shí)聲音信號的比特速率提高,因此最好對段描述進(jìn)行壓縮。
圖7a和7b實(shí)施例的無損編碼器/解碼器均包括創(chuàng)建用來包括所有可能的碼字及其比特表示的表。在發(fā)送端將聲音段描述輸入到分集控制器720之前,執(zhí)行簡單的表查詢,以對聲音段描述進(jìn)行無損壓縮。對應(yīng)地,在接收端,來自分集控制器750的聲音段描述在輸入到多描述解碼器780之前經(jīng)過無損解碼。
參照圖8a和8b,根據(jù)本發(fā)明的一個(gè)實(shí)施例,進(jìn)一步分別說明與多描述編碼器一起使用無損編碼以及與多描述解碼器一起使用無損解碼。圖8a和8b分別示出多描述編碼器/解碼器相對于使用其工作的其中一個(gè)描述的設(shè)計(jì)和操作。因此,圖8a的量化器800表示用于一個(gè)描述的量化器,并且在多描述編碼器中將分別為所使用的每個(gè)描述提供一組圖8a所示的所有單元。相應(yīng)地,在多描述解碼器中將分別為所使用的每個(gè)描述提供一組圖8b所示的所有單元。
參照圖8a,對于每個(gè)被安置為產(chǎn)生的描述,多描述編碼器包括第一量化器800、反量化器810、延遲塊820、預(yù)測器830、第二量化器840和無損編碼器850。因?yàn)榉戳炕?10和第二量化器840不是本實(shí)施例的必需單元,所以它們用虛線表示。后面將在另一實(shí)施例中描述對這些可選單元的使用。
對應(yīng)地,在圖8b中,對于被安置為解碼的描述,多描述解碼器包括無損解碼器855、量化器870、預(yù)測器880、延遲塊890以及反量化器860和863。因?yàn)榱炕?70和反量化器863不是本實(shí)施例的必需單元,所以它們用虛線表示。后面將在另一實(shí)施例中描述對這些可選單元的使用。
圖8a和8b實(shí)施例的每個(gè)無損編碼器850和每個(gè)無損解碼器855均包括創(chuàng)建用來包括所有可能的碼字及其比特表示的表。在聲音段作為碼字通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸之前,執(zhí)行表查詢以對具有由量化器800量化的數(shù)字聲音樣本的聲音段進(jìn)行無損編碼。對應(yīng)地,在接收器端,具有數(shù)字聲音樣本的編碼聲音段的碼字經(jīng)過無損解碼為量化數(shù)字聲音樣本,然后這些聲音樣本由反量化器860反量化為數(shù)字聲音樣本的重構(gòu)聲音段。
在圖8a中,從A/D轉(zhuǎn)換器接收的數(shù)字化聲音信號的數(shù)字聲音樣本由量化器800量化為量化數(shù)字聲音樣本。對于每個(gè)量化數(shù)字樣本,由預(yù)測器830根據(jù)一個(gè)或多個(gè)前面量化數(shù)字樣本生成一個(gè)預(yù)測樣本。預(yù)測器830根據(jù)前面量化數(shù)字樣本的量化電平即量化索引或量化值生成預(yù)測樣本的量化索引,其中前面量化數(shù)字樣本的電平由量化器800進(jìn)行輸出,并且由延遲塊820進(jìn)行延遲。然后預(yù)測樣本的量化索引傳輸?shù)綔p法器845,其中,將其從由量化器800輸出的當(dāng)前量化數(shù)字樣本的量化索引中減去。減法器845的結(jié)果,即預(yù)測樣本的量化索引與當(dāng)前量化數(shù)字樣本的量化索引之間的差值傳輸?shù)綗o損編碼器850。無損編碼器通過使用從減法器845接收的索引差值作為查詢表的條目以輸出對應(yīng)的碼字,對當(dāng)前量化數(shù)字樣本進(jìn)行編碼。具有量化數(shù)字樣本的完整編碼聲音段的碼字最終組裝到傳輸?shù)椒旨刂破鞯牟煌纸M??蛇x地,編碼聲音段的每個(gè)碼字由分集控制器集中,然后組裝到用于編碼聲音段的不同分組??刂破髟谕ㄟ^分組交換網(wǎng)絡(luò)傳輸數(shù)據(jù)分組之前加入首標(biāo)信息。
在圖8b中,無損解碼器855從分集控制器接收具有碼字的分組。每個(gè)碼字由無損解碼器用來選擇查詢表中的條目,以輸出對應(yīng)的索引差值,該索引差值又對應(yīng)一個(gè)量化數(shù)字樣本。對于每個(gè)量化數(shù)字樣本,由預(yù)測器880根據(jù)一個(gè)或多個(gè)前面量化數(shù)字樣本生成一個(gè)預(yù)測樣本。接收端的預(yù)測器880構(gòu)造為以與發(fā)送端的預(yù)測器830相同的方式工作。這些預(yù)測器的典型結(jié)構(gòu)是當(dāng)生成數(shù)字化聲音信號的開始量化數(shù)字樣本所對應(yīng)的預(yù)測樣本時(shí),預(yù)測器的狀態(tài)為零。采用與發(fā)送端相同的方式,預(yù)測器880根據(jù)前面量化數(shù)字樣本的量化電平即量化索引或量化值生成一個(gè)量化索引,其中前面量化數(shù)字樣本的電平隱式地由無損解碼器855進(jìn)行輸出,并且由延遲塊890進(jìn)行延遲。然后所生成預(yù)測樣本的量化索引傳輸?shù)郊臃ㄆ?65,其中,將其加到從無損解碼器855輸出的索引差別。加法器865的結(jié)果,即預(yù)測樣本的量化索引與索引差別之和傳輸?shù)椒戳炕?60,其中,它在傳輸?shù)紻/A轉(zhuǎn)換器之前經(jīng)過反量化。
在另一些實(shí)施例中,多描述編碼器包括如圖8a所示的反量化器810和/或第二量化器840。對應(yīng)地,根據(jù)這些其他實(shí)施例的多描述解碼器包括量化器870和/或反量化器863。
使用反量化器810和863,量化將輸入到預(yù)測器830和880的數(shù)字樣本的量化值而不是量化索引,并且預(yù)測器將根據(jù)值而不是索引生成預(yù)測樣本。
如果預(yù)測器830和880不包括用于輸出所生成預(yù)測樣本的量化電平如索引的量化表,多描述編碼器/解碼器將包括量化器840、870來提供所生成預(yù)測樣本的量化電平,例如索引。通過這種方式,減法器845和加法器865的輸入仍將是預(yù)測樣本的量化電平。而且,使用量化器840和870,可以確定所生成預(yù)測樣本的量化電平為屬于預(yù)定電平集的合法電平,而不是落在不同合法量化電平之間的電平。
根據(jù)本發(fā)明,為了避免誤差傳播,具有數(shù)字聲音樣本的一個(gè)聲音段的數(shù)字樣本所對應(yīng)的所生成預(yù)測樣本不應(yīng)基于前面聲音段的數(shù)字樣本。根據(jù)一個(gè)實(shí)施例,這通過在對具有量化數(shù)字樣本的新聲音段進(jìn)行編碼之前將預(yù)測器830的預(yù)測器狀態(tài)設(shè)為0來實(shí)現(xiàn)。對應(yīng)地,在接收端的多描述解碼器中,在對具有量化數(shù)字樣本的新聲音段進(jìn)行解碼之前,將預(yù)測器880的預(yù)測器狀態(tài)設(shè)為0??蛇x地,不同于將預(yù)測器狀態(tài)設(shè)為0,可以在具有數(shù)字樣本的每個(gè)聲音段中包含狀態(tài)信息。
參照圖9a和9b描述本發(fā)明的另一實(shí)施例。在本實(shí)施例中,聲音編碼器的多描述編碼器910由普通PCM編碼器911以及隨后的碼型變換器912組成。因此,使用普通PCM編碼器911對由聲音編碼器從A/D轉(zhuǎn)換器接收的數(shù)字化聲音信號進(jìn)行編碼。然后所獲得的PCM比特流由碼型變換器912轉(zhuǎn)換,即譯碼為若干比特流,然后,每個(gè)比特流提供PCM的粗表示。圖9b示出對應(yīng)的多描述解碼器。多描述解碼器980包括碼型變換器981,用于將所接收的多個(gè)比特流描述轉(zhuǎn)換為單個(gè)PCM比特流。然后,該P(yáng)CM比特流在傳輸?shù)紻/A轉(zhuǎn)換器之前由普通PCM解碼器982進(jìn)行解碼。下面將舉例說明碼型轉(zhuǎn)換或譯碼方法,其中,一個(gè)64k比特/秒PCM比特流轉(zhuǎn)換為提供多個(gè)PCM信號描述的兩個(gè)比特流。
采用μ律對數(shù)壓縮的標(biāo)準(zhǔn)64k比特/秒PCM編碼器使用8比特/樣本對樣本進(jìn)行編碼。這提供256個(gè)不同碼字,但是量化器只包括255個(gè)不同的電平。零電平用兩個(gè)不同的碼字來表示以簡化硬件實(shí)現(xiàn)。根據(jù)本實(shí)施例,每個(gè)量化電平用一個(gè)整數(shù)索引表示,從用于最負(fù)電平的零開始直到用于最高電平的254。通過刪除每個(gè)整數(shù)索引的最低位比特,獲得兩個(gè)比特流中的第一比特流。該新索引表示兩個(gè)粗量化器的第一量化器中的量化電平。通過在刪除最低位比特之前對每個(gè)索引加1來獲得第二比特流。因此,從原始8比特PCM表示中獲取兩個(gè)7比特表示。對兩個(gè)表示的解碼方式是在分組丟失的情況下,可以對單個(gè)表示執(zhí)行解碼;或者對兩個(gè)表示執(zhí)行解碼,在這種情況下,原始PCM信號被重構(gòu)。解碼只是簡單地轉(zhuǎn)換回到PCM索引,然后進(jìn)行表查詢。
可選地,PCM編碼器910是使用A律對數(shù)壓縮的標(biāo)準(zhǔn)64k比特/秒PCM編碼器。在這種情況下,量化器中的電平數(shù)目為256,比μ律編碼器多一個(gè)。為使用兩個(gè)新量化網(wǎng)格表示該256個(gè)電平,并且能夠完全重構(gòu)該信號,一個(gè)網(wǎng)格需要采用128個(gè)電平,并且另一個(gè)需要采用129個(gè)電平。最好使用如同μ律情況的兩個(gè)7比特網(wǎng)格,然而必須解決額外量化電平的問題。根據(jù)本發(fā)明,每個(gè)量化電平用一個(gè)整數(shù)索引表示,從用于最負(fù)電平的零開始直到用于最高電平的255。除表示索引號255之外,使用與μ律情況完全相同的規(guī)則來形成新索引。索引號255對于第一量化器用索引號126表示,并且對于第二量化器用索引號127表示,而不是假如遵循上述規(guī)則所得到的128和127。當(dāng)將兩個(gè)比特流轉(zhuǎn)換為A律PCM比特流時(shí),解碼器必須檢查該索引表示。如果在傳輸之后只接收到兩個(gè)描述中的第一描述并且所編碼的是第255索引,則解碼器將引入比其他索引稍高的量化誤差。
編碼PCM信號包含高度的冗余。因此,結(jié)合采用PCM編碼/解碼的本實(shí)施例與對從PCM聲音信號獲得的多個(gè)描述的無損編碼/解碼,是尤其有利的。如圖9a和9b所示,分別由發(fā)送端和接收端的無損編碼器930、931、932和無損解碼器960、961、962執(zhí)行對描述的無損編碼/解碼。
如果已經(jīng)由聲音編碼器接收的數(shù)字化聲音信號表示為64k比特/秒PCM比特流,并且如果接收部分的聲音解碼器應(yīng)輸出64k比特/秒PCM比特流,則不需要發(fā)送部分的PCM編碼器和接收部分的PCM解碼器。在這種情況下,本發(fā)明的多描述編碼器接收PCM比特流,并且將PCM索引轉(zhuǎn)換為上述0到254表示。該表示直接輸入到碼型轉(zhuǎn)換器,它使用上面給出的簡單規(guī)則將比特流轉(zhuǎn)換為兩個(gè)新比特流。在系統(tǒng)的接收器端,分集控制器集中接收分組中的信息。如果所有分組到達(dá),則碼型轉(zhuǎn)換器合并來自多個(gè)描述的信息,并且將其轉(zhuǎn)換回到原始PCM比特流。如果一些分組丟失,則不能完全重構(gòu)原始比特流,但是從已到達(dá)的描述中獲得良好的近似。
盡管在上面本發(fā)明是參照其不同實(shí)施例來舉例描述的,但應(yīng)該理解,在不脫離由所附權(quán)利要求限定的本發(fā)明范圍的情況下,可以對其進(jìn)行各種修改和改變。
權(quán)利要求
1.一種對數(shù)字化聲音信號進(jìn)行編碼并且通過分組交換網(wǎng)絡(luò)傳輸編碼數(shù)字化聲音信號的方法,所述方法提供分集并且包括如下步驟將所述數(shù)字化聲音信號及其聲音段編碼為具有各自段描述的至少兩個(gè)不同段描述,每個(gè)描述是具有各自量化電平集的聲音信號表示,其中,每個(gè)聲音段用至少兩個(gè)不同的段描述來表示;以及對于每一個(gè)所述聲音段,將所述至少兩個(gè)不同段描述分別在不同的時(shí)間點(diǎn)在各自的數(shù)據(jù)分組中進(jìn)行傳輸,其中,在傳輸聲音段的兩個(gè)不同段描述之間引入預(yù)定時(shí)間間隔。
2.如權(quán)利要求1所述的方法,包括如下步驟將若干不同聲音段的若干段描述一起分在同一數(shù)據(jù)分組中,其中,數(shù)據(jù)分組的每個(gè)段描述根據(jù)對應(yīng)的聲音信號描述來描述一個(gè)聲音段。
3.如權(quán)利要求1-2中的任一權(quán)利要求所述的方法,包括如下步驟將第一聲音段的第一段描述與第二聲音段的第二段描述一起分在同一數(shù)據(jù)分組中,其中,數(shù)據(jù)分組的每個(gè)段描述根據(jù)對應(yīng)的聲音信號描述來描述一個(gè)聲音段。
4.如權(quán)利要求3所述的方法,其中,所述第一聲音段和所述第二聲音段為所述數(shù)字化聲音信號的兩個(gè)連續(xù)聲音段。
5.如權(quán)利要求1-4中的任一權(quán)利要求所述的方法,其中,包含聲音段的一個(gè)段描述的數(shù)據(jù)分組在所述分組交換網(wǎng)絡(luò)中的傳輸路徑不同于包括同一聲音段的另一段描述的分組。
6.如權(quán)利要求1-5中的任一權(quán)利要求所述的方法,其中,所述數(shù)字化聲音信號為PCM編碼比特流。
7.如權(quán)利要求6所述的方法,其中,所述編碼步驟包括將n比特PCM表示比特流轉(zhuǎn)換為至少兩個(gè)表示比特流,其中每個(gè)表示比特流用小于n比特來表示,并且為具有各自量化電平集的聲音信號描述。
8.如權(quán)利要求1-7中的任一權(quán)利要求所述的方法,其中,每個(gè)段描述在包含到傳輸數(shù)據(jù)分組中之前經(jīng)過無損編碼,無損編碼包括通過采用編碼數(shù)字化聲音信號中的冗余壓縮段描述。
9.如權(quán)利要求8所述的方法,其中,所述無損編碼包括如下步驟對聲音段的數(shù)字化聲音樣本進(jìn)行量化;根據(jù)所述聲音段的前面量化數(shù)字聲音樣本,生成預(yù)測樣本;以及根據(jù)所生成的預(yù)測樣本對量化數(shù)字聲音樣本進(jìn)行無損編碼。
10.一種對來自分組交換網(wǎng)絡(luò)的編碼數(shù)字化聲音信號進(jìn)行接收和解碼的方法,所述方法利用由接收分組提供的分集,并且包括如下步驟在預(yù)定時(shí)間周期內(nèi)等待接收至少兩個(gè)不同的分組,其中,這些分組包含同一聲音段的不同段描述;以及a)如果在所述時(shí)間周期內(nèi)接收到所述不同段描述,根據(jù)所述至少兩個(gè)不同分組所包含的所述不同段描述的合并,對所述聲音信號段進(jìn)行解碼,或者b)根據(jù)在所述時(shí)間周期內(nèi)接收的那些不同段描述,一個(gè)或者多個(gè)的合并,對所述聲音信號段進(jìn)行解碼。
11.如權(quán)利要求10所述的方法,其中,每個(gè)接收分組包括分在一起的若干不同聲音段的若干段描述,所述方法包括如下步驟相對于所包含的段描述,連續(xù)分解接收分組,從而獲得每個(gè)聲音段的若干不同段描述,根據(jù)這些段描述,對所述每個(gè)聲音段進(jìn)行解碼。
12.如權(quán)利要求10或11所述的方法,其中,所述編碼數(shù)字化聲音信號為PCM編碼比特流。
13.如權(quán)利要求12所述的方法,其中,相同聲音信號段的兩個(gè)段描述的合并包括將每個(gè)均用小于n比特表示的至少兩個(gè)段表示轉(zhuǎn)換為所述相同聲音信號段的單個(gè)n比特PCM表示。
14.如權(quán)利要求10-13中的任一權(quán)利要求所述的方法,其中,接收段描述在與相同聲音信號段的另一段描述進(jìn)行合并之前經(jīng)過無損解碼。
15.如權(quán)利要求14所述的方法,其中,所述無損解碼包括如下步驟將接收段描述的碼字無損解碼為接收量化電平;根據(jù)所述數(shù)字化聲音信號的量化數(shù)字聲音樣本,生成預(yù)測樣本;根據(jù)所生成的預(yù)測樣本,從所述量化電平獲得所述數(shù)字化聲音信號的接收量化數(shù)字聲音樣本;以及將所述接收量化數(shù)字聲音樣本反量化為所述數(shù)字化聲音信號的數(shù)字化聲音樣本。
16.一種計(jì)算機(jī)可讀介質(zhì),具有計(jì)算機(jī)可執(zhí)行指令,用于使數(shù)字化聲音信號以提供分集的方式進(jìn)行編碼并且通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸,所述計(jì)算機(jī)可執(zhí)行指令執(zhí)行如權(quán)利要求1-9中的任一權(quán)利要求所述的方法的步驟。
17.一種計(jì)算機(jī)可讀介質(zhì),具有計(jì)算機(jī)可執(zhí)行指令,用于使來自分組交換網(wǎng)絡(luò)的數(shù)字化聲音信號以利用由接收分組提供的分集的方式進(jìn)行接收和解碼,所述計(jì)算機(jī)可執(zhí)行指令執(zhí)行如權(quán)利要求10-15中的任一權(quán)利要求所述的方法的步驟。
全文摘要
本發(fā)明涉及用于以提供分集的方式對通過分組交換網(wǎng)絡(luò)傳輸?shù)臄?shù)字化聲音信號進(jìn)行編碼/解碼的方法。數(shù)字化聲音信號的每個(gè)聲音段編碼為至少兩個(gè)不同的段描述,即聲音信號段的不同表示。這些段描述相互不同之處在于,它們提供數(shù)字聲音信號樣本的不同量化值。這些不同的段描述在不同的時(shí)間點(diǎn)通過網(wǎng)絡(luò)分別在各自的數(shù)據(jù)分組中進(jìn)行傳輸。
文檔編號H04L12/64GK1436416SQ0181127
公開日2003年8月13日 申請日期2001年5月9日 優(yōu)先權(quán)日2000年5月10日
發(fā)明者蒂納·亞伯拉罕森, 索倫·旺安德森, 羅爾·哈根, W·巴斯琴·克萊吉恩 申請人:環(huán)球Ip音響公司