專利名稱:數(shù)字語音信號(hào)聲響恢復(fù)的編碼方法及實(shí)施該方法的裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在電話通信期間便于發(fā)送到用戶終端的數(shù)字話音信號(hào)聲響恢復(fù)的編碼方法,該電話通信是在一個(gè)通信系統(tǒng)中通過信息包傳輸網(wǎng)與另一用戶終端建立的,該包傳輸網(wǎng)例如為因特網(wǎng),尤其是VOIP(因特網(wǎng)上的語音協(xié)議“Voice OverInternet Protocol”)類型的電話通信網(wǎng),即使用互連網(wǎng)協(xié)議IP或等效協(xié)議建立通信網(wǎng)。本發(fā)明還涉及通信裝置,及更具體地涉及編碼器及設(shè)有編碼裝置的用戶終端,該編碼裝置被設(shè)計(jì)來實(shí)施上述的編碼方法。
如所知道的,通過由包傳輸網(wǎng)彼此連接的用戶終端在用戶之間建立電話通信涉及相應(yīng)于與建立的通信相關(guān)的數(shù)字編碼語音信號(hào)的包以規(guī)則的方式傳輸,用于能在接收終端上以聲響的方式恢復(fù)語音信號(hào),使該語音信號(hào)能盡可能保真地接收。
這種規(guī)則的傳輸不總是能獲得的,尤其是,當(dāng)在用于語音信號(hào)通信的包之間插有大長度的數(shù)據(jù)包時(shí)更是如此。亦如所知道的,由一個(gè)用戶終端發(fā)送的包含數(shù)字編碼的語音信號(hào)的包可能以與發(fā)送它們不同的順序到達(dá)接收它們的用戶終端。一些包對(duì)于能被使用來說過遲地被接收,或根本不能被接收。在此情況下,以聲響形式恢復(fù)的、以包形式被接收的來自一個(gè)終端的語音信號(hào)、如原始用于編碼的一個(gè)或多個(gè)語音部分可能不再能被聽清楚。
已具有用于消除由包傳輸?shù)揭粋€(gè)接收終端的編碼聲響信號(hào)、尤其是語音信號(hào)的恢復(fù)缺陷的方法,當(dāng)該缺陷是由發(fā)送終端持續(xù)發(fā)送的包的可變傳輸延時(shí)的結(jié)果時(shí),只要該延時(shí)保持小于一個(gè)最大延時(shí)的閾值就行。尤其是,也公知了設(shè)置一個(gè)代碼轉(zhuǎn)換的接口,它包括存儲(chǔ)以包形式接收的數(shù)字話音信號(hào)的緩沖寄存器,該寄存器被這樣設(shè)計(jì)及定參數(shù),即存儲(chǔ)足夠多數(shù)目的包,以允許在考慮到包的原始發(fā)送順序的情況下以相應(yīng)于語音原始產(chǎn)生的速率的恢復(fù)速率來恢復(fù)信號(hào)。
還具有用于消除編碼聲響信號(hào)、尤其是語音信號(hào)的恢復(fù)缺陷的方法,該缺陷是在聲響恢復(fù)最后應(yīng)被使用的時(shí)刻上在接收的包之間缺少一個(gè)包引起的。該方法尤其通過重復(fù)借助在先包傳輸?shù)穆曧懶盘?hào)的采樣以取代相應(yīng)于缺掉的包的聲響信號(hào)來起作用,或是通過根據(jù)與在先和/或隨后的一個(gè)(多個(gè))包相關(guān)的采樣內(nèi)插聲響信號(hào)來起作用。在該包中所包含的數(shù)據(jù)相應(yīng)于相對(duì)均勻的聲響信號(hào)的一部分、如相應(yīng)于一個(gè)元音或一個(gè)唇音的聲音的情況下,可相對(duì)容易地掩蓋缺掉的編碼語音信號(hào)包。但當(dāng)包含在缺掉的包中的語音信號(hào)相應(yīng)于信號(hào)遭受到快速或/或不可預(yù)料的變化的聲響信號(hào)的一部分、如爆發(fā)聲、相應(yīng)于“t”或“k”的發(fā)音時(shí),情況將不是這樣。這時(shí),無論是用取自在先的包的采樣來代替與丟失包相關(guān)的采樣,還是用對(duì)于應(yīng)被丟失的包傳輸?shù)牟蓸拥膬?nèi)插來獲得采樣的替代。語音信號(hào)的聲響恢復(fù)都將危及不能再保真及這樣恢復(fù)的語音變得難于被聽清。
通過在電話通信范圍內(nèi)對(duì)由一個(gè)終端產(chǎn)生的每個(gè)語音信號(hào)包發(fā)送兩次,可以消除或至少極大地減小丟失包及由此引起缺陷的危險(xiǎn),在該電話通信中包是在不能保證被全部傳輸以致接收終端可保證恢復(fù)它們的條件下被傳輸?shù)?。但是該方法具有在VOIP類型的這種電話通信范圍內(nèi)使語音信號(hào)從一個(gè)用戶終端向另一用戶終端傳輸所需的帶寬倍增的缺點(diǎn)。
因此,本發(fā)明提出一種在VOIP類型的電話通信過程中便于發(fā)送到一個(gè)通信系統(tǒng)中用戶終端上的數(shù)字語音信號(hào)聲響恢復(fù)的方法,該通信是通過互連網(wǎng)或在等同協(xié)議范圍內(nèi)使用等同技術(shù)的包傳輸網(wǎng)在用戶之間實(shí)時(shí)地建立的,在一個(gè)終端界面上被獲取的語音信號(hào)根據(jù)確定的編碼協(xié)議被數(shù)字地編碼,在此過程中當(dāng)它們?cè)谛纬纱ㄟ^包傳輸網(wǎng)發(fā)送到至少一個(gè)接收終端的包以前,被瞬時(shí)地切成一系列同樣時(shí)寬的片段,在接收終端上根據(jù)與所述確定編碼協(xié)議互補(bǔ)的解碼協(xié)議使包解碼,以使得可根據(jù)被恢復(fù)的信號(hào)片段并通過消除可能雙重傳輸?shù)陌笆褂醚谏w與可能丟失的包相關(guān)的信號(hào)片段的算法來重組語音信號(hào)。
該方法特別適用于消除或至少極大地減小丟失重要語音信號(hào)包及由此引起的缺陷的危險(xiǎn),其代價(jià)只是在用戶終端處作出極小的改動(dòng)及不顯著地增加傳輸帶寬。
根據(jù)本發(fā)明的一個(gè)特征,該方法在用包傳輸?shù)木幋a過程中對(duì)一系列的片段設(shè)置了一個(gè)分析,以對(duì)每個(gè)片段確定它是否“關(guān)鍵”,即在接收終端上當(dāng)發(fā)現(xiàn)相應(yīng)的包丟失時(shí)是否不易于被掩蓋算法有效代替,和/或在接收終端上在相同情況下是否應(yīng)考慮成它可被掩蓋算法代替。
根據(jù)本發(fā)明,對(duì)于每個(gè)關(guān)鍵的片段考慮設(shè)置復(fù)制包,以便由發(fā)送終端雙重地發(fā)送這些關(guān)鍵片段。
根據(jù)本發(fā)明設(shè)置了智能地,在發(fā)送終端上為了控制包傳輸通帶在與發(fā)送語音信號(hào)片段相關(guān)的一系列包中消除可代替的包。
根據(jù)本發(fā)明,考慮了在發(fā)送終端發(fā)送時(shí)恒定地保持輸出帶寬,在關(guān)鍵包、即相應(yīng)于關(guān)鍵片段的包的復(fù)制情況下,在雙重發(fā)送結(jié)束時(shí),所述保持由消除可替代包及在發(fā)送前用復(fù)制產(chǎn)生的包代替可替代的包來保證。
根據(jù)本發(fā)明,包的復(fù)制是列被認(rèn)為是關(guān)鍵的包進(jìn)行的,該關(guān)鍵包相應(yīng)于相對(duì)至少緊前一信號(hào)片段估價(jià)時(shí)具有一個(gè)誤差值大于誤差估價(jià)閾值的信號(hào)片段,所述誤差值根據(jù)編碼時(shí)所考慮的信號(hào)片段的預(yù)定特征來確定。
根據(jù)本發(fā)明,在發(fā)送終端執(zhí)行的待復(fù)制包的選擇的程序中考慮由接收終端提供的包丟失率的數(shù)據(jù)。
本發(fā)明還涉及一種通信設(shè)備、尤其是編碼器或備有編碼裝置的個(gè)人或公用用戶終端,用于與包交換網(wǎng)相連接及設(shè)置用于使用數(shù)字化聲響信號(hào)、尤其是在VOIP類型的電話通信范圍中產(chǎn)生的語音信號(hào)通過該網(wǎng)與兼容的設(shè)備通信,每個(gè)設(shè)備設(shè)有軟件和/或硬件裝置,用于執(zhí)行上述的編碼方法。
本發(fā)明的特征及其優(yōu)點(diǎn)被清楚地描述在以下參照附圖的說明中,附圖為
圖1表示關(guān)于一個(gè)具體實(shí)施根據(jù)本發(fā)明方法的通信系統(tǒng)的概要示圖,該系統(tǒng)構(gòu)成在一個(gè)允許以數(shù)字或數(shù)字化包的形式在用戶終端之間交換信息、尤其是交換語音信號(hào)的網(wǎng)的周圍。
圖2表示關(guān)于實(shí)施本發(fā)明方法的通信的、涉及VOIP的不同協(xié)議重組的一個(gè)裝置的概要示圖。
根據(jù)本發(fā)明的編碼方法尤其在互連網(wǎng)或等效協(xié)議下建立的VOIP通信的情況下由用戶終端1,1’或2通過通信網(wǎng)3使用,該通信網(wǎng)保證信息以數(shù)字或數(shù)字化信號(hào)包的形式傳輸。如已知道的,該網(wǎng)可以是互連網(wǎng)或例如設(shè)計(jì)用于使用互連網(wǎng)協(xié)議IP或總地按在用至少近似相應(yīng)的裝置滿足同類功能的范圍上的等效功能考慮的協(xié)議的專用網(wǎng)。
用戶終端1,1’,2可能不同,但它們具有共同的特征,即能發(fā)送及接收包形式的數(shù)字化語音信號(hào)。它們譬如為專用于語音數(shù)據(jù)通信的個(gè)別裝置,這里用標(biāo)號(hào)1及1’表示,如通常由英語“Screenphon”(“可視電話”)表達(dá)的終端,或?qū)涞膫€(gè)人計(jì)算機(jī)它們可能是公用的或共享的設(shè)備,這里用標(biāo)號(hào)2表示,它們用于連接多個(gè)語音終端,例如多個(gè)能通過包連接到語音數(shù)據(jù)傳輸網(wǎng)的模擬或數(shù)字化信號(hào)電話機(jī)單個(gè)終端1的一個(gè)結(jié)構(gòu)例被表示在圖1上。該終端通過電話連接通路L連接到一個(gè)通信網(wǎng)3。該連接例如是通過的通路實(shí)現(xiàn)的,該互連網(wǎng)服務(wù)的提供者通常用英語縮寫ISP(“Internet Service Provider”)表示。通常在與互連網(wǎng)連接的終端的情況下,該電話線路然后通向一個(gè)與通路連接的電話交換中心。在終端直接連接到一個(gè)包傳輸網(wǎng)的情況下,該通路L也可為一種直接連接。
典型包括一個(gè)程序管理邏輯單元4的終端1還包括一個(gè)通信接口5。該接口用于使通過網(wǎng)3與另一終端建立通信成為可能,該通信允許在終端之間交換數(shù)字?jǐn)?shù)據(jù)和/或數(shù)字化信號(hào)。如果連接通路L是一個(gè)模擬信號(hào)電話線,則該交換通過一個(gè)未示出的與該連接通路串接的調(diào)制解調(diào)器來執(zhí)行。
終端1具有一個(gè)人-機(jī)接口6,后者包括一個(gè)音頻裝置7,用于輸入通過一個(gè)送話器8獲得的聲響信號(hào)并尤其是語音信號(hào),以便它們?cè)诰幋a器/解碼器器9上編碼及形成包后經(jīng)過電話線路L傳輸。該音頻裝置也允許由數(shù)字化聲音信號(hào)及尤其是數(shù)字化語音信號(hào)恢復(fù)聲響,例如通過一個(gè)揚(yáng)聲器10播出,這些數(shù)字化聲音信號(hào)以包的形式通過電話線路L一直傳輸?shù)侥繕?biāo)用戶終端1的編碼/解碼器9。在終端1中對(duì)通過電話線路L傳送來的包執(zhí)行分向,以使得語音信號(hào)在解碼后向著音頻裝置7發(fā)送,及使數(shù)據(jù)向著一個(gè)未示出的為使用數(shù)據(jù)而設(shè)置的裝置。至少其中一些數(shù)據(jù)用于使用人-機(jī)接口6的電話應(yīng)用范圍,例如用于計(jì)數(shù)、建立及斷開通信。
一個(gè)發(fā)送及接收信號(hào)包的緩沖單元11用于保證終端1與線路L的接口。它允許在發(fā)送前暫時(shí)地存儲(chǔ)從終端的送話器8獲得的語音及聲音信號(hào)產(chǎn)生的信號(hào)包,一旦通過編碼-解碼器組件9進(jìn)行了數(shù)字化及通常需要的壓縮后將語音及聲音信號(hào)以包的形式發(fā)送時(shí),就進(jìn)行暫存。它也可以暫時(shí)地存儲(chǔ)最新的一些包,這些包是在未被編碼-解碼器組件9使用前通過線路L傳送到終端1的。
終端1備有適當(dāng)?shù)膽?yīng)用及通信程序,以及譬如一個(gè)采集器,該采集器允許發(fā)送請(qǐng)求,該請(qǐng)求通常根據(jù)HTTP協(xié)議建立,用于與它要通過網(wǎng)3訪問的另外的個(gè)人終端或共享終端1’或2通信。尤其是,終端1應(yīng)當(dāng)設(shè)有一組通信監(jiān)控協(xié)議,分別用于包及電話信號(hào),用于數(shù)據(jù)及數(shù)據(jù)包,以及用于不同包通過所選例中的電話連接線路L的傳輸。這里假定該細(xì)協(xié)議由設(shè)在相應(yīng)于IP協(xié)議的一個(gè)層15上的兩個(gè)協(xié)議堆組成的。
電話應(yīng)用的監(jiān)控是在一個(gè)應(yīng)用層12上實(shí)現(xiàn)的,這里假定它用于裝載終端設(shè)備的人-機(jī)接口。它能夠處理電話使用請(qǐng)求,用于由終端借助包通過通信網(wǎng)發(fā)送。
源于應(yīng)用層12的請(qǐng)求在與一個(gè)電話協(xié)議13結(jié)合的傳輸層13及一個(gè)向著IP協(xié)議層的轉(zhuǎn)移協(xié)議層14的范圍中被處理。這些協(xié)議13及14例如為一個(gè)標(biāo)準(zhǔn)化電話協(xié)議SIP(“Session Initiation Protocol”的縮寫)及一個(gè)標(biāo)準(zhǔn)化轉(zhuǎn)移協(xié)議TCP(“Transmission Control Protocol”的縮寫)或UDP(“Use DatagramProtocol”的縮寫)。
語音編碼器/解碼器9例如可使用一種傳統(tǒng)壓縮編碼/解碼算法,如標(biāo)準(zhǔn)化算法G723,G729,或可使用一種非壓縮算法,如G711。該編碼/解碼算法COD/DECOD在圖2中以標(biāo)號(hào)16表示,它用于根據(jù)語音信號(hào)產(chǎn)生數(shù)字化語音信號(hào)包,這里假定電話通信的范圍中由終端的送話器8獲得,及用于根據(jù)通過連接通路L傳送到終端的包恢復(fù)聲音信號(hào)及主要是語音信號(hào)。如所知道的,在被發(fā)送前,獲得的每個(gè)語音信號(hào)在最大的延時(shí)上周期性地被采樣及以包的形式被編碼,該延時(shí)的設(shè)計(jì)能遵守與實(shí)時(shí)建立的通信相關(guān)的限制。
所獲得的數(shù)字化語音的信號(hào)包在由兩個(gè)標(biāo)號(hào)分別為18及19的標(biāo)準(zhǔn)化的協(xié)議如RTP及UDP(“Real Time Protocol”及“Use Datagram Protocol”的縮寫)相結(jié)合的一個(gè)傳輸層的范圍上被處理。UDP協(xié)議確定了構(gòu)成終端1中的編碼器/解碼器9的包出發(fā)端口及構(gòu)成譬如終端1’中的編碼器/解碼器的包到達(dá)端口,后者用于通過連接通路L接收來自終端1的語音信號(hào)包。實(shí)時(shí)傳輸協(xié)議RTP提供傳輸語音信號(hào)所必需的功能及尤其是監(jiān)控機(jī)制及實(shí)時(shí)監(jiān)控所需的元素。
在以下的例子中,根據(jù)本發(fā)明的方法具體地涉及在一個(gè)終端的編碼器-解碼器9上及在RTP協(xié)議堆上的算法COD。如前所指出的,該方法旨在便于在兩個(gè)終端之間實(shí)時(shí)建立的通信過程中用包傳輸?shù)臄?shù)字化語音信號(hào)的聲響恢復(fù)?;谟^察得出,由一個(gè)用戶終端向另一用戶終端持續(xù)發(fā)送的包中丟失的某些包對(duì)聲響恢復(fù)的影響結(jié)果要比丟失的另外一些包嚴(yán)重得多。實(shí)際上,如前所述,用包傳送給一個(gè)接收終端的數(shù)字化語音信號(hào)的聲響恢復(fù)在一個(gè)包不能直接地恢復(fù)時(shí),通常使用已被應(yīng)用的掩蓋丟失包的技術(shù)來實(shí)現(xiàn)。為了掩蓋丟失的包、即為了掩蓋在以一系列包的形式連續(xù)發(fā)送的一系列片段中丟失的聲響信號(hào)的片段,將在隨后過程中用替代信號(hào)片段來代替一相應(yīng)于丟失包的片段。當(dāng)與傳送的語音相應(yīng)的聲音是規(guī)則變化及很具有預(yù)見性的聲音時(shí),所獲得的聲響恢復(fù)通常具有很好的質(zhì)量;而當(dāng)丟失的片段相應(yīng)于快速變化及捉摸不定的聲音時(shí),卻很不能使人滿意,尤其是當(dāng)語音中包含爆發(fā)音、如“t”:“k”、“p”的情況。但在發(fā)送終端上這種聲響恢復(fù)的困難是可預(yù)見的,在該發(fā)送終端上使用了保證編碼的COD算法及其本身也設(shè)置了對(duì)與在所建立的通信范圍上用包傳送來的數(shù)字化語音信號(hào)解碼的DECOD算法相關(guān)的DIS掩蓋算法。
因此,根據(jù)本發(fā)明設(shè)計(jì)了在一個(gè)終端上對(duì)已編碼的將用包發(fā)送給另一終端的語音信號(hào)進(jìn)行算法分析,以便通過聲音編碼器來重復(fù)這里被稱為“關(guān)鍵”的數(shù)字化語音信號(hào)的每個(gè)片段,這些語音信號(hào)片段以一系列包的形式發(fā)送到接收終端,如果在應(yīng)被恢復(fù)時(shí)在一系列接收包中缺少相應(yīng)的包,這些片段則不能在接收終端上有效地被DIS掩蓋算法代替。
為此,譬如這樣地設(shè)計(jì),即在發(fā)送終端上對(duì)一個(gè)信號(hào)片段確定相對(duì)在先片段是可接受的誤差估價(jià)值Ee,及復(fù)制這樣的包這些包相應(yīng)于在進(jìn)行估價(jià)時(shí)其值低于一個(gè)閾值的片段,以便有利于維持服務(wù)質(zhì)量,要不然,該服務(wù)質(zhì)量靠以聲響形式恢復(fù)片段時(shí)獲得。該誤差估價(jià)值Ee考慮到一個(gè)包或一個(gè)幀中相繼語音信號(hào)的不同特性。因此,如果所使用的編碼協(xié)議是一個(gè)線性預(yù)測(cè)標(biāo)準(zhǔn)化協(xié)議CELP(“Code Excited Linear Prediction”的縮寫)如G729,G723.1或GSM FR,可以再利用編碼的參數(shù)、主更是長期預(yù)測(cè)濾波系數(shù),短期濾波參數(shù),及再兩個(gè)幀之間的誤差能量,以便獲得對(duì)誤差估價(jià)值Ee的求值。
根據(jù)本發(fā)明,考慮到在為了用包發(fā)送的編碼過程中分析這些片段,以確定哪些片段是關(guān)鍵的,即在接收終端上如果與片段對(duì)應(yīng)的包正好丟失時(shí),不易于由掩蓋算法有效替代的每個(gè)片段。也考慮到在編碼過程中分析這些片段,以發(fā)現(xiàn)是否存在能被接收終端在同樣條件下-即當(dāng)與它相應(yīng)的包已丟失時(shí)-考慮為可由掩蓋算法替代的片段。
為了當(dāng)一旦出現(xiàn)包丟失或具有不能允許的延遲危險(xiǎn)時(shí),能有利于在接收終端上恢復(fù)用包傳輸?shù)臄?shù)字化語音信號(hào)的聲響,考慮到在發(fā)送終端上復(fù)制這些關(guān)鍵片段,及將每個(gè)關(guān)鍵包、即與關(guān)鍵片段對(duì)應(yīng)的包雙重地發(fā)送到接收終端。
當(dāng)誤差估價(jià)值Ee的確定已完成時(shí),將考慮由發(fā)送終端對(duì)于其誤差估價(jià)值大于預(yù)定閾值的信號(hào)片段所對(duì)應(yīng)的每個(gè)包進(jìn)行復(fù)制-所謂智能復(fù)制-及雙重發(fā)送。
由此可減小在有效時(shí)間上不能被接收終端接收到關(guān)鍵包的危險(xiǎn),這些關(guān)鍵包相應(yīng)于具有不能由接收終端中設(shè)有的掩蓋算法替代的危險(xiǎn)的語音信號(hào)片段。此外,如所知道的,復(fù)制包的接收不會(huì)在接收終上端引起后果,因?yàn)閭鹘y(tǒng)地在RTP協(xié)議中已考慮了對(duì)于已接收的包消除其復(fù)制包。
對(duì)指定受發(fā)送終端復(fù)制的包的選擇可考慮不同的選擇因素。一種智能復(fù)制主要考慮,當(dāng)接收終端根據(jù)包含在其接收到的包首端的信息對(duì)傳送來的包進(jìn)行計(jì)數(shù)時(shí)及當(dāng)在當(dāng)前VOIP電話通信范圍中它通過隨后向包發(fā)送終端發(fā)送的RTCP信息發(fā)送關(guān)于該計(jì)數(shù)信息時(shí),由接收終端來接收到的包的數(shù)目或比例。
還設(shè)置了在發(fā)送終端上確定關(guān)于選擇待復(fù)制包功能,這除了考慮來自接收終端可能的包丟失數(shù)據(jù)外,還要考慮瞬時(shí)位傳輸速率、平均位傳輸速率和/或不穩(wěn)定或“跳動(dòng)”率。還考慮到,在與另一終端通信時(shí)由一個(gè)終端發(fā)送它使用的丟失包掩蓋算法DIS的識(shí)別信息的可觸性。這可使每個(gè)終端能在發(fā)送前考慮掩蓋算法DIS的特性來確定哪些是它應(yīng)該復(fù)制的包,該掩蓋算法是由與它通信的終端在接收時(shí)使用的。
當(dāng)已達(dá)到對(duì)發(fā)送終端設(shè)置的輸出帶寬及需要發(fā)送由復(fù)制產(chǎn)生的包時(shí),根據(jù)本發(fā)明考慮了這時(shí)取消對(duì)某些包的編碼。一種智能的刪除成為可能,因?yàn)榇嬖谥诮邮諘r(shí)能被接收終端的掩蓋算法有效替代的包。還可以用判斷為必需發(fā)送的包來替代被發(fā)送終端分析為可由接收終端替代的包。對(duì)于在上述條件下由智能復(fù)制產(chǎn)生的包可實(shí)現(xiàn)這種替代。
接收終端然后力圖通過以由接收到的包各自的首端指出的固定原始順序恢復(fù)接收的包、并用掩蓋算法替代丟失的包及消除由復(fù)制產(chǎn)生的并已接收到其復(fù)制的每個(gè)包,來重組被用于構(gòu)成一系列被接收包的的語音信號(hào)片段的原始序列。
將本發(fā)明的編碼方法用到一個(gè)用戶終端如圖1的終端1中,可通過時(shí)該終端中用于聲響信號(hào)-尤其終端的語音信號(hào)-包形式編碼的軟件及可能的硬件裝置范圍中的編碼器和/或用戶終端所包含的編碼算法COD及RTP層作出的修改來實(shí)現(xiàn)。
權(quán)利要求
1.一種在VOIP類型的電話通信過程中便于發(fā)送到一個(gè)通信系統(tǒng)中用戶終端(1,1’或2)上的數(shù)字化語音信號(hào)聲響恢復(fù)的編碼方法,該通信是通過包傳輸網(wǎng)(3)并尤其是互連網(wǎng)在用戶之間建立的,在一個(gè)終端上被獲取的語音信號(hào)根據(jù)編碼協(xié)議被數(shù)字地編碼,在此過程中當(dāng)它們待通過傳輸網(wǎng)以發(fā)送包形式的片段發(fā)送到至少一個(gè)接收終端以前,被瞬時(shí)地切成一系列同樣時(shí)寬的片段,在接收終端上根據(jù)與所述確定編碼協(xié)議互補(bǔ)的解碼協(xié)議使包解碼,以使得可根據(jù)被恢復(fù)的信號(hào)片段并通過消除可能雙重傳輸?shù)陌笆褂醚谏w與可能丟失的包相關(guān)的信號(hào)片段的算法來重組語音信號(hào),其特征在于該方法在用包傳輸?shù)木幋a過程中對(duì)一系列的片段設(shè)置了一個(gè)分析,以對(duì)每個(gè)片段確定它是否“關(guān)鍵”,即在接收終端上當(dāng)發(fā)現(xiàn)相應(yīng)的包丟失時(shí)是否不易于被掩蓋算法有效代替,和/或在接收終端上在相同情況下是否應(yīng)考慮成它可被掩蓋算法代替。
2.根據(jù)權(quán)利要求1的編碼方法,其中對(duì)于每個(gè)關(guān)鍵的片段設(shè)置一個(gè)復(fù)制包,以便由發(fā)送終端雙重地發(fā)送這些關(guān)鍵片段。
3.根據(jù)權(quán)利要求1,2中一項(xiàng)的編碼方法,其中考慮在發(fā)送終端上當(dāng)包傳輸通帶撿驗(yàn)結(jié)束時(shí)在與發(fā)送語音信號(hào)片段相關(guān)的一系列包中消除可代替的包。
4.根據(jù)權(quán)利要求3的編碼方法,其中考慮在發(fā)送終端發(fā)送時(shí)恒定地保持輸出帶寬,在關(guān)鍵包復(fù)制的情況下,為了雙重發(fā)送,所述保持由消除可替代包及在發(fā)送前用復(fù)制產(chǎn)生的包代替可替代的包來保證。
5.根據(jù)權(quán)利要求2,4中一項(xiàng)的編碼方法,其中包的復(fù)制是對(duì)關(guān)鍵包進(jìn)行的,該關(guān)鍵包相應(yīng)于相對(duì)至少緊前一信號(hào)片段估價(jià)時(shí)具有一個(gè)誤差值大于誤差估價(jià)閾值的信號(hào)片段,所述誤差值根據(jù)編碼時(shí)所考慮的信號(hào)片段的預(yù)定特征來確定。
6.根據(jù)權(quán)利要求2至5中一項(xiàng)的編碼方法,其中在發(fā)送終端執(zhí)行的待復(fù)制包的選擇的程序中考慮由接收終端提供的包丟失率的數(shù)據(jù)。
7.通信設(shè)備、尤其是編碼器或備有編碼裝置的個(gè)人或公用用戶終端,用于與包交換網(wǎng)(3)相連接及設(shè)置用于使用數(shù)字化聲響信號(hào)、尤其是在VOIP類型的電話通信范圍中產(chǎn)生的語音信號(hào)通過該網(wǎng)與兼容的設(shè)備通信,所述設(shè)備設(shè)有軟件和/或硬件裝置,用于根據(jù)確定協(xié)議數(shù)字地編碼將發(fā)送的聲響信號(hào)、尤其是語音信號(hào),通過該協(xié)議在以包形式發(fā)送以前,這些信號(hào)被瞬時(shí)地切成一系列同樣時(shí)寬的片段,及通過消除可能雙重接收的包及使用掩蓋與在一系列接收包中可能丟失的包相關(guān)的信號(hào)片段的算法來以聲響形式恢復(fù)以包形式發(fā)送的數(shù)字化聲響片段,其特征在于它包括軟件裝置(16,19)及硬件裝置(4,9),用于執(zhí)行根據(jù)權(quán)利要求1至6中任一項(xiàng)的編碼方法。
全文摘要
在VOIP類型的電話通信過程中發(fā)送到一個(gè)用戶終端(1,1’或2)上語音信號(hào)的編碼方法,該通信是通過包傳輸網(wǎng)(3)建立的。傳統(tǒng)地,在被編碼及以包形式發(fā)送前,被終端編碼器(9)切成一系列同樣時(shí)寬的片段,及根據(jù)接收包,通過消除雙重接收的包及使用掩蓋與丟失的包相關(guān)的信號(hào)片段的算法來重組語音信號(hào)。該方法設(shè)有一個(gè)對(duì)編碼的分析,以便當(dāng)相應(yīng)包丟失時(shí)重復(fù)不易于被掩蓋算法替代的每個(gè)片段。對(duì)于被分析為不易于被替代的片段所對(duì)應(yīng)的每個(gè)包由發(fā)送終端雙重地發(fā)送。
文檔編號(hào)G10L19/005GK1321968SQ0111705
公開日2001年11月14日 申請(qǐng)日期2001年2月2日 優(yōu)先權(quán)日2000年2月3日
發(fā)明者盧卡·阿蒂蒙特, 皮埃爾·伯納德 申請(qǐng)人:阿爾卡塔爾公司