亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

改善串聯(lián)聲碼器話音質(zhì)量的方法與設(shè)備的制作方法

文檔序號:7533220閱讀:408來源:國知局
專利名稱:改善串聯(lián)聲碼器話音質(zhì)量的方法與設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種在可能是無線性質(zhì)的通信環(huán)境中發(fā)送數(shù)字化話音信號的方法與設(shè)備。更具體而言,涉及一種改善音頻信號質(zhì)量的方法與設(shè)備,當該信號從通信網(wǎng)絡(luò)的一端傳送到另一端時,該音頻信號已被用數(shù)字信號處理技術(shù)進行了壓縮或編碼。
背景技術(shù)
近年來,為了滿足不同有線和無線通信系統(tǒng)的帶寬需要,遠程通信工業(yè)已經(jīng)出現(xiàn)了各種各樣數(shù)字聲碼器急劇增加的趨勢,名字《聲碼器》就起源于這樣的事實,它的應(yīng)用主要是特定于話音信號的編碼與解碼。聲碼器通常被集成在通信網(wǎng)絡(luò)的移動電話和基站中。它們提供數(shù)字化話音信號的語音壓縮以及反變換。典型情況下,話音信號通過許多量化技術(shù)中的一種被數(shù)字化。這些技術(shù)的例子是脈幅調(diào)制(PAM),脈碼調(diào)制(PCM)和Δ調(diào)制。為了本描述的目的,我們把PCM認為是聲碼器的輸入格式。因此,聲碼器包括一個編碼級,它將接受數(shù)字化話音信號作為輸入并輸出已壓縮信號,可能的壓縮比是8∶1。說到反變換,聲碼器有一個解碼級,它將接受已壓縮的語音信號并輸出數(shù)字化信號,例如PCM樣本。
壓縮語音的主要優(yōu)點在于它將使用較少的有限可用的信道帶寬供傳輸,主要缺點是損失語音質(zhì)量。
最現(xiàn)代的低位速率聲碼器是基于線性預(yù)測模型,將語音信號分成一組線性預(yù)測系數(shù),殘差信號和各種其它的參數(shù)。一般,可將語音從這些成分以良好的質(zhì)量恢復(fù)。然而,當語音須經(jīng)多級聲碼器的場合時,就要引入質(zhì)量降低。
在網(wǎng)絡(luò)多樣性及這些網(wǎng)絡(luò)用戶數(shù)目的快速增長使這樣一些場合的數(shù)量在不斷增長,即兩個聲碼器串聯(lián)放置服務(wù)于單一的連接點。在這樣的情況下,第一編碼器用于壓縮第一移動用戶的語音。已壓縮的語音被傳送到服務(wù)于本地移動用戶的基站,在其中被去壓縮(變換到PCM格式樣本)。得到的PCM樣本經(jīng)電話網(wǎng)絡(luò)的數(shù)字干線到達服務(wù)于第二移動終端的基站,其中第二編碼器用于壓縮輸入信號以便傳送到第二移動終端。在第二移動終端上的語音解碼器將接收到的已壓縮語音數(shù)據(jù)去壓縮,從而合成來自第一移動終端的原來的語音信號。這樣一種情況的一個特殊的例子,可以包含從按照北美時分多址(TDMA)系統(tǒng)工作的無線終端呼叫到歐洲標準全球移動系統(tǒng)(GSM)的移動電話。
在一種消除聲碼器串聯(lián)條件的嘗試中,在過去已經(jīng)提出一種稱為《旁路》的方法。在這種方法背后的基本思路是提供一種包括聲碼器和旁路機構(gòu)的數(shù)字信號處理器,當輸入信號的格式與聲碼器兼容時,此旁路機構(gòu)投入使用。在使用中,數(shù)字信號處理器與從第一移動終端接收RF信號的第一基站有聯(lián)系,確定通過發(fā)信號并控制存在于第二基站的完全相同的數(shù)字信號處理器,第二基站與呼叫所指向的移動終端有聯(lián)系。與第一基站有聯(lián)系的數(shù)字信號處理器并不將已壓縮的語音信號變換成PCM樣本,使旁路機構(gòu)投入工作并將已壓縮的語音輸出到通信網(wǎng)絡(luò)中。當已壓縮的語音信號到達與第二基站有聯(lián)系的數(shù)字信號處理器時,按預(yù)定路線傳送,例如將本地的聲碼器旁路。信號的去壓縮只發(fā)生在第二移動終端?!芭月贰狈椒ū幻枋鲈谌掌谑?995年12月13日的國際申請序號PCT95CA704中。所公開的內(nèi)容被引入于此作為參考。
然而,這種解決辦法只對完全相同的聲碼器有效,隨著網(wǎng)絡(luò)的快速擴展。聲碼器的參差也快速增長。因此,旁路的解決辦法只對包含串聯(lián)聲碼的小部分連接點有用。
因而,存在著一種工業(yè)上的需要,提供在包括不兼容的串聯(lián)聲碼器的連接期間能夠改善話音質(zhì)量的設(shè)備。
發(fā)明的目的與陳述本發(fā)明的一個目的是提供一種處理音頻信號的設(shè)備,當信號在通信網(wǎng)絡(luò)中的兩個聲碼器之間交換時,可以減少信號質(zhì)量下降。
本發(fā)明的另一個目的是提供一種方法,用于當信號在通信網(wǎng)絡(luò)中從一個聲碼器傳送到另一個聲碼器時減少音頻信號質(zhì)量下降。
正如在此實施并廣泛描述的那樣,本發(fā)明提供一種處理音頻信號的設(shè)備,所述的設(shè)備包括一個輸入與一個輸出,所述的設(shè)備對施加到所述的輸入的第一格式的一幀已壓縮音頻數(shù)據(jù)作出響應(yīng),在所述的輸出產(chǎn)生一幀第二格式的已壓縮的音頻數(shù)據(jù),第一格式的幀有一個系數(shù)段和一個激勵段,第二格式的幀有一個系數(shù)段和一個激勵段,所述的設(shè)備包括
a)連接到所述的輸入的第一處理裝置,用于接收第一格式的已壓縮音頻數(shù)據(jù)幀的系數(shù)段并在所述的輸出發(fā)出第二格式的已壓縮音頻數(shù)據(jù)幀的系數(shù)段;b)連接到所述的輸入的第二處理裝置,用于從第一格式的已壓縮音頻數(shù)據(jù)幀產(chǎn)生第二格式的已壓縮音頻數(shù)據(jù)幀的激勵段。
在本發(fā)明的一種最佳實施方案中,提供一對變碼器,實現(xiàn)已壓縮音頻信號從一種格式變換到不同的格式。每個變碼器有一個偽解碼器,將輸入已壓縮音頻信號變換到一種公共的格式。然后在電話公司網(wǎng)絡(luò)上,傳送到第二變碼器。在遠程的變碼器上的偽編碼器處理此公共格式信號并將變換為具有與送到第一變碼器的原來已壓縮音頻信號不同格式的已壓縮音頻信號,為了實現(xiàn)全雙工操作,每個變碼器有一個偽解碼器。產(chǎn)生公共格式信號,和有一個偽編碼器,將公共格式信號變換為已壓縮音頻信號。
當電話網(wǎng)絡(luò)有各種各樣不相同的聲碼器時,本系統(tǒng)特別有利。為了使語音信號能夠從一種聲碼器交換到另一種聲碼器,不考慮是否它們是相同還是不相同,它必須經(jīng)歷將由本地聲碼器發(fā)出的已壓縮音頻信號變換為遠方的偽編碼器可以處理的公共格式,此公共格式可被規(guī)定為一種中間形式的已壓縮音頻信號,指望將本地聲碼器的偽解碼器發(fā)送的重要參數(shù)信息直接傳送到遠方聲碼器的偽編碼器,這樣的參數(shù)信息包括系數(shù)段和描述被發(fā)送的語音信號的激勵段的參數(shù)。公共格式形式的一種重要要素是當它被網(wǎng)絡(luò)中的聲碼器之一編碼時保留音頻信號的基本幀結(jié)構(gòu),此網(wǎng)絡(luò)在一個給定的呼叫期間可互相連接。具體而言,公共格式幀包括一個系數(shù)段和一個激勵段,將在以下解釋,然而,指出這一點是重要的,作為一種公共格式結(jié)構(gòu),并不試圖使音頻信號成為PCM樣本或者等效的形式。這是不希望的,因為已壓縮的信號變換為PCM,然后把PCM樣本變換為壓縮的形式引起信號質(zhì)量方面很大的降低,應(yīng)該盡可能地避免。本發(fā)明已經(jīng)發(fā)現(xiàn),通過設(shè)計一種公共格式配置,在聲碼器編碼時保留音頻信號的基本結(jié)構(gòu),這些質(zhì)量下降被大大減少。
在本技術(shù)說明中,術(shù)語“系數(shù)段”是認為任何唯一規(guī)定一個濾波函數(shù)的系數(shù)集,此函數(shù)模擬人的發(fā)聲系統(tǒng)。也可看作是任何類型的信息格式,系數(shù)可間接地從此格式抽出。在通常的聲碼器中,幾種不同類型的系數(shù)是已知的,其中,包括反射系數(shù),反射系數(shù)的反正弦,線譜對,對數(shù)區(qū)比例。這些不同類型的系數(shù)通常通過數(shù)字變換相聯(lián)系,并具有使它們適合不同應(yīng)用的不同性質(zhì)。因此,術(shù)語“系數(shù)段”打算包含這些類型系數(shù)中任何一種。
“激勵段”可被認為是這樣一種信息,為了提供音頻信號的完整表象需要與系數(shù)段聯(lián)合的信息。也可認為是任何類型的信息格式,激勵可從此格式間接抽出。當合成信號以便獲得非壓縮形式的信號,如PCM樣本形式的信號時,激勵段補充系數(shù)段,其中,這樣的激勵段可以包括描述語言信號周期性的參數(shù)信息,作為由偽解碼器計算的激勵信號,語言幀控制信號,保證在與遠方聲碼器有聯(lián)系的偽編碼器中同步的編幀,音頻周期,音調(diào)滯后、增益與相對增益。系數(shù)段與激勵段在通過電話公司網(wǎng)絡(luò)發(fā)送信號中可用各種方法表示。一種可能性是這樣發(fā)送信息,換句話說,是代表要通信的參數(shù)值的位序列,另一種可能性是發(fā)送索引目錄,并不由它們自己傳送公共格式信號的參數(shù),只是簡單地在數(shù)據(jù)庫或編碼手冊中組成表列值,允許偽編碼器查尋此數(shù)據(jù)庫,并根據(jù)接收到的各種索引抽出適當?shù)男畔⒁员憬M成公共格式信號。
表達詞“第一格式”,“第二格式”或“第三格式”,當用于描述壓縮形式中的音頻信號時,或者是在公共格式形式中,或是在給定的聲碼器的格式中,述及這些信號,一般而言,雖然它們共同使用一種公共的基本結(jié)構(gòu),但它們是不相兼容的,換句話說,它們被分成系數(shù)段和激勵段。因此,能夠變換第一格式下的信號的聲碼器,一般而言,將不能夠處理被表達為任何其它不是第一格式的信號。
在一種最佳實施方案中,壓縮形式的音頻信號變換到公共格式是用兩步實現(xiàn)的。第一步是處理壓縮音頻信號數(shù)據(jù)幀中的系數(shù)段,產(chǎn)生公共格式的系數(shù)段。一般而言,從一種類型的系數(shù)變換到另一種是由眾所周知的數(shù)學(xué)算法實現(xiàn)的。取決于與偽解碼器有聯(lián)系的聲碼器的類型,這種變換可以簡單地通過將系數(shù)從壓縮音頻信號數(shù)據(jù)幀重新量化為組成公共格式數(shù)據(jù)幀的系數(shù)的新值來實現(xiàn)。下一步,公共格式數(shù)據(jù)幀的激勵段是通過處理幀能量,增益值,滯后值和編碼手冊信息(通常作為聲碼器的解碼部分)獲得并在形成公共格式數(shù)據(jù)幀以前將激勵信號量化。
通過偽編碼器從公共格式數(shù)據(jù)幀變換到壓縮音頻信號是以與早些時候描述過的類似方式實現(xiàn)的,公共格式數(shù)據(jù)幀的系數(shù)段首先被處理,產(chǎn)生壓縮音頻信號數(shù)據(jù)幀的系數(shù)段,壓縮音頻信號數(shù)據(jù)幀的激勵段首先通過合成語音信號來獲得,將公共格式激勵段通過一個系數(shù)也從公共格式取得的濾波器來實現(xiàn)。通常,此信號被施加到聲碼器的編碼部分。
另一種從另一格式的數(shù)據(jù)幀獲得一種格式的激勵段,并不合成音頻信號和實現(xiàn)分析的可能性是僅僅從源數(shù)據(jù)幀的激勵段中可得到的數(shù)據(jù)重新計算激勵段。此方法或以上描述的方法的選擇將取決于打算的應(yīng)用或需要變換的類型。具體而言,通過互相獨立地重新計算每幀的段,某些格式的壓縮音頻信號可容易地被變換到公共格式。然而,在其它情況下,比較實際的是使用一種合成分析方法獲得激勵段。
正如在此實施并廣泛描述的那樣,本發(fā)明還提供一種發(fā)送一個數(shù)據(jù)幀的壓縮音頻信息的設(shè)備,所述的設(shè)備包括a)包括第一輸入和第一輸出的的第一變碼器,所述的第一變碼器對于施加到所述的輸入的第一格式的一幀壓縮音頻數(shù)據(jù)作出響應(yīng),在所述的輸出產(chǎn)生一幀第二格式的壓縮音頻數(shù)據(jù),第一格式的幀具有系數(shù)段和激勵段,第二格式的幀具有系數(shù)段和激勵段;b)包括第二輸入和第二輸出的第二變碼器,所述的第二輸入連到所述的第一輸出,接收第二格式的壓縮音頻數(shù)據(jù)幀,所述的第二變碼器對于施加到所述的第二輸入的第二格式的壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的第二輸出產(chǎn)生第三格式的壓縮音頻數(shù)據(jù)幀,第三格式的幀具有系數(shù)段和激勵段。
正如在此實施并廣泛描述的那樣,本發(fā)明提供一種處理數(shù)字化與壓縮的形式的音頻信息的數(shù)據(jù)幀的表象的方法。數(shù)據(jù)幀包括系數(shù)段和激勵段,數(shù)據(jù)幀處于第一格式,所述的方法包括以下步驟a)處理第一格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生第二格式數(shù)據(jù)幀的系數(shù)段;b)處理第一格式數(shù)據(jù)幀,產(chǎn)生第二格式數(shù)據(jù)幀的激勵段;c)將在步驟a和b產(chǎn)生的第二格式數(shù)據(jù)幀的系數(shù)段與第二格式數(shù)據(jù)幀的激勵段組合起來,分別產(chǎn)生代表包含在第一格式數(shù)據(jù)幀中的音頻信息的第二格式數(shù)據(jù)幀。
正如在此實施和廣泛描述的那樣,本發(fā)明提供一種傳送代表數(shù)字化與壓縮形式的音頻信息的數(shù)據(jù)幀的方法,數(shù)據(jù)幀包括系數(shù)段和激勵段,數(shù)據(jù)幀處于第一格式,所述的方法包括以下步驟a)在第一地點處理第一格式的數(shù)據(jù)幀,產(chǎn)生第二格式的數(shù)據(jù)幀,第二格式的數(shù)據(jù)幀包括系數(shù)段和激勵段;
b)將第二格式的數(shù)據(jù)幀發(fā)送到遠離所述的第一地點的第二地點;c)在所述的第二地點處理第二格式的數(shù)據(jù)幀,產(chǎn)生第三格式的數(shù)據(jù)幀,第三格式的數(shù)據(jù)幀包括系數(shù)段和激勵段。
正如在此實施并廣泛描述的那樣,本發(fā)明提供一種在不兼容的聲碼器之間傳送音頻信號的方法,所述的方法包括以下步驟a)從第一聲碼器接收第一格式的數(shù)據(jù)幀,此數(shù)據(jù)幀包括系數(shù)段和激勵段;b)將第一格式的數(shù)據(jù)幀變換為中間格式的數(shù)據(jù)幀包括以下子步驟ⅰ)處理第一格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生中間格式數(shù)據(jù)幀的系數(shù)段;ⅱ)處理第一格式數(shù)據(jù)幀,產(chǎn)生中間格式數(shù)據(jù)幀的激勵段;ⅲ)將中間格式數(shù)據(jù)幀的系數(shù)段與中間格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包含第一格式數(shù)據(jù)幀中音頻信息的中間格式數(shù)據(jù)幀;c)將中間格式數(shù)據(jù)幀變換為第三格式數(shù)據(jù)幀包括以下子步驟ⅰ)處理中間格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生第三格式數(shù)據(jù)幀的系數(shù)段;ⅱ)處理中間格式的數(shù)據(jù)幀,產(chǎn)生第三格式數(shù)據(jù)幀的激勵段;ⅲ)將第三格式數(shù)據(jù)幀的系數(shù)段與第三格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包含在第一格式和中間格式數(shù)據(jù)幀中的音頻信息的第三格式數(shù)據(jù)幀。
d)將第三格式數(shù)據(jù)幀發(fā)送到第二聲碼器。
正如在此實施并廣泛描述的那樣,本發(fā)明提供一種機器可讀的存儲媒介,包含命令計算機處理音頻信號的程序部分,所述的計算機包括一個輸入與一個輸出,所述的程序部分使所述的計算機對施加到所述的輸入的第一格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的輸出產(chǎn)生第二格式壓縮音頻數(shù)據(jù)幀,第一格式幀具有系數(shù)段和激勵段,第二格式幀具有系數(shù)段和激勵段,所述的在所述的計算機功能塊中實施的程序部分包括a)連接到所述輸入的第一處理裝置,用于接收第一格式壓縮音頻數(shù)據(jù)幀的系數(shù)段和在所述的輸出發(fā)出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段;b)連接到所述輸入的第二處理裝置,用于從第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀產(chǎn)生第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段。
正如在此實施并廣泛描述的那樣,本發(fā)明進一步提供一種聲碼器之間的接口節(jié)點,用于將第一格式壓縮音頻信號幀變換為第二格式壓縮音頻信號幀,第一格式幀具有系數(shù)段和激勵段,第二格式幀具有系數(shù)段和激勵段,所述的節(jié)點包括a)包括第一輸入和第一輸出的第一變碼器,所述的第一變碼器對施加到所述的輸入的第一格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的輸出產(chǎn)生中間格式壓縮音頻數(shù)據(jù)幀,中間格式幀具有系數(shù)段和激勵段;b)包括第二輸入和第二輸出的第二變碼器,所述的第二輸入連到所述的第一輸出接收中間格式壓縮音頻數(shù)據(jù)幀,所述的第二變碼器對施加到所述的第二輸入的中間格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的第二輸出產(chǎn)生第二格式壓縮音頻數(shù)據(jù)幀。
附圖簡述

圖1是CELP聲碼器編碼級的方框圖;圖2是CELP聲碼器解碼級的方框圖;圖3a是無線移動終端和固定(有線)終端之間一個通信線路的略圖;圖3b是帶有包括兩個變碼器的本發(fā)明的實施方案的兩個無線移動終端之間一個通信線路的略圖;圖3c是帶有包括一個交叉變碼節(jié)點的本發(fā)明的一種實施方案的兩個無線移動終端之間一個通信線路的略圖;圖4是依據(jù)本發(fā)明組成的一種系統(tǒng)的方框圖,通過一種公共格式將已壓縮的語音信號從一種格式轉(zhuǎn)換為另一種格式不需要將信號去壓縮為PCM類型的數(shù)字化技術(shù);圖5是描繪在圖4中的系統(tǒng)的更詳細的方框圖;圖6是一種交叉變碼節(jié)點的方框圖,是組成圖5所描繪的系統(tǒng)的一個變型;圖7a示出IS54格式的數(shù)據(jù)幀;圖7b示出圖5中的變碼器或圖6中的變碼器產(chǎn)生的公共格式的數(shù)據(jù)幀;圖7c示出IS641格式的數(shù)據(jù)幀;圖8是將IS54格式的已壓縮語音數(shù)據(jù)幀變換為公共格式的操作流程圖;圖9是將公共格式數(shù)據(jù)幀變換為已壓縮語音幀IS141的操作流程圖;圖10是實現(xiàn)圖5中所示的類型的偽編碼器的功能的一種設(shè)備的方框圖;圖11是示于圖10中的設(shè)備的功能性方框圖;和圖12是示于圖10中設(shè)備的一種變型的功能性方框圖;最佳實施方案的描述以下是目前應(yīng)用在無線遠程通信中的線性預(yù)測編碼(LPC)聲碼器技術(shù)的描述,一種有特殊興趣的應(yīng)用是在移動終端和固定基站之間的信號的無線傳輸。另一種應(yīng)用是在互聯(lián)通信網(wǎng)絡(luò)上的語音傳輸,在其中不同的聲碼器可用于無線網(wǎng)絡(luò)的分開的部件中。
在信道帶寬受到重視的通信應(yīng)用中,利用盡可能小的傳輸信道部分是必要的。一種公共的解決辦法是在傳輸以前,將由用戶發(fā)出的話音信號量化與壓縮。
典型的做法是,話音信號首先通過許多量化技術(shù)中的一種被數(shù)字化。這些技術(shù)中的例子是脈幅調(diào)制(PAM),脈碼調(diào)制(PCM)和Δ調(diào)制,PCM或許是最通用的。基本上,在PCM中,模擬信號的樣本在特定的速率(通常是8KHz)上被取得并量化為離散值以便用數(shù)字格式表示。
為了最佳使用傳輸信道,包括編碼和解碼級的編譯碼器用來分別在源及接收點壓縮(和去壓縮)數(shù)字信號。專門用于話音信號的編譯碼器被授與《聲碼器》的名稱(用于話音編碼)。通過只對語音信號的必要特性編碼,傳輸需要的位數(shù)要比用不大大降低語音質(zhì)量的方法再現(xiàn)原來波形所需要的要少,由于需要較少的位數(shù),較低位速率傳輸將可實現(xiàn)。
目前,最低位速率聲碼器是線性預(yù)測編碼(LPC)家族,它是從時間域的波形提取適當?shù)恼Z音特征。聲碼器具有兩個主要的部件編碼器和解碼器,編碼器部分處理數(shù)字化語音信號將它壓縮,而解碼器部分將被壓縮的語音擴展為數(shù)字化音頻信號。
LPC型聲碼器利用過去的P個語音的樣本(Sn-k)的加權(quán)和來估算目前的樣本(Sn)。數(shù)目P確定模型的階數(shù)。階數(shù)越高,語音質(zhì)量越好,典型的模型階數(shù)在10到15的范圍內(nèi)。以下,語音樣本的等式可寫為sn=Σk=1paksn-k+en]]>其中,ak是確定上一個樣本Sn-k的貢獻的系數(shù),和en是當前樣本的誤差信號,利用Sn和en的Z變換,和定義一個預(yù)測濾波器,我們得到s(z)=e(z)1A(z)]]>其中A(z)=1+Σk=1pakz-k]]>濾波器
只有極點,因此被稱為全極點濾波器。
圖1是CELP聲碼器一般模型編碼部分的方框圖。由此圖可見,輸入到編碼器部分音域分析方框100的是PCM樣本。輸出是由代表預(yù)測誤差信號(也叫做殘差)的幾個參數(shù)組成的LPC濾波器系數(shù)段和激勵段組成。此輸出被轉(zhuǎn)交到遠程通信信道。
在系數(shù)段中LPC濾波器系數(shù)的數(shù)目由模型的階數(shù)P確定,激勵段參數(shù)的例子是激勵的性質(zhì)(話音或非話音),音調(diào)周期(對于話音激勵的情況),增益系數(shù),能量,音調(diào)預(yù)測增益,等。編碼激勵線性預(yù)測(CELP)聲碼器是目前用在電話中最普遍的聲碼器類型。替代發(fā)送激勵參數(shù),CELP聲碼器發(fā)送索引信息,它指出在自適應(yīng)的隨機的編碼手冊中一組向量,也就是說,對于每個語音信號,編碼器通過它的編碼手冊搜索當用作對LPC合成濾波器激勵時,對聲音感覺匹配得最好的一組向量。
包括此信息的語音幀每隔T秒鐘重新計算一次。T的通常值是20ms,一個20ms的壓縮語音幀代表在8KHz速率上取得的160個PCM樣本。
圖2是CELP聲碼器一般性模型解碼部分的方框圖。壓縮語音幀是從遠程通信信道210接收到的并送到LPC合成濾波器220。LPG合成濾波器220利用LPC濾波器系數(shù)段和激勵段產(chǎn)生通常是PCM樣本形式的輸出語音信號。
一種稱為內(nèi)插的技術(shù)被用來增強聲碼器。它把20ms的語音幀再分成5ms的子幀,并內(nèi)插它們的預(yù)測器系數(shù),這種技術(shù)對于避免在產(chǎn)生的語音信號中不希望的《爆裂聲》或《卡搭聲》噪音是有用的,這些噪音通常是預(yù)測器系數(shù)從一個信號幀到其它的信號幀快速變化的結(jié)果。具體而言,為參考的目的,每個信號幀被分成四個子幀,可標記為子幀(1),子幀(2),子幀(3)和子幀(4),用于在第一子幀,也就是子幀(1)上產(chǎn)生語音信號的預(yù)測器系數(shù)是前一幀預(yù)測器系數(shù)與當前幀系數(shù)的組合,比例是75%/25%,對于子幀(2),這個比例改變?yōu)?0%/50%,對于子幀(3),此比例達到25%/75%,而對于最后的子幀,子幀(4),此比例是0%/100%,換句話說,只有來自當前幀的系數(shù)被使用。
圖3a,3b和3c是描繪包括無線通信線路和具體實施CELP聲碼器技術(shù)的電話通信的略圖。
圖3a是無線移動終端300與固定(有線)終端330之間通信線路的略圖。語音由位于移動終端300中的聲碼器壓縮(編碼)并通過無線通信線路(RF信道)發(fā)送到基站310,在其中由第二聲碼器的解碼器將它解碼為PCM樣本。然后通過遠程通信公司網(wǎng)絡(luò)315的數(shù)字干線中各種開關(guān),此信號被指向中心辦公室320,固定終端330物理上就是連到此處,在中心辦公室,數(shù)字信號被變換為模擬格式并傳送到終端330,在這樣一種情景中,語音只被壓縮與去壓縮一次。
圖3b是帶有包括兩個變碼器的本發(fā)明實施方案的兩個無線移動終端340與380之間通信線路的略圖,語音由位于移動終端A340中的聲碼器壓縮(編碼)并通過無線通信線路(RF信道A)發(fā)送到基站A350,在其中由第二聲碼器的解碼器將它解碼為PCM樣本。然后,通過遠程通信公司網(wǎng)絡(luò)360,PCM樣本被發(fā)送到第二移動終端的基站B370,在其中它們第二次被第二基站聲碼器壓縮(編碼)。壓縮信號通過無線通信線路(RF信道B)發(fā)送到移動終端380,在其中由第二移動終端的聲碼器將它第二次解碼。然后在移動終端380可得到聽得見的語音。圖3b也示出包括兩個變碼器392和394的本發(fā)明的一種實施方案,這將在以下作詳細的描述。
圖3c是帶有包括交叉變碼節(jié)點390的本發(fā)明實施方案的兩個無線移動終端之間通信線路的略圖,交叉變碼節(jié)點將在以下作詳細的描述。
這種聲碼器的方案是稱為串聯(lián)聲碼器的一個例子,串聯(lián)聲碼的其它例子是無線移動終端與固定無線終端通信的場合,并且任何類型的無線終端正在從中央話音-郵政系統(tǒng)恢復(fù)消息,此系統(tǒng)在數(shù)據(jù)被存貯前使用聲碼器壓縮語音,在這樣的情況下,語音通過聲碼器的壓縮與去壓縮算法多于一次,當聲碼器以這樣的方式串聯(lián)時,語音的質(zhì)量通常是要降低的。
為了補償由于低位速率編譯碼器(聲碼器)的串聯(lián)引起的語音信號的質(zhì)量下降。一種稱為《旁路》的方法被開發(fā)出來以消除在基站350與370中由聲碼器執(zhí)行的雙重解碼/編碼。在這種方法背后的基本思路是基站A350,通過發(fā)信號與控制了解到在移動終端B380中的聲碼器是與移動終端A340中的聲碼器相同的,就將聲碼器旁路,這樣一來,允許信號數(shù)據(jù)幀在數(shù)字干線360中未經(jīng)變換地直接通過。同樣地,基站370,了解到它接收已壓縮語音數(shù)據(jù)幀,就簡單地把信號發(fā)送到移動終端B380而不作任何編碼操作。這種旁路方法在本技術(shù)說明的前面部分涉及到的國際申請書中已充分地作了描述。
然而,這種解決辦法只對相同的聲碼器是有效的。隨著網(wǎng)絡(luò)的快速擴展,聲碼器的參差性也快速地增加,因此,旁路解決辦法只對包含串聯(lián)聲碼操作的一小部分連接有用。
本發(fā)明提供一種方法和系統(tǒng),用于減少當聲碼器在呼叫期間是串聯(lián)連接時產(chǎn)生的信號質(zhì)量下降,本系統(tǒng)特點在于將已壓縮的語音數(shù)據(jù)幀變換到一種中間公共表象的機制與協(xié)議,不論是兩個移動終端之間還是一個移動終端和一個固定無線終端之間都同樣適用。
圖4示出依據(jù)本發(fā)明組成的一種系統(tǒng)的方框圖,該系統(tǒng)把已壓縮的語音信號從一種格式通過一個公共格式轉(zhuǎn)換為另一種格式,不需要對信號去壓縮為PCM類型的數(shù)字化技術(shù)。
本系統(tǒng)的一種特定的實施方案描述在圖5中,它是示出一個模塊化交叉變碼系統(tǒng)510的方框圖,該系統(tǒng)具有兩個有相同功能塊的變碼器,用于實現(xiàn)依據(jù)本發(fā)明的方法,變碼器是安裝在通信路徑末端的分開的設(shè)備,用于提供信號變換功能,這些信號變換功能可以是不同的,這要取決于該網(wǎng)絡(luò)正在使用的通信標準,在一種典型的應(yīng)用中,每個變碼器可以與網(wǎng)絡(luò)的一個基站有聯(lián)系,因此,由一個變碼器發(fā)出的信號在電話網(wǎng)絡(luò)上傳送到要處理的第二變碼器,這樣在以后作詳細描述,兩個變碼器具有相同的功能塊,為簡單起見,在此描述一個變碼器,同樣適用于其它的單元。
變碼器510包括一個信號與控制520,一個編碼方框530和一個解碼方框540。信號與控制方框520的主要功能是通過PCM位竊取通信(帶內(nèi)信號)或者直接從一個在通信線路的其它端上有實體的中心基站(帶外信號)通信,確定是否a)此連接端接在一個相同的LPC型的聲碼器上,b)此連接端接在一個不同的LPC型的聲碼器上,c)此連接端接在并不包括上面的a),或b)的一個實體上(即,另外的家族型聲碼器,新型LPC聲碼器,無線終端,等)解碼方框540包括一個解碼器542,一個偽解碼器544和一個旁路部分546,在信號與控制方框520的控制下,解碼方框540將執(zhí)行下面的任務(wù)之一a)當連接端接在一個相同的LPC型聲碼器時,從移動終端A通過旁路部分546發(fā)送已壓縮的語音信號,此旁路部分將通過已壓縮的語音數(shù)據(jù),或許在重新編排格式以后,用于傳送到朝向移動終端B的變碼器550的旁路部分586;b)當連接端接在一種不同的變碼模塊可得到的LPC型聲碼器時,應(yīng)用偽解碼器544從移動終端A將已壓縮的語音數(shù)據(jù)變換到公共格式信號,用于傳送到變碼器550的偽編碼器584;或c)當連接端接在一個并不由以上的a)或b)包括的實體時(即,另一種家族型的聲碼器,新型的LPC聲碼器,無線終端,等),應(yīng)用語音解碼器542從移動終端A將已壓縮的語音數(shù)據(jù)變換為PCM樣本,用于傳送到變碼器550的編碼器582或中心辦公室590。
編碼方框530包括一個編碼器532,一個偽編碼器534和一個旁路部分536。在信號與控制方框520的控制下,編碼方框530將執(zhí)行以下任務(wù)之一a)當連接源有一個相同的LPC型聲碼器時,將從變碼器550的旁路部分576接收到語音信號發(fā)送到旁路部分536,旁路部分將通過已壓縮的語言數(shù)據(jù),可能在重新編排格式以后,用于傳送到變碼器510被連接的移動終端A;b)當連接源有一個變碼模塊可得到的不同的LPC型聲碼器時,使偽編碼器534將從變碼器550的偽解碼器部分574接收到的公共格式信號變換為已壓縮語音數(shù)據(jù)并將此信號轉(zhuǎn)交到移動終端A;c)當連接端接在以上的a)或b)未包括的實體時(即,另一種家族型聲碼器,新型LPC聲碼器,無線終端,等),應(yīng)用語音編碼器532將從變碼器550的解碼器572或中心辦公室590接收到的PCM格式樣本變換為已壓縮語音數(shù)據(jù)并將此壓縮語音數(shù)據(jù)轉(zhuǎn)交到移動終端A。
在變碼器510中的信號與控制方框520被設(shè)計成向變碼器550發(fā)送消息,也從變碼器550接收消息,使能依據(jù)從變碼器550接收到的或向變碼器550發(fā)送的數(shù)據(jù)適當?shù)卣{(diào)節(jié)變碼器的操作。兩變碼器之間的通信是通過在它們之間建立的通信信道實現(xiàn)的。
在PCM傳輸期間,使用位竊取方法。這種方法是利用某些語音樣本的某些位傳送信號信息。信號位的位置和位竊取速率被選擇以減少位的替換對感覺的影響,使得在移動終端任何一個上的可聽到的信號未受較大影響,接收聲碼器知道在語音樣本中信號位的位置,因此能夠?qū)⒋讼⒔獯a。
在變碼器510與550之間的握手步驟包括交換不同的消息,使一個變碼器能夠識別伙伴變碼器,這樣每個單元能被設(shè)置為允許產(chǎn)生最佳可能的語音質(zhì)量的模式,握手步驟包括交換以下消息a)信號與控制方框520的發(fā)射機將一個標識符嵌入由變碼器510發(fā)出的PCM語音信號中。此標識符能使任何遠方的變碼器準確地確定連到始發(fā)變碼器也就是變碼器510的聲碼器的類型,這種識別是通過基站搜索操作實現(xiàn)的,將在以下描述。
b)信號與控制方框560查看由變碼器550接收到的數(shù)據(jù)幀并提取帶內(nèi)信號信息,這是通過觀測在數(shù)據(jù)幀中預(yù)先規(guī)定的位置上的位值來實現(xiàn)的。如果消息是變碼器標識符,數(shù)據(jù)庫(圖中未示出)考慮確定連到發(fā)出消息的變碼器的聲碼器的類型。根據(jù)消息的內(nèi)容,產(chǎn)生以下的可能性。
1)編碼方框530與580的常設(shè)模式,解碼方框540與570是這樣的,編碼器532與582,和解碼器542與572是動作的,而其余功能模塊,也就是偽編碼器534和584,偽解碼器544和574,和旁路部分536,546,576和586是不動作的。這就意味著如果變碼器510(或550)并未認出在網(wǎng)絡(luò)中存在伙伴變碼器,該變碼器將作為一個通常的聲碼器起作用,也就是說它將把從移動終端A接收到的已壓縮語音數(shù)據(jù)變換為輸入到傳輸網(wǎng)絡(luò)中的PCM樣本。同樣地,變碼器將期待從傳輸網(wǎng)絡(luò)接收PCM樣本并將這些樣本變換為與此變碼器服務(wù)的移動終端的聲碼器兼容的壓縮格式;2)如果信號與控制方框510,已經(jīng)認識出存在一個遠方的變碼器,變碼器的標識符在本地數(shù)據(jù)庫中被檢驗,確定發(fā)送消息的變碼器的類型,如ⅰ)變碼器是相同的,換句話說,連接到遠方變碼器的聲碼器是按照與連到變碼器510的聲碼器相同的幀格式或標準操作的,信號與控制方框520使解碼方框?qū)⑴月芳?46使能,而使解碼器542和偽解碼器544不能工作。因此,從遠方變碼器接收到的任何壓縮語音數(shù)據(jù)將指向移動終端A而未經(jīng)解碼操作。這種操作模式允許實現(xiàn)最佳可能的話音質(zhì)量,因為不產(chǎn)生聲碼器的串聯(lián)。信號與控制方框520也將切換編碼方框530為旁路部分536是動作的,而編碼器532與偽編碼器534是不動作的狀態(tài)。因此,從移動終端A接收到的壓縮語音數(shù)據(jù)將通過變碼器510而不作任何解碼操作。應(yīng)該注意到,將編碼方框530切換到旁路模式是基于假設(shè),遠方的變碼器550的信號與控制方框560已經(jīng)接收到變碼器510的標識符并且也已經(jīng)設(shè)置解碼方框570與編碼方框580為旁路模式。在這種情況下,交換壓縮語音信號的變碼器之間建立的是全雙工連接;ⅱ)變碼器是不同的,也就是遠方變碼器指明與移動終端B有連系的聲碼器是不同LPC型的,然后信號與控制方框520使解碼方框540能夠激活偽解碼器544,使解碼器542和旁路部分546不能工作。在這種操作模式中,信號與控制方框520期望接收以公共格式編碼的語音信號,偽解碼器544將變換為與移動站A有聯(lián)系的聲碼器的格式,而且,信號與控制方框520將編碼方框530切換到偽編碼器534是動作的,而編碼器532與旁路部分536是不動作的模式。因此,由變碼器510發(fā)出的數(shù)據(jù)是公共格式的,偽編碼器584將編碼為與移動終端B有連系的聲碼器的格式。
一種如圖6中所示的交叉變碼節(jié)點是本發(fā)明的另一種實施方案。注意,為了清楚起見,總的交叉變碼節(jié)點只有一半被示出。交叉變碼節(jié)點的另一半是相同的,提供相反方向中的通信能力,交叉變碼節(jié)點600起著不同的語音編譯碼器之間的一個集中的接口的作用,大體上,變碼節(jié)點600可看成是兩對物理上互相連接的變碼器,而不是以前的實施方案中描述的互相分開的情況,代替使用每個變碼器分開的信號與控制方框,使用的是單個的信號與控制級610。交叉變碼節(jié)點600也包括一個解碼方框620,一個編碼方框630與一個開關(guān)640。
信號與控制方框610的主要功能是與通信線路另一端上的實體通信(或試圖通信),以確定是否a)連接端接在一個相同的LPC型聲碼器上;b)連接端接在一個變碼模塊可得到的不同LPC型的聲碼器上;c)連接端接在以上的a)或b)未包含的一個實體上(即,另一種家族型聲碼器,新型LPC聲碼器,無線終端,等);定時與同步信息被用于控制解碼方框620與編碼方框630。控制信息用于為開關(guān)640選擇正確的位置以便按規(guī)定路線發(fā)送正確的信號。
解碼方框620包括一個解碼器622,一個偽解碼器624和一個旁路部分626。編碼方框630包括一個旁路部分632,一個偽編碼器634和一個編碼器636。
當兩個聲碼器互相連接時,交叉變碼節(jié)點將起著以下要描述的作用。在信號與控制方框610的控制下,解碼方框620將執(zhí)行以下任務(wù)之一a)當連接端接在一個相同LPC型的聲碼器上,發(fā)送壓縮語音信號到旁路部分626,通過旁路部分632將通過語音數(shù)據(jù),可能在重新編排格式以后,用于傳送到相同的LPC型聲碼器,b)當連接端接在一個變碼模塊可得到的不同LPC型的聲碼器上時,應(yīng)用偽解碼器624將壓縮語音數(shù)據(jù)變換為公共格式信號,然后將信號傳送到偽編碼器634,將公共格式變回到壓縮信號,最后,將壓縮語音信號傳送到不同LPC型的聲碼器;或c)當連接端接在以上的a)或b)未包括的一個實體(即,另一種家族型的聲碼器,新型LPC聲碼器,無線終端,等),應(yīng)用語音解碼器622將壓縮語音數(shù)據(jù)變換為PCM樣本,然后把信號傳送到編碼器636,將PCM樣本變回到壓縮語音信號,最后,將壓縮語音信號發(fā)送到末端實體。
當連接到一個無線終端時,交叉變碼節(jié)點將起著如以下所描述的作用,當PCM信號正在輸入時,它被傳送到開關(guān)640,信號與控制方框610選擇切換到將信號轉(zhuǎn)交到編碼器636,在其中信號被變換為壓縮語音,最后,壓縮語音將被發(fā)送到外部的聲碼器。當無線終端是在通信線路的接收端上并且壓縮語音正在輸入時,信號被傳送到解碼器622,在其中被變換為PCM格式,然后,信號與控制方框選擇切換到將信號轉(zhuǎn)交到無線終端。
以下的描述將提供一個特殊的例子,以便了解偽編碼器單元是如何實現(xiàn)從壓縮信號變換為公共格式信號,以及逆變換,也就是從公共格式變換為壓縮信號,具體而言,考慮這樣的情況,語音信號從移動終端(MTA340發(fā)送到MTB380時被變換。在本例中,MTA使用IS54無線電話通信標準的向量和增強型線性預(yù)測(VSELP)聲碼器。圖7a描述了IS54的幀格式。信號被變換為如圖7b所示的公共格式,在接收站MTB使用IS641標準的增強型全速率編碼器(EFRC),圖7C示出IS641的幀格式。
參看圖3b和5,為了本例中的變換,語音信號由位于MTA340的VSELP聲碼器按IS54標準進行壓縮(編碼),并通過無線通信線路(RF信道A)發(fā)送到基站A350。在其中由變碼器510(示于圖5中)的偽解碼器544將其變換為公共格式。然后公共格式數(shù)據(jù)幀通過遠程通信公司網(wǎng)絡(luò)360發(fā)送到變碼器550,在其中由偽編碼器584將它們變換為IS641標準的壓縮語音。壓縮信號通過無線通信線路(RF信道B)發(fā)送到MT380,在其中由第二MT的EFRC聲碼器將其解碼。然后在MT380上可得到可聽見的語音。
偽解碼器544,接收如圖7a所示的IS54格式的語音數(shù)據(jù)幀,將其變換如以下所述,也由圖8的流程圖示出。偽解碼器544利用其自身的量化器對于20ms數(shù)據(jù)幀重新計算代表LPC反射系數(shù)的10維向量。然后利用10維向量為4個子幀確定4組內(nèi)插的LPC系數(shù)向量。內(nèi)插方法與以前描述過的是相同的。公共格式數(shù)據(jù)幀的這部分準備就緒,偽解碼器544將其存貯為將來恢復(fù)用。然后偽解碼器544從壓縮格式讀出4個滯后值(音調(diào)延時)。偽解碼器544將它們存貯為將來插入公共格式時用。然后偽解碼器544利用編碼手冊信息,增益因數(shù)及用于4個子幀的音調(diào)延時和用于幀的幀能量為公共格式建立一個合成激勵信號(4乘40個樣本)。最后,通過將激勵信號和存貯的LPC濾波器系數(shù)以及音調(diào)延時聯(lián)系起來組成公共格式數(shù)據(jù)幀。這種數(shù)據(jù)幀被發(fā)送到下一個基站的偽編碼器584。注意,在圖7b上,已經(jīng)在公共格式幀中保留了信息位用于能量和音調(diào)預(yù)測增益信息。這種信息在本特例中不作計算。
如圖9中所示,偽編碼器584接收公共格式語音數(shù)據(jù)幀,現(xiàn)在需要將它變換到IS641壓縮語音格式以便使EFRC在MTB能將它正確地解碼。偽編碼器584讀出4個子幀的LPC系數(shù),丟掉頭三個子幀的系數(shù),只保留第四個子幀的系數(shù)。注意,這是為整個幀算出的LPC反射系數(shù)向量,在此特例中用于變換的頭三個向量是不需要的,因為在MTB的EFRC聲碼器將依據(jù)IS-641內(nèi)插方案內(nèi)插出頭三個子幀向量。然而所有四個向量可用于變換包括其它類型聲碼器的場合。在這點上,偽編碼器584利用其自身的量化器重新量化第四個子幀LPC反射系數(shù)。在偽編碼器將10個LPC反射系數(shù)提交給它的量化器以前,首先需要將它們變換為LP(線性預(yù)測)系數(shù),然后變換為線譜對(LSP)系數(shù),最后,變換為線譜頻率(LSF向量)。然后LSF向量被量化并變換為量化LSP向量。這種量化LSF向量是IS641格式的部分并按原樣被存貯。然后,偽編碼器584將量化LSP向量變換為量化LP系數(shù)并為頭三個子幀內(nèi)插LP系數(shù)。這組LP系數(shù)向量將在下一步驟中使用。
偽編碼器584使用公共格式激勵信號并將四個40樣本的子幀中每一個通過一個合成濾波器,利用量化與內(nèi)插的LP系數(shù)作為抽頭系數(shù),重建語音信號。偽編碼器584通過利用以前計算出的10個LSP系數(shù)從語音信號算出(與常規(guī)的EFRC編碼器相同的方式)音調(diào)滯后,增益和激勵值(用于MTB編碼手冊的代數(shù)碼)。最后,IS641壓縮語音格式幀利用量化音調(diào)延時,增益和激勵值以及存貯的LSP向量組成。這種語音數(shù)據(jù)幀被發(fā)送到MTB中的EFRC解碼器,在其中與通常的一樣被變換為語音信號。
注意,來自公共格式的音調(diào)延時信息在本例中未用上,但可用于其它的變換中,代替的是,利用已知算法從產(chǎn)生的語音信號算出音調(diào)延時信息。
概括地說,偽解碼器534將輸入壓縮語音信號變換為公共格式,具有系數(shù)部分和激勵部分。然后,公共格式被偽編碼器用于重建壓縮語音,但其格式是與輸入偽解碼器544的壓縮語音格式是不同的,具體而言,偽編碼器584從公共格式信號中的系數(shù)部分生成由偽編碼器584輸出的壓縮語音信號的系數(shù)。在公共格式信號的基礎(chǔ)上,語音信號被重建,并被用于提取任何激勵或其它信息,它們與為壓縮語音信號算出的系數(shù)一起用于代表語音信息。
需要指出的是變碼器510的偽編碼器和偽解碼器是按照與它將交互作用的聲碼器的類型設(shè)計的。共同之處在于每個偽解碼器將接受壓縮語音信號并發(fā)出公共格式信號,依次將由偽編碼器變換為另一種壓縮語音信號格式。這種特點使本系統(tǒng)非常靈活,尤其是當新的聲碼器被引入時更顯出來。設(shè)計一種在新聲碼器信號格式與公共格式之間提供交換的偽編碼器與偽解碼器就足夠了。不需要用任何方法改變現(xiàn)有的變碼器。因為由本系統(tǒng)使用的公共格式仍然是相同的。
從結(jié)構(gòu)的觀點看,在圖10上所示的設(shè)備可用于實現(xiàn)偽編碼器584的功能,其操作情況已在上面隨同圖9詳細描述過。此設(shè)備包括一個輸入信號線910,一個信號輸出線912,一個處理器914和一個存貯器916。存貯器916用于存貯操作處理器914的指令,也存貯在執(zhí)行這些指令時處理器914所用的數(shù)據(jù)??偩€918是用來在存貯器916與處理器914之間交換信息。
存貯在存貯器916中的指令使設(shè)備能夠按照在圖11上所示的功能性方框圖操作。設(shè)備包括一個系數(shù)段變換器,正如隨同圖9已描述的那樣,通過已知的數(shù)學(xué)處理將系數(shù)段從公共格式幀變換為壓縮音頻信號幀的系數(shù)段。在本例中是變換為IS641幀格式,本設(shè)備也包括一個合成濾波器。從系數(shù)段變換器接收用于四個子幀的量化LPC系數(shù)。合成濾波器也從公共格式幀的激勵段接收激勵信號以便組成音頻信號。然后,此信號輸入一種合成分析過程,產(chǎn)生用于IS641幀格式的激勵段,通過利用抽頭系數(shù),由系數(shù)段變換器輸出量化LSP向量。
圖12示出在圖5中所示的偽解碼器544的方框圖。本設(shè)備包括兩個主要的功能方框,也就是系數(shù)段變換器,從IS54格式的數(shù)據(jù)幀接收系數(shù)段并將它變換為公共格式數(shù)據(jù)幀的系數(shù)段。本設(shè)備也包括一個激勵段變換器,利用來自IS54數(shù)據(jù)格式的激勵段的部分,將它變換為公共格式數(shù)據(jù)幀的激勵段,在本設(shè)計中的方法是處理壓縮音頻信號數(shù)據(jù)幀的所有段,以便組成公共格式的數(shù)據(jù)幀。
當為一種特定的應(yīng)用設(shè)計變碼器時,偽編碼器和偽解碼器可利用圖11和12所示的設(shè)備中的一種來組成。兩種系統(tǒng)中選擇哪一種將取決于要實現(xiàn)的特定的格式變換,當壓縮音頻信號的格式(或者是源數(shù)據(jù)幀,或者是目的地數(shù)據(jù)幀)是這樣的情況,即來自源數(shù)據(jù)幀的系數(shù)段和激勵段可被獨立地處理來實現(xiàn)到目的地數(shù)據(jù)幀的變換,則圖12上所示的設(shè)備可能對于這種操作是最適合的。另一方面,當重建音頻信號是比較合適時,則圖11上所示的設(shè)備應(yīng)被采用。
至于組成每個變碼器的編碼器和旁路級,它們可按照目前對本領(lǐng)域的技術(shù)人員熟知的系統(tǒng)來制作。具體而言,編碼器和解碼器可分別依據(jù)圖1和圖2的方框圖來組成,而旁路機構(gòu)可依據(jù)前面提到過的國際申請書的內(nèi)容來設(shè)計。
以上描述的一種最佳實施方案不應(yīng)該以任何局限性的方式來解釋,因為可以作許多變化或改進而不偏離本發(fā)明的精神。本發(fā)明的范圍被規(guī)定在所附的權(quán)利要求及它們的等同物中。
權(quán)利要求
1.一種處理音頻信號的設(shè)備,所述的設(shè)備包括一個輸入和一個輸出,所述的設(shè)備對施加到所述的輸入的第一格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的輸出產(chǎn)生第二格式的壓縮音頻數(shù)據(jù)幀,第一格式的幀具有系數(shù)段和激勵段,第二格式的幀具有系數(shù)段和激勵段,所述的設(shè)備包括a)連接到所述的輸入的第一處理裝置,用于接收第一格式壓縮音頻數(shù)據(jù)幀的系數(shù)段并在所述的輸出上反出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段;b)連接到所述的輸入的第二處理裝置,用于從第一格式壓縮音頻數(shù)據(jù)幀產(chǎn)生第二格式壓縮音頻數(shù)據(jù)幀的激勵段。
2.一種根據(jù)權(quán)利要求1的設(shè)備,其中所述的第一處理裝置發(fā)出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段,沒有任何實質(zhì)性的利用第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀中的激勵段。
3.一種根據(jù)權(quán)利要求2的設(shè)備,其中所述的第一處理裝置包括一個量化器。
4.一種根據(jù)權(quán)利要求1的設(shè)備,其中所述的第二處理裝置包括一個量化器。
5.一種根據(jù)權(quán)利要求1的設(shè)備,其中所述的第二處理裝置算出第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段,沒有任何實質(zhì)性的利用第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的系數(shù)段。
6.一種根據(jù)權(quán)利要求1的設(shè)備,其中所述的第二處理裝置包括一個濾波器。
7.一種根據(jù)權(quán)利要求6的設(shè)備,其中所述的濾波器包括一個第一輸入,用于接收重新組成的音頻信號和一個第二輸入,用于接收第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的系數(shù)段。
8.一種根據(jù)權(quán)利要求1的設(shè)備,其中第一格式是IS54。
9.一種根據(jù)權(quán)利要求1的設(shè)備,其中第二格式是IS641。
10.一種用于發(fā)送壓縮音頻信息數(shù)據(jù)幀的設(shè)備,所述的設(shè)備包括a)第一變碼器,包括一個第一輸入和一個第一輸出,所述的第一變碼器對施加到所述的輸入的第一格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的輸出產(chǎn)生第二格式壓縮音頻數(shù)據(jù)幀,第一格式幀具有系數(shù)段和激勵段,第二格式幀具有系數(shù)段和激勵段;b)第二變碼器,包括一個第二輸入和一個第二輸出,所述的第二輸入被連接到所述的第一輸出,接收第二格式的壓縮音頻數(shù)據(jù)幀,所述的第二變碼器對施加到所述的第二輸入的第二格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的第二輸出產(chǎn)生第三格式壓縮音頻數(shù)據(jù)幀,第三格式幀具有系數(shù)段和激勵段。
11.一種根據(jù)權(quán)利要求10的設(shè)備,其中所述的第一變碼器包括a)連接到所述的第一輸入的第一處理裝置,用于接收第一格式的壓縮音頻數(shù)據(jù)幀的系數(shù)段并在所述的第一輸出上發(fā)出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段;b)連接到所述的第一輸入的第二處理裝置,用于從第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀產(chǎn)生第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段。
12.一種根據(jù)權(quán)利要求11的設(shè)備,其中所述的第一處理裝置發(fā)出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段,沒有任何實質(zhì)性的利用第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀中的激勵段。
13.一種根據(jù)權(quán)利要求12的設(shè)備,其中所述的第一處理裝置包括一個量化器。
14.一種根據(jù)權(quán)利要求12的設(shè)備,其中所述的第二處理裝置包括一個量化器。
15.一種根據(jù)權(quán)利要求12的設(shè)備,其中所述的第二處理裝置計算第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段,沒有任何實質(zhì)性的利用第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的系數(shù)段。
16.一種根據(jù)權(quán)利要求12的設(shè)備,其中所述的第二處理裝置包括一個濾波器。
17.一種根據(jù)權(quán)利要求16的設(shè)備,其中所述的濾波器包括一個第一輸入,用于接收重新組成的音頻信號,和一個第二輸入,用于接收第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的系數(shù)段。
18.一種根據(jù)權(quán)利要求10的設(shè)備,其中所述的第二變碼器包括a)連接到所述的第二輸入的第三處理裝置,用于接收第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段,和在所述的第二輸出上發(fā)出第三格式壓縮音頻數(shù)據(jù)幀的系數(shù)段;b)連接到所述的第二輸入的第四處理裝置,用于從第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀產(chǎn)生第三格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段。
19.一種根據(jù)權(quán)利要求18的設(shè)備,其中所述的第三處理裝置發(fā)出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段,沒有任何實質(zhì)性的利用第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀中的激勵段。
20.一種根據(jù)權(quán)利要求19的設(shè)備,其中所述的第三處理裝置包括一個量化器。
21.一種根據(jù)權(quán)利要求19的設(shè)備,其中所述的第四處理裝置包括一個量化器。
22.一種根據(jù)權(quán)利要求18的設(shè)備,其中所述的第四處理裝置計算第三格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段,沒有任何實質(zhì)性的利用第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的系數(shù)段。
23.一種根據(jù)權(quán)利要求18的設(shè)備,其中所述的第四處理裝置包括一個濾波器。
24.一種根據(jù)權(quán)利要求23的設(shè)備,其中所述的濾波器包括一個輸入,用于接收重新組成的音頻信號,和一個輸入,用于接收第三格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的系數(shù)段。
25.一種用于處理代表數(shù)字化與壓縮形式的音頻信息的數(shù)據(jù)幀的方法,數(shù)據(jù)幀包括一個系數(shù)段和一個激勵段,數(shù)據(jù)幀處于第一格式中,所述的方法包括以下步驟a)處理第一格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生第二格式數(shù)據(jù)幀的系數(shù)段;b)處理第一格式數(shù)據(jù)幀,產(chǎn)生第二格式數(shù)據(jù)幀的激勵段;c)將分別在步驟a)和b)產(chǎn)生的第二格式數(shù)據(jù)幀的系數(shù)段與第二格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包括在第一格式數(shù)據(jù)幀中的音頻信息的第二格式數(shù)據(jù)幀。
26.一種根據(jù)權(quán)利要求25的方法,其中產(chǎn)生第二格式數(shù)據(jù)幀的激勵段的步驟包括以下步驟a)至少部分地根據(jù)包含在數(shù)據(jù)幀的激勵段中的信息合成音頻信號;b)分析在步驟a)合成的音頻信號,產(chǎn)生至少部分的第二格式數(shù)據(jù)幀的激勵段。
27.一種根據(jù)權(quán)利要求26的方法,包括將權(quán)利要求26的步驟a)合成的音頻信號通過一個濾波器并對所述的濾波器提供所述的第二格式數(shù)據(jù)幀的系數(shù)段中的抽頭系數(shù)的步驟。
28.一種根據(jù)權(quán)利要求25的方法,其中第二格式數(shù)據(jù)幀的激勵段的產(chǎn)生是僅僅通過第一格式數(shù)據(jù)幀的激勵段的變換取得的。
29.一種根據(jù)權(quán)利要求25的方法,其中第二格式數(shù)據(jù)幀的系數(shù)段的產(chǎn)生是僅僅通過第一格式數(shù)據(jù)幀的系數(shù)段的變換取得的。
30.一種傳輸代表數(shù)字化與壓縮形式的音頻信息的數(shù)據(jù)幀的方法,數(shù)據(jù)幀包括系數(shù)段和激勵段,數(shù)據(jù)幀處于第一格式,所述的方法包括以下步驟a)在第一地點處理第一格式的數(shù)據(jù)幀,產(chǎn)生第二格式的數(shù)據(jù)幀,第二格式的數(shù)據(jù)幀包括系數(shù)段和激勵段;b)將第二格式的數(shù)據(jù)幀傳送到遠離所述的第一地點的第二地點;c)在所述的第二地點處理第二格式的數(shù)據(jù)幀,產(chǎn)生第三格式的數(shù)據(jù)幀,第二格式的數(shù)據(jù)幀包括系數(shù)段和激勵段。
31.一種根據(jù)權(quán)利要求30的方法,包括以下的步驟a)在第一地點處理第一格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生第二格式數(shù)據(jù)幀的系數(shù)段;b)在第一地點處理第一格式數(shù)據(jù)幀,產(chǎn)生第二格式數(shù)據(jù)幀的激勵段;c)將分別在步驟a)和b)產(chǎn)生的第二格式數(shù)據(jù)幀的系數(shù)段與第二格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包含在第一格式數(shù)據(jù)幀中的音頻信息的第二格式數(shù)據(jù)幀。
32.一種根據(jù)權(quán)利要求31的方法,包括以下步驟a)在所述的第二地點處理第二格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生第三格式數(shù)據(jù)幀的系數(shù)段;b)在所述的第二地點處理第二格式的數(shù)據(jù)幀,產(chǎn)生第三格式數(shù)據(jù)幀的激勵段;c)將分別在步驟a)和b)產(chǎn)生的第三格式數(shù)據(jù)幀的系數(shù)段與第三格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包含在第一格式和第二格式數(shù)據(jù)幀中的音頻信息的第三格式數(shù)據(jù)幀。
33.一種在兩個不兼容聲碼器之間傳送音頻信號的方法,所述的方法包括以下步驟a)從第一聲碼器接收第一格式數(shù)據(jù)幀,數(shù)據(jù)幀包括系數(shù)段和激勵段;b)將第一格式數(shù)據(jù)幀變換為中間格式數(shù)據(jù)幀,包括以下子步驟ⅰ)處理第一格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生中間格式數(shù)據(jù)幀的系數(shù)段;ⅱ)處理第一格式數(shù)據(jù)幀,產(chǎn)生中間格式數(shù)據(jù)幀的激勵段;ⅲ)將中間格式數(shù)據(jù)幀的系數(shù)段與中間格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包含在第一格式數(shù)據(jù)幀中的音頻信息的中間格式數(shù)據(jù)幀,c)將中間格式數(shù)據(jù)幀變換為第三格式數(shù)據(jù)幀包括以下子步驟ⅰ)處理中間格式數(shù)據(jù)幀的系數(shù)段,產(chǎn)生第三格式數(shù)據(jù)幀的系數(shù)段;ⅱ)處理中間格式數(shù)據(jù)幀,產(chǎn)生第三格式數(shù)據(jù)幀的激勵段;ⅲ)將第三格式數(shù)據(jù)幀的系數(shù)段與第三格式數(shù)據(jù)幀的激勵段組合,產(chǎn)生代表包含在第一格式和中間格式數(shù)據(jù)幀中的音頻信息的第三格式數(shù)據(jù)幀,d)將第三格式數(shù)據(jù)幀傳送到第二聲碼器。
34.一種包含程序部分的機器可讀存貯媒介,用于命令計算機處理音頻信號,所述的計算機包括一個輸入和一個輸出,所述的程序部分使所述的計算機對施加到所述的輸入的第一格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的輸出產(chǎn)生第二格式壓縮音頻數(shù)據(jù)幀,第一格式幀有系數(shù)段和激勵段,第二格式幀有系數(shù)段和激勵段,所述的程序部分在所述的計算機中實現(xiàn)的功能性方框包括a)連接到所述的輸入的第一處理裝置,用于接收第一格式壓縮音頻數(shù)據(jù)幀的系數(shù)段并在所述的輸出發(fā)出第二格式壓縮音頻數(shù)據(jù)幀的系數(shù)段;b)連接到所述的輸入的第二處理裝置,用于從第一格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀產(chǎn)生第二格式壓縮音頻數(shù)據(jù)的數(shù)據(jù)幀的激勵段。
35.一種聲碼器之間的接口節(jié)點,用于將第一格式壓縮音頻信號幀變換為第二格式壓縮音頻信號幀,第一格式幀有一個系數(shù)段和一個激勵段,所述的節(jié)點包括a)第一變碼器,包括一個第一輸入和一個第一輸出,所述的第一變碼器對施加在所述的輸入的第一格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的輸出產(chǎn)生中間格式壓縮音頻數(shù)據(jù)幀,中間格式幀有一個系數(shù)段和一個激勵段;b)第二變碼器,包括一個第二輸入和一個第二輸出,所述的第二輸入連接到所述的第一輸出,接收中間格式壓縮音頻數(shù)據(jù)幀,所述的第二變碼器對施加到所述的第二輸入的中間格式壓縮音頻數(shù)據(jù)幀作出響應(yīng),在所述的第二輸出產(chǎn)生第二格式壓縮音頻數(shù)據(jù)幀。
全文摘要
近年來,為了滿足不同的有線和無線通信系統(tǒng)的帶寬需要,遠程通信工業(yè)已經(jīng)出現(xiàn)了各種各樣數(shù)字聲碼器急劇增加的趨勢,網(wǎng)絡(luò)的參差性以及這樣一些網(wǎng)絡(luò)的用戶數(shù)量的快速增長使得兩個聲碼器串聯(lián)放置服務(wù)于單一連接點的場合也不斷增加。這樣一些低位速率編譯碼器的方案會降低所傳輸?shù)脑捯舻馁|(zhì)量。為了克服這個問題,本發(fā)明提供了一種用于在無線通信環(huán)境中傳輸數(shù)字化話音信號的新方法和設(shè)備。本設(shè)備能夠通過一種中間的公共格式,將壓縮的話音信號從一種格式變換為另一種格式,因而避免了相繼地將話音數(shù)據(jù)去壓縮成為PCM型數(shù)字方式,然后再重新將話音數(shù)據(jù)壓縮的必要。
文檔編號H03M7/30GK1228867SQ97197452
公開日1999年9月15日 申請日期1997年11月5日 優(yōu)先權(quán)日1997年6月26日
發(fā)明者P·默梅爾斯泰恩, R·拉比普爾, P·科維爾達勒, W·納瓦羅 申請人:北方電訊有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1