語音傳輸系統(tǒng)的制作方法

文檔序號：2835814閱讀：174來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音傳輸系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明是涉及包含帶有語音編碼器的發(fā)射機(jī)的一種傳輸系統(tǒng)，該語音編碼器用于從語音信號樣本得出具有代表所述語音信號樣本幀的系數(shù)的數(shù)據(jù)幀，該語音編碼器包含幀裝配裝置，用于裝配完全的數(shù)據(jù)幀和不完全的數(shù)據(jù)幀，所述不完全數(shù)據(jù)幀包含代表其語音信號樣本幀的不完全系數(shù)集，該發(fā)射機(jī)還包括發(fā)送裝置，用于通過傳輸介質(zhì)向接收機(jī)發(fā)送所述數(shù)據(jù)幀，該接收機(jī)包含一個(gè)語音解碼器，所述語音解碼器包含一個(gè)完成裝置，用于利用內(nèi)插的系數(shù)使不完全地系數(shù)集變成完全的系數(shù)集，這些內(nèi)插的系數(shù)是從與所述不完全數(shù)據(jù)幀對應(yīng)的語音信號樣本幀的前后的語音信號樣本幀所對應(yīng)的系數(shù)得到的。
本發(fā)明還涉及發(fā)射機(jī)、接收機(jī)、編碼器、解碼器、語音編碼方法及被編碼的語音信號。根據(jù)本前序的傳輸系統(tǒng)可從美國專利4,379,949號中得知。
將這種傳輸系統(tǒng)用于這樣一些應(yīng)用，在這些應(yīng)用中語音信號不得不以有限的傳輸容量在傳輸介質(zhì)上傳送，或者不得不以有限的存儲容量存儲到存儲介質(zhì)上。這種應(yīng)用的實(shí)例是在因特網(wǎng)上傳送語音信號，從移動(dòng)電話向基站傳送語音信號和反過來從基站向移動(dòng)電話傳送語音信號，以及把語音信號存儲在CD-ROM上，固態(tài)存儲器中或硬盤驅(qū)動(dòng)器上。
語音編碼器從語音樣本幀得出數(shù)據(jù)幀，該數(shù)據(jù)幀包括代表所述語音樣本幀的系數(shù)。這些系數(shù)包括分析系數(shù)和激發(fā)系數(shù)。一組這樣的分析系數(shù)描述語音信號的短時(shí)譜。分析系數(shù)的另一實(shí)例是代表語音信號音調(diào)(pitch)的系數(shù)。將分析系數(shù)通過傳輸介質(zhì)傳送到接收機(jī)，在那里將這些分析系數(shù)用作為一個(gè)合成濾波器的系數(shù)。
除了分析參數(shù)外，語音編碼器還確定每個(gè)語音樣本幀的激發(fā)(excitation)序列數(shù)(例如4)。被這種激發(fā)序列復(fù)蓋的時(shí)間間隔稱作子幀(Subframe)將語音編碼器安排成用于找出這樣的激發(fā)信號，使得當(dāng)使用上述分析系數(shù)的合成濾波器被所述激發(fā)序列激發(fā)時(shí)能得到最好的語音質(zhì)量。所述激發(fā)序列的一種表達(dá)(representation)作為數(shù)據(jù)幀中的系數(shù)通過傳輸介質(zhì)被傳送到接收機(jī)。在接收機(jī)中，該激發(fā)序列被從接收的信號中恢復(fù)出來并加到合成濾波器的輸入端。在合成濾波器的輸出端便可以得到一個(gè)合成的語音信號。
以一定質(zhì)量描述語音信號所需要的位速率(bitrate)取決于語音的內(nèi)容。由數(shù)據(jù)幀攜帶的一些系數(shù)在一個(gè)長時(shí)間段上可能基本上為常數(shù)，例如在持續(xù)的元音的情況中。在這種情況下能通過傳送包含不完全系數(shù)集的不完全數(shù)據(jù)幀來利用這一特性。
將這種可能性用于根據(jù)上述的美國專利的傳輸系統(tǒng)中。這個(gè)專利描述了一個(gè)帶有語音編碼器的傳輸系統(tǒng)，其中不在每一幀中都傳送分析系數(shù)。只有當(dāng)在一個(gè)數(shù)據(jù)幀中至少一個(gè)實(shí)際分析系數(shù)與從相鄰數(shù)據(jù)幀中的分析系數(shù)進(jìn)行內(nèi)插所得到的相應(yīng)分析系數(shù)之間的差值超過一個(gè)預(yù)先確定的閾值時(shí)，這些分析系數(shù)才被傳送。這造成傳輸語音信號所需位速率的降低。
根據(jù)上面提到的美國專利的傳輸系統(tǒng)的缺點(diǎn)是由于要完成內(nèi)插使語音信號總是被延遲若干幀。
本發(fā)明的目的是提供一個(gè)根據(jù)本文前序的傳輸系統(tǒng)，其中語音信號的延遲已被減小。
所以，根據(jù)本發(fā)明的傳輸系統(tǒng)的特征在于所述裝配裝置被安排成用于引入至少一個(gè)所述不完全數(shù)據(jù)幀和代表這樣一些語音信號樣本幀的附加系數(shù)，這些語音信號樣本幀在時(shí)間上遲于所述不完全數(shù)據(jù)幀所對應(yīng)的語音信號樣本幀；其特征還在于將完成裝置安排成用于利用所述附加系數(shù)使不完全系數(shù)集變?yōu)橥耆摹?br> 通過在不完全數(shù)據(jù)幀中傳送代表較遲的語音信號樣本幀的附加系數(shù)，使得在編碼器中至少提前一個(gè)幀間隔能得到這些附加系數(shù)。因?yàn)檫@些附加系數(shù)被用于以內(nèi)插來使決定不完全系數(shù)集變?yōu)橥耆南禂?shù)集，所以這一內(nèi)插也能至少提前一個(gè)幀間隔完成。于是能提前完成被重建語音信號的合成，而時(shí)間延遲能被減小至少一個(gè)幀間隔。
本發(fā)明的一個(gè)實(shí)施例的特征在于將幀裝配裝置安排成用于在數(shù)據(jù)幀中引入指示符，用于指示該幀是否是不完全數(shù)據(jù)幀，以及指示該數(shù)據(jù)幀攜帶的系數(shù)所代表的語音樣本幀是否不同于它所對應(yīng)的語音樣本幀。
第一和第二指示符的引入使得在接收器中能很容易地解碼。在接收機(jī)中的完成裝置能容易地從輸入信號提取出不完全幀，并在能得到攜帶附加系數(shù)的不完全幀之后盡快地開始(通過內(nèi)插)使其完全。如果只存在一個(gè)指示符，則語音解碼器為了能對信號解碼需要對應(yīng)于先前數(shù)據(jù)幀的指示符。這需要非常可靠的通信來避免數(shù)據(jù)幀中出錯(cuò)和丟失數(shù)據(jù)幀。
現(xiàn)在將參考附圖解釋本發(fā)明。這些附圖是

圖1給出其中能使用本發(fā)明的一個(gè)傳輸系統(tǒng)；
圖2是在本發(fā)明中能使用的編碼裝置的一個(gè)實(shí)施例，該編碼裝置向外發(fā)送被編碼的語音信號幀。
圖3是在根據(jù)圖2的編碼裝置中要使用的控制裝置30的一個(gè)實(shí)施例；
圖4顯示輸入的語音幀序列、從這語音幀序列導(dǎo)出的數(shù)據(jù)幀、以及在接收機(jī)處根據(jù)所述數(shù)據(jù)幀重建的語音幀；
圖5是實(shí)現(xiàn)多路調(diào)制器6的可編程處理器所用程序的流程圖6是實(shí)現(xiàn)信號分離器16的可編程處理器所用程序的流程圖7是圖6中指令138的另一種實(shí)現(xiàn)的流程圖8是在根據(jù)圖1的傳輸系統(tǒng)中使用的語音解碼裝置18。
在根據(jù)圖1的傳輸系統(tǒng)中，要被編碼的語音信號被加到發(fā)射機(jī)2中的語音編碼器4的一個(gè)輸入端。語音編碼器4的第一輸出端載有代表分析系數(shù)的輸出信號LPC，該第一輸出端與多路調(diào)制器6的第一輸入端相連。語音編碼器4的第二輸出端載有輸出信號下，該第二輸出端與多路調(diào)制器6的第二輸入端相連。信號F代表一個(gè)標(biāo)志，指出信號LPC是否得要被傳送。語音編碼器4的第三輸出端載有信號EX，該第三輸出端與多路調(diào)制器6的第三輸入端相連。信號EX代表供語音解碼器中的合成濾波器使用的激發(fā)信號。一個(gè)位速率控制信號R被加到語音編碼器4的第二輸入端。
多路調(diào)制器6的一個(gè)輸出端與發(fā)送裝置8的一個(gè)輸入端相連。發(fā)送裝置8的一個(gè)輸出端通過傳輸介質(zhì)10與接收機(jī)12相連。
在接收機(jī)12中，傳輸介質(zhì)10的輸出端與接收裝置14的一個(gè)輸入端相連。接收裝置14的一個(gè)輸出端與信號分離器(demultiplexer)16的一個(gè)輸入端相連。信號分離器16的第一輸出端載有信號LPC，該第一輸出端與語音解碼裝置18的第一輸入端相連；信號分離器16的第二輸出端載有信號EX，該第二輸出端與語音解碼裝置18的第二輸入端相連，在語音解碼裝置18的輸出端能得到被重建的語音信號，信號分離器16和語音解碼裝置18的組合構(gòu)成了根據(jù)本發(fā)明概念的語音解碼器。
對于根據(jù)本發(fā)明的傳輸系統(tǒng)的操作所做的解釋是在假定使用CELP型語音編碼器的情況下進(jìn)行的，但應(yīng)該看到，本發(fā)明的范圍不限于此。
語音編碼器4被安排成從語音信號樣本幀中提取被編碼的語音信號。語音編碼器提取例如代表語音信號短時(shí)譜的分析系數(shù)。通常是使用LPC系數(shù)或它的變換后的表現(xiàn)形式。有用的表現(xiàn)形式是對數(shù)面積比(LogAreaRatios，LARs)、反射系數(shù)的反正弦或線性譜頻率(Line SpectralFrequencies，LSFs)，后者也稱作線性譜對(Line Spectral Pairs，LSPs)。在語音編碼器4的第一輸出端能得到作為信號LPC的分析系數(shù)表現(xiàn)形式。
在語音編碼器4中，其激發(fā)信號等于一個(gè)或多個(gè)固定代碼本(codebook)和一個(gè)適應(yīng)性代碼本的輸出信號的加權(quán)和。固定代碼本的輸出信號由固定代碼本索引(index)指示，而固定代碼本的加權(quán)因子由固定代碼本增益指示。適應(yīng)性代碼本的輸出信號由適應(yīng)性代碼本索引指示，而適應(yīng)性代碼本的加權(quán)因子由適應(yīng)性代碼本增益指示。
代碼本索引和增益是通過以合成方法進(jìn)行分析來確定的，即所確定的代碼本索引和增益要使原始語音信號和基于激發(fā)系數(shù)和分析系數(shù)合成的語音信號之間的差值為一極小值。信號F指示是否要發(fā)送對應(yīng)于語音信號樣本當(dāng)前幀的分析參數(shù)。這些系數(shù)能在當(dāng)前數(shù)據(jù)幀中被發(fā)送，或者在較早的一個(gè)數(shù)據(jù)幀中被發(fā)送。
多路調(diào)制器6把幀頭與代表語音信號的數(shù)據(jù)組合成數(shù)據(jù)幀，該幀頭包含一個(gè)第一指示(標(biāo)志F)，指示當(dāng)前數(shù)據(jù)幀是否為不完全數(shù)據(jù)幀。該幀頭還可任選地包含第二指示(標(biāo)志L)，指示當(dāng)前數(shù)據(jù)幀是否載有分析參數(shù)。該幀還包含多個(gè)子幀用的激發(fā)參數(shù)，子幀個(gè)數(shù)取決于在語音編碼器4的控制輸入端的信號R所選定的位速率。每幀的子幀個(gè)數(shù)和幀長度能被編碼到該幀的幀頭中，但也能在建立連接的過程中約定每幀的子幀數(shù)和幀長度。在多路調(diào)制器6的輸出端能得到代表語音信號的完全的幀。
在發(fā)送裝置8中，在多路調(diào)制器6輸出端產(chǎn)生的幀被轉(zhuǎn)換成能通過傳輸介質(zhì)10發(fā)送出去的信號。在發(fā)送裝置中完成的操作涉及糾錯(cuò)編碼、交錯(cuò)組合(interleaving)和調(diào)制。
接收機(jī)12被安排成接收來自傳輸介質(zhì)10的由發(fā)射機(jī)2發(fā)送的信號。接收裝置14被安排成用于解調(diào)、去交錯(cuò)組合以及糾錯(cuò)解碼。信號分離器從接收裝置14的輸出信號中提取信號LPC、F和EX。必要時(shí)由信號分離器16完成相繼收到的兩組系數(shù)之間的內(nèi)插。完全的系數(shù)LPC和EX集合被提供給語音解碼裝置18。在語音解碼裝置18的輸出端，能得到被重建的語音信號。
在根據(jù)圖2的語音編碼器中，輸入信號被加到幀裝置20的一個(gè)輸入端。幀裝置20的載有輸出信號Sk+1的輸出端與分析裝置(這里是一個(gè)線性預(yù)測分析器22)的一個(gè)輸入端相連，還和延時(shí)部件28的一個(gè)輸入端相連。線性預(yù)測分析器22的載有信號αk+1的輸出端與量子化裝置(quantiger)24的一個(gè)輸入端相連。量化裝置24的載有輸出信號Ck+1的第一輸出端與延時(shí)部件26的一個(gè)輸入端相連，并與語音編碼器4的第一輸出端相連。延時(shí)部件26的載有輸出信號Ck的一個(gè)輸出端與語音編碼器的第二輸出端相連。
量化裝置24的載有信號
的第二輸出端與控制裝置30的一個(gè)輸入端相連。代表位速率設(shè)置值的輸入信號R被加到控制裝置30的第二輸入端?？刂蒲b置30的第一輸出端載有輸出信號F，該第一輸出端與語音編碼器4的一個(gè)輸出端相連。
控制裝置30的載有輸出信號α′k的第三輸出端與插補(bǔ)器(interpolator)32相連。插補(bǔ)器32的載有輸出信號α′k〔m〕的一個(gè)輸出端與感性(perceptual)加權(quán)濾波器34的控制輸入端相連。
幀裝置20的輸出端還與延時(shí)部件28的一個(gè)輸入端相連。延時(shí)部件28的載有信號Sk的輸出端與感性加權(quán)濾波器34的載有信號rs〔m〕的輸出端與激發(fā)查尋裝置36的一個(gè)輸入端相連。在激發(fā)查尋裝置36的輸出端處，能得到一個(gè)激發(fā)信號EX的代表信號，它包含固定代碼本索引、固定代碼本增益、適應(yīng)性代碼本索引和適應(yīng)性代碼本增益。
幀裝置從來自語音編碼器4的輸入信號中得到包含多個(gè)輸入樣本的幀。在一幀中的樣本個(gè)數(shù)能根據(jù)位速率設(shè)置R而改變。線性預(yù)測分析器22從輸入樣本幀中提取出包含預(yù)測系數(shù)αk+1〔P〕的多個(gè)分析系數(shù)。這些預(yù)測系數(shù)能由公知的Levinson-Durbin算法找出。量子化裝置24把系數(shù)αk+1〔P〕變換成另一種表現(xiàn)形式，并把變換后的預(yù)測系數(shù)量子化為量子化系數(shù)Ck+1〔P〕，這些量子化系數(shù)Ck+1〔P〕通過延時(shí)部件26后作為系數(shù)Ck〔P〕被送到輸出端。該延時(shí)部件的目的是使對應(yīng)于同一幀語音輸入樣本的系數(shù)Ck〔P〕和激發(fā)信號EX能同時(shí)出現(xiàn)在多路調(diào)制器6處。量子化裝置24向控制裝置30提供信號
信號
是通過對量子化系數(shù)Ck+1進(jìn)行逆變換得到的。這種逆變換與接收機(jī)中的語音解碼器中完成的變換相同。在語音編碼器中完成量子化系數(shù)的逆變換，是為了把與接收機(jī)中解碼器能得到的那些系數(shù)完全相同的系數(shù)提供給語音編碼器用于本地合成。
控制裝置30被安排成提取出一部分幀，使其中被傳送的關(guān)于分析系數(shù)的信息多于其他幀中包含的信息。在根據(jù)本實(shí)施例的語音編碼器4中，各幀中或者攜帶關(guān)于分析系數(shù)的全部信息，或者根本不攜帶關(guān)于分析系數(shù)的任何信息，控制裝置30提供一個(gè)輸出信號F，它指示多路調(diào)制器6是否要在當(dāng)前幀中引入信號LPC。然而，應(yīng)該看到，每幀中所攜帶的分析參數(shù)的個(gè)數(shù)是能夠改變的。
控制單元30向插補(bǔ)器32提供預(yù)測系數(shù)α′k。如果對于當(dāng)前幀，所述LPC系數(shù)被傳送，則α′k之值等于最近確定的(量子化的)預(yù)測系數(shù)。如果對于當(dāng)前幀其LPC系數(shù)未被傳送，則通過對α′k-1和α′k+1之值進(jìn)行內(nèi)插來找出α′k之值。
內(nèi)插器32對當(dāng)前幀中的每個(gè)子幀由α′k-1和α′k+1之值給出線性內(nèi)插值α′k(m)。該α′k(m)之值被加到感性加權(quán)濾波器34，用于從輸入信號Sk的當(dāng)前子幀m中導(dǎo)出“殘差信號”rs〔m〕。查尋裝置36被安排成用于找出這樣的固定代碼本索引、固定代碼本增益、適應(yīng)性代碼本索引和適應(yīng)性代碼本增益，它們所造成的激發(fā)信號能給出與“殘差信號”rs〔m〕的當(dāng)前子幀m的最佳匹配。對于每個(gè)子幀m，能在語音編碼器4的輸出端EX得到激發(fā)參數(shù)固定代碼本索引、固定代碼本增益、適應(yīng)性代碼本索引和適應(yīng)性代碼本增益。
根據(jù)圖2的一個(gè)實(shí)例語音編碼器是一個(gè)寬帶語音編碼器，用于以7kHz帶寬和位速率變化范圍從13.6kbit/s至24kbit/s對語音信號進(jìn)行編碼。語音編碼器可被設(shè)定在4個(gè)所謂錨定位速率，這些錨定位速率是這樣一些起始值，可以通過減小攜帶預(yù)測參數(shù)的幀數(shù)份額來使位速率從這些值起始下降。在下表中給出這4個(gè)錨定位速率和相應(yīng)的幀持續(xù)時(shí)間值、一幀中的樣本個(gè)數(shù)以及每幀的子幀個(gè)數(shù)。
通過減少存在LPC系數(shù)的幀的個(gè)數(shù)，便能以小步長控制位速率。如果攜帶LPC系數(shù)的幀所占份額在0.5至1之間變化，而且傳送一幀LPC系數(shù)所需二進(jìn)制位數(shù)為66，便能計(jì)算出最大能得到的位速率降低。對于10ms大小的幀，LPC系數(shù)所需的位速率可在3.3kbit/s至6.6kbit/s之間變化。對于15ms大小的幀，LPC系數(shù)所需的位速率可在2.2kbit/s至4.4kbit/s之間變化。在下表中對這4個(gè)錨定位速率給出位速率降低最大值和最小位速率。
在根據(jù)圖3的控制裝置中，載有信號
的第一輸入端與延時(shí)部件60的一個(gè)輸入端以及轉(zhuǎn)換器64的一個(gè)輸入端相連。延時(shí)部件60的載有信號
的一個(gè)輸出端與延時(shí)部件62的一個(gè)輸入端以及轉(zhuǎn)換器70的一個(gè)輸入端相連。轉(zhuǎn)換器64的載有輸出信息ik+1的一個(gè)輸出端與插補(bǔ)器68的第一輸入端相連。轉(zhuǎn)換器66的載有輸出信號ik-1的一個(gè)輸出端與插補(bǔ)器68的第二輸入端相連。插補(bǔ)器68的載有輸出信號
的輸出端與差距計(jì)算器72的第一輸入端以及選擇器80的第一輸入端相連。轉(zhuǎn)換器70的載有輸出信號ik的一個(gè)輸出端與差距計(jì)算器72的第二輸入端以及選擇器80的第二輸入端相連。
控制裝置30的一個(gè)輸入信號R與計(jì)算裝置74的一個(gè)輸入端相連。計(jì)算裝置74的第一輸出端與控制裝置76相連。在計(jì)算裝置74的第一輸出端處的信號代表攜帶LPC參數(shù)的幀的個(gè)數(shù)所占的份額r，于是所述信號代表位速率設(shè)置。
計(jì)算裝置的第二和第三輸出端載有的信號代表根據(jù)信號R設(shè)置的錨定位速率?？刂茊卧?6的載有閾值信號t的一個(gè)輸出端與比較器78的第一輸入端相連。差距計(jì)算器72的一個(gè)輸出端與比較器78的第二輸入端相連。比較器78的一個(gè)輸出端與選擇器80的控制輸入端、控制單元76的一個(gè)輸入端以及控制裝置30的一個(gè)輸出端相連。
在根據(jù)圖3的控制裝置中，延時(shí)部件60和62根據(jù)反射系數(shù)集
提供延時(shí)后的反射系數(shù)集
和
轉(zhuǎn)換器64、70和66計(jì)算系數(shù)ik+1ik及ik-1，它們比系數(shù)
及
更適于進(jìn)行內(nèi)插。插補(bǔ)器68根據(jù)ik+1和ik-1值得出內(nèi)差后的值
差距計(jì)算器72確定預(yù)測參數(shù)集ik和由ik+1及ik-1內(nèi)插得到的預(yù)測參數(shù)集
之間的差距測量值d。一個(gè)合適的差距測量值由下式給出
在(1)中H(ω)是由系數(shù)ik描述的譜，
是由系數(shù)
描述的譜。測量值d是通常使用的，但實(shí)驗(yàn)表明，更容易計(jì)算的L1范數(shù)能給出可與之相比較的結(jié)果。為此，L1范數(shù)可寫成在(2)式中p是由分析裝置22確定的預(yù)測系數(shù)的個(gè)數(shù)。由比較器78將差距測量值d與閾值t進(jìn)行比較。如果差距d大于閾值t，則比較器78輸出信號C指示應(yīng)發(fā)送當(dāng)前幀的LPC系數(shù)。如果差距測量值d小于閾值t，則比較器78的輸出信號C指示當(dāng)前幀的LPC系數(shù)不必發(fā)送。通過在一預(yù)定時(shí)間段(例如在K幀上，而K的典型值為100)上對信號C指示要發(fā)送LPC系數(shù)的次數(shù)a進(jìn)行計(jì)數(shù)，便能得到包含LPC參數(shù)的幀數(shù)所占實(shí)際份額的測量值a。如果給定了對應(yīng)于所選錨定位速率的參數(shù)，該測量值a也是實(shí)際位速率的一種測量。
控制裝置30被安排成用于對實(shí)際位速率的測量值和位速率設(shè)定值的比較，并在必要時(shí)調(diào)整實(shí)際位速率。計(jì)算裝置74根據(jù)信號R確定錨定位速率和份額r。萬一從兩個(gè)不同的錨定位速率出發(fā)都能達(dá)到某一位速率R，則選擇產(chǎn)生最佳語音質(zhì)量的那個(gè)錨定位速率。把錨定位速率的值作為信號R的函數(shù)存儲到一個(gè)表中會帶來方便。如果已選定錨定位速率，便能確定攜帶LPC系數(shù)的幀所占的份額。
首先，根據(jù)公式
BMAX＝bHEADER+bEXCITATION+bLPC ((4)
BMIN＝bHEADER+bEXCITATION ((5)確定代表每幀中二進(jìn)制位個(gè)數(shù)最大值和最小值的BMAX和BMIN之值。在式(4)和(5)中，bHEADER是一幀中幀頭位的個(gè)數(shù)，bEXCITATION是代表激發(fā)信號的位的個(gè)數(shù)，而bLPC是代表分析系數(shù)的位的個(gè)數(shù)。如果信號R代表所需位速率BREQ，則對于攜帶LPC參數(shù)的幀所占份額r有公式
應(yīng)該指出，在本實(shí)施例中r的最小值是0.5。
控制單元76確定份額r和攜帶LPC參數(shù)幀的實(shí)際份額a之間的差值。為了根據(jù)位速率設(shè)置和實(shí)際位速率之間的差值來調(diào)整位速率，可增大或減小閾值t。如果閾值t增大，則將有較少的幀數(shù)出現(xiàn)差距測量值d超過所述閾值的情況，于是實(shí)際位速率將會降低。如果閾值t減小，則將有較多的幀數(shù)出現(xiàn)差距測量值d超過所述閾值的情況，于是實(shí)際位速率將會提高。由控制單元76按照下式根據(jù)對位速率設(shè)定值得到的測量值r和對實(shí)際位速率得到的測量值b來完成對閾值t的更新
在(3)式中t′是閾值的原始值，而C1和C2是常數(shù)。
在圖4中，圖100給出包含語音信號樣本的幀1……8。圖101顯示出具有與圖100中的語音信號幀相對應(yīng)的系數(shù)的幀。對語音信號樣本幀1……8的每一個(gè)，確定其LPC系數(shù)L和激發(fā)系數(shù)EX。
圖102顯示出由根據(jù)先有技術(shù)的傳輸系統(tǒng)所傳送的數(shù)據(jù)幀。假定平均有一半數(shù)據(jù)幀是完全的數(shù)據(jù)幀。即它們攜帶有與它們的語音樣本幀相對應(yīng)的LPC和激發(fā)系數(shù)。在圖102所示例子中，數(shù)據(jù)幀1、3、5和7是完全的數(shù)據(jù)幀。其余的(不完全的)數(shù)據(jù)幀0、2、4和6只攜帶對應(yīng)于它們的語音樣本幀的激發(fā)系數(shù)。根據(jù)圖101和圖102的數(shù)據(jù)幀之間存在延時(shí)，以使得能決定要發(fā)送的幀是否必須是完全的或不完全的數(shù)據(jù)幀。為了做出這一決定，必須得能夠得到下一個(gè)語音樣本幀的LPC系數(shù)。
幀頭Hi能包含幀同步信號，它還包含如前文解釋的第一和第二指示碼。
在圖103中顯示出根據(jù)圖102從數(shù)據(jù)幀中解碼出來的語音信號樣本幀序列?？梢钥吹?，在被發(fā)送的和被接收的語音樣本幀之間存在多于3個(gè)幀間隔的延時(shí)。在接收機(jī)處，引起這一延時(shí)的原因是在收到攜帶LPC系數(shù)的下一幀之前，它不能重建與一不完全數(shù)據(jù)幀對應(yīng)的語音樣本幀。在圖103中，在收到對應(yīng)于語音幀1的LPC參數(shù)L1之前，語音信號樣本幀0不能被重建。對于語音幀2和4也有同樣情況。
在根據(jù)本發(fā)明的傳輸系統(tǒng)中，數(shù)據(jù)幀的傳輸如圖104中所示?，F(xiàn)在不完全幀0、2和4分別攜帶來自其后的完全幀1、3和5的LPC系數(shù)。提前傳送下一個(gè)完全幀的LPC系數(shù)，則允許提前一個(gè)幀間隔開始實(shí)現(xiàn)內(nèi)插以得到不完全幀的LPC系數(shù)。在圖104中，剛一收到對應(yīng)于幀0的數(shù)據(jù)幀(它包括語音幀1的LPC參數(shù))便已經(jīng)能夠重建語音幀0。從圖105能看到，這造成顯著減小了語音信號幀的延時(shí)。
在圖5的流程圖中，被編號的指令具有按下表給出的含義
根據(jù)圖5流程圖的程序在每個(gè)幀間隔被執(zhí)行一次，它由語音編碼器4提供的輸出信號組合物成數(shù)據(jù)幀。應(yīng)該指出，如果已經(jīng)能得到語音樣本的第K+1幀的LPC系數(shù)，則程序從組合第K數(shù)據(jù)幀開始。假定只存在標(biāo)志F指示當(dāng)前幀是否為完全幀。如果還得要使用標(biāo)志L指示當(dāng)前幀是否攜帶任何LPC系數(shù)的話，則要增加由*號指示的指令115、117和119。
在指令110中開始該程序，并根據(jù)需要對所用變量設(shè)置成各自的初始值。在指令112中，從語音編碼器6中收到的標(biāo)志F〔K〕被寫入當(dāng)前數(shù)據(jù)幀的幀頭中。
在指令114中，標(biāo)志F〔K〕之值與1進(jìn)行比較。如果F〔K〕＝1，則當(dāng)前數(shù)據(jù)幀是一不完全數(shù)據(jù)幀。在這種情況下，在指令118中下一個(gè)語音信號樣本幀的LPC參數(shù)LPC〔K+1〕被寫入當(dāng)前數(shù)據(jù)幀。如果得要包括標(biāo)志L的話，則在指令115中把標(biāo)志L置為1并寫入當(dāng)前數(shù)據(jù)幀的幀頭中，以指示在當(dāng)前數(shù)據(jù)幀中存在LPC系數(shù)。其后該程序在指令122處繼續(xù)進(jìn)行。
如果F〔K〕＝0，則當(dāng)前數(shù)據(jù)幀是一完全數(shù)據(jù)幀。在指令116中，F(xiàn)〔K-1〕之值與1進(jìn)行比較。F〔K-1〕之值指示前一個(gè)數(shù)據(jù)幀是不完全數(shù)據(jù)幀。在這種情況下，當(dāng)前完全數(shù)據(jù)幀的LPC系數(shù)已在所述前一個(gè)(不完全)數(shù)據(jù)幀中被傳送。于是，在當(dāng)前數(shù)據(jù)幀中將不傳送LPC系數(shù)。如果得要包括標(biāo)志L，則在指令119中使標(biāo)志L置為0并寫入當(dāng)前數(shù)據(jù)幀的幀頭中，以指示在當(dāng)前數(shù)據(jù)幀中不存在LPC系數(shù)，其后該程序在指令122處繼續(xù)進(jìn)行。
如果F〔K-1〕之值等于0，則當(dāng)前(完全)數(shù)據(jù)幀的LPC系數(shù)尚未被傳送，于是在指令120中這些LPC系數(shù)被寫入當(dāng)前數(shù)據(jù)幀。如果得要包括標(biāo)志L，則在指令117中標(biāo)志L被置為1并寫入當(dāng)前數(shù)據(jù)幀的幀頭中，以指示在當(dāng)前數(shù)據(jù)幀中存在LPC系數(shù)。
在指令122中，激發(fā)系數(shù)EX〔K〕被寫入當(dāng)前數(shù)據(jù)幀。在指令124中，F(xiàn)〔K〕之值被存儲，用于下次執(zhí)行該程序時(shí)作為F〔K-1〕。在指令126中該程序被終止。
在圖6的流程圖中，被編號的指令具有按下表給出的含義
根據(jù)圖6所示流程圖的程序被用于實(shí)現(xiàn)只使用標(biāo)志F情況下信號分離器的功能。為了還處置標(biāo)志L所需的修改將在后面討論。
在指令130中程序開始。在指令132中，標(biāo)志F〔K〕之值被從當(dāng)前數(shù)據(jù)幀中讀出。在指令134中，標(biāo)志F〔K〕之值與1進(jìn)行比較。
如果標(biāo)志F〔K〕等于0，則指明當(dāng)前幀是一不完全幀，在指令136中F〔K-1〕之值與1進(jìn)行比較。如果F〔K-1〕等于1，則前一個(gè)數(shù)據(jù)幀是攜帶當(dāng)前幀LPC系數(shù)的不完全數(shù)據(jù)幀。這些系數(shù)是在上一次執(zhí)行該程序時(shí)被存于存儲器中的。其后，在指令138中系數(shù)LPC〔K〕被從存儲器中讀出并傳送給語音解碼裝置18。在執(zhí)行指令138之后該程序以指令150繼續(xù)。
如果標(biāo)志F〔K-1〕等于0，則前一個(gè)數(shù)據(jù)幀為一完全數(shù)據(jù)幀，而且當(dāng)前幀的LPC系數(shù)由當(dāng)前數(shù)據(jù)幀攜帶。于是在指令140中從當(dāng)前數(shù)據(jù)幀讀出系數(shù)LPC〔K〕。在指令140中，由指令140得到的系數(shù)LPC〔K〕被寫入存儲器，供對下一數(shù)據(jù)幀執(zhí)行程序時(shí)使用。系數(shù)LPC〔K〕被進(jìn)一步傳送給語音解碼裝置18。其后程序以指令150繼續(xù)執(zhí)行。
如果在指令134中標(biāo)志F〔K〕之值等于1，則當(dāng)前數(shù)據(jù)幀是一不完全數(shù)據(jù)幀，它攜帶與下一數(shù)據(jù)幀對應(yīng)的系數(shù)LPC〔K+1〕。在指令146中，根據(jù)下次從系數(shù)LPC〔K-1〕和LPC〔K+1〕計(jì)算出系數(shù)LPC〔K〕在(4)式中I是一運(yùn)行參數(shù)，P是被傳送的預(yù)測系數(shù)的個(gè)數(shù)。在指令148中，由指令146計(jì)算出的系數(shù)LPC〔K〕被存儲在存儲器中供處理下一數(shù)據(jù)幀時(shí)使用。
在指令150中，激發(fā)系數(shù)EX〔K〕被從當(dāng)前數(shù)據(jù)幀中讀出并傳送給語音解碼裝置18。在指令152中，標(biāo)志F〔K〕被存于存儲器中供處理下一數(shù)據(jù)幀時(shí)使用。在指令154，該程序的執(zhí)行被終止。
圖7顯示根據(jù)圖6的程序中指令136的修改，以處理標(biāo)志L。除了標(biāo)志F〔K〕外還使用標(biāo)志L〔K〕的好處在于當(dāng)由于傳輸錯(cuò)誤導(dǎo)致一個(gè)或多個(gè)數(shù)據(jù)幀出錯(cuò)或者完全丟失時(shí)仍可能重新開始對數(shù)據(jù)幀解碼，因?yàn)榇藭r(shí)不必象只有標(biāo)志F的情況那樣需要來自先前一些幀的標(biāo)志值。圖7中編號的指令具有按下表給出的含義
在指令131中從當(dāng)前數(shù)據(jù)幀讀出L〔K〕值，并在指令133中L〔K〕之值與1進(jìn)行比較。如果L〔K〕之值為1，這意味著當(dāng)前數(shù)據(jù)幀攜帶LPC系數(shù)。程序繼續(xù)指令140以從數(shù)據(jù)幀中讀出LPC系數(shù)。如果L〔K〕之值為0，這意味著當(dāng)前數(shù)據(jù)幀不攜帶LPC系數(shù)。于是程序繼續(xù)指令138以從存儲器中加載先前收到的LPC系數(shù)。
在根據(jù)圖8的解碼裝置18中，載有信號LPC的輸入端與一子幀插補(bǔ)器87的一個(gè)輸入端相連。子幀插補(bǔ)器87的輸出端與合成濾波器88的一個(gè)輸入端相連。
語音解碼裝置18的一個(gè)載有輸入信號EX的輸入端與信號分離器89的一個(gè)輸入端相連。信號分離器89的第一輸出端載有代表固定代碼本索引的信號FI，該第一輸出端與固定代碼本90的一個(gè)輸入端相連。固定代碼本90的一個(gè)輸出端與乘法器92的第一輸入端相連。信號分離器的載有信號FCBG(固定代碼本增益)的第二輸出端與乘法器92的第二輸入端相連。
信號分離器89的第三輸出端載有代表適應(yīng)性代碼本索引的信號AI，該第三輸出端與適應(yīng)性代碼本91的一個(gè)輸入端相連。適應(yīng)性代碼本91的一個(gè)輸出端與乘法器93的第一輸入端相連。信號分離器89的第二輸出端載有信號ACBG(適應(yīng)性代碼本增益)，該輸出端與乘法器93的第二輸入端相連。乘法器92的一個(gè)輸出端與加法器94的第一輸入端相連，而乘法器93的一個(gè)輸出端與加法器94的第二輸入端相連。加法器94的輸出端與適應(yīng)性代碼本的一個(gè)輸入端以及合成濾波器的一個(gè)輸入端相連。
在根據(jù)圖8的語音解碼裝置中，插補(bǔ)器為每個(gè)子幀提供內(nèi)插得到的預(yù)測系數(shù)，并把這些預(yù)測系數(shù)傳送給合成濾波器88。
合成濾波器的激發(fā)信號等于固定代碼本90和適應(yīng)性代碼本91的輸出信號的加權(quán)和。加權(quán)是由乘法器92和93完成的，代碼本索引FI和AI是由信號分離器89從信號EX中提取出來的。加權(quán)因子FCBG(固定代碼本增益)和ACBG(適應(yīng)性代碼本增益)也是由信號分離器89從信號EX中提取出來的。加法器94的輸出信號被移入適應(yīng)性代碼本以提供其適應(yīng)性。
權(quán)利要求
1.一種包含數(shù)據(jù)幀的信號，這些數(shù)據(jù)幀具有代表語音信號樣本幀的系數(shù)集，所述信號包含一些不完全數(shù)據(jù)幀，這些不完全數(shù)據(jù)幀具有代表其相應(yīng)語音信號樣本幀的不完全系數(shù)集，其特征在于一些不完全數(shù)據(jù)幀包含附加系數(shù)，這些附加系數(shù)代表的語音信號樣本幀在時(shí)間上遲于所述不完全數(shù)據(jù)幀對應(yīng)的語音信號樣本幀。
2.根據(jù)權(quán)利要求7的信號，其特征在于數(shù)據(jù)幀包含指示符用于指示該幀是否是不完全數(shù)據(jù)幀以及用于指示該數(shù)據(jù)幀攜帶的系數(shù)是否代表不同于其對應(yīng)的語音樣本幀的語音樣本幀。
3.根據(jù)權(quán)利要求2的信號，其中這些數(shù)據(jù)幀的首標(biāo)包括表示該當(dāng)前幀是否為不完全幀的第一指示符，和表示該當(dāng)前幀是否攜帶分析參數(shù)的第二指示符。
4.根據(jù)權(quán)利要求3的信號，其中該第一指示符是一個(gè)特征位，它的第一值表示該當(dāng)前幀是不完全幀，而第二值表示該當(dāng)前幀是完全數(shù)據(jù)幀。
5.根據(jù)權(quán)利要求3或4的信號，其中該第二指示符是一個(gè)特征位，它的第一值表示在當(dāng)前數(shù)據(jù)幀中分析參數(shù)的存在，而第二值表示在當(dāng)前數(shù)據(jù)幀中不存在分析參數(shù)。
6.根據(jù)權(quán)利要求3-5的任一項(xiàng)的信號，其中這些分析系數(shù)是LPC系數(shù)。
7.根據(jù)權(quán)利要求3-6的任一項(xiàng)的信號，其中該信號表示已由CELP型的語音編碼器編碼的語音信號。
8.一種存儲媒體，具有其上存儲的如前面權(quán)利要求的任一項(xiàng)的信號。
全文摘要
在語音編碼器(4)中，語音樣本幀(100)被編碼成數(shù)據(jù)幀(104)，數(shù)據(jù)幀(104)中包含一組LPC系數(shù)和一組激發(fā)系數(shù)。為了降低編碼語音信號的位速率，LPC系數(shù)只引入到數(shù)據(jù)幀中，這取決于實(shí)際LPC系數(shù)和對先前的及其后的語音樣本幀的LPC系數(shù)進(jìn)行內(nèi)插所得到的LPC系數(shù)之間的差別。為了減小解碼延遲，根據(jù)本發(fā)明提出，如果當(dāng)前幀的LPC系數(shù)未被傳送的話，則傳送已在當(dāng)前幀中的來自下一幀的LPC參數(shù)。為得到當(dāng)前語言幀的LPC參數(shù)所用的內(nèi)插能在當(dāng)前數(shù)據(jù)幀開始時(shí)便已經(jīng)被執(zhí)行。
文檔編號G10L19/002GK1426049SQ0212855
公開日2003年6月25日申請日期2002年8月9日優(yōu)先權(quán)日1997年4月7日
發(fā)明者R·陶里, A·J·格爾里茨申請人:皇家菲利浦電子有限公司

完整全部詳細(xì)技術(shù)資料下載