專利名稱:話音分組發(fā)送方法、話音分組發(fā)送裝置、話音分組發(fā)送程序及已記錄該程序的記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及話音分組發(fā)送方法、裝置和用于在IP(因特網(wǎng)協(xié)議)網(wǎng)絡(luò)中執(zhí)行該方法的程序及記錄該程序的記錄介質(zhì)。
背景技術(shù):
目前,使用IP(因特網(wǎng)協(xié)議)(見非專利文獻1)在因特網(wǎng)上分組執(zhí)行諸如電子郵件和WWW(萬維網(wǎng))通信之類的各種類型的通信。
當今廣泛使用的因特網(wǎng)是盡力而為(best-effort)網(wǎng)絡(luò),不保證分組的送達。因此,使用TCP(傳輸控制協(xié)議)(見非專利文獻2)執(zhí)行重傳控制的通信常常被用來確保更可靠的分組傳輸。然而,如果在諸如使用VoIP(因特網(wǎng)協(xié)議傳輸話音)的、實時性至關(guān)重要的通信中出現(xiàn)分組丟失時執(zhí)行重傳控制,則分組的到達將會大大延遲,因此接收緩沖區(qū)中存儲的分組數(shù)量將不得不設(shè)置為大的值,這將影響實時性。因此,諸如VoIP通信之類的通信通常使用UDP(用戶數(shù)據(jù)報協(xié)議)(見非專利文獻3)來執(zhí)行,UDP不使用重傳控制。然而,這引起在網(wǎng)絡(luò)擁塞期間出現(xiàn)分組丟失、從而話音質(zhì)量下降的問題。
一種防止話音質(zhì)量下降而不用重發(fā)分組的常規(guī)方法是根據(jù)傳輸期間分組丟失率發(fā)送相同分組的副本來增加分組到達的概率,從而防止話音中斷(見專利文獻1)。然而,分組丟失最經(jīng)常發(fā)生在網(wǎng)絡(luò)擁塞期間,如果在這種情況下發(fā)送過多的復制分組,則會出現(xiàn)這樣的問題發(fā)送的信息量和發(fā)送的分組數(shù)量的增加加劇了網(wǎng)絡(luò)擁塞,因此進一步增加了分組丟失的數(shù)量。另一個問題是,由于在分組丟失率高的時候連續(xù)的發(fā)送復制分組,網(wǎng)絡(luò)傳輸接口過載,導致分組傳輸延遲。
一種防止由于分組丟失導致的話音質(zhì)量下降而不增加延遲的方法是話音數(shù)據(jù)壓縮方法。例如,G.711附錄I(見非專利文獻4)中的方法重復過去節(jié)距(pitch)周期中的數(shù)據(jù)來填充丟失的段。然而,該方法的問題在于,如果諸如話音上升周期這樣的信號急劇改變的區(qū)域中的話音數(shù)據(jù)丟失,則由于由過去數(shù)據(jù)合成的話音數(shù)據(jù)具有與原始話音不同的功率和節(jié)距,因此出現(xiàn)異常噪聲。
提出的另一種方法,其中發(fā)送端假設(shè)在接收端將發(fā)生分組丟失,并且發(fā)送端通過重復當前幀的節(jié)距長度的話音波形來合成話音波形,如果合成的話音波形相對于下一幀的原始話音波形的質(zhì)量低于閾值,則將下一幀的壓縮的話音碼作為子幀碼與當前幀話音碼一起使用分組發(fā)送(專利文獻2)。使用該方法,在接收端出現(xiàn)當前幀的分組丟失時,如果在先前和后繼幀中的任何分組中不包含子幀碼,則由先前幀中一個節(jié)距長度的波形合成當前幀,或者如果包含子幀碼,則解碼并使用該碼。在任一情況下,都將生成具有比原始話音信號質(zhì)量低的話音波形。該方法有以下問題如果補償波形的質(zhì)量低于指定值,那么該方法除了當前幀外還要將子編解碼器信息添加到先前和后繼分組,因此,如果三個或更多連續(xù)的分組丟失,則使用先前和后繼分組發(fā)送的當前幀的編碼信息和子編解碼器編碼信息將無法得到,從而解碼話音質(zhì)量下降。
專利文獻1日本專利申請?zhí)卦S公開No.11-177623專利文獻2日本專利申請?zhí)卦S公開No.2003-249957非專利文獻1“Internet Protocol”,RFC791,1981非專利文獻2“Transmission Control Protocol”,RFC793,1981非專利文獻3“User Datagram Protocol”,RFC768,1980非專利文獻4ITU-T Recommendation G.711 Appendix I,“A high qualitylow-complexity algorithm for packet loss concealment with G.711”,pp.1-18,1999非專利文獻5J.Nurminen,A.Heikkinen&J.Saarinen,“Objective evaluationof methods for quantization of variable-dimension spectral vectors in WI speechcoding”,in Proc.Eurospeech 2001,Aalborg,Denmark,Sep.2001,pp.1969-1972發(fā)明內(nèi)容發(fā)明要解決的問題根據(jù)上述問題做出了本發(fā)明,并且本發(fā)明的目的是提供一種話音分組發(fā)送方法、裝置及其其上記錄有其程序的記錄介質(zhì),能夠最小化對于話音再現(xiàn)非常重要的幀數(shù)據(jù)丟失,并且在避免延遲和防止網(wǎng)絡(luò)過載的同時,減輕在實時性尤其關(guān)鍵的雙向話音通信中再現(xiàn)的話音質(zhì)量下降。
解決問題的方法根據(jù)本發(fā)明,由除了當前幀話音信號部分外的話音信號生成關(guān)于當前幀話音信號的補償話音信號,計算補償話音信號的話音質(zhì)量評估值,根據(jù)話音質(zhì)量評估值獲得值隨著補償信號的話音質(zhì)量下降而遞增的復制等級,生成與復制等級指定數(shù)量一樣多的相同話音分組,并且將相同的話音分組發(fā)送到網(wǎng)絡(luò)。
發(fā)明效果根據(jù)本發(fā)明的配置,僅僅冗余地發(fā)送補償話音信號不能確保足夠話音再現(xiàn)質(zhì)量的幀話音信號。因此,不管何時出現(xiàn)話音信號分組丟失,接收端都可以獲得具有良好話音質(zhì)量的再現(xiàn)話音信號,而不會增加分組延遲和使網(wǎng)絡(luò)過載。
圖1A是示出根據(jù)本發(fā)明第一實施例的話音分組發(fā)送裝置的示例性功能配置的方框圖;圖1B是示出分組的示例性結(jié)構(gòu)的方框圖;圖2是示出圖1所示的補償話音生成部分20的特定示例性功能配置的方框圖;圖3A是描述用于合成波形的方法的圖;圖3B是描述用于在節(jié)距比一幀長的情況下合成波形的方法的圖;圖4是圖解用于合成波形的另一示例性方法的圖;圖5A示出用于連接圖4中的波形的一個加權(quán)函數(shù)的例子;圖5B示出另一加權(quán)函數(shù)的例子;圖6是示出圖1所示的話音質(zhì)量評估部分40的特定示例性功能配置的方框圖;圖7示出定義話音質(zhì)量評估值和復制等級之間的關(guān)系的示例性表格;圖8示出定義話音質(zhì)量評估值和復制等級之間的關(guān)系的另一示例性表格;圖9示出定義話音質(zhì)量評估值和復制等級之間的關(guān)系的再一個示例性表格;
圖10示出圖1所示的話音質(zhì)量評估部分40的另一示例性配置;圖11示出在使用圖10所示的話音質(zhì)量評估部分的情況下、定義話音質(zhì)量評估值和復制等級之間的關(guān)系的一個示例性表格;圖12是圖1所示的話音質(zhì)量評估部分40和分組生成部分105執(zhí)行的處理的流程圖;圖13是與圖1所示的發(fā)送裝置相關(guān)聯(lián)的接收裝置的示例性功能配置的方框圖;圖14A是圖13中處理接收的分組的處理的流程圖;圖14B是圖13中生成再現(xiàn)話音的處理的流程圖;圖15是示出根據(jù)本發(fā)明第二實施例的話音分組發(fā)送裝置的示例性功能配置的方框圖;圖16是示出圖15所示的話音質(zhì)量評估部分40的特定示例性功能配置的方框圖;圖17是定義話音質(zhì)量評估值和復制等級之間的關(guān)系的另一個示例性表格;圖18是圖15所示的發(fā)送裝置中的話音質(zhì)量評估部分40和分組生成部分15執(zhí)行的處理的流程圖;圖19是示出與圖15所示的話音分組發(fā)送裝置相關(guān)聯(lián)的話音分組接收裝置的示例性功能配置的方框圖;圖20是示出根據(jù)本發(fā)明第三實施例的話音分組發(fā)送裝置的示例性功能配置的方框圖;圖21是示出圖20所示的補償話音生成部分20的特定示例性功能配置的方框圖;圖22是示出與圖20的發(fā)送裝置相關(guān)聯(lián)的接收裝置的示例性功能配置的方框圖;圖23是示出根據(jù)本發(fā)明第四實施例的話音分組發(fā)送裝置的示例性功能配置的方框圖;圖24是示出圖23所示的輔助信息(side information)生成部分30的特定示例性功能配置的方框圖;圖25是示出圖23所示的補償話音生成部分20的特定示例性功能配置的方框圖;
圖26是示出圖23所示的話音質(zhì)量評估部分40的特定示例性功能配置的方框圖;圖27示出定義話音質(zhì)量評估值、復制等級和話音質(zhì)量下降等級之間的關(guān)系的示例性表格;圖28示出定義估值和話音質(zhì)量下降等級之間的關(guān)系的表格例子;圖29是圖23所示的發(fā)送裝置的第一操作示例中的、話音質(zhì)量評估部分40和分組生成部分15執(zhí)行的處理的流程圖;圖30是圖23所示的發(fā)送裝置的第二操作示例中的、話音質(zhì)量評估部分40和分組生成部分15執(zhí)行的處理的流程圖;圖31是圖23所示的發(fā)送裝置的第三操作示例中的、話音質(zhì)量評估部分40和分組生成部分15執(zhí)行的處理的流程圖;圖32是示出圖31中的處理的后半部分的流程圖;圖33是示出圖23所示的發(fā)送裝置的第四操作示例中的、話音質(zhì)量評估部分40和分組生成部分15執(zhí)行的處理的后半部分的流程圖;圖34是示出與圖23的發(fā)送裝置相關(guān)聯(lián)的接收裝置的例子的方框圖;圖35是示出圖34所示的補償話音生成部分70的特定示例性配置的方框圖;圖36A是圖34中處理接收的分組的處理流程圖;以及圖36B是圖34中生成再現(xiàn)話音的處理流程圖。
具體實施例方式圖1示出根據(jù)本發(fā)明第一實施例的話音分組發(fā)送裝置的示例性功能配置。在本發(fā)明中,通過使用UDP/IP協(xié)議發(fā)送和接收分組。根據(jù)UDP/IP協(xié)議,如圖1B所示,每個分組包含目的地址DEST ADD、源地址ORG ADD和RTP格式的數(shù)據(jù)。話音信號的幀號FR#和話音數(shù)據(jù)DATA作為RTP格式數(shù)據(jù)包含在內(nèi)。話音數(shù)據(jù)可以是通過對輸入的PCM話音信號編碼而產(chǎn)生的編碼話音信號,或者可以是未編碼的輸入PCM話音信號。在該實施例中,分組中包含的話音數(shù)據(jù)是編碼話音信號。盡管在下面描述中假設(shè)一個分組中包含一幀話音數(shù)據(jù)并進行發(fā)送,但一個分組中也可以包含多幀話音數(shù)據(jù)。
輸入的PCM話音信號通過輸入端100輸入到編碼器11,在編碼器11處對信號編碼。編碼器11中使用的編碼算法可以是能夠處理輸入信號的話音頻帶的任何編碼算法。可以使用話音頻帶信號(最高到4kHz)的編碼算法,如ITU-T G.711,或者4kHz以上的寬帶信號的編碼算法,如ITU-T G.722。盡管取決于編碼算法,但編碼一幀話音信號通常生成由編碼算法處理的多個參數(shù)碼。這些參數(shù)將簡單籠統(tǒng)地稱為編碼話音信號。
從編碼器11輸出的編碼話音信號的碼序列送到分組生成部分15中,并且同時送到解碼器12,在解碼器12處使用與編碼器11所使用的編碼算法對應(yīng)的解碼算法將其解碼成PCM話音信號。解碼器12中解碼話音信號提供到補償話音生成部分20,在補償話音生成部分20處通過與當在目的接收裝置處發(fā)生分組丟失時執(zhí)行的補償處理類似的處理生成補償話音信號??梢允褂猛馔品ㄓ僧斍皫暗膸牟ㄐ紊裳a償話音信號,或者可以使用內(nèi)插法由當前幀之前和后繼的幀的波形生成補償話音信號。
圖2示出補償話音生成部分20的特定示例性功能配置。這里,使用外推法生成補償話音信號。來自輸入端201的解碼話音信號存儲在存儲器202的區(qū)域A0中。存儲器202的每個區(qū)域A0、...、A5具有容納具有編碼中使用的分析幀長度的PCM話音信號的大小。例如,如果以10ms的分析幀長度編碼以8kHz采樣的解碼話音信號,則一個區(qū)域中將存儲80個解碼話音信號采樣。每次解碼話音信號的一個分析幀輸入到存儲器202中時,已經(jīng)存儲在區(qū)域A0-A4的過去幀的解碼話音信號被移動到A1-A5,并且將當前幀的解碼話音信號寫入?yún)^(qū)域A0中。
丟失信號生成部分203使用存儲在存儲器202中的話音信號生成當前幀的補償話音信號。輸入到丟失信號生成部分203的是存儲在存儲器202中除了區(qū)域A0之外的區(qū)域A1-A5中的話音信號。盡管這里描述了存儲器202中的區(qū)域A1-A5中的話音信號的5個連續(xù)幀被送到丟失信號生成部分203的情況,但存儲器202中必須提供足夠存儲器,以便可以存儲對一幀(分組)生成補償話音信號的算法所需的過去PCM話音信號采樣。這個例子中的丟失信號生成部分203通過使用補償方法,由除了輸入的話音信號之外(當前幀話音信號)的解碼話音信號(在本實施例中是5個幀),生成并輸出當前幀話音信號。
丟失信號生成部分203包括節(jié)距檢測部分203A、波形剪切部分203B和幀波形合成部分203C。節(jié)距檢測部分203A在依次移動采樣點的同時計算存儲區(qū)域A1-A5中的話音波形序列的自相關(guān)值,并且檢測自相關(guān)值的峰值之間的距離作為節(jié)距長度。通過為圖2所示的多個過去幀提供存儲區(qū)域A1-A5,即使話音信號的節(jié)距比一幀長也可以檢測到它(假設(shè)它小于或等于5幀的長度)。
圖3A示意性示出在從存儲區(qū)域A0-A5中寫入的話音波形數(shù)據(jù)的當前幀m到過去幀m-3中點這段時間內(nèi)的示例性波形。波形剪切部分203B從當前幀的前一幀復制所檢測的節(jié)距長度的波形3A,并且如圖3A所示在正方向上將其重復粘貼為波形3B、3C和3D,直到填充了一幀長度為止,從而合成當前幀的補償話音信號。通常,由于幀長度不一定是節(jié)距長度的整數(shù)倍,因此將波形的最后副本截斷以便適合幀剩余的段。如圖3B所示,例如,如果檢測的節(jié)距長度比一幀長度長,則復制從當前幀緊前面的一個波形節(jié)距長度的前端開始、一幀長度的波形3A,并且使用復制的波形3B作為當前幀的補償話音信號。
圖4示出合成補償話音信號的方法的另一例子。在這個例子中,重復地復制比檢測的節(jié)距長度長ΔL的波形4A來提供波形4B、4C和4D。該波形被排列使得相鄰波形在其末端有ΔL重合。在前和后端的重合時段ΔL分別乘以圖5A和5B所示的加權(quán)函數(shù)w1和W2,并且將乘積加在一起來串行連接剪切的波形。這樣,可以產(chǎn)生一幀長度的波形4E。例如,在時間t1和t2之間的重合時段中,波形4B的后端部分ΔL(從時間t1到t2)乘以圖5A所示的加權(quán)函數(shù)W1(從1到0線性遞減),而相同時段內(nèi)的波形4C的前端部分ΔL乘以圖5B所示的加權(quán)函數(shù)W2(從0到1線性遞增)。將這些乘積在從t1到t2時段上的采樣值加在一起。對其他重合時段執(zhí)行相同的操作。
這樣,丟失信號生成部分203根據(jù)至少一個緊前面的幀中的話音信號生成一幀的補償話音信號,并且將其提供給話音質(zhì)量評估部分40。在丟失信號生成部分203中使用的補償話音信號生成算法可以是例如非專利文獻4中描述的算法,或者其他算法。
回到圖1,將來自輸入端100的話音信號(原始話音信號)、來自解碼器12的輸出信號和來自補償話音生成部分20的輸出信號提供給話音質(zhì)量評估部分40,在話音質(zhì)量評估部分40處確定分組的復制等級Ld。
圖6示出話音質(zhì)量評估部分40的特定例子。首先,在評估值計算部分41中計算表示補償話音信號質(zhì)量的評估值。這里,第一計算部分412由通過輸入端100提供的輸入話音信號(原始話音信號)和解碼器12的輸出信號(解碼話音信號),計算當前幀的解碼話音信號相對于當前幀的原始話音信號的目標評估值Fw1。類似地,第二計算部分413由當前幀的輸入話音信號(原始話音信號)和從補償話音生成部分20輸出的、由過去幀的解碼話音信號生成的當前幀的信號(補償信號),計算補償話音信號相對于原始話音信號的目標評估值Fw2。特別地,通過第一計算部分412和第二計算部分413計算的目標評估值可以是例如SNR(信噪比)。這里,第一計算部分412使用作為信號S的一幀原始信號的功率Porg,并使用作為噪聲N的一幀原始話音信號和解碼話音信號之間的差的功率Pdif1(對應(yīng)于一幀上的兩個信號采樣的值之間的差的平方和),來計算Fw1=10log(S/N)=10log(Porg/Pdif1) (1)令N表示每幀中的采樣數(shù)量,xn和yn分別表示該幀的原始話音信號和解碼話音信號的第n個采樣值,則Porg=Σxn2,]]>Pdif1=∑(xn-yn)2。這里,∑表示幀中采樣0到N-1的和。類似地,第二計算部分413使用作為信號S的一幀原始信號的功率Porg,使用作為噪聲N的原始話音信號和補償話音信號之間的差的功率Pdif2,來計算目標評估值FW2Fw2=10log(S/N)=10log(Porg/Pdif2) (2)這里,令幀的補償話音信號的第n個采樣值為zn,則Pdif2=∑(xn-zn)2。
除了信噪比(SNR),也可以使用其他評估值,如WSNR(加權(quán)信噪比;例如見非專利文獻5,J.Nurminen,A.Heikkinen&J.Saarinen,“Objectiveevaluation of methods for quantization of variable-dimension spectral vectors inWI speech coding”,in Proc.Eurospeech 2001,Aalborg,Denmark,Sep.2001,pp.1969-1972)或SNRseg(分段SNR,可以通過將每幀分成段并且在段上求SNR平均值來獲得),WSNRseg,CD(倒譜距離這里在第一計算部分412獲得的原始話音信號Org和解碼話音信號Dec之間的倒譜距離,下面用CD(org,Dec)表示,其對應(yīng)于畸變),或PESQ(ITU-T標準P.862中指定的綜合評估測量)。目標評估值不限于一種類型;可以組合使用兩個或多個目標評估值。
第三計算部分411使用通過第一計算部分412和第二計算部分412計算出的一個或多個目標評估值計算表示補償話音信號的話音質(zhì)量的評估值,并且將其發(fā)送到復制發(fā)送確定部分42。根據(jù)評估值,復制發(fā)送確定部分42確定復制值Ld(整數(shù)值)。補償話音信號的話音質(zhì)量越低,該整數(shù)值越大。即,根據(jù)作為評估值得到的表示話音質(zhì)量的值,選擇復制等級(離散的值)之一Ld。如果使用WSNR作為目標評估值,則可以通過使用感受加權(quán)差信號的平方和WPdif1=∑[WF(xn-yn)]2作為方程(1)中的差的功率Pdif1,代替Pdif1=∑(xn-yn)2,確定分組的復制等級Ld。WF(xn-yn)表示施加到差信號(xn-yn)的感受加權(quán)過濾??梢杂稍荚捯粜盘柕木€性預測系數(shù)確定感受加權(quán)過濾器的系數(shù)。同樣適用于方程(2)。
分別使用第一和第二計算部分412和413處獲得的WSNR輸出作為Fw1和Fw2,在第三計算部分411處計算Fd=Fw1-Fw2,然后將Fd作為評估值輸入到復制發(fā)送確定部分42,并且參考圖7所示的表由值Fd確定復制等級Ld,這是有效的。即,復制等級Ld隨著值Fd增加而增加,F(xiàn)d是通過將補償話音信號對于原始話音信號的評估值Fw2減去解碼話音信號相對于原始話音信號的評估值Fw1得到的。Fd=Fw1-Fw2值越大,補償話音信號相對于解碼話音信號的話音質(zhì)量就越低。因此,為了最大化這樣一幀話音信號到達接收端的概率,增加同一分組的復制分組發(fā)送的數(shù)量。相反,如果Fd=Fw1-Fw2小,則即使出現(xiàn)分組丟失,接收端處的再現(xiàn)話音信號質(zhì)量也將下降得少,并且補償話音信號替代該幀的話音信號。因此,如果Fd=Fw1-Fw2小,則選擇小的同一分組的復制分組發(fā)送數(shù)量Ld。如果Ld=1,則同一幀的分組僅發(fā)送一次(即,不執(zhí)行復制發(fā)送)?;谠囼烆A先準備了圖7中的表,并且存儲在復制發(fā)送確定部分42的表存儲器42T中。
可以使用多個目標評估值。例如,如果使用WSNR和CD的值作為目標評估值,則第一計算部分412也可以計算CD(Org,Dec)并將計算出的CD作為Fd1與Fd=Fw1-Fw2一同提供給復制發(fā)送確定部分42,并且參考圖8所示的表由值Fd確定復制等級Ld。如果解碼話音信號相對于原始話音信號的畸變Fd1=CD(Org,Dec)小,則如上所述,復制等級值Ld的值隨著Fd=Fw1-Fw2增加而增加。另一方面,大的Fd1值指示即使沒有分組丟失該幀也提供不了高的話音質(zhì)量。因此,高復制等級Ld沒有什么用處,因而只提供兩個低Ld值,并且根據(jù)Fd=Fw1-Fw2的值在這兩個Ld等級之間進行選擇。補償話音信號Com相對于解碼話音信號Dec的倒頻距離CD(Dec,Com)可以在評估值計算部分41中計算,并且也可以使用得到的值Fd2來確定復制等級Ld。圖9示出用于該目的的表的例子。在這個例子中,將圖8中的表的范圍Fd=Fw1-Fw2<2dB和范圍2dB≤Fd<10dB用一個范圍Fd<10dB替代,并且將該范圍分成兩個Fd2范圍,一個小于1,另一個大于或等于1。
圖1中的分組生成部分15生成從編碼器11接收的編碼話音信號的副本,其數(shù)量與從話音質(zhì)量評估部分40接收的分組復制等級一樣多,并且將Ld個生成的分組送到發(fā)送部分16,后者將分組發(fā)送到網(wǎng)絡(luò)。如果Ld=1,則只發(fā)送一個分組而沒有復制件。
在參照圖6描述的例子中,評估值計算部分41使用兩個評估值,即,通過使用方程(1)由原始話音信號的功率Porg和原始話音信號與解碼話音信號之間的差的功率Pdif1獲得的評估值Fw1、以及通過使用方程(2)由原始話音信號的功率Porg和原始話音信號與補償話音信號之間的差的功率Pdif2獲得的評估值Fw2,作為目標評估值來確定復制等級Ld。然而,如圖10中的話音質(zhì)量評估部分41的另一例子所示,可以僅由解碼話音信號和補償話音信號確定目標評估值。特別地,評估值計算部分根據(jù)下面方程由解碼話音信號的功率Pdec和解碼話音信號與補償話音信號之間的差的功率Pdif’計算評估值Fw’。
Fw’=10log(Pdec/Pdif’) (3)這指示隨著差的功率Pdif’增加,評估值Fw’降低,并且相應(yīng)地,補償話音信號的話音質(zhì)量下降。在復制發(fā)送確定部分42中的表中,如圖11所示指定基于評估值Fw’的復制等級Ld,其中如果評估值Fw’低于2dB,則Ld=1,如果2dB≤Fw’<10dB,則Ld=2,如果Fw’≥10dB,則Ld=3。該表是基于試驗預先準備的。
圖12示出圖1中的發(fā)送裝置中的話音質(zhì)量評估部分40和分組生成部分15執(zhí)行的、通過使用圖7所示的表確定復制等級Ld的處理。這里,使用加權(quán)信噪比WSNR作為目標評估值。在下面的處理中,步驟S1到S3由評估值計算部分41執(zhí)行,步驟S4到S10由復制發(fā)送確定部分42執(zhí)行,而步驟S11由分組生成部分15執(zhí)行。
步驟S1在評估值計算部分41中,由原始話音信號Org的功率Porg和原始話音信號Org與解碼話音信號Dec之間的感受加權(quán)差信號的功率WPdif1得到WSNR=10log(Porg/WPdif1),作為評估值Fw1。該計算下面表示為Fw1=WSNR(Org,Dec)。
步驟S2在評估值計算部分41中,由原始話音信號Org的功率Porg和原始話音信號Org與補償話音信號Com之間的感受加權(quán)差信號的功率WPdif2得到WSNR=10log(Porg/WPdif2),作為評估值Fw2。該計算下面表示為Fw2=WSNR(Org,Ext)。
步驟S3獲得差Fd=Fw1-Fw2。
步驟S4在復制發(fā)送確定部分42,進行關(guān)于是否Fd<2dB的確定。如果Fd小于2dB,則在步驟S5確定Ld=1;否則,處理前進到步驟S6。
步驟S6進行關(guān)于是否2dB≤Fd<10dB的確定。如果是,則在步驟S7由圖7所示的表確定Ld=2,否則,處理前進到步驟S8。
步驟S8進行關(guān)于是否10dB≤Fd<15dB的確定。如果是,則在步驟S9由圖7所示的表確定Ld=3,否則,在步驟S10確定Ld=4。
步驟S11分組生成部分15將當前幀的相同話音數(shù)據(jù)放入Ld個分組中的每個中,并且依次發(fā)送它們。
圖13示出與圖1所示的話音分組發(fā)送裝置相關(guān)聯(lián)的話音分組接收裝置的功能配置。接收裝置包括接收部分50、碼序列構(gòu)造部分61、解碼器62、補償話音生成部分70和輸出信號選擇器63。接收部分50包括分組接收機51、緩沖區(qū)52和控制器53??刂破?3檢查緩沖區(qū)52來看看是否它存儲了包含具有與在分組接收機51處接收的分組中所包含的話音數(shù)據(jù)相同幀號的話音數(shù)據(jù)的分組。如果已經(jīng)存儲,則控制器53丟棄接收到的分組;否則,控制器將接收到的分組存儲在緩沖區(qū)52中。
控制器53在整個緩沖區(qū)52中按照幀號順序、以每個幀號搜索包含話音數(shù)據(jù)的分組。如果找到分組,則控制器53提取該分組并將其提供給碼序列構(gòu)造部分61。碼序列構(gòu)造部分61從提供的分組提取一幀長的編碼話音信號,將構(gòu)成編碼話音信號的參數(shù)碼按預定順序排序,然后將編碼話音信號提供給解碼器62。解碼器62解碼所提供的編碼話音信號來生成一幀長的話音信號,并且將其提供給輸出選擇器63和補償話音生成部分70。如果緩沖區(qū)52不包括含有當前幀的編碼話音信號的分組,則控制器53生成指示分組丟失的控制信號CLST,并且將其提供給補償話音生成部分70和輸出信號選擇器63。
補償話音生成部分70具有與發(fā)送裝置中的補償話音生成部分20基本上相同的配置,包括存儲器702和丟失信號生成部分703。丟失信號生成部分703也具有與圖2的發(fā)送端處的丟失信號生成部分203相似的配置。當從解碼器62提供解碼話音信號時,補償話音生成部分70將區(qū)域A0-A4中的話音信號移動到存儲器702中的區(qū)域A1-A5,并且將提供的解碼話音信號寫入?yún)^(qū)域A0中,除非提供了控制信號CLST。然后將輸出信號選擇器63所選擇的編碼話音信號作為再現(xiàn)話音信號輸出。
如果控制器53檢測到分組丟失并且生成控制信號CLST,則無法從緩沖區(qū)52獲得當前幀的分組。因此,補償信號生成部分70將區(qū)域A0-A4中的話音信號移動到存儲器702中的區(qū)域A1-A5,并且丟失信號生成部分703基于移動的話音信號生成補償話音信號,將其寫入存儲器702中的區(qū)域A0中,并且也通過輸出信號選擇器63將其作為再現(xiàn)話音信號輸出。
圖14A和14B示出圖13所示的接收裝置中執(zhí)行的分組接收處理和分組再現(xiàn)處理。在分組接收處理中,在圖14A中的步驟S1A做出關(guān)于是否接收到分組的確定。如果接收到了分組,則在步驟S2A做出關(guān)于包含具有與分組中所包含的話音數(shù)據(jù)相同幀號的話音數(shù)據(jù)的分組是否已經(jīng)存儲在緩沖區(qū)52中的確定。如果找到包含具有相同幀號的話音數(shù)據(jù)的分組,則在步驟S3A丟棄接收到的分組,并且處理在步驟S1A等待下一分組。如果在緩沖區(qū)52中沒有找到包含具有相同幀號的話音數(shù)據(jù)的分組,則在步驟S4A將接收到的分組存儲在緩沖區(qū)52中,并且處理返回步驟S1A,等待下一分組。
在話音信號再現(xiàn)處理中,在圖14B中的步驟S1B做出關(guān)于包含當前幀話音數(shù)據(jù)的分組是否存儲在緩沖區(qū)52中的確定。如果存儲在其中,則在步驟S2B提取分組并將其提供給碼序列構(gòu)造部分61。碼序列構(gòu)造部分61從提供的分組中提取編碼話音信號(當前幀話音數(shù)據(jù)),將構(gòu)成編碼話音信號的參數(shù)碼按預定順序排序,然后將信號提供到解碼器62。解碼器62在步驟S3B對編碼話音信號進行解碼來生成話音信號。在步驟S4B將話音信號存儲在存儲器702中,并且在步驟S6B將其輸出。如果在步驟S1B沒有在緩沖區(qū)52中找到包含當前幀話音數(shù)據(jù)的分組,則在步驟S5B由先前幀的話音信號生成補償話音信號,在步驟S4B將話音信號存儲在存儲器702中,并且在步驟S4B將其輸出。
圖15示出根據(jù)本發(fā)明第二實施例的話音分組發(fā)送裝置的功能配置。在該實施例中,沒有提供第一實施例中給出的編碼器11和解碼器12。輸入的PCM話音信號被直接分組并發(fā)送。補償話音生成部分20由通過輸入端100提供的輸入PCM話音生成補償話音信號。補償話音生成部分20執(zhí)行的處理與圖2所示的相同。這里生成的補償話音信號被送到話音質(zhì)量評估部分40。話音質(zhì)量評估部分40確定分組的復制等級Ld并且將其輸出到分組生成部分15。
圖16示出話音質(zhì)量評估部分40的特定示例。這里,評估值計算部分41計算從補償話音生成部分20輸出的補償話音信號相對于通過輸入端100提供的當前幀的輸入PCM原始話音信號的目標評估值。目標評估值可以是諸如SNR、WSNR、SNRseg、WSNRseg、CD或PESQ之類的評估值。目標評估值不限于一種類型;可以組合使用兩個或多個評估值。在評估值計算部分41中計算目標評估值被送到復制發(fā)送確定部分42,在復制發(fā)送確定部分42處確定分組的復制等級Ld。對于復制等級Ld的確定,在例如使用WSNR作為目標評估值的情況下,可以如圖17所示使用從評估值計算部分41輸出的WSNR作為Fw確定分組的復制等級。在這種情況下,評估值Fw越大,將選擇越小的復制低級Ld。在這個例子中,在復制發(fā)送確定部分42中提供圖17所示的表。在這種情況下,評估值計算部分41使用原始話音信號的功率作為S,使用作為噪聲N的原始話音信號與補償話音信號之間的加權(quán)差信號的功率。如果WSNR大的話,則通過使用丟失分組的補償話音信號使話音質(zhì)量不會嚴重下降。因此,WSNR越大,將選擇越小的復制等級Ld。
分組生成部分15生成要處理的幀大小的輸入PCM話音信號的副本,數(shù)量與從話音質(zhì)量評估部分40接收的分組復制等級Ld一樣多,并且將Ld個生成的分組送到發(fā)送部分16,后者將分組發(fā)送到網(wǎng)絡(luò)。
圖18示出圖16所示的話音質(zhì)量評估部分40通過使用圖17的表確定復制等級Ld的處理,以及圖15所示的發(fā)送裝置中的分組生成部分15執(zhí)行的分組生成處理的過程。該例子還是使用加權(quán)信噪比WSNR作為評估值Fw。在步驟S1,由原始話音信號Org的功率Porg和原始話音信號Org與補償話音信號Com之間的感受加權(quán)差信號的功率WPdif計算評估值Fw,WSNR=10log(Porg/WPdif)該計算在下面表示為Fw=WSNR(Org,Com)。在步驟S2做出關(guān)于評估值Fw是否小于2dB的確定。如果是,則在步驟S3參考圖17所示的表由Fw的值確定復制等級Ld=3。如果Fw不小于2dB,則在步驟S4做出關(guān)于Fw是否大于等于2dB且小于10dB的確定。如果是,則在步驟S5參考圖17所示的表確定Ld=2。否則,在步驟S6確定Ld=1。在步驟S7,分組生成部分15將當前幀話音信號放入根據(jù)預定復制等級Ld的Ld個分組中的每個中,并且將分組提供給發(fā)送部分16,后者依次發(fā)送分組。
圖19示出與圖15所示的發(fā)送裝置相關(guān)聯(lián)的分組接收裝置。接收部分50和補償話音生成部分70具有與圖13所示的接收部分50和補償話音生成部分70類似的配置。在這個例子中,PCM話音信號構(gòu)造部分64從在接收部分50接收到的分組數(shù)據(jù)中提出PCM輸出話音信號序列。分組是冗余地從發(fā)送端發(fā)送的。如果在接收部分50處接收到復制分組,則丟棄第二個和隨后復制的分組。如果成功接收到分組,則PCM話音信號構(gòu)造部分64從該分組提取PCM話音信號并將其發(fā)送到輸出信號選擇器63,同時將其存儲在補償話音生成部分70(見圖13)中的存儲器中,以便為后繼幀生成補償話音信號。如果接收部分50處以控制信號CLST指示出現(xiàn)分組丟失,則補償話音生成部分70以類似于參照圖2所述的處理的方式生成補償話音信號,并將其發(fā)送到輸出信號選擇器63。如果從接收部分50指示出現(xiàn)分組丟失,則輸出信號選擇器63選擇從補償話音生成部分70輸出的補償話音信號作為輸出話音信號并將其輸出。如果沒有分組丟失,則選擇器63選擇PCM話音信號構(gòu)造部分64的輸出作為輸出話音信號并將其輸出。
盡管在上述實施例中使用外推法由過去幀生成補償話音信號,但在第三實施例中使用內(nèi)插法由當前幀的先前和后繼幀中的波形生成補償話音信號。圖20示出根據(jù)本發(fā)明第三實施例的話音分組發(fā)送裝置的功能配置。編碼器11、解碼器12、話音質(zhì)量評估部分40、分組生成部分15和發(fā)送部分16的配置與圖1所示的實施例中的對應(yīng)部件相同。第三實施例被配置成使得通過內(nèi)插法由當前幀的過去幀話音信號和后繼幀話音信號生成當前幀話音信號的補償話音信號。
在編碼器11中編碼的話音信號被送到數(shù)據(jù)延遲部分19(提供1幀周期的延遲),同時還被送到解碼器12。在解碼器12中解碼話音信號通過數(shù)據(jù)延遲部分18(提供1幀周期的延遲)提供到話音質(zhì)量評估部分40,并且還送到補償話音生成部分20,在補償話音生成部分20處基于當前幀前面的幀中將出現(xiàn)分組丟失的假設(shè)生成補償話音。將經(jīng)數(shù)據(jù)延遲部分17延遲一個幀周期的原始話音信號以及來自補償話音生成部分20的補償話音信號和來自數(shù)據(jù)延遲部分18的解碼信號提供到話音質(zhì)量評估部分40,并且以類似于圖1實施例的方式確定復制等級Ld。
圖21示出使用內(nèi)插法的補償話音生成部分20的特定例子。解碼話音信號被復制到存儲器202中的區(qū)域A-1。存儲在存儲器202中的區(qū)域A-1和區(qū)域A1-A5中的每一個(除了區(qū)域A0外)中的一幀解碼話音信號輸入到丟失信號生成部分203。在這種情況下,通過使用預先讀出的將來解碼話音信號和過去解碼話音信號為丟失了分組的幀生成該分組的話音信號的補償話音信號。丟失信號生成部分203由當前幀的過去解碼話音信號(本實施例中為5幀)和預先讀出的將來解碼話音信號(本實施例中為一幀),為要發(fā)送的當前幀話音信號生成補償話音信號,并將其輸出。
特別地,例如區(qū)域A1-A5中的話音信號用于像圖3A所示例子中那樣檢測節(jié)距長度,并且在反方向上從區(qū)域A1的末端(與當前幀的邊界)剪切一節(jié)距長度的波形,并且連接該波形的副本來由過去生成外推的波形。類似地,在正方向上從區(qū)域A0的起點剪切一節(jié)距長度的波形,連接該波形的副本來由將來生成外推的波形。將對應(yīng)于這兩個外推的波形的采樣加在一起,并且將和除以2以獲得內(nèi)插的話音信號作為補償話音信號。在這個例子中,只能處理具有小于或等于一幀長度的節(jié)距長度的波形,因為為將來幀提供一幀長度的存儲區(qū)域A-1。然而,顯然可以為多個將來幀提供多個區(qū)域來處理具有大于一幀長度的節(jié)距長度的波形。在這種情況下,數(shù)據(jù)延遲部分17、18和19提供的延遲量必須根據(jù)將來幀的數(shù)量而增加。當下一幀的解碼話音信號輸入到存儲器202中時,存儲在區(qū)域A1、...、A4中的解碼話音信號向具有較大區(qū)域號A0、...、A5的區(qū)域移動一個位置。
在圖20中,通過輸入端100輸入的話音信號被送進數(shù)據(jù)延遲部分17,在數(shù)據(jù)延遲部分17處話音信號被延遲一個幀周期,然后提供給話音質(zhì)量評估部分40。此外,由數(shù)據(jù)延遲部分18將來自解碼器12的解碼話音信號延遲一個幀周期,然后將其提供給話音質(zhì)量評估部分40。將來自數(shù)據(jù)延遲部分17的原始話音信號、來自數(shù)據(jù)延遲部分18的解碼話音信號和來自補償話音生成部分20的補償話音信號提供到話音質(zhì)量確定部分40,后者然后確定分組復制等級Ld。話音質(zhì)量評估部分40的操作與參照圖6所述的操作相同。數(shù)據(jù)延遲部分19將編碼器11提供的編碼話音信號延遲一個幀周期,然后將其提供到分組生成部分15。
圖22示出與圖20所示的話音分組發(fā)送裝置相關(guān)聯(lián)的話音分組接收裝置的功能配置。諸如接收部分50、碼序列構(gòu)造部分61、解碼器62和輸出信號選擇器63之類的部件與圖13中所示的對應(yīng)部件相同。接收裝置與圖13的接收裝置不同之處在于,在解碼器62的輸出側(cè)上提供用于將解碼話音信號延遲一個幀周期的數(shù)據(jù)延遲部分67,提供數(shù)據(jù)延遲部分68用來將(接收部分50中的控制器(見圖13)在檢測到分組丟失時輸出的)控制信號CLST延遲一個幀周期以便將其提供給補償話音信號生成部分70和輸出信號選擇器63,并且補償話音信號生成部分70由當前幀的來自圖21所示的過去解碼話音信號和預先讀出的將來解碼話音信號,生成內(nèi)插話音信號作為補償話音信號。
解碼器62解碼的話音信號送到數(shù)據(jù)延遲部分67,并且也存儲在補償話音生成部分70中的存儲器(未示出)中(類似于圖21所示的存儲器),用于生成后繼幀的補償話音信號。數(shù)據(jù)延遲部分67將加碼話音信號延遲一幀并且將其提供給輸出信號選擇器63。如果檢測到出現(xiàn)分組丟失,并且從接收部分50向數(shù)據(jù)延遲部分68輸出控制信號CLST,則將控制信號CLST延遲一個幀周期并且提供給補償話音生成部分70和輸出信號選擇器63。補償話音生成部分70以類似于參照圖21描述的操作的方式生成和輸出補償話音信號。如果從接收部分50指示分組丟失,則輸出信號選擇器63選擇補償話音生成部分70的輸出作為輸出話音信號。如果沒有出現(xiàn)分組丟失,則輸出信號選擇器63選擇數(shù)據(jù)延遲部分67的輸出作為輸出話音信號并且輸出解碼話音信號。
在上述實施例中,如果在發(fā)送端由與當前幀相鄰的至少一個幀生成的當前幀話音信號的補償話音信號的話音質(zhì)量低于指定值,則在接收對應(yīng)于該幀的分組端出現(xiàn)丟失時由該相鄰幀生成的補償話音信號的話音質(zhì)量也將是低的。因此,為了最小化分組丟失的出現(xiàn),包含相同幀的話音信號的分組被發(fā)送多次,次數(shù)等于復制等級Ld值,復制等級Ld是根據(jù)預期補償話音信號的目標評估值確定的。在上述例子中,通過從與當前幀相鄰的至少一個幀開始重復復制節(jié)距長度的話音波形、直到填滿幀長度為止,來生成補償話音信號。
在下面實施例中,如果確定可以通過使用當前幀的節(jié)距(和功率)合成話音質(zhì)量更好的補償話音信號,則在一分組中發(fā)送當前幀的解碼話音信號,并且還在同一幀的另一分組中發(fā)送作為輔助信息的同一當前幀的節(jié)距參數(shù)(和功率參數(shù)),而不是解碼話音信號的副本。如果在接收端不能接收到包含幀的解碼話音信號的分組而接收到輔助信息的分組,則可以使用輔助信息在減少要發(fā)送的數(shù)據(jù)量的同時生成較高質(zhì)量的補償話音信號。
圖23示出允許使用該輔助信息的發(fā)送裝置的示例性配置。在該配置中,將用于獲得當前幀話音信號的節(jié)距參數(shù)(和功率參數(shù))的輔助信息生成部分30加到圖1所示的發(fā)送裝置。補償話音生成部分20具有(1)第一功能,用于如參照圖1所述,從至少一個相鄰幀檢測節(jié)距,剪切節(jié)距長度的波形,并且基于波形生成第一補償話音信號,(2)第二功能,使用輔助信息生成部分30檢測的當前幀話音信號的節(jié)距參數(shù)、而不是使用第一功能中從相鄰幀的波形檢測的節(jié)距,并且通過使用節(jié)距參數(shù)從相鄰幀的波形剪切節(jié)距長度的波形來生成第二補償話音波形,和(3)第三功能,根據(jù)第二功能中的輔助信息生成部分30獲得的當前幀話音信號的功率參數(shù)調(diào)節(jié)合成的第二補償話音信號的功率,來生成與當前幀話音信號功率一致的第三補償話音波形。
話音質(zhì)量評估部分40分別基于第一、第二和第三補償話音波形確定評估值Fd1、Fd2和Fd3,然后參照預定義這些值的表,確定對應(yīng)于評估值Fd1的復制等級Ld和話音質(zhì)量下降等級QL_1、對應(yīng)于評估值Fd2的話音質(zhì)量下降等級QL_2、對應(yīng)于評估值Fd3的話音質(zhì)量下降等級QL_3。
分組生成部分15根據(jù)復制等級Ld并且通過話音質(zhì)量下降等級QL_1、QL_2和QL_3之間的比較,確定是將當前幀話音數(shù)據(jù)放入Ld個分組中送出還是將當前幀話音數(shù)據(jù)放在一個分組中且將相同的輔助信息(節(jié)距參數(shù)或節(jié)距和功率參數(shù))放在其余Ld-1個分組中送出。分組生成部分15根據(jù)該確定生成和發(fā)送分組。將在稍后參照流程圖描述該處理。
圖24示出輔助信息生成部分30的示例性配置。當前幀話音信號提供到功率計算部分301,在功率計算部分301計算幀的話音信號的功率P=Σxn2]]>來獲得作為功率參數(shù)的功率值。話音信號還提供到線性預測部分303,在線性預測部分303獲得該幀的話音信號的線性預測系數(shù)。獲得的線性預測系數(shù)提供到變平部分302來根據(jù)線性預測分析形成具有相反的頻譜包絡(luò)特性的反向濾波器。使用該反向濾波器將話音信號反向濾波,并且將其頻譜包絡(luò)變平。反向濾波的話音信號提供到自相關(guān)系數(shù)計算部分304,在這里計算其自相關(guān)系數(shù)[方程1].R(k)=Σn=0N-1xnxn-k]]>這里,如果以8kHz采樣輸入話音信號,最好40≤k≤120。節(jié)距參數(shù)確定部分305檢測提供自相關(guān)系數(shù)R(k)的峰值的k作為節(jié)距,并且輸出節(jié)距參數(shù)。
圖25示出補償話音生成部分20的示例性功能配置。如圖2中的例子所示,將當前幀的解碼話音信號寫在存儲器202中的區(qū)域A0,并且將區(qū)域A0-A4中保存的過去幀的話音信號移動到區(qū)域A1-A5。丟失信號生成部分203具有第一、第二和第三補償信號生成部分21、22和23。第一補償信號生成部分21像圖2的例子中那樣,通過上述第一功能、通過重復地連接使用由區(qū)域A1-A5中的波形檢測的節(jié)距長度剪切的波形來合成第一補償話音信號。第二補償信號生成部分22通過上述第二功能、使用當前幀的節(jié)距參數(shù)(輔助信息生成部分30提供的輔助信息)從區(qū)域A1中的話音信號剪切節(jié)距長度的波形并且重復地連接波形,來合成第二補償話音信號。第三補償信號生成部分23通過第三功能、通過使用輔助信息生成部分30提供的當前幀的功率信息調(diào)節(jié)第二補償信號生成部分22生成的第二補償話音信號的功率使得第二補償話音信號的功率等于當前幀,來生成第三補償話音信號。特別地,令Pp表示功率參數(shù),Pc=Σyn2]]>為功率調(diào)節(jié)前的補償話音信號的功率,則可以通過計算K=(Pp/Pc)1/2并且將補償話音信號的每個采樣yn乘以K來獲得功率調(diào)節(jié)后的補償話音信號。
圖26示出話音質(zhì)量評估部分40的示例性配置。與圖6所示的例子中的話音質(zhì)量評估部分40相似,該話音質(zhì)量評估部分40包括評估值計算部分41和復制發(fā)送確定部分42。評估值計算部分41具有第一計算部分412,用于由原始話音信號Org和解碼話音信號Dec計算Fw1=WSNR(Org,Dec);第二計算部分#1 413A,用于由原始話音信號Org和第一補償話音信號Com1計算Fw2_1=WSNR(Org,Com1);第二計算部分#2 413B,用于由原始話音信號Org和第二補償話音信號Com2計算Fw2_2=WSNR(Org,Com2);和第二計算部分#3 413C,用于由原始話音信號Org和第三補償話音信號Com3計算Fw2_3=WSNR(Org,Com3);以及第三計算部分411,用于計算第一評估值Fd=Fw1-Fw2_1、第二評估值Fd2=Fw1-Fw2_2和第三評估值Fd3=Fw1-Fw2_3。這些評估值Fd1、Fd2和Fd3提供給復制發(fā)送確定部分42。
復制發(fā)送確定部分42的表存儲器42T中存儲有圖27所示的表(定義第一評估值Fd1的復制等級Ld和話音質(zhì)量下降等級QL_1)、圖28所示的表(定義第二評估值Fd2的話音質(zhì)量下降等級QL_2)和與圖28的表類似的未示出的表(定義第三評估值的話音質(zhì)量下降等級QL_3)。在圖27和28的表中,話音質(zhì)量下降等級隨著評估值增加而遞增。盡管在圖27的示例性表中評估值Fd1的復制等級Ld值與話音質(zhì)量下降等級QL_1值相同,但這些值不必相同。這些值是通過試驗預先確定的。
第一操作示例圖29示出圖23中的發(fā)送裝置的第一操作示例。在該示例中,根據(jù)話音質(zhì)量下降等級進行關(guān)于是如圖1所示使用過去幀的波形和節(jié)距長度生成補償話音信號Ext1還是使用當前幀的節(jié)距和過去幀的波形生成補償話音信號Ext2的選擇。將輔助信息生成部分30對當前幀的輸入話音信號獲得的節(jié)距參數(shù)和功率參數(shù)以及解碼器12對經(jīng)編碼器11編碼的當前幀話音信號進行解碼所生成的解碼話音信號提供給補償話音生成部分20。
步驟S1補償話音生成部分20由原始話音信號(Org)及其解碼話音信號(Dec)計算Fw1=WSNR(Org,Dec),由原始話音信號(Org)和第一補償話音信號(Com1)計算Fw2=WSNR(Org,Com1),并且由原始話音信號(Org)和第二補償話音信號(Com2)計算Fw3=WSNR(Org,Com2)。
步驟S2計算不同評估值Fd1=Fw1-Fw2和Fd2=Fw1-Fw3。
在步驟S3到S9B,做出關(guān)于差評估值Fd1屬于圖27的表中的哪個范圍的確定,并且確定對應(yīng)于該范圍的復制等級Ld和話音質(zhì)量下降等級QL_1的值。
在步驟S10到S16,做出關(guān)于差評估值Fd2屬于圖28的表中的哪個范圍的確定,并且確定對應(yīng)于該范圍的話音質(zhì)量下降等級QL_2的值。
步驟S17做出關(guān)于話音質(zhì)量下降等級QL_1是否低于QL_2,即,使用當前幀的節(jié)距生成的補償話音信號Com2的話音質(zhì)量下降等級是否低于由過去幀的節(jié)距生成的補償話音信號Com1的話音質(zhì)量下降等級的確定。如果Com2的話音質(zhì)量下降等級不低于Com1的話音質(zhì)量下降等級,即,使用當前幀的節(jié)距將不會提高話音質(zhì)量,則在步驟S18將當前幀的編碼話音數(shù)據(jù)放進所有Ld個分組中并且依次發(fā)送分組。
步驟S19如果話音質(zhì)量下降等級QL_2低于QL_1,則使用例如利用從過去幀中的話音波形剪切的波形的節(jié)距長度和當前幀話音信號的節(jié)距生成的補償話音信號Ext2與使用僅僅用過去幀的話音信號生成的補償話音信號Ex1相比,話音質(zhì)量將進一步提高。因此,將當前幀的編碼話音數(shù)據(jù)放進一個分組,且將當前幀的節(jié)距參數(shù)作為輔助信息放進所有Ld-1個分組中,并且發(fā)送分組。
這樣,如果在接收端可以接收到包含當前幀話音數(shù)據(jù)的分組,則可以再生當前幀話音信號,而如果在接收端不能接收到包含當前幀話音數(shù)據(jù)的分組而可以接收到包含當前幀的輔助信息(節(jié)距參數(shù))的分組,則可以使用當前幀的節(jié)距來由過去幀中的話音波形生成補償話音信號,從而一定程度上可以減少話音質(zhì)量的下降。
第二操作示例圖30示出第二操作示例。本操作示例中的步驟S1到S18與圖29所示的步驟S1到S18相同,但后面的步驟不同。即,在步驟S19,將輔助信息(節(jié)距參數(shù))的復制數(shù)量確定為質(zhì)量等級的差Ndup1=QL_1-QL_2,并且在步驟S20將當前幀的輔助信息(這里為節(jié)距參數(shù))放進Ld個分組當中的Ndup1個分組的每一個中,并且將當前幀的編碼話音數(shù)據(jù)放進其余Ld-Ndup1個分組的每一個中,然后發(fā)送分組。即,在示例性操作中,如果在使用當前幀的節(jié)距生成補償話音信號的情況中的話音質(zhì)量下降小于僅從過去幀的話音數(shù)據(jù)生成補償話音信號的情況中的語音質(zhì)量下降,則根據(jù)減少話音質(zhì)量下降的效果改變發(fā)送相同輔助信息的復制分組數(shù)量,從而也可以相應(yīng)地改變發(fā)送相同當前幀的編碼話音數(shù)據(jù)的復制分組數(shù)量。
第三操作示例圖31和32示出第三操作示例。在本操作示例中,使用當前幀的節(jié)距和功率參數(shù)作為輔助信息,除了在第一和第二示例性操作中使用的第一和第二補償話音信號Com1和Com2外,由過去幀中的波形生成第三補償話音信號Com3。因此,在步驟S1除了執(zhí)行在圖30的步驟S1的WSNR計算外,還執(zhí)行第四評估值Fw4=WSNR(Org,Com3)的計算,并且在步驟S2,除了執(zhí)行在圖30的步驟S2的WSNR差計算外,還執(zhí)行Fd3=Fw1-Fw4的計算。此外,以類似于圖30的步驟S10到S16中確定Fd2的話音質(zhì)量下降等級QL_2的方式,添加步驟S110到S116用來確定Fd3的話音質(zhì)量下降等級QL_3。
在步驟S17,做出關(guān)于QL_2或QL_3中較小的一個是否小于QL_1的確定。如果否,則在步驟S18將當前幀的編碼話音數(shù)據(jù)放進Ld個分組中的每一個中并且發(fā)送。如果它們中任一個都小于QL_1,則在步驟S19做出關(guān)于QL_3是否小于QL_2的確定。如果否,則與圖29的步驟S19相似的方式,在步驟S20生成包含當前幀的編碼話音數(shù)據(jù)的一個分組和Ld-1個包含當前幀的節(jié)距參數(shù)的分組并且發(fā)送。如果QL_3小于QL_2,則在步驟S21生成包含當前幀的編碼話音數(shù)據(jù)的一個分組和Ld-1個包含當前幀的節(jié)距和功率的分組并且發(fā)送。
第四操作示例第四示例性操作是第三示例性操作的變型。處理的前半部分的步驟與圖31所示的第三示例性操作的步驟S1到S16相同,因此這些步驟也用在本示例中。步驟S16后面的步驟是圖33所示的步驟S110到S23。除這些步驟之外,用于確定Fd3的話音質(zhì)量下降等級QL_3的步驟S110到S116與圖32所示的第三示例性操作的步驟S110到S116也相同。此外,步驟S17和S18也與圖32中的相同。
如果在步驟S19中QL_3不小于QL_2,這意味著使用當前幀的節(jié)距和功率參數(shù)作為輔助信息與僅使用當前幀的節(jié)距參數(shù)相比,不能在補償話音信號的話音質(zhì)量上提供改善。因此,在步驟S20將節(jié)距參數(shù)的復制數(shù)量確定為Ndup1=QL_1-QL_2,并且在步驟S21將當前幀的節(jié)距參數(shù)放進Ndup1個分組中,將當前幀的編碼話音數(shù)據(jù)放進其余Ld-Ndup1個分組中,并且發(fā)送這些分組。如果在步驟S19中QL_3小于QL_2,這意味著使用當前幀的節(jié)距和功率參數(shù)與僅使用當前幀的節(jié)距參數(shù)作為輔助信息相比,在補償話音信號的話音質(zhì)量上提供了改善。因此,在步驟S22將輔助信息(節(jié)距和功率)的復制數(shù)量確定為Ndup2=QL_1-QL_3,并且在步驟S23將當前幀的輔助信息放進Ndup2個分組中,將當前幀的編碼話音數(shù)據(jù)放進其余Ld-Ndup2個分組中,并且發(fā)送這些分組。
圖34示出與圖23中的發(fā)送裝置相關(guān)聯(lián)的接收裝置的示例性配置。在該配置中,輔助信息提取部分81加入到圖13所示的接收裝置中。此外,補償話音生成部分70包括存儲器702、丟失信號生成部分703和信號選擇器704,如圖35所示。丟失信號生成部分703包括節(jié)距檢測部分703A、波形剪切部分703B、幀波形合成部分703C和節(jié)距選擇器開關(guān)703D。
控制器53檢查緩沖區(qū)62來看接收到的分組中包含的相同幀的分組是否已經(jīng)存儲在緩沖區(qū)52中。如果沒有的話,控制器53將接收到的分組存儲在緩沖區(qū)52中。將在后面參照圖36A的流程圖詳述該處理。
在再現(xiàn)話音信號的處理中,控制器53檢查緩沖區(qū)52來看當前需要的幀的分組是否存儲在緩沖區(qū)52中,這將在稍后參照圖36B的流程圖描述。如果沒有存儲,則控制器53確定分組已經(jīng)丟失,并且生成控制信號CLST。當控制器生成控制信號CLST時,信號選擇器704選擇丟失信號生成部分703的輸出并且節(jié)距選擇器開關(guān)703D選擇節(jié)距檢測部分703A檢測的節(jié)距,并將其提供給波形剪切部分703B,后者然后從存儲器702的區(qū)域A1剪切節(jié)距長度的波形。幀波形合成部分703C由剪切的波形合成一幀長度的波形,并且將合成的波形作為補償話音信號提供給輸出選擇器63,同時通過信號選擇器704將其寫入存儲器702的區(qū)域A0中。
如果控制器53在緩沖區(qū)52中找到包含當前幀的編碼話音數(shù)據(jù)的分組,則控制器53將該分組提供給碼序列構(gòu)造部分61,在碼序列構(gòu)造部分61從分組提取編碼話音數(shù)據(jù)。在解碼器62中對編碼話音數(shù)據(jù)進行解碼,并且通過輸出信號選擇器63輸出解碼話音信號,同時通過信號選擇器704將其寫入補償話音生成部分70的存儲器702中的區(qū)域A0中。如果控制器53找到包含關(guān)于當前幀的輔助信息的分組,則控制器53將該分組提供給復制信息提取部分81。
輔助信息提取部分81從分組中提取關(guān)于當前幀的輔助信息(節(jié)距參數(shù)或節(jié)距參數(shù)與功率參數(shù)的組合),并且將其提供給補償話音生成部分70中的丟失信號生成部分703。當提供輔助信息時,將輔助信息中的當前幀的節(jié)距參數(shù)通過節(jié)距選擇器開關(guān)703D提供給波形剪切部分703B。于是,波形剪切部分703B從區(qū)域A1中的話音波形中剪切當前幀的所提供的節(jié)距長度的波形?;谠摬ㄐ危瑤ㄐ魏铣刹糠?03C合成并輸出一幀波形作為補償話音信號。如果輔助信息還包含當前幀的功率參數(shù),則幀波形合成部分703C使用功率參數(shù)調(diào)節(jié)合成的幀波形的功率,并且輸出波形作為補償話音信號。在任一情況中,當生成補償話音信號時,將其通過信號選擇器704寫入存儲器702的區(qū)域A0中。
圖36A示出在控制器53的控制下將分組接收機51接收到的分組存儲在緩沖區(qū)52中的處理的例子。
在步驟S1A做出關(guān)于是否已經(jīng)接收到分組的確定。如果接收到分組,則在步驟S2A檢查緩沖區(qū)52來看包含具有與接收到的分組中所包含的數(shù)據(jù)相同幀號的數(shù)據(jù)的分組是否已經(jīng)在緩沖區(qū)52中。如果是的話,則在步驟S3A檢查緩沖區(qū)的分組中包含的數(shù)據(jù)來確定它是否為編碼話音數(shù)據(jù)。如果它是話音編碼數(shù)據(jù),則接收到的分組就是不必要的,因此在步驟S4A丟棄它,然后處理返回步驟S1A,處理在此等待下一分組。
如果在步驟S3A中緩沖區(qū)中相同幀的分組中的數(shù)據(jù)不是編碼話音數(shù)據(jù),即,如果數(shù)據(jù)是輔助信息,則在步驟S5A做出關(guān)于接收到的分組中的數(shù)據(jù)是否編碼話音數(shù)據(jù)的確定。如果它不是編碼話音數(shù)據(jù)(即,如果它是輔助信息),則在步驟S4A丟棄接收到的分組,然后處理返回到步驟S1A。如果在步驟S5A中接收到的分組中的數(shù)據(jù)是編碼話音數(shù)據(jù),則在步驟S6A中用接收到的分組替代緩沖區(qū)中包含的相同幀的分組,然后處理返回到步驟S1A。即,如果接收到的相同幀的分組是編碼話音數(shù)據(jù),則不需要生成補償話音,因此不要求輔助信息。如果緩沖區(qū)不包含相同幀的分組,則在步驟S7A中將接收到的分組存儲在緩沖區(qū)52中,然后處理返回到步驟S1A等待下一分組。
圖36B示出在控制器53的控制下從緩沖區(qū)52讀出的分組中提取話音數(shù)據(jù)并且輸出再現(xiàn)話音信號的處理的例子。
在步驟S1B,檢查緩沖區(qū)52來看是否存在需要的當前幀的分組。如果沒有,則確定出現(xiàn)分組丟失,并且由丟失信號生成部分703的節(jié)距檢測部分703A從過去幀中檢測節(jié)距。在步驟S3B使用檢測的檢測長度來從過去幀中的話音波形剪切一個節(jié)距長度的波形,并且合成一個幀長度的波形。在步驟S7B將合成的波形作為補償話音信號存儲在存儲器702中的區(qū)域A0中,在步驟S8B輸出補償話音信號,然后處理返回到步驟S1B,開始下一幀的處理。
如果在步驟S1B中緩沖器52包含當前幀的分組,則在步驟S4B做出關(guān)于分組中的數(shù)據(jù)是否為輔助信息的確定。如果是輔助信息,則在步驟S5B從輔助信息提取節(jié)距參數(shù),并且在步驟S3B使用節(jié)距參數(shù)生成補償話音信號。如果在步驟S4B確定當前幀的分組中的數(shù)據(jù)不是輔助信息,則分組中的數(shù)據(jù)為編碼話音數(shù)據(jù)。因此,在步驟S6B對編碼話音數(shù)據(jù)進行解碼來獲得話音波形數(shù)據(jù),并且在步驟S7B將話音波形數(shù)據(jù)寫入存儲器402A中的區(qū)域A0中,并且在步驟S8B將話音波形作為話音信號輸出,然后處理返回到S1B。
圖36B中的處理對應(yīng)于在發(fā)送端中的圖30中的示例性操作。在處理對應(yīng)于圖31、32和33中的示例性操作的情況下,在步驟S5B(如括號所示)中也從輔助信息中提取功率參數(shù),并且在步驟S3B中(如括號所示)根據(jù)功率參數(shù)調(diào)節(jié)合成的波形的功率。
權(quán)利要求
1.一種使用分組逐幀地發(fā)送輸入的話音信號的話音分組發(fā)送方法,包括步驟(a)從與當前幀相鄰的至少一幀的話音信號生成關(guān)于當前幀話音信號的補償話音信號;(b)計算補償話音信號的話音質(zhì)量評估值;(c)根據(jù)話音質(zhì)量評估值確定復制等級,復制等級是1或更大的整數(shù)值,其值隨著補償話音信號的話音質(zhì)量的降低而遞增;(d)對當前幀話音信號生成與復制等級指定的數(shù)量一樣多的分組;和(e)將生成的分組發(fā)送到網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的話音分組發(fā)送方法,其中,步驟(b)由輸入的話音信號和補償話音信號計算話音質(zhì)量評估值;和步驟(d)包括將當前幀的輸入的話音信號直接按原樣進行分組的步驟。
3.如權(quán)利要求1所述的話音分組發(fā)送方法,其中,步驟(a)包括通過編碼輸入的話音信號生成碼序列的步驟以及通過解碼碼序列生成解碼話音信號的步驟;步驟(b)包括由輸入的話音信號和解碼話音信號計算第一話音質(zhì)量評估值的步驟,以及由輸入的話音信號和補償話音信號計算第二話音質(zhì)量評估值的步驟;步驟(c)包括根據(jù)第一和第二話音質(zhì)量評估值確定復制等級的步驟。
4.如權(quán)利要求1所述的話音分組發(fā)送方法,其中,步驟(a)包括步驟(a-1)生成至少包括節(jié)距參數(shù)的輔助信息,節(jié)距參數(shù)是當前幀話音信號的特征參數(shù);(a-2)由至少一個相鄰幀的話音信號生成具有話音信號的節(jié)距的第一補償話音信號;和(a-3)通過至少使用輔助信息中的節(jié)距參數(shù),由至少一個相鄰幀的話音信號生成第二補償話音信號;以及步驟(b)包括獲取第一補償話音信號的第一話音質(zhì)量評估值的步驟和獲得第二補償話音信號的第二話音質(zhì)量評估值的步驟;步驟(c)包括根據(jù)第一話音質(zhì)量評估值確定復制等級和隨著話音質(zhì)量下降而遞增的第一話音質(zhì)量下降等級的步驟,以及根據(jù)第二話音質(zhì)量評估值確定隨著話音質(zhì)量下降而遞增的第二話音質(zhì)量下降等級的步驟;步驟(d)包括步驟如果第二話音質(zhì)量下降等級不小于第一話音質(zhì)量下降等級,則生成數(shù)量與復制等級值一樣多的、當前幀話音信號的分組;如果第二話音質(zhì)量下降等級小于第一話音質(zhì)量下降等級,則生成一個或多個當前幀話音信號的分組和一個或多個輔助信息的分組,所生成分組的總數(shù)等于復制等級值;以及步驟(e)為當前幀發(fā)送總數(shù)與復制等級值一樣多的分組。
5.如權(quán)利要求4所述的話音分組發(fā)送方法,其中,步驟(c)還包括步驟計算第一話音質(zhì)量下降等級和第二話音質(zhì)量下降等級之間的差作為輔助信息的復制數(shù)量;以及如果第二話音質(zhì)量下降等級不小于第一話音質(zhì)量下降等級,則步驟(d)生成與輔助信息的復制數(shù)量一樣多的輔助信息的分組。
6.如權(quán)利要求1所述的話音分組發(fā)送方法,其中,步驟(a)包括步驟(a-1)生成包括節(jié)距參數(shù)和功率參數(shù)的輔助信息,節(jié)距參數(shù)和功率參數(shù)是當前幀話音信號的特征參數(shù);(a-2)由至少一個相鄰幀的話音信號生成具有話音信號的節(jié)距的第一補償話音信號;(a-3)通過使用輔助信息中的節(jié)距參數(shù),由至少一個相鄰幀的話音信號生成第二補償話音信號;和(a-4)通過使用輔助信息中的節(jié)距參數(shù)和功率參數(shù),由至少一個相鄰幀的話音信號生成第三補償話音信號;步驟(b)包括獲取第一補償話音信號的第一話音質(zhì)量評估值的步驟、獲得第二補償話音信號的第二話音質(zhì)量評估值的步驟以及獲得第三補償話音信號的第三話音質(zhì)量評估值的步驟;步驟(c)包括步驟(c-1)根據(jù)第一話音質(zhì)量評估值確定復制等級和隨著話音質(zhì)量下降而遞增的第一話音質(zhì)量下降等級;(c-2)根據(jù)第二話音質(zhì)量評估值確定隨著話音質(zhì)量下降而遞增的第二話音質(zhì)量下降等級;(c-3)根據(jù)第三話音質(zhì)量評估值確定隨著話音質(zhì)量下降而遞增的第三話音質(zhì)量下降等級;步驟(d)包括步驟如果第二或第三話音質(zhì)量下降等級中小的一個不小于第一話音質(zhì)量下降等級,則生成數(shù)量與復制等級值一樣多的、當前幀話音信號的分組;如果第二和第三話音質(zhì)量下降等級小于第一話音質(zhì)量下降等級,且第三話音質(zhì)量下降等級不小于第二話音質(zhì)量下降等級,則生成一個或多個當前幀話音信號的分組和一個或多個節(jié)距參數(shù)的分組,所生成分組的總數(shù)等于復制等級值,而如果第三話音質(zhì)量下降等級小于第二話音質(zhì)量下降等級,則生成一個或多個當前幀話音信號的分組和一個或多個包括節(jié)距參數(shù)和功率參數(shù)的輔助信息的分組,所生成分組的總數(shù)等于復制等級值;以及步驟(e)為當前幀發(fā)送總數(shù)與復制等級值一樣多的分組。
7.如權(quán)利要求6所述的分組發(fā)送方法,其中,步驟(c)還包括步驟計算第一話音質(zhì)量下降等級和第二話音質(zhì)量下降等級之間的差作為輔助信息的第一復制數(shù)量,并且計算第一話音質(zhì)量下降等級和第三話音質(zhì)量下降等級之間的差作為輔助信息的第二復制數(shù)量;以及如果第三話音質(zhì)量下降等級不小于第二話音質(zhì)量下降等級,則步驟(d)生成與輔助信息的第一復制數(shù)量一樣多的節(jié)距參數(shù)的分組,而如果第三話音質(zhì)量下降等級小于第二話音質(zhì)量下降等級,則步驟(d)生成與輔助信息的第二復制數(shù)量一樣多的包括節(jié)距參數(shù)和功率參數(shù)的輔助信息的分組。
8.一種使用分組逐幀地發(fā)送輸入的話音信號的話音分組發(fā)送方法,包括補償話音信號生成部分,用于從與當前幀相鄰的至少一幀的話音信號生成關(guān)于當前幀的補償話音信號;評估值計算部分,至少有補償話音信號輸入其中,并且其計算補償話音信號的話音質(zhì)量評估值;復制發(fā)送確定部分,用于根據(jù)話音質(zhì)量評估值確定復制等級,復制等級是隨著補償話音信號的話音質(zhì)量的降低而遞增的整數(shù)值;分組生成部分,用于對當前幀話音信號生成與復制等級所指定的數(shù)量一樣多的分組;和發(fā)送部分,用于將生成的分組發(fā)送到網(wǎng)絡(luò)。
9.如權(quán)利要求8所述的話音分組發(fā)送裝置,還包括編碼器,用于編碼輸入的當前幀話音來獲得編碼的話音;和解碼器,用于對編碼的話音進行解碼來獲得解碼話音,其中補償話音信號生成部分使用與當前幀相鄰的至少一幀的解碼話音生成補償話音。
10.如權(quán)利要求8所述的話音分組發(fā)送裝置,還包括用于生成當前幀話音信號的節(jié)距參數(shù)作為輔助信息的輔助信息生成部分,其中補償話音生成部分僅由與當前幀相鄰的至少一個幀的話音信號生成第一補償話音,以及通過使用當前幀的節(jié)距參數(shù),由與當前幀相鄰的至少一個幀的話音信號生成第二補償話音;話音質(zhì)量評估值計算部分獲得第一補償話音信號的第一話音質(zhì)量評估值和第二補償話音信號的第二話音質(zhì)量評估值;復制發(fā)送確定部分根據(jù)第一話音質(zhì)量評估值確定復制等級和隨著話音質(zhì)量下降而遞增的第一話音質(zhì)量下降等級,并且根據(jù)第二話音質(zhì)量評估值確定隨著話音質(zhì)量下降而遞增的第二話音質(zhì)量下降等級;如果第二話音質(zhì)量下降等級不小于第一話音質(zhì)量下降等級,則分組生成部分生成數(shù)量與復制等級值一樣多的、當前幀話音信號的分組;如果第二話音質(zhì)量下降等級小于第一話音質(zhì)量下降等級,則分組生成部分生成一個或多個當前幀話音信號的分組和一個或多個輔助信息的分組,所生成分組的總數(shù)等于復制等級值。
11.如權(quán)利要求8所述的話音分組發(fā)送裝置,還包括用于生成當前幀話音信號的節(jié)距參數(shù)和功率操作作為輔助信息的輔助信息生成部分,其中補償話音生成部分僅由與當前幀相鄰的至少一個幀的話音信號生成第一補償話音信號,通過使用當前幀的節(jié)距參數(shù)由與當前幀相鄰的至少一個幀的話音信號生成第二補償話音信號,以及通過使用當前幀的節(jié)距參數(shù)和功率參數(shù)由與當前幀相鄰的至少一個幀的話音信號生成第三補償話音信號;話音質(zhì)量評估值計算部分計算第一補償話音信號的第一話音質(zhì)量評估值、第二補償話音信號的第二話音質(zhì)量評估值和第三補償話音信號的第三話音質(zhì)量評估值;復制發(fā)送確定部分根據(jù)第一話音質(zhì)量評估值確定復制等級和隨著話音質(zhì)量下降而遞增的第一話音質(zhì)量下降等級,根據(jù)第二話音質(zhì)量評估值確定隨著話音質(zhì)量下降而遞增的第二話音質(zhì)量下降等級,以及根據(jù)第三話音質(zhì)量評估值確定隨著話音質(zhì)量下降而遞增的第三話音質(zhì)量下降等級;以及如果第二或第三話音質(zhì)量下降等級中小的一個小于第一話音質(zhì)量下降等級,則分組生成部分生成數(shù)量與復制等級值一樣多的、當前幀話音信號的分組;如果第二或第三話音質(zhì)量下降等級中小的一個小于第一話音質(zhì)量下降等級、且第三話音質(zhì)量下降等級不小于第二話音質(zhì)量下降等級,則分組生成部分生成一個或多個當前幀話音信號的分組和一個或多個節(jié)距參數(shù)的分組,所生成分組的總數(shù)等于復制等級值;如果第三話音質(zhì)量下降等級小于第二話音質(zhì)量下降等級,則生成一個或多個當前幀話音信號的分組和一個或多個包括節(jié)距參數(shù)和功率參數(shù)的輔助信息的分組,所生成分組的總數(shù)等于復制等級值。
12.一種在計算機上執(zhí)行如權(quán)利要求1所述的話音分組發(fā)送方法的計算機可執(zhí)行程序。
13.一種計算機可讀記錄介質(zhì),其上記錄有能使計算機執(zhí)行如權(quán)利要求1所述的話音分組發(fā)送方法的程序。
全文摘要
在編碼器(11)中對輸入話音進行編碼,解碼器(12)對經(jīng)編碼的話音進行解碼,補償話音生成部分(20)使用先前解碼話音生成用于補償當前幀話音的補償話音,話音質(zhì)量評估部分(40)使用輸入話音和補償話音評估補償話音的質(zhì)量并且生成其值隨著話音質(zhì)量評估值的降低而逐漸增加的復制等級,分組生成部分(15)對經(jīng)編碼的話音生成與復制等級指定的數(shù)量一樣多的相同分組,并且發(fā)送分組。從而,可以減少在接收端發(fā)生分組損失的可能性。
文檔編號G10L19/14GK1906662SQ200580001518
公開日2007年1月31日 申請日期2005年5月10日 優(yōu)先權(quán)日2004年5月11日
發(fā)明者森岳至, 大室仲, 日和崎佑介, 片岡章俊 申請人:日本電信電話株式會社