用于多碼率語音和音頻編解碼器的幀擦除隱藏的制作方法
【專利摘要】提供一種音頻編碼終端和方法。所述終端包括:編碼模式設(shè)置單元,用于從多個操作模式設(shè)置用于由編解碼器對輸入音頻數(shù)據(jù)進(jìn)行編碼的操作模式;編解碼器被配置用于基于設(shè)置的操作模式對輸入音頻數(shù)據(jù)進(jìn)行編碼,使得當(dāng)設(shè)置的操作模式是高幀擦除率(FER)操作模式時,編解碼器根據(jù)一個或多個幀擦除隱藏(FEC)模式中的一個FEC模式對輸入音頻數(shù)據(jù)的當(dāng)前幀進(jìn)行編碼。在編碼模式設(shè)置單元將操作模式設(shè)置為高FER操作模式時,編碼模式設(shè)置單元從針對高FER操作模式預(yù)先確定的所述一個或多個FEC模式選擇所述一個FEC模式,根據(jù)選擇的所述一個FEC模式,基于輸入音頻數(shù)據(jù)的編碼內(nèi)的冗余的合并或與編碼的輸入音頻分離的分離冗余信息來控制編解碼器。
【專利說明】用于多碼率語音和音頻編解碼器的幀擦除隱藏
【技術(shù)領(lǐng)域】
[0001]一個或多個實施例涉及用于對音頻進(jìn)行編碼和解碼的科技和技術(shù),更具體的,涉及用于使用利用多碼率語音和音頻編解碼器的改進(jìn)的幀錯誤隱藏對音頻進(jìn)行編碼和解碼的科技和技術(shù)。
【背景技術(shù)】
[0002]在針對預(yù)計編碼的語音或音頻的幀在它們的傳輸期間遭遇偶爾丟失的環(huán)境的語音和音頻編碼的【技術(shù)領(lǐng)域】中,編碼的語音或音頻傳輸或解碼系統(tǒng)被設(shè)計為幀丟失限制到少
量百分比。
[0003]為了限制這些幀丟失,或為了補(bǔ)償這些幀丟失,可由獨立于用于對語音或音頻進(jìn)行編碼或解碼的語音編解碼器的解碼系統(tǒng)實現(xiàn)幀擦除隱藏(FEC)算法。很多編解碼器使用僅解碼器的算法,以減少由幀丟失造成的劣化。
[0004]這樣的FEC算法最近已被用于在蜂窩通信網(wǎng)絡(luò)或根據(jù)給定標(biāo)準(zhǔn)或規(guī)范操作的環(huán)境中。例如,所述標(biāo)準(zhǔn)或規(guī)范可定義應(yīng)被用于連接和通信的通信協(xié)議和/或參數(shù)。不同標(biāo)準(zhǔn)和/或規(guī)范的示例包括例如全球移動通信系統(tǒng)(GSM)、GSM/增強(qiáng)型數(shù)據(jù)速率GSM演進(jìn)(EDGE)、美國移動電話系統(tǒng)(AMPS)、寬帶碼分多址(WCDMA)或第三代系統(tǒng)(3G)通用移動電信系統(tǒng)(UMTS)、國際移動電信2000 αΜΤ-2000)。這里,先前已使用可變碼率編碼或固定碼率編碼執(zhí)行語音編碼。在可變碼率編碼中,源使用算法來將語音分類為不同碼率,并根據(jù)各個預(yù)定比特率對分類語音進(jìn)行編碼??蛇x擇地,已使用固定比特率執(zhí)行語音編碼,其中,可根據(jù)固定比特率對檢測的聲音語音音頻進(jìn)行編碼。這種固定碼率編解碼器的示例包括由第三代合作伙伴項目(3GPP)開發(fā)的用于GSM/EDGE和WCDMA通信網(wǎng)絡(luò)的多碼率語音編解碼器,諸如,自適應(yīng)多碼率(AMR)編解碼器和自適應(yīng)多碼率寬帶(AMR-WB)編解碼器,所述編解碼器根據(jù)這樣檢測的語音信息并還基于諸如網(wǎng)絡(luò)性能和空中接口的無線電信道條件等因素,對語音進(jìn)行編碼。術(shù)語多碼率指依據(jù)編解碼器的操作的模式可用的固定碼率。例如,AMR包含用于語音的從4.7kbit/s到12.2kbit/s的八個可用比特率,而AWR-WB包含用于語音的從6.6kbit/s到23.85kbit/s的九個比特率。AMR和AMR-WB編解碼器的規(guī)范分別可用在用于第三代3GPP無線系統(tǒng)的3GPP TS26.090和3GPP TS26.190技術(shù)規(guī)范,可在用于第三代3GPP無線系統(tǒng)的第三代的3GPP TS26.194技術(shù)規(guī)范中找到AMRWB的語音檢測方面,其公開被包含在本文中。
[0005]在這樣的蜂窩環(huán)境中,例如,可由于例如蜂窩無線鏈路中的干擾或IP網(wǎng)絡(luò)中的路由器溢出而導(dǎo)致丟失。例如,目前正在開發(fā)新的第四代3GPP無線系統(tǒng),被稱為增強(qiáng)型分組業(yè)務(wù)(EPS),EPS的主要空中接口被稱為長期演進(jìn)(LTE)。作為示例,圖1示出具有語音媒體組件12的EPS10,其中,根據(jù)用于寬帶語音音頻數(shù)據(jù)的示例AMR-WB編解碼器和用于窄帶語音音頻數(shù)據(jù)的AMR編解碼器對語音數(shù)據(jù)進(jìn)行編碼,所述AMR也可被稱為AMR窄帶(AMR-NB)。EPSlO符合例如在3GPP版本8和9中的UMTS和LTE語音編解碼器。在3GPP版本8和9中的UMTS與LTE語音編解碼器也可被稱為用于通過在3GPP版本8和9中的EPS的IP多媒體核心網(wǎng)絡(luò)子系統(tǒng)(MS)的多媒體電話服務(wù),這是用于第三代3GPP無線系統(tǒng)的第四代的第一版本。MS是用于傳送互聯(lián)網(wǎng)協(xié)議(IP)多媒體服務(wù)的架構(gòu)框架。
[0006]雖然已經(jīng)考慮了潛在的傳輸干擾和蜂窩或無線網(wǎng)絡(luò)失敗而開發(fā)了 LTE,但是在3GPP蜂窩網(wǎng)絡(luò)中傳輸?shù)恼Z音幀將仍然遭遇擦除(在傳輸期間小百分比的幀和/或包丟失)。擦除是例如由解碼器進(jìn)行的分類,用于解碼器假設(shè)包的信息已丟失或無法使用。在EPS網(wǎng)絡(luò)的情況下,例如,幀擦除可仍被預(yù)測。為了解決擦除幀,解碼器通常會實現(xiàn)幀錯誤隱藏(FEC)算法,以減輕相應(yīng)的丟失幀的影響。
[0007]—些FEC方法僅使用解碼器來解決擦除幀(即,丟失幀)的隱藏。例如,解碼器注意到或被動注意到已發(fā)生幀擦除,并從剛在擦除幀之前或有時剛在擦除幀之后到達(dá)解碼器的已知好的幀估計擦除幀的內(nèi)容。
[0008]一些3GPP蜂窩網(wǎng)絡(luò)的特點在于能夠識別發(fā)生的幀擦除并向接收站通知發(fā)生的幀擦除。因此,語音解碼器知道接收到的語音幀將被認(rèn)為是好的幀還是將被認(rèn)為是擦除幀。由于語音和音頻的性質(zhì),如果實施適當(dāng)?shù)膸脸郎p輕或隱藏措施,則可容忍很小百分比的幀擦除。一些FEC算法可僅使用噪聲來代替丟失的包(例如,靜音,一些類型的淡出/淡入或一些類型的插值),以幫助使幀的丟失不太明顯。
[0009]可替代的FEC方法包括使編碼器以冗余方式發(fā)送特定信息。例如,通過參照包含在此的ITU電信標(biāo)準(zhǔn)化部門G.718 (ITU-T G.718)標(biāo)準(zhǔn)建議在增強(qiáng)層發(fā)送適合核心編碼器輸出的冗余信息。可在來自核心層中的不同的包中發(fā)送所述增強(qiáng)層。
【發(fā)明內(nèi)容】
[0010]技術(shù)方案
[0011]在一個或多個實施例中,提供一種終端,包括:編碼模式設(shè)置單元,用于從多個操作模式設(shè)置用于由編解碼器對輸入音頻數(shù)據(jù)進(jìn)行編碼操作模式;編解碼器被配置用于基于設(shè)置的操作模式對輸入音頻數(shù)據(jù)進(jìn)行編碼,使得當(dāng)設(shè)置的操作模式是高幀擦除率(FER)操作模式時,編解碼器根據(jù)一個或多個巾貞擦除隱藏(FEC)模式的一個FEC模式對輸入音頻數(shù)據(jù)的當(dāng)前幀進(jìn)行編碼,其中,在編碼模式設(shè)置單元將操作模式設(shè)置為高FER操作模式時,編碼模式設(shè)置單元從針對高FER操作模式預(yù)先確定的所述一個或多個FEC模式選擇所述一個FEC模式,根據(jù)選擇的所述一個FEC模式,基于輸入音頻數(shù)據(jù)的編碼內(nèi)的冗余的合并或與編碼的輸入音頻分離的分離冗余信息來控制編解碼器。
[0012]編碼模式設(shè)置單元可執(zhí)行針對輸入音頻數(shù)據(jù)的多個幀中的每一個從所述一個或多個FER模式選擇所述一個FEC模式。
[0013]高FER操作模式可以是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且所述編解碼器可以是EVS編解碼器,其中,當(dāng)EVS編解碼器對當(dāng)前幀的音頻進(jìn)行編碼時,EVS編解碼器將來自至少一個鄰近幀的編碼音頻添加到對當(dāng)前幀的當(dāng)前包中的當(dāng)前幀進(jìn)行編碼的結(jié)果,作為組合EVS編碼源比特,所述組合EVS編碼源比特被表示在當(dāng)前包中,并與當(dāng)前包的RTP有效載荷部分區(qū)別,其中,所述來自至少一個鄰近幀的編碼音頻包括一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻,其中,EVS編碼器可被配置為將來自所述至少一個鄰近幀中的每一個的音頻分別編碼為編碼音頻,并且將來自所述至少一個鄰近幀中的每一個的分別編碼的音頻包括在與當(dāng)前包分離的包中。[0014]所述一個或多個FEC模式中的至少一個可控制編解碼器根據(jù)有選擇的不同固定比特率和/或不同包大小來對當(dāng)前幀和鄰近幀進(jìn)行編碼,控制編解碼器根據(jù)相同固定比特率對當(dāng)前幀和鄰近幀進(jìn)行編碼,或控制編解碼器根據(jù)相同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼,其中,所述一個或多個FEC模式中的所述至少一個FEC模式中的每一個控制編解碼器將當(dāng)前幀劃分為子幀,基于根據(jù)比相同固定比特率更小的比特率編碼的子幀,來計算用于每個子幀的各個碼本比特的數(shù)量,并且使用所述相同固定比特率對子幀進(jìn)行編碼,其中,所述相同固定比特率具有用于限定子幀的比特的碼字的各個碼本比特的數(shù)量。
[0015]EVS編解碼器可被配置為基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來對當(dāng)前幀的比特提供不等冗余,并不同于將分類為第二子幀的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼結(jié)果添加到各自一個或多個鄰近包。
[0016]EVS編解碼器可被配置為基于將當(dāng)前幀的比特劃分為包括最少一個第一子幀和第二子幀的子幀,來對當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類為第二子幀的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加到鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各自一個或多個鄰近包。
[0017]編解碼器可還被配置為將高FER模式標(biāo)記添加到當(dāng)前幀的當(dāng)前包,以將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,其中,可由當(dāng)前包的RTP有效載荷部分中的單個比特在當(dāng)前包中表示高FER模式標(biāo)記。編解碼器可還被配置為將FEC模式標(biāo)記添加到當(dāng)前幀的當(dāng)前包,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式,其中,僅作為示例,可由預(yù)定數(shù)量的比特在當(dāng)前包中表示FEC模式標(biāo)記,其中,編解碼器使用不同幀的包中的冗余對當(dāng)前幀的FEC模式標(biāo)記進(jìn)行編碼。僅作為示例,在一個實施例中,比特的預(yù)定數(shù)量可以是2,雖然可選擇的實施例同樣可用。
[0018]高FER操作模式可以是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且編解碼器可以是EVS編解碼器,其中,EVS編解碼器可還被配置為對至少當(dāng)前包中的高FER模式標(biāo)記進(jìn)行解碼,來將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,并且在檢測到高FER模式標(biāo)記時,對來自至少當(dāng)前包的當(dāng)前巾貞的FEC模式標(biāo)記進(jìn)行解碼,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式,其中,輸入音頻數(shù)據(jù)的編碼可以是根據(jù)選擇的FEC模式對輸入音頻數(shù)據(jù)進(jìn)行的解碼,其中,當(dāng)EVS編解碼器可以對輸入音頻數(shù)據(jù)進(jìn)行解碼時,從當(dāng)前包解析來自至少一個鄰近幀的編碼的冗余音頻,所述編碼的冗余音頻包括對于當(dāng)前幀的一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻,并且基于當(dāng)前包中的分別解析的編碼冗余音頻對來自所述一個或多個先前幀和/或一個或多個將來幀的丟失幀進(jìn)行解碼。
[0019]這里,EVS編解碼器可被配置為基于輸入音頻數(shù)據(jù)內(nèi)的當(dāng)前幀的比特或參數(shù)的不等冗余對當(dāng)前幀進(jìn)行解碼,其中,不等冗余可基于先前將當(dāng)前幀的比特或參數(shù)分類為至少第一類和第二類,不同于將分類為第二類的當(dāng)前幀的參數(shù)或比特的編碼結(jié)果任意添加在鄰近包中作為各個冗余信息,將分類在第一類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果添加到各個一個或多個鄰近包作為各自冗余信息,其中,對當(dāng)前幀進(jìn)行編碼的步驟包括在當(dāng)前幀丟失時,基于來自所述一個或多個鄰近包的當(dāng)前幀的解碼音頻對當(dāng)前幀進(jìn)行解碼。
[0020]高FER操作模式可以是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且編解碼器可以是EVS編解碼器,其中,EVS編解碼器可還被配置為對至少當(dāng)前包中的高FER模式標(biāo)記進(jìn)行解碼,來將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,并且當(dāng)檢測到高FER模式標(biāo)記時,對來自當(dāng)前包的當(dāng)前巾貞的FEC模式標(biāo)記進(jìn)行解碼,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式,其中,輸入音頻數(shù)據(jù)的編碼可以是根據(jù)選擇的FEC模式對輸入音頻數(shù)據(jù)進(jìn)行的編碼,其中,EVS編解碼器可被配置為基于用于輸入音頻數(shù)據(jù)內(nèi)的當(dāng)前幀的比特或參數(shù)的不等冗余對當(dāng)前幀進(jìn)行解碼,其中,不等冗余可基于先前將當(dāng)前幀的比特或參數(shù)分類為至少第一類或第二類,并且不等同于將分類在第二類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果任意添加在鄰近包中,將分類在第一類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果添加到各自一個或多個鄰近包,其中,對當(dāng)前幀進(jìn)行編碼的步驟包括在當(dāng)前幀丟失時,基于來自所述一個或多個鄰近包的當(dāng)前幀的解碼音頻對當(dāng)前幀進(jìn)行解碼。
[0021]這里,EVS編解碼器可被配置為通過將當(dāng)前幀的比特分類為至少第一類和第二類來對當(dāng)前幀的比特或參數(shù)提供不等冗余,并且不同于將分類為第二類的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一類中的當(dāng)前幀的比特的編碼結(jié)果添加到各個第一或多個鄰近包。
[0022]EVS編解碼器可被配置為通過將當(dāng)前幀的比特或參數(shù)分類為至少第一類和第二類來對當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類為第二類的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類為第一類中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各自一個或多個鄰近包。
[0023]編解碼器可對當(dāng)前幀的音頻進(jìn)行編碼,編解碼器將來自至少一個鄰近幀的編碼音頻添加到當(dāng)前巾貞的當(dāng)前包的巾貞錯誤隱藏(FEC)部分,其中,當(dāng)前巾貞的當(dāng)前包的FEC部分與包括當(dāng)前幀的編碼結(jié)果的當(dāng)前包的編解碼器編碼的源比特部分區(qū)別,當(dāng)前包的編解碼器編碼的源比特部分和當(dāng)前包的FEC部分均被表示在與當(dāng)前包中,并與當(dāng)前包的任意RTP有效載荷部分區(qū)別,其中,編解碼器可被配置為將來自所述至少一個鄰近幀中的每一個的音頻分別編碼為編碼音頻,并將來自所述至少一個鄰近幀中的每一個的分別編碼的音頻包括與當(dāng)前包分別的包中,其中,所述來自至少一個鄰近幀的編碼音頻包括一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻。
[0024]編解碼器可被配置為通過將所述至少一個鄰近幀的比特的編碼的各個結(jié)果添加到當(dāng)前包作為單獨區(qū)分的FEC部分,來對所述至少一個鄰近幀的比特提供冗余。另外,所述分離的包可不連續(xù)。
[0025]編碼模式設(shè)置單元可基于終端可用的反饋信息的分析將操作模式設(shè)置為FER操作模式,其中,與非FER操作模式的多個模式的其余操作模式相比,所述FER操作模式具有不同的、增加的和/或可變的冗余,所述分析基于終端外部的一個或多個確定的傳輸質(zhì)量和/或確定輸入音頻數(shù)據(jù)中的當(dāng)前幀在傳輸時對幀擦除更敏感或具有比輸入音頻數(shù)據(jù)的其他幀更高的重要性。
[0026]反饋信息可包括以下項中至少一個:快反饋(FFB)信息,作為在物理層發(fā)送的混合自動重傳請求(HARQ)反饋;慢反饋(SFB)信息,作為在比物理層更高的層發(fā)送的來自網(wǎng)絡(luò)信令的反饋;帶內(nèi)反饋(ISB)信息,作為來自遠(yuǎn)端的編解碼器的帶內(nèi)信令;高敏感幀(HSF)信息,作為由編解碼器對于將以冗余方式發(fā)送特定關(guān)鍵幀的選擇。[0027]終端可接收FFB信息、HARQ反饋、SFB信息和ISB信息中的至少一個,并執(zhí)行對接收到的反饋信息的分析以確定終端外部的一個或多個的傳輸質(zhì)量。
[0028]終端可接收指示先前已基于包中接收到的標(biāo)記執(zhí)行了對FFB信息、HARQ反饋、SFB信息和ISB信息中的所述至少一個的分析的信息,其中,所述接收到的標(biāo)記指示當(dāng)前包中的當(dāng)前幀根據(jù)高FER模式被編碼或指示編解碼器應(yīng)該在高FER模式下來執(zhí)行當(dāng)前包的編碼。
[0029]編碼模式設(shè)置單元可基于從多個可用編碼類型確定的當(dāng)前幀和/或鄰近幀的編碼類型或從多個可用幀分類確定的當(dāng)前幀和/或鄰近幀的幀分類中的一個,將操作模式設(shè)置為所述一個或多個FEC模式中的至少一個FEC模式。
[0030]所述多個可用編碼類型可包括用于無聲語音幀的無聲寬帶類型、用于有聲語音幀的有聲寬帶類型、用于非固定語音幀的一般寬帶類型和用于增強(qiáng)幀擦除性能的過渡寬帶類型。所述多個可用幀分類可包括用于無聲、靜音、噪聲、語音偏移的無聲幀分類、用于從無聲分量過渡到有聲分量的無聲過渡分類、用于從有聲分量過渡到無聲分量的有聲過渡分類、用于有聲幀的有聲分類,并且先前幀也是有聲的或被分類為起始幀、以及用于足夠好地建立以使解碼器跟蹤語音隱藏的有聲起始的起始分類。
[0031]在一個或多個實施例中,提供一種編解碼器編碼方法,包括:從多個操作模式設(shè)置用于對輸入音頻數(shù)據(jù)進(jìn)行編碼的操作模式;基于設(shè)置的操作模式對輸入音頻數(shù)據(jù)進(jìn)行編碼,使得當(dāng)設(shè)置的操作模式是高幀擦除率(FER)操作模式時,編碼的步驟包括根據(jù)一個或多個幀擦除隱藏(FEC)模式的一個FEC模式對輸入音頻數(shù)據(jù)的當(dāng)前幀進(jìn)行編碼,其中,在將操作模式設(shè)置為高FER操作模式時,從針對高FER操作模式預(yù)先確定的所述一個或多個FEC模式選擇所述一個FEC模式,并根據(jù)選擇的一個FEC模式,基于輸入音頻數(shù)據(jù)的編碼內(nèi)的冗余的合并或與編碼輸入音頻分離的分離冗余信息對輸入音頻數(shù)據(jù)進(jìn)行編碼。
[0032]一個或多個實施例的附加方面和/或優(yōu)點將在下面的描述中被部分闡明,并且一部分從描述中是清楚的或通過公開的一個或多個實施例的實施可以被理解。一個或多個實施例可包括這樣的附加方面。
【專利附圖】
【附圖說明】
[0033]從下面結(jié)合附圖的實施例的描述中,這些和/或其他方面將變得清楚和更易于理解,其中:
[0034]圖1示出根據(jù)一個或多個實施例的包括增強(qiáng)語音服務(wù)(EVS)編解碼器的演進(jìn)分組系統(tǒng)(EPS) 20 ;
[0035]圖2a示出根據(jù)一個或多個實施例的編碼終端100、一個或多個網(wǎng)絡(luò)140和解碼終端 150 ;
[0036]圖2b示出根據(jù)一個或多個實施例的包括EVS編解碼器的終端200 ;
[0037]圖3示出根據(jù)一個或多個實施例的在替換包中提供的針對一個幀的冗余比特的示例;
[0038]圖4示出根據(jù)一個或多個實施例的在兩個替換包中提供的針對幀的冗余比特的示例;
[0039]圖5示出根據(jù)一個或多個實施例的在幀的包之前或之后的替換包中提供的針對所述幀的冗余比特的示例;
[0040]圖6示出根據(jù)一個或多個實施例的分別基于源比特的不同分類的替換包中的源 比特的不等冗余;
[0041]圖7示出根據(jù)一個或多個實施例的具有不等冗余的示例FEC操作模式;
[0042]圖8示出根據(jù)一個或多個實施例的用于具有相同傳輸塊大小的高FEC操作模式的 不同F(xiàn)EC操作模式;
[0043]圖9示出根據(jù)一個或多個實施例的基于A類比特的數(shù)量等于C類比特的數(shù)量的約 束而可用于不等冗余傳輸?shù)陌乃膫€子類型;
[0044]圖10示出根據(jù)一個或多個實施例的向起始幀提供增強(qiáng)保護(hù)的各種包的子類型;
[0045]圖11說明根據(jù)一個或多個實施例的在高FEC模式下使用不同F(xiàn)EC操作模式對音 頻數(shù)據(jù)進(jìn)行編碼的方法;
[0046]圖12示出根據(jù)一個或多個實施例的基于是否針對所有FEC操作模式保持相同比 特率或相同包大小的FEC框架;
[0047]圖13示出根據(jù)一個或多個實施例的三個示例FEC操作模式;
[0048]圖14示出根據(jù)一個或多個實施例的在高FEC模式下使用不同F(xiàn)EC操作模式對音 頻數(shù)據(jù)進(jìn)行解碼的方法。
【具體實施方式】
[0049]現(xiàn)在將詳細(xì)描述一個或多個實施例,在附圖中示出所述實施例,其中相同的標(biāo)號 指示相同的元件。就這一點而言,由于本文討論的實施例被理解之后,本領(lǐng)域的普通技術(shù) 人員將理解本文描述的系統(tǒng)、設(shè)備和/或方法的各種改變、修改和等同物包括在本發(fā)明中, 因此本發(fā)明的實施例可以以許多不同的形式實現(xiàn),并且不應(yīng)被解釋為限于這里闡述的實施 例。因此,下面通過參照附圖僅描述實施例,以解釋本發(fā)明的各個方面。
[0050]一個或多個實施例涉及語音和音頻編碼的【技術(shù)領(lǐng)域】,其中,編碼的語音或音頻的 幀可在它們的傳輸期間遭遇偶爾丟失。僅作為示例,可由于蜂窩無線鏈路的干擾的或IP網(wǎng) 絡(luò)中的路由器溢出而導(dǎo)致丟失。
[0051 ] 這里,雖然可針對未來在第四代的3GPP無線系統(tǒng)架構(gòu)內(nèi)采用的一個或多個EVS編 解碼器討論實施例,但是實施例不限于此。
[0052]3GPP在使用于未來的蜂窩或無線系統(tǒng)的新的語音和音頻編解碼器標(biāo)準(zhǔn)化的處理 中。所述編解碼器(被稱為增強(qiáng)語音服務(wù)(EVS)編解碼器)被設(shè)計用于有效地將語音和音 頻壓縮到用于被稱為增強(qiáng)分組業(yè)務(wù)(EPS)的3GPP第四代網(wǎng)絡(luò)的寬范圍的編碼比特率中。 EPS的一個關(guān)鍵特點是針對包括這些語音和音頻、包括通過EPS空中接口(被稱為長期演進(jìn) (LTE))的所有服務(wù)使用基于分組的傳輸。EVS編解碼器被設(shè)計用于在基于分組的環(huán)境下有 效地操作。
[0053]除了立體聲功能以外,EVS編解碼器將具有對從窄帶到寬帶的音頻帶寬進(jìn)行壓縮 的能力,并可被看作現(xiàn)有3GPP編解碼器的最終代替者。在3GPP中的新編解碼器的推動包 括語音和音頻編碼算法的提高、預(yù)計需要更高的音頻帶寬和立體聲的新的應(yīng)用以及語音和 音頻服務(wù)從電路交換到分組交換環(huán)境的變遷。
[0054]如先前基于3GPP網(wǎng)絡(luò)的情況,EVS編解碼器將操作的環(huán)境的關(guān)鍵方面是隨著語音/音頻幀從發(fā)送器傳輸?shù)浇邮掌?,所述語音/音頻幀丟失。這是在蜂窩網(wǎng)絡(luò)中的傳輸?shù)念A(yù)期 結(jié)果并在設(shè)計用于在這樣的環(huán)境下操作的語音和音頻編解碼器的設(shè)計期間被考慮。EVS編 解碼器也不是例外并也將包括最小化語音的幀的丟失或幀擦除的影響的算法。EPS以及傳 統(tǒng)的3GPP蜂窩網(wǎng)絡(luò)被設(shè)計來在正常條件期間為大多數(shù)用戶保持合理的幀擦除率。
[0055]在此預(yù)期EVS編解碼器(諸如,圖1的EVS編解碼器26)將發(fā)現(xiàn)不僅用于3GPP應(yīng) 用中,還用于包丟失條件可少于、類似于或差于3GPP網(wǎng)絡(luò)的超越3GPP的應(yīng)用。此外,即使 在EPS中,存在一些用戶,所述用戶在一些條件下將體驗高于一般率的幀擦除(即,高于EVS 的預(yù)期)。為了解決這些問題,提出用于EVS編解碼器的高幀擦除率(FER)模式,其中,額外 資源(額外比特率和延遲)在特殊情況下可用來提供額外幀丟失。
[0056]例如,高FER模式可解決在LTE的極端操作條件下的幀擦除率。高FER模式將權(quán) 衡額外資源(比特率、延時),以換取大約10%或更高的幀擦除率的更好的性能。
[0057]僅作為實例,一個或多個實施例關(guān)注于EVS編解碼器26的高FER模式的幀擦除隱 藏(FEC)框架。一個或多個實施例提出冗余方案,其中,基于特定參數(shù)的重要性,語音幀的 各種編碼參數(shù)使用變化的冗余被發(fā)送。另外,在編碼器產(chǎn)生但不是編碼語音的一部分的FEC 比特也可使用變化冗余被優(yōu)先化并發(fā)送。通過重復(fù)在多個包中的一些或全部的比特,并依 據(jù)以幀間或幀內(nèi)的不等方式執(zhí)行實施例,來實現(xiàn)冗余。
[0058]圖1示出語音媒體組件22內(nèi)的用于第四代3GPP的演進(jìn)分組系統(tǒng)(EPS) 20,其包 括增強(qiáng)型語音服務(wù)(EVS)編解碼器26和語音服務(wù)編解碼器24。EVS編解碼器26可通過示 例LTE空中接口來有效地操作。僅作為示例,這個有效的設(shè)計可將各種編解碼器的幀大小 和RTP有效載荷與已針對LTE定義的傳輸塊大小匹配。EVS編解碼器26可以是將在可發(fā) 生或?qū)l(fā)生幀丟失的環(huán)境(無線空中接口和VoIP網(wǎng)絡(luò))中操作的多碼率和多帶寬編解碼器。 因此,根據(jù)一個或多個實施例中,EVS編解碼器26包括用于減輕幀丟失的影響的幀擦除隱 藏(FEC)算法。
[0059]先前已通過與用于對語音和音頻進(jìn)行編碼或解碼的語音編解碼器獨立的解碼系 統(tǒng)實現(xiàn)了音頻編碼FEC方法。然而,如果有機(jī)會,可能更有效的方法是在EVS編解碼器26 的解碼器端的開發(fā)階段期間將FEC算法設(shè)計到EVS編解碼器26中。在編碼器端,編碼器還 通常獨立于實現(xiàn)為對音頻數(shù)據(jù)的語音進(jìn)行編碼的基礎(chǔ)編解碼器而僅提供數(shù)據(jù)中的冗余。因 此,雖然先前編解碼器已使用僅解碼器算法以減少由于幀丟失引起的劣化,在這里提出了 根據(jù)一個或多個實施例的盡管以系統(tǒng)帶寬和可能延遲為額外代價但將FEC算法合并在EVS 編解碼器26的至少編碼器端(例如,在EVS編解碼器26的編碼器端的開發(fā)階段期間)的可 能更有效的方法。一個或多個實施例可包括由編碼器應(yīng)用的FEC算法以及解碼器的適當(dāng) FEC算法,以隱藏錯誤或丟失幀,并還可用于與解碼器的附加幀錯誤隱藏算法或方法結(jié)合來 充分地重建錯誤比特或丟失包,例如,為了保持解碼音頻數(shù)據(jù)的合適時序和可能具有如錯 誤或丟失不易注意的音頻特點或用于相同的重建。因此,EVS編解碼器26可實現(xiàn)用于幀丟 失隱藏的兩個先前討論的方法,以及這里討論的FEC框架的多個方面。
[0060]因此,一個或多個實施例涉及至少基于編碼器的FEC算法,如此在第四代3GPP無 線系統(tǒng)中,具有包括可分別執(zhí)行編碼和解碼操作的編碼器和/或解碼器的一個或多個實施 例。
[0061]圖2a示出編碼終端100、一個或多個網(wǎng)絡(luò)140以及解碼終端150。在一個或多個實施例中,所述一個或多個網(wǎng)絡(luò)140還包括一個或多個中間終端,所述中間終端還可包括EVS 編解碼器26并根據(jù)需要來執(zhí)行編碼、解碼或變換。編碼終端100可包括編碼器端的編解碼 器120和用戶接口 130,解碼終端150可類似地包括解碼器端的編解碼器160和用戶接口 170。
[0062]圖2b示出根據(jù)一個或多個實施例的終端200以及所述一個或多個網(wǎng)絡(luò)140內(nèi)的 任意中間終端,所述終端200代表圖2a的編碼終端100和解碼終端150中的一個或兩者。 終端200包括連接到音頻輸入裝置(例如,諸如麥克風(fēng)260)的編碼單元205,連接到音頻輸 出設(shè)備(諸如,揚聲器270)的解碼單元250和可能的顯示器230和輸入/輸出接口 235以 及處理器(諸如,中央處理單元(CPU) 210)。CPU210可被連接到編碼單元205和解碼單元 250,并可控制編碼單元205和解碼單元250的操作以及終端200的其他組件與編碼單元 205和解碼單元250的交互。在實施例中,僅作為示例,終端200可以是移動裝置(諸如,移 動電話、智能電話、平板計算機(jī)或個人數(shù)字助理),并且僅作為示例,CPU210可在移動電話、 智能電話、平板計算機(jī)或個人數(shù)字助理中實現(xiàn)終端的其它功能和用于通常功能的能力。
[0063]作為示例,根據(jù)一個或多個實施例,編碼單元205基于FEC算法或框架數(shù)字地對輸 入音頻進(jìn)行編碼。存儲的碼本可基于應(yīng)用的FEC算法被選擇地使用,諸如存儲在編碼單元 205和解碼單元250的存儲器中的碼本。編碼的數(shù)字音頻可隨后在調(diào)制到載波信號上的包 中被發(fā)送,并由天線240發(fā)送。編碼的音頻數(shù)據(jù)可還被存儲在存儲器215中用于稍后播放, 其中,存儲器215可以是例如非易失性或易失性存儲器。編碼的數(shù)字音頻可隨后在調(diào)制到 載波信號的包中被發(fā)送,并由天線240發(fā)送。作為另一示例,解碼單元250可基于一個或多 個實施例的FEC算法對輸入音頻進(jìn)行解碼。由解碼單元250解碼的音頻可從天線240提 供,或作為先前存儲的編碼的音頻數(shù)據(jù)從存儲器215獲得。另外,在一個或多個實施例中, 存儲的碼本可被存儲在存儲單元205和解碼單元250的存儲器中或存儲器215中,并基于 應(yīng)用的FEC算法選擇地被使用。如指出的,取決于實施例,編碼單元205和解碼單元250均 包括諸如用于存儲適當(dāng)碼本和適當(dāng)編解碼器算法或FEC算法的存儲器。編碼單元205和解 碼單元250可以是單個單元,例如,一起代表包括的處理裝置(如用于對音頻數(shù)據(jù)進(jìn)行編碼 和/或解碼的編解碼器)的相同使用。在實施例中,處理裝置被配置用于執(zhí)行編碼和/或解 碼的編解碼器,其中,所述編解碼器對輸入音頻的不同部分或不同音頻流進(jìn)行并行處理。
[0064]終端200還提出從編碼單元205和/或解碼單元250的操作的多個可用模式中選 擇的編解碼器模式設(shè)置單元255。每個編解碼模式設(shè)置單元255考慮可存在一個用于編碼 單元205和解碼單元250兩者的編解碼器模式設(shè)置單元。EVS編解碼器可使用相同的操作 模式對語音和音樂兩者進(jìn)行編碼。另外,如果輸入音頻是非語音音頻,則編碼單元205或解 碼單元250可分別對例如音樂或更大保真度音頻進(jìn)行編碼和解碼。如果輸入音頻是語音音 頻,則編解碼器模式設(shè)置單元可確定編碼單元205或解碼單元250應(yīng)分別使用多個操作模 式中的哪一個來對音頻數(shù)據(jù)進(jìn)行編碼或解碼。如果編解碼器模式設(shè)置單元255檢測到高 FER操作模式被確定,則將由編解碼器模式設(shè)置單兀255選擇一個或多個FEC模式中的一 個來在高FEC操作模式中操作。雖然未實現(xiàn)可用于語音編碼的其他操作模式,但是由于對 高FER操作模式的操作模式的設(shè)置,F(xiàn)EC模式可合并在此討論的FEC框架內(nèi)的其他語音編 碼模式的使用。編解碼器模式設(shè)置單元255可還執(zhí)行對編碼的輸入包的解析,來解析出標(biāo) 識接收到的編碼音頻是否是語音、用于非語音音頻的操作模式、是否設(shè)置了高FER模式、用于FER模式的任何可能的一個或多個FEC操作模式等的信息。雖然可還由編碼單元205基于例如執(zhí)行的最終編碼來添加所述信息,但是編解碼器模式設(shè)置單元255可還將所述信息添加到編碼的輸出包的包中。
[0065]在一個或多個實施例中,EVS編解碼器26包括用于語音音頻的若干操作模式。例如,每個操作模式將具有相關(guān)的編碼比特率。根據(jù)特定模式的比特率,例如,一些能夠多次使用來傳輸音頻帶寬的選擇,或傳輸使用傳統(tǒng)AWR-WB編解碼器編碼的語音。在下面的表1 中示出這些用于語音音頻的操作模式的示例。
[0066]已使用用在傳輸各種大小的包中的固定數(shù)量的傳輸塊大小設(shè)計LTE空中接口。更少的傳輸塊大小被設(shè)計用于現(xiàn)有的3GPP編解碼器(例如,用于第三代3GPP無線系統(tǒng)),并可由EVS編解碼器26通過編解碼器將操作的比特率模式的明智選擇來重復(fù)使用。在實施例中,EVS編解碼器26將語音編碼為20ms幀,為了減少端到端延遲,每個包可傳輸一個幀,雖然實施例不限于此。
[0067]下面的表1示出在比特范圍的較低端的這些示例語音EVS編解碼器比特率和與比特率模式結(jié)合使用的相關(guān)傳輸塊大小。RTP有效載荷的示例大小基于AMR-WB編解碼器中的現(xiàn)有RTP有效載荷大小,注意實施例不限于所述RTP有效載荷大小,或不限于這樣的有效載荷被要求是RTP有效載荷的限制。
[0068]表1:
[0069]
【權(quán)利要求】
1.一種終端,包括: 編碼模式設(shè)置單元,用于從多個操作模式設(shè)置用于由編解碼器對輸入音頻數(shù)據(jù)進(jìn)行編碼的操作模式;編解碼器被配置用于基于設(shè)置的操作模式對輸入音頻數(shù)據(jù)進(jìn)行編碼,使得當(dāng)設(shè)置的操作模式是高幀擦除率(FER)操作模式時,編解碼器根據(jù)一個或多個幀擦除隱藏(FEC)模式的一個FEC模式對輸入音頻數(shù)據(jù)的當(dāng)前幀進(jìn)行編碼, 其中,在編碼模式設(shè)置單元將操作模式設(shè)置為高FER操作模式時,編碼模式設(shè)置單元從針對高FER操作模式預(yù)先確定的所述一個或多個FEC模式選擇所述一個FEC模式,根據(jù)選擇的所述一個FEC模式,基于輸入音頻數(shù)據(jù)的編碼內(nèi)的冗余的合并或與編碼的輸入音頻分離的分離冗余信息來控制編解碼器。
2.如權(quán)利要求1所述的終端,其中,編碼模式設(shè)置單元執(zhí)行針對輸入音頻數(shù)據(jù)的多個幀中的每一個從所述一個或多個FER模式選擇所述一個FEC模式。
3.如權(quán)利要求2所述的終端,其中,高FER操作模式是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且所述編解碼器是EVS編解碼器, 其中,當(dāng)EVS編解碼器對當(dāng)前幀的音頻進(jìn)行編碼時,EVS編解碼器將來自至少一個鄰近幀的編碼音頻添加到對當(dāng)前幀的當(dāng)前包中的當(dāng)前幀進(jìn)行編碼的結(jié)果,作為組合EVS編碼源比特,所述組合EVS編碼源比特被表示在當(dāng)前包中,并與當(dāng)前包的RTP有效載荷部分區(qū)別,其中,所述來自至少一個鄰近幀的編碼音頻包括一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻, 其中,EVS編碼器被配置為將來自所述至少一個鄰近幀中的每一個的音頻分別編碼為編碼音頻,并且將來自所述至少一個鄰近幀中的每一個的分別編碼的音頻包括在與當(dāng)前包分離的包中。
4.如權(quán)利要求3所述 的終端,其中,所述一個或多個FEC模式中的至少一個控制編解碼器根據(jù)有選擇的不同固定比特率和/或不同包大小來對當(dāng)前幀和鄰近幀進(jìn)行編碼。
5.如權(quán)利要求3所述的終端,其中,所述一個或多個FEC模式中的至少一個控制編解碼器根據(jù)相同固定比特率對當(dāng)前幀和鄰近幀進(jìn)行編碼。
6.如權(quán)利要求5所述的終端,其中,所述一個或多個FEC模式中的至少一個控制編解碼器根據(jù)相同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼, 其中,所述一個或多個FEC模式中的所述至少一個中的每一個控制編解碼器將當(dāng)前幀劃分為子幀,基于根據(jù)比相同固定比特率更小的比特率編碼的子幀,來計算用于每個子幀的各個碼本比特的數(shù)量,并且使用所述相同固定比特率對子幀進(jìn)行編碼,其中,所述相同固定比特率具有用于限定子幀的比特的碼字的各個碼本比特的數(shù)量。
7.如權(quán)利要求6所述的終端,其中,EVS編解碼器被配置為基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來對當(dāng)前幀的比特提供不等冗余,并不同于將分類為第二子幀的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼結(jié)果添加到各個一個或多個鄰近包。
8.如權(quán)利要求6所述的終端,其中,EVS編解碼器被配置為基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來對當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類為第二子幀的當(dāng)前幀 的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各個一個或多個鄰近包。
9.如權(quán)利要求3所述的終端,其中,當(dāng)前幀的當(dāng)前包不包括針對具有來自先前幀和/或?qū)韼娜哂嘈畔⒌膸e誤隱藏(FEC)比特的區(qū)別部分。
10.如權(quán)利要求3所述的終端,其中,編解碼器還被配置為將高FER模式標(biāo)記添加到當(dāng)前幀的當(dāng)前包,以將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式。
11.如權(quán)利要求10所述的終端,其中,由當(dāng)前包的RTP有效載荷部分中的單個比特在當(dāng)前包中表示高FER模式標(biāo)記。
12.如權(quán)利要求3所述的終端,其中,編解碼器還被配置為將FEC模式標(biāo)記添加到當(dāng)前幀的當(dāng)前包,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式。
13.如權(quán)利要求12所述的終端,其中,僅有兩個比特在當(dāng)前包中表示FEC模式標(biāo)記。
14.如權(quán)利要求13所述的終端,其中,編解碼器使用不同幀的包中的冗余對當(dāng)前幀的FEC模式標(biāo)記進(jìn)行編碼。
15.如權(quán)利要求2所述的終端,其中,高FER操作模式是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且編解碼器是EVS編解碼器, 其中,EVS編解碼器還被配置為對至少當(dāng)前包中的高FER模式標(biāo)記進(jìn)行解碼,來將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,并且當(dāng)檢測到高FER模式標(biāo)記時,對來自至少當(dāng)前包的當(dāng)前幀的FEC模式標(biāo)記進(jìn)行解碼,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式, 其中,輸入音頻數(shù)據(jù)的編碼是根據(jù)選擇的FEC模式對輸入音頻數(shù)據(jù)進(jìn)行的解碼, 其中,當(dāng)EVS編解碼器對輸入音頻數(shù)據(jù)進(jìn)行解碼時,從當(dāng)前包解析來自至少一個鄰近幀的編碼的冗余音頻,其中,所述編碼的冗余音頻包括對于當(dāng)前幀的一個或多個先前幀和/或一個或多個將來幀分別編碼的音頻,并且基于當(dāng)前包中的分別解析的編碼冗余音頻對來自所述一個或多個先前幀和/或一個或多個將來幀的丟失幀進(jìn)行解碼。
16.如權(quán)利要求15所述的終端,其中,EVS編解碼器被配置為基于輸入音頻數(shù)據(jù)內(nèi)的當(dāng)前幀的比特或參數(shù)的不等冗余對當(dāng)前幀進(jìn)行解碼,其中,不等冗余基于先前將當(dāng)前幀的比特或參數(shù)分類為至少第一類和第二類,并且不同于將分類為第二類的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果任意添加在鄰近包中作為各個冗余信息,將分類在第一類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果添加到各個一個或多個鄰近包作為各個冗余信息, 其中,對當(dāng)前幀進(jìn)行編碼的步驟包括在當(dāng)前幀丟失時,基于來自所述一個或多個鄰近包的當(dāng)前幀的解碼音頻對當(dāng)前幀進(jìn)行解碼。
17.如權(quán)利要求2所述的終端,其中,高FER操作模式是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且編解碼器是EVS編解碼器, 其中,EVS編解碼器還被配置為對至少當(dāng)前包中的高FER模式標(biāo)記進(jìn)行解碼,來將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,并且當(dāng)檢測到高FER模式標(biāo)記時,對來自至少當(dāng)前包的當(dāng)前幀的FEC模式標(biāo)記進(jìn)行解碼,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟是根據(jù)選擇的FEC模式對輸入音頻數(shù)據(jù)進(jìn)行的解碼, 其中,EVS編解碼器被配置為基于用于輸入音頻數(shù)據(jù)內(nèi)的當(dāng)前幀的比特或參數(shù)的不等冗余對當(dāng)前幀進(jìn)行解碼,其中,不等冗余基于先前將當(dāng)前幀的比特或參數(shù)分類為至少第一類或第二類,并且不等同于將分類在第二類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果任意添加在鄰近包中,將分類在第一類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果添加到各個一個或多個鄰近包, 其中,對當(dāng)前幀進(jìn)行編碼的步驟包括在當(dāng)前幀丟失時,基于來自所述一個或多個鄰近包的當(dāng)前幀的解碼音頻對當(dāng)前幀進(jìn)行解碼。
18.如權(quán)利要求3所述的終端,其中,EVS編解碼器被配置為通過將當(dāng)前幀的比特分類為至少第一類和第二類,來對當(dāng)前幀的比特提供不等冗余,并且不同于將分類為第二類的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一類中的當(dāng)前幀的比特的編碼結(jié)果添加到各個一個或多個鄰近包。
19.如權(quán)利要求3所述的終端,其中,EVS編解碼器被配置為通過將當(dāng)前幀的比特分類為至少第一類和第二類,來對當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類為第二類的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類為第一類中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各個一個或多個鄰近包。
20.如權(quán)利要求2所述的終端,其中,當(dāng)編解碼器對當(dāng)前幀的音頻進(jìn)行編碼時,編解碼器將來自至少一個鄰近幀的編碼音頻添加到當(dāng)前幀的當(dāng)前包的幀錯誤隱藏(FEC)部分,其中,當(dāng)前幀的當(dāng)前包的FEC部分與包括當(dāng)前幀的編碼結(jié)果的當(dāng)前包的編解碼器編碼的源比特部分區(qū)別,當(dāng)前包的編解碼器編碼的源比特部分和當(dāng)前包的FEC部分均被表示在當(dāng)前包中,并與當(dāng)前包的任意RTP有效載荷部分區(qū)別,其中,編解碼器被配置為將來自所述至少一個鄰近幀中的每一個的音頻分別編碼為編碼音頻,并將來自所述至少一個鄰近幀中的每一個的分別編碼的音頻包括在與當(dāng)前包的分離的包中,其中,所述來自至少一個鄰近幀的編碼音頻包括一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻。
21.如權(quán)利要求20所述 的終端,其中,編解碼器是3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器。
22.如權(quán)利要求20所述的終端,其中,編解碼器被配置為通過將所述至少一個鄰近幀的比特的編碼的各個結(jié)果添加到當(dāng)前包作為單獨區(qū)分的FEC部分,來對所述至少一個鄰近中貞的比特提供冗余。
23.如權(quán)利要求22所述的終端,其中,所述分離的包不連續(xù)。
24.如權(quán)利要求20所述的終端,其中,所述一個或多個FEC模式中的至少一個控制編解碼器根據(jù)有選擇的不同固定比特率和/或不同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼。
25.如權(quán)利要求20所述的終端,其中,所述一個或多個FEC模式中的至少一個控制編解碼器根據(jù)相同固定比特率對當(dāng)前幀和鄰近幀進(jìn)行編碼。
26.如權(quán)利要求25所述的終端,其中,所述一個或多個FEC模式中的所述至少一個控制編解碼器根據(jù)相同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼,其中,所述一個或多個FEC模式中的所述至少一個中的每一個控制編解碼器將當(dāng)前幀劃分為子幀,基于根據(jù)比相同固定比特率更小的比特率編碼的子幀來計算用于每個子幀的各個碼本比特的數(shù)量,并使用所述相同固定比特率對子幀進(jìn)行編碼,其中,所述相同固定比特率具有用于限定子幀的比特的碼字的各個碼本比特的數(shù)量。
27.如權(quán)利要求26所述的終端,其中,EVS編解碼器被配置為基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀來對當(dāng)前幀的比特提供不等冗余,并且不同于將分類在第二子幀的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼結(jié)果添加在各個一個或多個鄰近包。
28.如權(quán)利要求26所述的終端,其中,EVS編解碼器被配置為基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀來對當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類為第二子幀的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各個一個或多個鄰近包。
29.如權(quán)利要求1所述的終端,其中,編碼模式設(shè)置單元基于終端可用的反饋信息的分析將操作模式設(shè)置為高FER操作模式,其中,與一般操作模式的多個模式的其余操作模式,高FER操作模式具有不同的、增加的和/或可變的冗余,所述分析基于終端外部的一個或多個確定的傳輸質(zhì)量和/或確定輸入音頻數(shù)據(jù)中的當(dāng)前幀在傳輸時對幀擦除更敏感或具有比輸入音頻數(shù)據(jù)的其他幀更高的重要性。
30.如權(quán)利要求29所述的終端,其中,反饋信息包括以下項中的至少一個:快反饋(FFB)信息,作為在物理層發(fā)送的混合自動重傳請求(HARQ)反饋;慢反饋(SFB)信息,作為在比物理層更高的層發(fā)送的來自網(wǎng)絡(luò)信令的反饋;帶內(nèi)反饋(ISB)信息,作為來自遠(yuǎn)端的編解碼器的帶內(nèi)信令;高敏感幀(HSF)信息,作為由編解碼器對于將以冗余方式發(fā)送特定關(guān)鍵幀的選擇。
31.如權(quán)利要求30所述的終端,其中,終端接收FFB信息、HARQ反饋、SFB信息和ISB信息中的至少一個,并執(zhí)行對接收到的反饋信息的分析以確定終端外部的一個或多個傳輸質(zhì)量。
32.如權(quán)利要求30所述的終端,其中,終端接收指示先前已基于包中接收到的標(biāo)記執(zhí)行了對FFB信息、HARQ反饋、SFB信息和ISB信息中的所述至少一個的分析的信息,其中,所述接收到的標(biāo)記指示當(dāng)前包中的當(dāng)前幀根據(jù)高FER模式被編碼或指示編解碼器應(yīng)該在高FER模式下來執(zhí)行當(dāng)前包的編碼。
33.如權(quán)利要求1所述的終端,其中,編碼模式設(shè)置單元基于從多個可用編碼類型確定的當(dāng)前幀和/或鄰近幀的編碼類型或從多個可用幀分類確定的當(dāng)前幀和/或鄰近幀的幀分類中的一個,將操作模式設(shè)置為所述一個或多個FEC模式中的所述一個FEC模式。
34.如權(quán)利要求33所述的終端,其中,所述多個可用編碼類型包括用于無聲語音幀的無聲寬帶類型、用于有聲語音幀的有聲寬帶類型、用于非固定語音幀的一般寬帶類型和用于增強(qiáng)幀擦除性能的過渡寬帶類型。
35.如權(quán)利要求33所述的終端,其中,所述多個可用幀分類包括用于無聲、靜音、噪聲、語音偏移的無聲幀分類、用于從無聲分量過渡到有聲分量的無聲過渡分類、用于從有聲分量過渡到無聲分量的有聲過渡分類、用于有聲幀的有聲分類,并且先前幀也是有聲的或被分類為起始幀、以及用于足夠好地建立以使解碼器跟蹤語音隱藏的有聲起始的起始分類。
36.一種編解碼器編碼方法,包括: 從多個操作模式設(shè)置用于對輸入音頻數(shù)據(jù)進(jìn)行編碼的操作模式; 基于設(shè)置的操作模式對輸入音頻數(shù)據(jù)進(jìn)行編碼,使得當(dāng)設(shè)置的操作模式是高幀擦除率(FER)操作模式時,編碼的步驟包括根據(jù)一個或多個幀擦除隱藏(FEC)模式中的一個FEC模式對輸入音頻數(shù)據(jù)的當(dāng)前幀進(jìn)行編碼, 其中,在將操作模式設(shè)置為高FER操作模式時,從針對高FER操作模式預(yù)先確定的所述一個或多個FEC模式選擇所述一個FEC模式,并根據(jù)選擇的所述一個FEC模式,基于輸入音頻數(shù)據(jù)的編碼內(nèi)的冗余的合并或與編碼輸入音頻分離的分離冗余信息對輸入音頻數(shù)據(jù)進(jìn)行編碼。
37.如權(quán)利要求36所述的方法,其中,設(shè)置操作模式的步驟是針對輸入音頻數(shù)據(jù)的多個幀中的每一個從所述一個或多個FEC模式選擇所述一個FEC模式。
38.如權(quán)利要求37所述的方法,其中,高FER操作模式是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且由EVS編解碼器執(zhí)行輸入音頻數(shù)據(jù)的編碼, 所述方法還包括將來自至少一個鄰近幀的編碼音頻添加到對當(dāng)前幀的當(dāng)前包中的當(dāng)前幀進(jìn)行編碼的結(jié)果,作為組合EVS編碼源比特,其中,組合編碼EVS編碼源比特被表示在當(dāng)前包中,并與當(dāng)前包的任意RTP有效載荷部分區(qū)別,其中,所述至少一個鄰近幀的編碼音頻包括一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻; 將來自所述至少一個鄰近幀中的每一個的音頻分別編碼為編碼音頻,并將來自所述至少一個鄰近幀中的每一個的分別編碼的音頻包括在與當(dāng)前包分離的包中。
39.如權(quán)利要求38所述的方法,其中,對輸入音頻進(jìn)行編碼的步驟包括:基于所述一個或多個FEC模式中的至少一個,根據(jù)有選擇的不同固定比特率和/或不同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼。
40.如權(quán)利要求38所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于所述一個或多個FEC模式中的至少一個,根據(jù)相同固定比特率對當(dāng)前幀和鄰近幀進(jìn)行編碼。
41.如權(quán)利要求38所述的 方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于所述一個或多個FEC模式中的至少一個,根據(jù)相同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:針對所述一個或多個FEC模式中的所述至少一個中的任意一個,將當(dāng)前幀劃分為子幀,基于根據(jù)比相同固定比特率更小的比特率編碼的子幀,來計算用于每個子幀的各個碼本比特的數(shù)量,并使用所述相同固定比特率對子幀進(jìn)行編碼,其中,所述相同固定比特率具有用于限定子幀的比特的碼字的各個碼本比特的數(shù)量。
42.如權(quán)利要求41所述的方法,還包括基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來向當(dāng)前幀的比特提供不等冗余,不同于將分類在第二子幀中的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼結(jié)果添加到各個一個或多個鄰近包。
43.如權(quán)利要求41所述的方法,還包括基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來向當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類在第二子幀中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類在第一子幀的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各個一個或多個鄰近包。
44.如權(quán)利要求38所述的方法,其中,當(dāng)前幀的當(dāng)前包不包括針對具有來自先前幀和/或?qū)韼娜哂嘈畔⒌膸e誤隱藏(FEC)比特的區(qū)別部分。
45.如權(quán)利要求38所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括將高FER模式標(biāo)記添加到當(dāng)前幀的當(dāng)前包,以將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式。
46.如權(quán)利要求45所述的方法,其中,由當(dāng)前包的RTP有效載荷部分中的單個比特在當(dāng)前包中表示高FER模式標(biāo)記。
47.如權(quán)利要求38所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:將FEC模式標(biāo)記添加到當(dāng)前幀的當(dāng)前包,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式。
48.如權(quán)利要求47所述的方法,其中,僅由兩個比特在當(dāng)前包中表示FEC模式標(biāo)記。
49.如權(quán)利要求48所述的方法,還包括使用不同幀的包中的冗余對當(dāng)前幀的FEC模式標(biāo)記進(jìn)行編碼。
50.如權(quán)利要求37所述的方法,其中,高FER操作模式是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且由EVS編解碼器執(zhí)行輸入音頻數(shù)據(jù)的編碼, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:對至少當(dāng)前包中的高FER模式標(biāo)記進(jìn)行解碼,來將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,并且在檢測到高FER模式標(biāo)記時,對來自至少當(dāng)前包的當(dāng)前幀的FEC模式標(biāo)記進(jìn)行解碼,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式, 其中,所述編碼是根據(jù)選擇的FEC模式對輸入音頻數(shù)據(jù)進(jìn)行的解碼, 還包括,當(dāng)對輸入音頻數(shù)據(jù)進(jìn)行解碼時,從當(dāng)前包解析來自至少一個鄰近幀的編碼的冗余音頻,其中,所述編碼的冗余音頻包括對于當(dāng)前幀的一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻,并且基于當(dāng)前包中的分別解析的編碼冗余音頻對來自所述一個或多個先前幀和/或一個或多個將來幀的丟失幀進(jìn)行解碼。
51.如權(quán)利要求50所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于用于輸入音頻數(shù)據(jù)內(nèi)的當(dāng)前幀的比特或參數(shù)的不等冗余對當(dāng)前幀進(jìn)行解碼,其中,不等冗余基于先前將當(dāng)前幀的比特或參數(shù)分類為至少第一類和第二類,并且不同于將分類為第二類的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果任意添加在鄰近包中作為各個冗余信息,將分類在第一類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果添加到各個第一或多個鄰近包作為各個冗余信息, 其中,對當(dāng)前幀進(jìn)行編碼的步驟包括在當(dāng)前幀丟失時,基于來自所述一個或多個鄰近包的當(dāng)前幀的解碼音頻對當(dāng)前幀進(jìn)行解碼。
52.如權(quán)利要求37所述的方法,其中,高FER操作模式是用于3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器的操作模式,并且對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括使用EVS編解碼器對輸入音頻數(shù)據(jù)進(jìn)行編碼, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括對至少當(dāng)前包中的高FER模式標(biāo)記進(jìn)行解碼,來將設(shè)置的當(dāng)前幀的操作模式標(biāo)識為高FER操作模式,并且當(dāng)檢測到高FER模式標(biāo)記時,對來自至少當(dāng)前包的當(dāng)前幀的FEC模式標(biāo)記進(jìn)行解碼,以標(biāo)識針對當(dāng)前幀選擇了所述一個或多個FEC模式中的哪一個FEC模式, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟是根據(jù)選擇的FEC模式對輸入音頻數(shù)據(jù)進(jìn)行的解碼, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟還包括基于用于輸入音頻數(shù)據(jù)內(nèi)的當(dāng)前幀的比特或參數(shù)的不等冗余對當(dāng)前幀進(jìn)行解碼,其中,不等冗余基于將當(dāng)前幀的比特或參數(shù)先前分類為至少第一類或第二類,并且不等同于將分類在第二類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果任意添加在鄰近包中,將分類在第一類中的當(dāng)前幀的比特或參數(shù)的編碼結(jié)果添加到各個一個或多個鄰近包, 其中,編碼的步驟還包括在當(dāng)前幀丟失時,基于來自所述一個或多個鄰近包的當(dāng)前幀的解碼音頻對當(dāng)前幀進(jìn)行解碼。
53.如權(quán)利要求38所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:通過將當(dāng)前幀的比特分類為至少第一類和第二類,來向當(dāng)前幀的比特提供不等冗余,并且不同于將分類為第二類的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一類中的當(dāng)前幀的比特的編碼結(jié)果添加到各個第一或多個鄰近包。
54.如權(quán)利要求38所述的方法,其中,編碼的步驟包括:通過將當(dāng)前幀的比特分類為至少第一類和第二類,來向當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類為第二類的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類為第一類中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各個一個或多個鄰近包。
55.如權(quán)利要求37所述的方法,其中,當(dāng)對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟是對當(dāng)前幀的音頻進(jìn)行編碼時,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟還包括將來自至少一個鄰近幀的編碼音頻添加到當(dāng)前幀的當(dāng)前包的幀錯誤隱藏(FEC)部分,其中,當(dāng)前幀的當(dāng)前包的FEC部分與包括當(dāng)前幀的編碼結(jié)果的當(dāng)前包的編解碼器編碼的源比特部分區(qū)別,當(dāng)前包的編解碼器編碼的源比特部分和當(dāng)前包的FEC部分均被表示在當(dāng)前包中,并與當(dāng)前包的任意RTP有效載荷部分區(qū)別,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括將來自所述至少一個鄰近幀中的每一個的音頻分別編碼為編碼音頻,并將來自所述至少一個鄰近幀中的每一個的分別編碼的音頻包括與當(dāng)前包分離的包中,其中,所述來自至少一個鄰近幀的編碼音頻包括一個或多個先前幀和/或一個或多個將來幀的分別編碼的音頻。
56.如權(quán)利要求55所述的方法,其中,編解碼器是3GPP標(biāo)準(zhǔn)的增強(qiáng)語音服務(wù)(EVS)編解碼器。
57.如權(quán)利要求55所 述的方法,其中,對輸入音頻數(shù)據(jù)的編碼包括通過將所述至少一個鄰近幀的比特的編碼的各個結(jié)果添加到當(dāng)前包作為單獨區(qū)分的FEC部分,來對所述至少一個鄰近幀的比特提供冗余。
58.如權(quán)利要求57所述的方法,其中,所述分離的包不連續(xù)。
59.如權(quán)利要求55所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括,基于所述一個或多個FEC模式中的至少一個,根據(jù)有選擇的不同固定比特率和/或不同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼。
60.如權(quán)利要求55所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于所述一個或多個FEC模式中的至少一個,根據(jù)相同固定比特率對當(dāng)前幀和鄰近幀進(jìn)行編碼。
61.如權(quán)利要求60所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于所述一個或多個FEC模式中的所述至少一個,根據(jù)相同包大小對當(dāng)前幀和鄰近幀進(jìn)行編碼, 其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:針對所述一個或多個FEC模式中的所述至少一個中的每一個,將當(dāng)前幀劃分為子幀,基于根據(jù)比相同固定比特率更小的比特率編碼的子幀,來計算用于每個子幀的各個碼本比特的數(shù)量,并使用所述相同固定比特率對子幀進(jìn)行編碼,其中,其中,所述相同固定比特率具有用于限定子幀的比特的碼字的各個碼本比特的數(shù)量。
62.如權(quán)利要求61所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來對當(dāng)前幀的比特提供不等冗余,并且不同于將分類在第二子幀中的當(dāng)前幀的比特的編碼結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼結(jié)果添加在各個一個或多個鄰近包。
63.如權(quán)利要求61所述的方法,其中,對輸入音頻數(shù)據(jù)進(jìn)行編碼的步驟包括:基于將當(dāng)前幀的比特劃分為包括至少第一子幀和第二子幀的子幀,來對當(dāng)前幀的線性預(yù)測參數(shù)提供不等冗余,并且不同于將分類在第二子幀的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果任意添加在鄰近包中,將分類在第一子幀中的當(dāng)前幀的比特的編碼的線性預(yù)測參數(shù)結(jié)果添加到各個一個或多個鄰近包。
64.如權(quán)利要求36所述的方法,其中,設(shè)置操作模式的步驟包括:基于終端可用的反饋信息的分析將操作模式設(shè)置為FER操作模式,其中,與非FER操作模式的多個模式的其余操作模式相比,所述FER操作模式具有不同的、增加的和/或可變的冗余,所述分析基于終端外部的一個或多個確定的傳輸質(zhì)量,并基于確定輸入音頻數(shù)據(jù)中的當(dāng)前幀在傳輸時對幀擦除更敏感或具有比輸入音頻數(shù)據(jù)的其他幀更高的重要性,來選擇所述一個FEC模式。
65.如權(quán)利要求64所述的方法,其中,反饋信息包括以下項中的至少一個:快反饋(FFB)信息,作為在物理層發(fā)送的混合自動重傳請求(HARQ)反饋;慢反饋(SFB)信息,作為在比物理層更高的層發(fā)送的來自網(wǎng)絡(luò)信令的反饋;帶內(nèi)反饋(ISB)信息,作為來自遠(yuǎn)端的編解碼器的帶內(nèi)信令;高敏感幀(HSF)信息,作為對于將以冗余方式發(fā)送的特定關(guān)鍵幀的選擇。
66.如權(quán)利要求65所述的方法,還包括:接收FFB信息、HARQ反饋、SFB信息和ISB信息中的至少一個,并執(zhí)行對接收到的反饋信息的分析以確定終端外部的一個或多個傳輸質(zhì)量。
67.如權(quán)利要求65所述的終端,還包括:接收指示先前已基于包中接收到的標(biāo)記執(zhí)行了對FFB信息、HARQ反饋、 SFB信息和ISB信息中的所述至少一個的分析的信息,其中,所述接收到的標(biāo)記指示當(dāng)前包中的當(dāng)前幀根據(jù)高FER模式被編碼或指示應(yīng)該在高FER模式下來執(zhí)行當(dāng)前包的編碼。
68.如權(quán)利要求36所述的方法,其中,設(shè)置操作模式的步驟包括:基于從多個可用編碼類型確定的當(dāng)前幀和/或鄰近幀的編碼類型或從多個可用幀分類確定的當(dāng)前幀和/或鄰近幀的幀分類中的一個,將操作模式設(shè)置為所述一個或多個FEC模式中的一個。
69.如權(quán)利要求68所述的方法,其中,所述多個可用編碼類型包括用于無聲語音幀的無聲寬帶類型、用于有聲語音幀的有聲寬帶類型、用于非固定語音幀的一般寬帶類型和用于增強(qiáng)幀擦除性能的過渡寬帶類型。
70.如權(quán)利要求68所述的方法,其中,所述多個可用幀分類包括用于無聲、靜音、噪聲、語音偏移的無聲幀分類、用于從無聲分量過渡到有聲分量的無聲過渡分類、用于從有聲分量過渡到無聲分量的有聲過渡分類、用于有聲幀的有聲分類,并且先前幀也是有聲的或被分類為起始幀、以及用于足夠好地建立以使解碼器跟蹤語音隱藏的有聲起始的起始分類。
71.包括計算機(jī)可讀代碼的至少一種非暫時計算機(jī)可讀介質(zhì),其中,當(dāng)由至少一個處理裝置執(zhí)行所述計算機(jī)可讀代碼時,所述計算機(jī)可讀代碼使得所述至少一個處理裝置實現(xiàn)如權(quán)利要求36所述的方法。
【文檔編號】G10L19/00GK103597544SQ201280028806
【公開日】2014年2月19日 申請日期:2012年4月11日 優(yōu)先權(quán)日:2011年4月11日
【發(fā)明者】成昊相, 史蒂芬·克雷格·格里爾 申請人:三星電子株式會社