在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法

文檔序號：2837154閱讀：755來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語音編解碼技術(shù)，更具體地涉及通用移動電信系統(tǒng)(UMTS)中統(tǒng)一實(shí)現(xiàn)多種語音編解碼的方法。
為了達(dá)到上述目的，通常的做法就是在語音編解碼器中分別實(shí)現(xiàn)所有7種語音編解碼算法。然而，由于語音編解碼算法非常復(fù)雜，這種實(shí)現(xiàn)方法的代價十分昂貴(自行開發(fā)或采購)。而且通常用于實(shí)現(xiàn)語音編解碼的高速半導(dǎo)體器件(如DSP)的存儲器空間十分有限，特別是UE，受成本、功耗、體積等因素限制，其存儲空間更是緊張。為了實(shí)現(xiàn)7種語音編解碼算法所需要的程序空間和數(shù)據(jù)空間都是相當(dāng)可觀并且難以承受的。
本發(fā)明的方法是通過如下的技術(shù)方案實(shí)現(xiàn)的，在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法，該方法包括如下步驟編碼時首先根據(jù)設(shè)置的命令判斷當(dāng)前的編碼類型；根據(jù)編碼類型選擇速率模式；然后調(diào)用統(tǒng)一的AMR語音編碼模塊，執(zhí)行編碼操作；其中，如果經(jīng)過靜音檢測確定是靜音，則根據(jù)相應(yīng)的編碼類型調(diào)用各自的舒適噪音編碼(SID)和斷續(xù)傳輸(DTX)模塊；如果是非靜音，則根據(jù)確定的速率輸出語音編碼比特；解碼是編碼的逆過程，首先從接收到的幀中判斷其壞幀指示(BFI)標(biāo)志，檢查是否有錯幀，根據(jù)壞幀指示(BFI)標(biāo)志判斷是否需要作錯幀補(bǔ)償；如果判斷是錯幀，則進(jìn)行錯幀補(bǔ)償和弱音處理；如果判斷是正常的，則根據(jù)舒適噪音編碼(SID)標(biāo)志判斷是否是靜音，如果是靜音，則根據(jù)相應(yīng)的編解碼類型調(diào)用各自的斷續(xù)傳輸和舒適噪音解碼模塊；如果是非靜音，則根據(jù)相應(yīng)的編解碼類型設(shè)置速率，進(jìn)行AMR解碼操作，最后統(tǒng)一輸出13bit線性PCM數(shù)據(jù)。
所述的確定的速率和根據(jù)相應(yīng)的編解碼類型設(shè)置速率均為GSMEFR選擇AMR_12.20，TDMA_EFR選擇AMR_7.40，PDC_EFR選擇AMR_6.70，而HR AMR、FR AMR、UMTS AMR和UMTS AMR 2則根據(jù)各自的速率控制命令確定速率。
本發(fā)明基于AMR語音編解碼統(tǒng)一實(shí)現(xiàn)了UMTS系統(tǒng)窄帶語音業(yè)務(wù)規(guī)定的所有7種語音編解碼算法，顯著降低了UMTS語音編解碼器的實(shí)現(xiàn)成本，解決了存儲空間的問題，明顯提高了系統(tǒng)實(shí)現(xiàn)效率。

圖1是本發(fā)明方法使用的編碼流程示意圖；圖2是本發(fā)明方法使用的解碼流程示意圖；圖3是傳統(tǒng)實(shí)現(xiàn)方法的代碼量統(tǒng)計表格圖；圖4是本發(fā)明實(shí)現(xiàn)方法的代碼量統(tǒng)計表格圖；圖5是不同方法的存儲空間比較表格圖。
AMR算法是多速率的語音編解碼算法，一共有8種模式(AMR_12.20，AMR_10.20，AMR_7.95，AMR_7.40，AMR_6.70，AMR_5.90，AMR_5.15，AMR_4.75)，分別對應(yīng)8種速率(12.20 kbit/s(GSM EFR)，0.20 kbit/s，7.95 kbit/s，7.40 kbit/s(TDMA-EFR)，6.70 kbit/s(PDC-EFR)，5.90 kbit/s，5.15 kbit/s，4.75 kbit/s)。
另外，AMR還支持靜音檢測(VAD)和斷續(xù)傳輸功能(DTX)，在靜音期間只定期傳輸舒適噪音(由SID幀承載)，其他時間不傳輸任何數(shù)據(jù)。因此，除了上述8種速率模式之外，還有AMR_SID(1.80 kbit/s)和AMR_NODATA(0 kbit/s)兩種模式。
GSM EFR、TDMA EFR和PDC EFR都是固定速率的語音編解碼算法，其速率分別是12.20 kbit/s，7.40 kbit/s，6.70 kbit/s。由于AMR、GSMEFR、TDMA EFR和PDC EFR的算法原理都是采用“算術(shù)碼本激勵”(ACELP)的方法，而且在設(shè)計AMR解碼算法時，考慮了兼容需求，因此AMR_12.20模式與GSM EFR是兼容的；AMR_7.40模式與TDMA EFR是兼容的；AMR_6.70模式與PDC EFR是兼容的。但是他們在靜音檢測和斷續(xù)傳輸模式下的靜音幀(SID幀)卻是不兼容的AMR_SID幀的大小是35bit并且每160ms更新一次，而GSM EFR的靜音幀是244bit并且每480ms更新一次，TDMAEFR的靜音幀是38bit并且可以連續(xù)更新1。另外，不同語音編解碼的DTX控制也是不同的，例如TDMA-EFR和PDC-EFR在原有系統(tǒng)中只支持上行的斷續(xù)傳輸(DTX)，不支持下行的DTX；而且AMR與其他編解碼的DTX平滑機(jī)制也有所不同。由于斷續(xù)傳輸模式可以有效增大無線信道容量、節(jié)省UE功率、節(jié)約傳輸資源，因此是UMTS設(shè)備缺省的配置項(xiàng)。在編解碼協(xié)商時，除了指定的編解碼速率，缺省設(shè)置了SID模式和NO DATA模式。因此上述SID幀的不兼容實(shí)際上導(dǎo)致了AMR與GSM EFR、TDMA EFR和PDC EFR無法統(tǒng)一實(shí)現(xiàn)。
本發(fā)明的方法，在AMR語音編解碼的核心算法的基礎(chǔ)上，集成GSMEFR、TDMA EFR和PDC EFR協(xié)議的斷續(xù)傳輸(DTX)和舒適噪音產(chǎn)生功能，通過編解碼類型和模式的控制，統(tǒng)一實(shí)現(xiàn)7種語音編解碼，具體的編解碼流程描述如下圖1是本發(fā)明方法使用的編碼流程示意圖。如圖1所示，13bit線性PCM數(shù)據(jù)流在步驟S101根據(jù)設(shè)置的命令判斷當(dāng)前的編碼類型，在后續(xù)的步驟中，根據(jù)步驟S101選擇的編碼類型設(shè)定速率如果選擇GSM-EFR編解碼，則在步驟S102-1設(shè)定為AMR_12.20kbps的速率；如果選擇TDMA-EFR，則在步驟S102-2設(shè)定為AMR_7.40kbps的速率；如果選擇PDC-EFR，則在步驟S102-3設(shè)定為AMR_6.70的速率；如果選擇HR AMR、FR AMR、UMTS AMR、UMTS AMR 2，則在步驟S102-4至步驟S102-7根據(jù)速率控制命令設(shè)置指定的速率。在步驟S103根據(jù)步驟S102設(shè)定的速率，執(zhí)行AMR語音編碼功能，接著在步驟S104判斷在步驟S103的編碼過程中，根據(jù)計算參數(shù)判斷應(yīng)該輸出非靜音幀還是靜音幀，如果判斷是非靜音，則在步驟S105輸出語音壓縮碼流；如果判斷是靜音，則在步驟S106判斷當(dāng)前編碼類型如果判斷是GSM-EFR，則在步驟S107-1執(zhí)行GSM-EFR的算法計算靜音幀的參數(shù)，并在步驟S108-1按照GSM-EFR的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù)；如果是TDMA-EFR，則在步驟S107-2執(zhí)行TDMA-EFR的算法計算靜音幀的參數(shù)，在步驟S108-2按照TDMA-EFR的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù)；如果是PDC-EFR，則在步驟S107-3執(zhí)行PDC-EFR的算法計算靜音幀的參數(shù)，在步驟108-3按照PDC-EFR的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù)；如果是HR AMR、FR AMR、UMTS AMR、UMTS AMR 2，則在步驟S107-4統(tǒng)一執(zhí)行UMTS AMR 2的算法計算靜音幀的參數(shù)，在步驟108-4按照UMTS AMR 2的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù)。
解碼是編碼的逆過程，只增加一個錯幀補(bǔ)償和弱音處理。圖2是本發(fā)明方法使用的解碼流程示意圖。如圖1所示，在步驟S201從接收到的幀中判斷其壞幀指示(Bad Frame Indication-簡稱BFI)標(biāo)志，檢查是否是錯幀；如果步驟S201判斷是正常的，則程序進(jìn)入步驟S203，如果步驟S201判斷是錯幀，在步驟S202則進(jìn)行錯幀補(bǔ)償和弱音處理，在步驟S203從接收到的幀中判斷其SID標(biāo)志；如果在步驟S203判斷是靜音，則在步驟S204判斷當(dāng)前的編解碼類型；根據(jù)步驟S204判斷的編解碼類型，調(diào)用不同的靜音處理程序如果是GSM-EFR，則在步驟S205-1和步驟S206-1根據(jù)GSM-EFR的斷續(xù)傳輸和SID參數(shù)輸出靜音數(shù)據(jù)；如果是TDMA-EFR，則在步驟S205-2和步驟S206-2根據(jù)TDMA-EFR的斷續(xù)傳輸和參數(shù)輸出靜音數(shù)據(jù)；如果是PDC-EFR，則在步驟S205-3和步驟S206-3根據(jù)PDC-EFR的斷續(xù)傳輸和SID參數(shù)輸出靜音數(shù)據(jù)；如果是HR AMR、FRAMR、UMTS AMR、UMTS AMR 2，則在步驟S205-4和步驟S206-4根據(jù)UMTSAMR 2的斷續(xù)傳輸和SID參數(shù)輸出靜音數(shù)據(jù)；如果步驟S203判斷為非靜音，則在步驟S207判斷當(dāng)前的編解碼類型；根據(jù)步驟S207判斷的編解碼類型設(shè)置速率如果是GSM-EFR，則在步驟S208-1設(shè)置成AMR_12.20的速率；如果是TDMA-EFR，則在步驟S208-2設(shè)置成AMR_7.40的速率；如果是PDC-EFR，則在步驟S208-3設(shè)置成AMR_6.70的速率；如果是HRAMR、FR AMR、UMTS AMR、UMTS AMR 2，則在步驟S208-4根據(jù)速率控制命令設(shè)置成指定的速率；在步驟S209根據(jù)S208設(shè)置的速率，在步驟S209執(zhí)行AMR語音解碼功能；在步驟S210輸出13bit的線性PCM數(shù)據(jù)，至此，描述了編解碼程序的整個過程。
本發(fā)明只需在AMR算法的基礎(chǔ)上添加GSM EFR、TDMA EFR和PDC EFR的舒適噪音生成(SID)和斷續(xù)傳輸(DTX)模塊和速率指定和控制模塊，增加的實(shí)現(xiàn)工作量很小，分別用AMR、GSM EFR、TDMA EFR、PDC EFR算法協(xié)議的ANSI C語言的算法描述程序作為工作量的標(biāo)準(zhǔn)，圖3描述了傳統(tǒng)實(shí)現(xiàn)方法所需要開發(fā)的代碼量，圖4描述了本發(fā)明實(shí)現(xiàn)方法所需要開發(fā)的代碼量。對比上面兩圖的合計，本發(fā)明需要實(shí)現(xiàn)的代碼量只及傳統(tǒng)實(shí)現(xiàn)方法的48％，實(shí)現(xiàn)成本(開發(fā)時間和費(fèi)用)大大降低。
在存儲空間上，本發(fā)明的效果十分明顯。圖5參照在TMS320C54X DSP上的應(yīng)用實(shí)例，給出了傳統(tǒng)實(shí)現(xiàn)方法分別實(shí)現(xiàn)所有語音編解碼所需要的存儲器容量。由此可見，本發(fā)明實(shí)現(xiàn)的方法在程序空間比傳統(tǒng)方法節(jié)省了2.8倍；表空間上節(jié)省了2.6倍，效果十分明顯。按照傳統(tǒng)實(shí)現(xiàn)方法，實(shí)現(xiàn)1路UMTS語音編解碼處理需要92K×16bit的空間，超過大多數(shù)定點(diǎn)DSP的片內(nèi)存儲器容量；而本發(fā)明實(shí)現(xiàn)方法僅需35.4K×16bit的空間，可以在一般的定點(diǎn)DSP上實(shí)現(xiàn)。因此硬件實(shí)現(xiàn)成本也大大降低。
權(quán)利要求
1.在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法，其特征在于所述的方法包括如下步驟編碼時首先根據(jù)設(shè)置的命令判斷當(dāng)前的編碼類型；根據(jù)編碼類型選擇速率模式；然后調(diào)用統(tǒng)一的AMR語音編碼模塊，執(zhí)行編碼操作；其中，如果經(jīng)過靜音檢測確定是靜音，則根據(jù)相應(yīng)的編碼類型調(diào)用各自的舒適噪音編碼(SID)和斷續(xù)傳輸(DTX)模塊；如果是非靜音，則根據(jù)確定的速率輸出語音編碼比特；解碼是編碼的逆過程，首先從接收到的幀中判斷其壞幀指示(BFI)標(biāo)志，檢查是否有錯幀，根據(jù)壞幀指示(BFI)標(biāo)志判斷是否需要作錯幀補(bǔ)償；如果判斷是錯幀，則進(jìn)行錯幀補(bǔ)償和弱音處理；如果判斷是正常的，則根據(jù)舒適噪音編碼(SID)標(biāo)志判斷是否是靜音，如果是靜音，則根據(jù)相應(yīng)的編解碼類型調(diào)用各自的斷續(xù)傳輸和舒適噪音解碼模塊；如果是非靜音，則根據(jù)相應(yīng)的編解碼類型設(shè)置速率，進(jìn)行AMR解碼操作，最后統(tǒng)一輸出13bit線性PCM數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于所述的多種為七種，這七種語音編解碼為GSM系統(tǒng)增強(qiáng)型全速率編解碼(GSM EFR)，TDMA系統(tǒng)增強(qiáng)型全速率編解碼(TDMA EFR)，PDC系統(tǒng)增強(qiáng)型全速率編解碼(PDC EFR)，半速率AMR語音編解碼(HR AMR)，全速率AMR語音編解碼(FR AMR)，UMTS系統(tǒng)AMR語音編解碼(UMTS AMR)，UMTS系統(tǒng)AMR語音編解碼標(biāo)準(zhǔn)2(UMTS AMR 2)。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于所述的確定的速率和根據(jù)相應(yīng)的編解碼類型設(shè)置速率均為GSM EFR選擇AMR_12.20，TDMA_EFR選擇AMR_7.40，PDC_EFR選擇AMR_6.70，而HR AMR、FR AMR、UMTS AMR和UMTS AMR 2則根據(jù)各自的速率控制命令確定速率。
全文摘要
本發(fā)明公開了一種在通用移動電信系統(tǒng)中基于一種編解碼算法實(shí)現(xiàn)多種語音編解碼的方法，該方法包括編碼時首先根據(jù)編碼類型選擇速率模式，調(diào)用統(tǒng)一的AMR語音編解碼模塊，如果檢測為非靜音，則按照確定的速率輸出語音編碼比特，如果檢測為靜音，則根據(jù)編碼類型選擇各自的舒適噪音產(chǎn)生和斷續(xù)傳輸模塊，輸出靜音編碼比特；解碼是編碼的逆過程，只增加一個錯幀補(bǔ)償和弱音處理步驟，最后統(tǒng)一輸出13bit線性PCM數(shù)據(jù)。在保證語音質(zhì)量不變的前提下，基于一種語音編解碼算法統(tǒng)一實(shí)現(xiàn)所有UMTS系統(tǒng)窄帶語音業(yè)務(wù)定義的7種語音編解碼，以顯著改善UMTS系統(tǒng)語音編解碼器的經(jīng)濟(jì)性、可實(shí)現(xiàn)性并解決占用存儲空間大的問題。
文檔編號G10L19/00GK1398126SQ0112300
公開日2003年2月19日申請日期2001年7月18日優(yōu)先權(quán)日2001年7月18日
發(fā)明者周亮申請人:華為技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：周亮
技術(shù)所有人：華為技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：互動玩具和反應(yīng)模式產(chǎn)生方法
上一篇：可變速率聲碼器的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法