專利名稱:在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音編解碼技術(shù),更具體地涉及通用移動電信系統(tǒng)(UMTS)中統(tǒng)一實(shí)現(xiàn)多種語音編解碼的方法。
為了達(dá)到上述目的,通常的做法就是在語音編解碼器中分別實(shí)現(xiàn)所有7種語音編解碼算法。然而,由于語音編解碼算法非常復(fù)雜,這種實(shí)現(xiàn)方法的代價十分昂貴(自行開發(fā)或采購)。而且通常用于實(shí)現(xiàn)語音編解碼的高速半導(dǎo)體器件(如DSP)的存儲器空間十分有限,特別是UE,受成本、功耗、體積等因素限制,其存儲空間更是緊張。為了實(shí)現(xiàn)7種語音編解碼算法所需要的程序空間和數(shù)據(jù)空間都是相當(dāng)可觀并且難以承受的。
本發(fā)明的方法是通過如下的技術(shù)方案實(shí)現(xiàn)的,在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法,該方法包括如下步驟編碼時首先根據(jù)設(shè)置的命令判斷當(dāng)前的編碼類型;根據(jù)編碼類型選擇速率模式;然后調(diào)用統(tǒng)一的AMR語音編碼模塊,執(zhí)行編碼操作;其中,如果經(jīng)過靜音檢測確定是靜音,則根據(jù)相應(yīng)的編碼類型調(diào)用各自的舒適噪音編碼(SID)和斷續(xù)傳輸(DTX)模塊;如果是非靜音,則根據(jù)確定的速率輸出語音編碼比特;解碼是編碼的逆過程,首先從接收到的幀中判斷其壞幀指示(BFI)標(biāo)志,檢查是否有錯幀,根據(jù)壞幀指示(BFI)標(biāo)志判斷是否需要作錯幀補(bǔ)償;如果判斷是錯幀,則進(jìn)行錯幀補(bǔ)償和弱音處理;如果判斷是正常的,則根據(jù)舒適噪音編碼(SID)標(biāo)志判斷是否是靜音,如果是靜音,則根據(jù)相應(yīng)的編解碼類型調(diào)用各自的斷續(xù)傳輸和舒適噪音解碼模塊;如果是非靜音,則根據(jù)相應(yīng)的編解碼類型設(shè)置速率,進(jìn)行AMR解碼操作,最后統(tǒng)一輸出13bit線性PCM數(shù)據(jù)。
所述的確定的速率和根據(jù)相應(yīng)的編解碼類型設(shè)置速率均為GSMEFR選擇AMR_12.20,TDMA_EFR選擇AMR_7.40,PDC_EFR選擇AMR_6.70,而HR AMR、FR AMR、UMTS AMR和UMTS AMR 2則根據(jù)各自的速率控制命令確定速率。
本發(fā)明基于AMR語音編解碼統(tǒng)一實(shí)現(xiàn)了UMTS系統(tǒng)窄帶語音業(yè)務(wù)規(guī)定的所有7種語音編解碼算法,顯著降低了UMTS語音編解碼器的實(shí)現(xiàn)成本,解決了存儲空間的問題,明顯提高了系統(tǒng)實(shí)現(xiàn)效率。
圖1是本發(fā)明方法使用的編碼流程示意圖;圖2是本發(fā)明方法使用的解碼流程示意圖;圖3是傳統(tǒng)實(shí)現(xiàn)方法的代碼量統(tǒng)計表格圖;圖4是本發(fā)明實(shí)現(xiàn)方法的代碼量統(tǒng)計表格圖;圖5是不同方法的存儲空間比較表格圖。
AMR算法是多速率的語音編解碼算法,一共有8種模式(AMR_12.20,AMR_10.20,AMR_7.95,AMR_7.40,AMR_6.70,AMR_5.90,AMR_5.15,AMR_4.75),分別對應(yīng)8種速率(12.20 kbit/s(GSM EFR),0.20 kbit/s,7.95 kbit/s,7.40 kbit/s(TDMA-EFR),6.70 kbit/s(PDC-EFR),5.90 kbit/s,5.15 kbit/s,4.75 kbit/s)。
另外,AMR還支持靜音檢測(VAD)和斷續(xù)傳輸功能(DTX),在靜音期間只定期傳輸舒適噪音(由SID幀承載),其他時間不傳輸任何數(shù)據(jù)。因此,除了上述8種速率模式之外,還有AMR_SID(1.80 kbit/s)和AMR_NODATA(0 kbit/s)兩種模式。
GSM EFR、TDMA EFR和PDC EFR都是固定速率的語音編解碼算法,其速率分別是12.20 kbit/s,7.40 kbit/s,6.70 kbit/s。由于AMR、GSMEFR、TDMA EFR和PDC EFR的算法原理都是采用“算術(shù)碼本激勵”(ACELP)的方法,而且在設(shè)計AMR解碼算法時,考慮了兼容需求,因此AMR_12.20模式與GSM EFR是兼容的;AMR_7.40模式與TDMA EFR是兼容的;AMR_6.70模式與PDC EFR是兼容的。但是他們在靜音檢測和斷續(xù)傳輸模式下的靜音幀(SID幀)卻是不兼容的AMR_SID幀的大小是35bit并且每160ms更新一次,而GSM EFR的靜音幀是244bit并且每480ms更新一次,TDMAEFR的靜音幀是38bit并且可以連續(xù)更新1。另外,不同語音編解碼的DTX控制也是不同的,例如TDMA-EFR和PDC-EFR在原有系統(tǒng)中只支持上行的斷續(xù)傳輸(DTX),不支持下行的DTX;而且AMR與其他編解碼的DTX平滑機(jī)制也有所不同。由于斷續(xù)傳輸模式可以有效增大無線信道容量、節(jié)省UE功率、節(jié)約傳輸資源,因此是UMTS設(shè)備缺省的配置項(xiàng)。在編解碼協(xié)商時,除了指定的編解碼速率,缺省設(shè)置了SID模式和NO DATA模式。因此上述SID幀的不兼容實(shí)際上導(dǎo)致了AMR與GSM EFR、TDMA EFR和PDC EFR無法統(tǒng)一實(shí)現(xiàn)。
本發(fā)明的方法,在AMR語音編解碼的核心算法的基礎(chǔ)上,集成GSMEFR、TDMA EFR和PDC EFR協(xié)議的斷續(xù)傳輸(DTX)和舒適噪音產(chǎn)生功能,通過編解碼類型和模式的控制,統(tǒng)一實(shí)現(xiàn)7種語音編解碼,具體的編解碼流程描述如下圖1是本發(fā)明方法使用的編碼流程示意圖。如圖1所示,13bit線性PCM數(shù)據(jù)流在步驟S101根據(jù)設(shè)置的命令判斷當(dāng)前的編碼類型,在后續(xù)的步驟中,根據(jù)步驟S101選擇的編碼類型設(shè)定速率如果選擇GSM-EFR編解碼,則在步驟S102-1設(shè)定為AMR_12.20kbps的速率;如果選擇TDMA-EFR,則在步驟S102-2設(shè)定為AMR_7.40kbps的速率;如果選擇PDC-EFR,則在步驟S102-3設(shè)定為AMR_6.70的速率;如果選擇HR AMR、FR AMR、UMTS AMR、UMTS AMR 2,則在步驟S102-4至步驟S102-7根據(jù)速率控制命令設(shè)置指定的速率。在步驟S103根據(jù)步驟S102設(shè)定的速率,執(zhí)行AMR語音編碼功能,接著在步驟S104判斷在步驟S103的編碼過程中,根據(jù)計算參數(shù)判斷應(yīng)該輸出非靜音幀還是靜音幀,如果判斷是非靜音,則在步驟S105輸出語音壓縮碼流;如果判斷是靜音,則在步驟S106判斷當(dāng)前編碼類型如果判斷是GSM-EFR,則在步驟S107-1執(zhí)行GSM-EFR的算法計算靜音幀的參數(shù),并在步驟S108-1按照GSM-EFR的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù);如果是TDMA-EFR,則在步驟S107-2執(zhí)行TDMA-EFR的算法計算靜音幀的參數(shù),在步驟S108-2按照TDMA-EFR的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù);如果是PDC-EFR,則在步驟S107-3執(zhí)行PDC-EFR的算法計算靜音幀的參數(shù),在步驟108-3按照PDC-EFR的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù);如果是HR AMR、FR AMR、UMTS AMR、UMTS AMR 2,則在步驟S107-4統(tǒng)一執(zhí)行UMTS AMR 2的算法計算靜音幀的參數(shù),在步驟108-4按照UMTS AMR 2的斷續(xù)傳輸?shù)姆椒ㄝ敵鲮o音數(shù)據(jù)。
解碼是編碼的逆過程,只增加一個錯幀補(bǔ)償和弱音處理。圖2是本發(fā)明方法使用的解碼流程示意圖。如圖1所示,在步驟S201從接收到的幀中判斷其壞幀指示(Bad Frame Indication-簡稱BFI)標(biāo)志,檢查是否是錯幀;如果步驟S201判斷是正常的,則程序進(jìn)入步驟S203,如果步驟S201判斷是錯幀,在步驟S202則進(jìn)行錯幀補(bǔ)償和弱音處理,在步驟S203從接收到的幀中判斷其SID標(biāo)志;如果在步驟S203判斷是靜音,則在步驟S204判斷當(dāng)前的編解碼類型;根據(jù)步驟S204判斷的編解碼類型,調(diào)用不同的靜音處理程序如果是GSM-EFR,則在步驟S205-1和步驟S206-1根據(jù)GSM-EFR的斷續(xù)傳輸和SID參數(shù)輸出靜音數(shù)據(jù);如果是TDMA-EFR,則在步驟S205-2和步驟S206-2根據(jù)TDMA-EFR的斷續(xù)傳輸和參數(shù)輸出靜音數(shù)據(jù);如果是PDC-EFR,則在步驟S205-3和步驟S206-3根據(jù)PDC-EFR的斷續(xù)傳輸和SID參數(shù)輸出靜音數(shù)據(jù);如果是HR AMR、FRAMR、UMTS AMR、UMTS AMR 2,則在步驟S205-4和步驟S206-4根據(jù)UMTSAMR 2的斷續(xù)傳輸和SID參數(shù)輸出靜音數(shù)據(jù);如果步驟S203判斷為非靜音,則在步驟S207判斷當(dāng)前的編解碼類型;根據(jù)步驟S207判斷的編解碼類型設(shè)置速率如果是GSM-EFR,則在步驟S208-1設(shè)置成AMR_12.20的速率;如果是TDMA-EFR,則在步驟S208-2設(shè)置成AMR_7.40的速率;如果是PDC-EFR,則在步驟S208-3設(shè)置成AMR_6.70的速率;如果是HRAMR、FR AMR、UMTS AMR、UMTS AMR 2,則在步驟S208-4根據(jù)速率控制命令設(shè)置成指定的速率;在步驟S209根據(jù)S208設(shè)置的速率,在步驟S209執(zhí)行AMR語音解碼功能;在步驟S210輸出13bit的線性PCM數(shù)據(jù),至此,描述了編解碼程序的整個過程。
本發(fā)明只需在AMR算法的基礎(chǔ)上添加GSM EFR、TDMA EFR和PDC EFR的舒適噪音生成(SID)和斷續(xù)傳輸(DTX)模塊和速率指定和控制模塊,增加的實(shí)現(xiàn)工作量很小,分別用AMR、GSM EFR、TDMA EFR、PDC EFR算法協(xié)議的ANSI C語言的算法描述程序作為工作量的標(biāo)準(zhǔn),圖3描述了傳統(tǒng)實(shí)現(xiàn)方法所需要開發(fā)的代碼量,圖4描述了本發(fā)明實(shí)現(xiàn)方法所需要開發(fā)的代碼量。對比上面兩圖的合計,本發(fā)明需要實(shí)現(xiàn)的代碼量只及傳統(tǒng)實(shí)現(xiàn)方法的48%,實(shí)現(xiàn)成本(開發(fā)時間和費(fèi)用)大大降低。
在存儲空間上,本發(fā)明的效果十分明顯。圖5參照在TMS320C54X DSP上的應(yīng)用實(shí)例,給出了傳統(tǒng)實(shí)現(xiàn)方法分別實(shí)現(xiàn)所有語音編解碼所需要的存儲器容量。由此可見,本發(fā)明實(shí)現(xiàn)的方法在程序空間比傳統(tǒng)方法節(jié)省了2.8倍;表空間上節(jié)省了2.6倍,效果十分明顯。按照傳統(tǒng)實(shí)現(xiàn)方法,實(shí)現(xiàn)1路UMTS語音編解碼處理需要92K×16bit的空間,超過大多數(shù)定點(diǎn)DSP的片內(nèi)存儲器容量;而本發(fā)明實(shí)現(xiàn)方法僅需35.4K×16bit的空間,可以在一般的定點(diǎn)DSP上實(shí)現(xiàn)。因此硬件實(shí)現(xiàn)成本也大大降低。
權(quán)利要求
1.在通用移動電信系統(tǒng)中實(shí)現(xiàn)多種語音編解碼的方法,其特征在于所述的方法包括如下步驟編碼時首先根據(jù)設(shè)置的命令判斷當(dāng)前的編碼類型;根據(jù)編碼類型選擇速率模式;然后調(diào)用統(tǒng)一的AMR語音編碼模塊,執(zhí)行編碼操作;其中,如果經(jīng)過靜音檢測確定是靜音,則根據(jù)相應(yīng)的編碼類型調(diào)用各自的舒適噪音編碼(SID)和斷續(xù)傳輸(DTX)模塊;如果是非靜音,則根據(jù)確定的速率輸出語音編碼比特;解碼是編碼的逆過程,首先從接收到的幀中判斷其壞幀指示(BFI)標(biāo)志,檢查是否有錯幀,根據(jù)壞幀指示(BFI)標(biāo)志判斷是否需要作錯幀補(bǔ)償;如果判斷是錯幀,則進(jìn)行錯幀補(bǔ)償和弱音處理;如果判斷是正常的,則根據(jù)舒適噪音編碼(SID)標(biāo)志判斷是否是靜音,如果是靜音,則根據(jù)相應(yīng)的編解碼類型調(diào)用各自的斷續(xù)傳輸和舒適噪音解碼模塊;如果是非靜音,則根據(jù)相應(yīng)的編解碼類型設(shè)置速率,進(jìn)行AMR解碼操作,最后統(tǒng)一輸出13bit線性PCM數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述的多種為七種,這七種語音編解碼為GSM系統(tǒng)增強(qiáng)型全速率編解碼(GSM EFR),TDMA系統(tǒng)增強(qiáng)型全速率編解碼(TDMA EFR),PDC系統(tǒng)增強(qiáng)型全速率編解碼(PDC EFR),半速率AMR語音編解碼(HR AMR),全速率AMR語音編解碼(FR AMR),UMTS系統(tǒng)AMR語音編解碼(UMTS AMR),UMTS系統(tǒng)AMR語音編解碼標(biāo)準(zhǔn)2(UMTS AMR 2)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于所述的確定的速率和根據(jù)相應(yīng)的編解碼類型設(shè)置速率均為GSM EFR選擇AMR_12.20,TDMA_EFR選擇AMR_7.40,PDC_EFR選擇AMR_6.70,而HR AMR、FR AMR、UMTS AMR和UMTS AMR 2則根據(jù)各自的速率控制命令確定速率。
全文摘要
本發(fā)明公開了一種在通用移動電信系統(tǒng)中基于一種編解碼算法實(shí)現(xiàn)多種語音編解碼的方法,該方法包括編碼時首先根據(jù)編碼類型選擇速率模式,調(diào)用統(tǒng)一的AMR語音編解碼模塊,如果檢測為非靜音,則按照確定的速率輸出語音編碼比特,如果檢測為靜音,則根據(jù)編碼類型選擇各自的舒適噪音產(chǎn)生和斷續(xù)傳輸模塊,輸出靜音編碼比特;解碼是編碼的逆過程,只增加一個錯幀補(bǔ)償和弱音處理步驟,最后統(tǒng)一輸出13bit線性PCM數(shù)據(jù)。在保證語音質(zhì)量不變的前提下,基于一種語音編解碼算法統(tǒng)一實(shí)現(xiàn)所有UMTS系統(tǒng)窄帶語音業(yè)務(wù)定義的7種語音編解碼,以顯著改善UMTS系統(tǒng)語音編解碼器的經(jīng)濟(jì)性、可實(shí)現(xiàn)性并解決占用存儲空間大的問題。
文檔編號G10L19/00GK1398126SQ0112300
公開日2003年2月19日 申請日期2001年7月18日 優(yōu)先權(quán)日2001年7月18日
發(fā)明者周亮 申請人:華為技術(shù)有限公司