本發(fā)明涉及一種AMR碼流轉(zhuǎn)換成AMR-WB碼流的方法,屬于編碼技術(shù)領(lǐng)域。
背景技術(shù):在很多通信系統(tǒng)中,如公共電話交換網(wǎng)(PSTN)和全球移動(dòng)通信系統(tǒng)(GSM),系統(tǒng)傳輸?shù)恼Z(yǔ)音帶寬被限制在4KHz以內(nèi)。雖然4KHz窄帶語(yǔ)音可滿足基本的通信要求,但在一些對(duì)音質(zhì)要求較高的場(chǎng)合,如會(huì)議電視系統(tǒng)等,由于4KHz窄帶語(yǔ)音缺乏高頻成分,其聽起來(lái)“悶悶”的,自然度和可懂度均較低,已不能滿足音質(zhì)方面的需求。這些應(yīng)用上的需求促使人們開始關(guān)注寬帶語(yǔ)音編碼技術(shù),并相繼提出了一些寬帶編碼標(biāo)準(zhǔn),如AMR-WB[和G.729.1等。但這些寬帶編碼標(biāo)準(zhǔn)未考慮對(duì)已有網(wǎng)絡(luò)通信協(xié)議的兼容,即對(duì)編碼速率和碼流格式改變都較大,很難直接應(yīng)用于既有網(wǎng)絡(luò)中。長(zhǎng)時(shí)間建設(shè)而成的既有通信網(wǎng)絡(luò)極其龐雜,因而網(wǎng)絡(luò)的升級(jí)必然是一個(gè)復(fù)雜、漸進(jìn)的過(guò)程,因此,短時(shí)間內(nèi)對(duì)既有通信網(wǎng)絡(luò)進(jìn)行全面升級(jí)是不現(xiàn)實(shí)的,如何在現(xiàn)有通信網(wǎng)絡(luò)條件下,獲得寬帶語(yǔ)音質(zhì)量就成為一個(gè)亟待解決的問題。為此,人們提出了人工語(yǔ)音帶寬技術(shù),所謂的人工帶寬擴(kuò)展就是借助語(yǔ)音信號(hào)處理方法,擴(kuò)展出窄帶語(yǔ)音的其它頻帶分量,進(jìn)而合成出寬帶語(yǔ)音。早在1933年,人們就提出了語(yǔ)音帶寬擴(kuò)展概念并嘗試通過(guò)線性運(yùn)算實(shí)現(xiàn)該技術(shù)。后來(lái)在上世紀(jì)70年代的早期,開始有公司試圖通過(guò)數(shù)字信號(hào)處理技術(shù)來(lái)重建寬帶語(yǔ)音信號(hào)。但當(dāng)時(shí)沒考慮聲音特性和人耳聽覺特點(diǎn),早期的嘗試都以失敗告終。直到70年代末期,學(xué)者們提出語(yǔ)音的線性預(yù)測(cè)模型,才使語(yǔ)音帶寬擴(kuò)展技術(shù)取得突破性的進(jìn)展,相繼提出了多種帶寬擴(kuò)展算法。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明針對(duì)以上問題的提出,而研制一種AMR碼流轉(zhuǎn)換成AMR-WB碼流的方法。本發(fā)明的技術(shù)手段如下:一種AMR碼流轉(zhuǎn)換成AMR-WB碼流的方法;AMR窄帶碼進(jìn)入擴(kuò)展單元后轉(zhuǎn)換成AMR-WB碼流,擴(kuò)展單元和訓(xùn)練單元,所述的訓(xùn)練單元為擴(kuò)展單元提供參數(shù)擴(kuò)展過(guò)程所需的映射關(guān)系。所述的擴(kuò)展單元包括AMR解碼單元、參數(shù)提取單元、窄帶能量計(jì)算單元、SVR預(yù)測(cè)單元、函數(shù)映射單元A、碼本映射單元、函數(shù)映射單元B、升采樣單元以及AMR-WB部分編碼單元,所述的AMR解碼單元的輸入端輸入AMR的窄帶碼流,輸出端與參數(shù)提取單元、窄帶能量計(jì)算單元以及升采樣單元的輸入端相連,所述的參數(shù)提取單元的輸入端與AMR解碼單元的輸出相連,其輸出端與SVR預(yù)測(cè)單元、函數(shù)映射單元A、碼本映射單元以及AMR-WB部分編碼單元的輸入端相連。所述的窄帶能量計(jì)算單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與函數(shù)映射單元B的輸入端相連,所述的SVR預(yù)測(cè)單元、函數(shù)映射單元A以及碼本映射單元的輸入端與參數(shù)提取單元的輸出端相連并接收訓(xùn)練單元提供的映射關(guān)系,它們的輸出端都與AMR-WB部分編碼單元的輸入端相連,所述的函數(shù)映射單元B的輸入端與窄帶能量計(jì)算單元的輸出端相連接收訓(xùn)練單元提供的映射函數(shù),其輸出端與AMR-WB部分編碼單元的輸入端相連,所述的升采樣單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與AMR-WB部分編碼單元的輸入端相連,AMR-WB部分編碼單元的輸入端與SVR預(yù)測(cè)單元、函數(shù)映射單元A、碼本映射單元、函數(shù)映射單元B以及升采樣單元的輸出端相連,其輸出端輸出AMR-WB寬帶碼流。所述的AMR解碼單元包括窄帶碼流分離單元、LSP解碼單元、自適應(yīng)碼本解碼單元、增益解碼單元、固定碼本解碼單元、4子幀插值單元、激勵(lì)重建單元、LSP到A(z)轉(zhuǎn)換單元、合成濾波器單元以及后置濾波器單元,所述的窄帶碼流分離單元的輸入端輸入AMR窄帶碼流,其輸出端分別約LSP解碼單元、自適應(yīng)碼本解碼單元、增益解碼單元以及固定碼本解碼單元的輸入端相連。所述的LSP解碼單元的輸入端與碼流分離單元的輸出端相連、其輸出端與4子幀插值單元的輸入端相連。所述的自適應(yīng)碼本解碼單元、增益解碼單元以及固定碼本解碼單元的輸入端都與碼流分離單元的輸出端相連、他們的輸出端都與激勵(lì)重建單元的輸入端相連,所述的4子幀LSP插值單元的輸入端與LSP解碼單元的輸出端相連,其輸出端與LSP到A(z)轉(zhuǎn)換單元的輸入端相連,所述的激勵(lì)重建單元的輸入端分別與自適應(yīng)碼本解碼單元、增益解碼單元以及固定碼本解碼單元的輸出端相連。所述的LSP到A(z)轉(zhuǎn)換單元的輸入端與4子幀LSP插值單元的輸出端相連,其輸出端與合成濾波器單元的輸入端相連,所述的合成濾波器單元的輸入端分別與激勵(lì)重建單元和LSP到A(z)轉(zhuǎn)換單元的輸出端相連,其輸出端與后置濾波器單元的輸入端相連,所述的后置濾波器單元的輸入端與合成濾波器單元的輸出端相連,其輸出單元輸出合成語(yǔ)音。所述的參數(shù)提取單元包括VAD提取單元、LSP提取單元、開環(huán)基音周期及固定碼本提取單元,所述的VAD提取單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與AMR-WB部分編碼的輸入端相連,所述的LSP提取單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與SVR預(yù)測(cè)單元的輸入端相連,所述的開環(huán)基音提取單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與映射單元A的輸入端相連,所述的固定碼本單元的輸入端AMR解碼單元的輸出端相連,其輸出端與碼本映射單元的輸入端相連。所述的AMR-WB部分編碼單元包括加權(quán)語(yǔ)音計(jì)算單元、4子幀差值單元A、ISP到ISF轉(zhuǎn)換單元、開環(huán)基音搜索單元、閉環(huán)基音搜索單元、自適應(yīng)碼本計(jì)算單元、4子幀差值單元B、ISF量化單元、自適應(yīng)碼本貢獻(xiàn)計(jì)算單元、自適應(yīng)濾波器選擇單元、固定碼本目標(biāo)信號(hào)計(jì)算單元、固定碼本搜索單元、增益矢量量化單元、脈沖響應(yīng)計(jì)算單元以及AMR-WB碼流生成單元。所述的加權(quán)語(yǔ)音計(jì)算單元的輸入端輸入升采樣之后的AMR合成語(yǔ)音和VAD并與4子幀插值單元A的輸出端相連,其輸出端與開環(huán)基音搜索單元的輸入端相連。所述的4子幀插值單元A的輸入端與輸入16維的ISP,其輸出端分別與加權(quán)語(yǔ)音計(jì)算單元、自適應(yīng)碼本計(jì)算單元以及脈沖響應(yīng)計(jì)算單元的輸入端相連。所述的ISP到ISF轉(zhuǎn)換單元的輸入端輸入16維的ISP,其輸出端與ISF量化單元的輸入端相連。所述的ISF量化單元的輸入端與ISP到ISF轉(zhuǎn)換單元的輸出端相連,其輸出端分別與4子幀插值單元B和AMR-WB碼流生成單元的輸入端相連。所述的開環(huán)基音搜索單元的輸入端接收擴(kuò)展得到的開環(huán)基音并與加權(quán)語(yǔ)音的輸出端相連,其輸出端與閉環(huán)基音搜索單元的輸入端相連。所述的4子幀差值單元B的輸入端與ISF量化單元的輸出端相連,其輸出端分別與自適應(yīng)碼本信號(hào)計(jì)算單元和脈沖響應(yīng)計(jì)算單元的輸入端相連。所述的自適應(yīng)碼本計(jì)算單元的輸入端輸入升采樣后的AMR合成語(yǔ)音并與4子幀插值單元A的輸出端相連,其輸出端與固定碼本目標(biāo)信號(hào)計(jì)算單元的輸入端相連。所述的閉環(huán)基音搜索單元的輸入端與自適應(yīng)碼本計(jì)算單元的輸出端相連,其輸出端分別與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元和AMR-WB碼流生成單元的輸入端相連。所述的自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸入端與閉環(huán)基音搜索單元的輸出端相連,其輸出端分別與自適應(yīng)濾波器選擇單元和增益矢量量化單元的輸入端相連。所述的增益矢量量化單元的輸入端分別與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元和固定碼本搜索單元的輸出端相連,其輸出端與AMR-WB碼流生成單元的輸入端相連。所述的自適應(yīng)濾波器選擇單元的輸入端自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸出端相連,其輸出端分別與固定碼本目標(biāo)信號(hào)計(jì)算單元和AMR-WB碼流生成單元的輸入端相連。所述的固定碼本計(jì)算單元的輸入端輸入擴(kuò)展得到寬帶固定碼本并分別與自適應(yīng)碼本目標(biāo)信號(hào)計(jì)算單元和自適應(yīng)濾波器選擇單元的輸出端相連,其輸出端與固定碼本搜索單元的輸入端相連。所述的固定碼本搜索單元的輸入端分別與固定碼本目標(biāo)信號(hào)計(jì)算單元和脈沖響應(yīng)計(jì)算單元的輸出端相連,其輸出端分別與增益矢量化單元和AMR-WB碼流生成單元的輸入端相連。所述的AMR-WB碼流生成單元的輸入端接收擴(kuò)展得到高頻增益索引并分別與固定碼本搜索單元、自適應(yīng)濾波器選擇單元、增益矢量量化單元、閉環(huán)基音搜索單元以及ISF量化單元的輸出端相連,其輸出端輸出AMR-WB寬帶碼流。所述的訓(xùn)練單元包括窄帶碼流分離單元、窄帶碼流解析單元、AMR-WB編碼單元、SVR訓(xùn)練單元、開環(huán)基音映射函數(shù)訓(xùn)練單元、固定碼本映射碼本訓(xùn)練單元以及高頻增益映射函數(shù)訓(xùn)練單元。所述的窄帶碼流分離單元的輸入端輸入窄帶碼流,其輸出端與窄帶碼流解析單元的輸入端相連;所述的窄帶碼流解析單元的輸入端與窄帶碼流分離單元的輸出端相連,其輸出端分別與SVR訓(xùn)練單元、開環(huán)基音映射函數(shù)訓(xùn)練單元、固定碼本映射碼本訓(xùn)練單元以及高頻增益映射函數(shù)訓(xùn)練單元的輸入端相連;所述的AMR-WB編碼單元的輸入端輸入寬帶語(yǔ)音,其輸出端分別與SVR訓(xùn)練單元、開環(huán)基音映射函數(shù)訓(xùn)練單元、固定碼本映射碼本訓(xùn)練單元以及高頻增益映射函數(shù)訓(xùn)練單元的輸入端相連;所述的SVR訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸出端相連,其輸出端輸出SVR映射模型;所述的開環(huán)基音映射函數(shù)訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸出端相連,其輸出端輸出開環(huán)基音映射函數(shù);所述的固定碼本映射碼本訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸入端相連,其輸出端輸出映射碼本;所述的高頻增益映射函數(shù)訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸入端相連,其輸出端輸出高頻增益映射函數(shù)。所述的AMR-WB編碼單元包括預(yù)處理單元、線性預(yù)測(cè)分析單元、ISP量化單元、4子幀ISP插值單元A、加權(quán)語(yǔ)音計(jì)算單元、4子幀ISP插值單元B、開環(huán)基音搜索單元、目標(biāo)信號(hào)計(jì)算單元、最佳基音延遲和增益搜索單元、自適應(yīng)碼本分量計(jì)算單元、自適應(yīng)碼本濾波器選擇單元、沖激響應(yīng)計(jì)算單元、高頻增益索引計(jì)算單元、固定碼本搜索單元、濾波器更新單元、激勵(lì)計(jì)算單元以及增益量化單元。所述的預(yù)處理單元的輸入端輸入采樣率為16KHz的寬帶語(yǔ)音,其輸出端分別與線性預(yù)測(cè)分析單元、加權(quán)語(yǔ)音計(jì)算單元以及目標(biāo)信號(hào)計(jì)算單元的輸入端相連;所述的線性預(yù)測(cè)分析單元的輸入端與預(yù)處理單元的輸出端相連、其輸出端分別與ISP量化單元和4子幀ISP插值單元B的輸入端相連;所述的ISP量化單元的輸入端與線性預(yù)測(cè)分析單元的輸出端相連,其輸出端與4子幀ISP差值單元A的輸入端相連;所述的4子幀插值單元A的輸入端與ISP量化單元的輸出端相連,其輸出端與沖激響應(yīng)計(jì)算單元的輸入端相連;所述的加權(quán)語(yǔ)音計(jì)算單元的輸入端分別與預(yù)處理單元和四子幀ISP插值單元B的輸出端相連,其輸出端與開環(huán)基音搜索單元的輸入端相連;所述的4子幀插值單元B的輸入端與線性預(yù)測(cè)分析單元的輸出端相連,其輸出端分別與目標(biāo)信號(hào)計(jì)算單元、加權(quán)語(yǔ)音計(jì)算單元以及沖激響應(yīng)計(jì)算單元的輸入端相連;所述的開環(huán)基音搜索單元的輸入端與加權(quán)語(yǔ)音計(jì)算單元的輸出端相連,其輸出端與最佳基音延遲和增益搜索單元的輸入端相連;所述的目標(biāo)信號(hào)計(jì)算單元的輸入端分別與預(yù)處理單元、4子幀ISP插值單元B以及4子幀ISP插值單元A的輸出端相連,其輸出端分別與固定碼本搜索單元和最佳基音延遲和增益搜索單元的輸入端相連;所述的最佳基音延遲和增益搜索單元的輸入端分別與目標(biāo)信號(hào)計(jì)算單元、開環(huán)基音搜索以及沖激響應(yīng)計(jì)算單元的輸出端相連,其輸出端輸出基音索引并與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸入端相連;所述的自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸入端與最佳基因延遲和增益上搜索單元的輸出端相連,其輸出端分別與自適應(yīng)碼本濾波器選擇單元和增益量化單元的輸入端相連;所述的自適應(yīng)碼本濾波器選擇單元的輸入端與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸出端相連,其輸出端輸出濾波器索引并與脈沖響應(yīng)計(jì)算單元的輸入端相連;所述的沖激響應(yīng)計(jì)算單元的輸入端分別與自適應(yīng)碼本濾波器選擇單元、4子幀ISP插值單元A以及4子幀ISP插值單元B的輸出端相連,其輸出端分別與最佳基音延遲和增益搜索單元以及固定碼本搜索單元的輸入端相連;所述的固定碼本搜索單元的輸入端分別與目標(biāo)信號(hào)計(jì)算單元、自適應(yīng)碼本濾波器選擇單元以及沖激響應(yīng)計(jì)算單元的輸出端相連,其輸出端輸出固定碼本增益索引并與增益量化單元的輸入端相連;所述的增益量化單元的輸入端分別與固定碼本搜索單元以及自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸出端相連,其輸出端輸出增益索引并與激勵(lì)計(jì)算單元的輸入端相連;所述的激勵(lì)計(jì)算單元的輸入端與增益量化單元的輸出端相連,其輸出端分別與濾波器狀態(tài)更新單元和高頻增益索引計(jì)算單元的輸入端相連;所述的濾波器狀態(tài)更新單元的輸入端與激勵(lì)計(jì)算單元的輸出端相連;所述的高頻增益索引計(jì)算單元的輸入端輸入采樣率為16KHz的寬帶語(yǔ)音并分別與4子幀ISP插值單元和激勵(lì)計(jì)算單元的輸出端相連,其輸出端輸出高頻增益索引。本發(fā)明的有益效果:(1)本發(fā)明可以準(zhǔn)確地恢復(fù)出窄帶信號(hào)所對(duì)應(yīng)的高頻部分,因此可以實(shí)現(xiàn)AMR窄帶碼流到AMR-WB寬帶碼流的轉(zhuǎn)換。(2)AMR窄帶碼流解碼得到窄帶語(yǔ)音相比,擴(kuò)展后的AMR-WB寬帶碼流解碼得到的寬帶語(yǔ)音音質(zhì)有明顯提高。(3)與AMR到AMR-WB的時(shí)域帶寬擴(kuò)展方法相比,本發(fā)明提出的碼流域帶寬擴(kuò)展方法編解碼部分計(jì)算量大幅度降低,可以降低30%左右。附圖說(shuō)明圖1一種將AMR窄帶碼流轉(zhuǎn)換成AMR-WB寬帶碼流的轉(zhuǎn)換裝置。圖2本發(fā)明擴(kuò)展單元結(jié)構(gòu)簡(jiǎn)圖。圖3本發(fā)明AMR解碼單元結(jié)構(gòu)簡(jiǎn)圖。圖4本發(fā)明參數(shù)提取單元結(jié)構(gòu)簡(jiǎn)圖。圖5本發(fā)明AMR-WB部分編碼單元。圖6本發(fā)明訓(xùn)練單元結(jié)構(gòu)簡(jiǎn)圖。圖7本發(fā)明AMR-WB編碼單元。圖8本發(fā)明AMR編碼器速率表。圖9本發(fā)明AMR-WB編碼器速率表。圖10本發(fā)明AMR在10.20kbps編碼速率下的比特分配表。圖11本發(fā)明確定軌道最大最小位置的算法流程圖。圖12本發(fā)明AMR-WB固定碼本搜索流程圖。圖13本發(fā)明AMR-WB在23.85kbps編碼模式下的參數(shù)索引比特分配。圖14本發(fā)明SVR參數(shù)設(shè)置。具體實(shí)施方式下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步說(shuō)明:本發(fā)明是根據(jù)AMR窄帶碼流按照一定的方法生成AMR-WB寬帶碼流,本發(fā)明的技術(shù)方案如下:一種將AMR窄帶碼流轉(zhuǎn)換成AMR-WB寬帶碼流的轉(zhuǎn)換裝置如圖1所示:包括擴(kuò)展單元和訓(xùn)練單元,所述的訓(xùn)練單元為擴(kuò)展單元提供參數(shù)擴(kuò)展過(guò)程所需的映射關(guān)系,只在擴(kuò)展單元工作之前“離線”地運(yùn)行一次。所述的擴(kuò)展單元如圖2所示:包括AMR解碼單元、參數(shù)提取單元、窄帶能量計(jì)算單元、SVR預(yù)測(cè)單元、函數(shù)映射單元A、碼本映射單元、函數(shù)映射單元B、升采樣單元以及AMR-WB部分編碼單元。所述的AMR解碼單元的輸入端輸入AMR的窄帶碼流,輸出端與參數(shù)提取單元、窄帶能量計(jì)算單元以及升采樣單元的輸入端相連。所述的參數(shù)提取單元的輸入端與AMR解碼單元的輸出相連,其輸出端與SVR預(yù)測(cè)單元、函數(shù)映射單元A、碼本映射單元以及AMR-WB部分編碼單元的輸入端相連。所述的窄帶能量計(jì)算單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與函數(shù)映射單元B的輸入端相連。所述的SVR預(yù)測(cè)單元、函數(shù)映射單元A以及碼本映射單元的輸入端與參數(shù)提取單元的輸出端相連并接收訓(xùn)練單元提供的映射關(guān)系,它們的輸出端都與AMR-WB部分編碼單元的輸入端相連。所述的函數(shù)映射單元B的輸入端與窄帶能量計(jì)算單元的輸出端相連接收訓(xùn)練單元提供的映射函數(shù),其輸出端與AMR-WB部分編碼單元的輸入端相連。所述的升采樣單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與AMR-WB部分編碼單元的輸入端相連。AMR-WB部分編碼單元的輸入端與SVR預(yù)測(cè)單元、函數(shù)映射單元A、碼本映射單元、函數(shù)映射單元B以及升采樣單元的輸出端相連,其輸出端輸出AMR-WB寬帶碼流。所述的AMR解碼單元如圖3所示:包括窄帶碼流分離單元、LSP解碼單元、自適應(yīng)碼本解碼單元、增益解碼單元、固定碼本解碼單元、4子幀插值單元、激勵(lì)重建單元、LSP到A(z)轉(zhuǎn)換單元、合成濾波器單元以及后置濾波器單元。所述的窄帶碼流分離單元的輸入端輸入AMR窄帶碼流,其輸出端分別約LSP解碼單元、自適應(yīng)碼本解碼單元、增益解碼單元以及固定碼本解碼單元的輸入端相連。所述的LSP解碼單元的輸入端與碼流分離單元的輸出端相連、其輸出端與4子幀插值單元的輸入端相連。所述的自適應(yīng)碼本解碼單元、增益解碼單元以及固定碼本解碼單元的輸入端都與碼流分離單元的輸出端相連、他們的輸出端都與激勵(lì)重建單元的輸入端相連。所述的4子幀LSP插值單元的輸入端與LSP解碼單元的輸出端相連,其輸出端與LSP到A(z)轉(zhuǎn)換單元的輸入端相連。所述的激勵(lì)重建單元的輸入端分別與自適應(yīng)碼本解碼單元、增益解碼單元以及固定碼本解碼單元的輸出端相連。所述的LSP到A(z)轉(zhuǎn)換單元的輸入端與4子幀LSP插值單元的輸出端相連,其輸出端與合成濾波器單元的輸入端相連。所述的合成濾波器單元的輸入端分別與激勵(lì)重建單元和LSP到A(z)轉(zhuǎn)換單元的輸出端相連,其輸出端與后置濾波器單元的輸入端相連。所述的后置濾波器單元的輸入端與合成濾波器單元的輸出端相連,其輸出單元輸出合成語(yǔ)音。所述的參數(shù)提取單元如圖4所示:包括VAD提取單元、LSP提取單元、開環(huán)基音周期及固定碼本提取單元。所述的VAD提取單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與AMR-WB部分編碼的輸入端相連。所述的LSP提取單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與SVR預(yù)測(cè)單元的輸入端相連。所述的開環(huán)基音提取單元的輸入端與AMR解碼單元的輸出端相連,其輸出端與映射單元A的輸入端相連。所述的固定碼本單元的輸入端AMR解碼單元的輸出端相連,其輸出端與碼本映射單元的輸入端相連。所述的AMR-WB部分編碼單元如圖5所示:包括加權(quán)語(yǔ)音計(jì)算單元、4子幀差值單元A、ISP到ISF轉(zhuǎn)換單元、開環(huán)基音搜索單元、閉環(huán)基音搜索單元、自適應(yīng)碼本計(jì)算單元、4子幀差值單元B、ISF量化單元、自適應(yīng)碼本貢獻(xiàn)計(jì)算單元、自適應(yīng)濾波器選擇單元、固定碼本目標(biāo)信號(hào)計(jì)算單元、固定碼本搜索單元、增益矢量量化單元、脈沖響應(yīng)計(jì)算單元以及AMR-WB碼流生成單元。所述的加權(quán)語(yǔ)音計(jì)算單元的輸入端輸入升采樣之后的AMR合成語(yǔ)音和VAD并與4子幀插值單元A的輸出端相連,其輸出端與開環(huán)基音搜索單元的輸入端相連。所述的4子幀插值單元A的輸入端與輸入16維的ISP,其輸出端分別與加權(quán)語(yǔ)音計(jì)算單元、自適應(yīng)碼本計(jì)算單元以及脈沖響應(yīng)計(jì)算單元的輸入端相連。所述的ISP到ISF轉(zhuǎn)換單元的輸入端輸入16維的ISP,其輸出端與ISF量化單元的輸入端相連。所述的ISF量化單元的輸入端與ISP到ISF轉(zhuǎn)換單元的輸出端相連,其輸出端分別與4子幀插值單元B和AMR-WB碼流生成單元的輸入端相連。所述的開環(huán)基音搜索單元的輸入端接收擴(kuò)展得到的開環(huán)基音并與加權(quán)語(yǔ)音的輸出端相連,其輸出端與閉環(huán)基音搜索單元的輸入端相連。所述的4子幀差值單元B的輸入端與ISF量化單元的輸出端相連,其輸出端分別與自適應(yīng)碼本信號(hào)計(jì)算單元和脈沖響應(yīng)計(jì)算單元的輸入端相連。所述的自適應(yīng)碼本計(jì)算單元的輸入端輸入升采樣后的AMR合成語(yǔ)音并與4子幀插值單元A的輸出端相連,其輸出端與固定碼本目標(biāo)信號(hào)計(jì)算單元的輸入端相連。所述的閉環(huán)基音搜索單元的輸入端與自適應(yīng)碼本計(jì)算單元的輸出端相連,其輸出端分別與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元和AMR-WB碼流生成單元的輸入端相連。所述的自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸入端與閉環(huán)基音搜索單元的輸出端相連,其輸出端分別與自適應(yīng)濾波器選擇單元和增益矢量量化單元的輸入端相連。所述的增益矢量量化單元的輸入端分別與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元和固定碼本搜索單元的輸出端相連,其輸出端與AMR-WB碼流生成單元的輸入端相連。所述的自適應(yīng)濾波器選擇單元的輸入端自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸出端相連,其輸出端分別與固定碼本目標(biāo)信號(hào)計(jì)算單元和AMR-WB碼流生成單元的輸入端相連。所述的固定碼本計(jì)算單元的輸入端輸入擴(kuò)展得到寬帶固定碼本并分別與自適應(yīng)碼本目標(biāo)信號(hào)計(jì)算單元和自適應(yīng)濾波器選擇單元的輸出端相連,其輸出端與固定碼本搜索單元的輸入端相連。所述的固定碼本搜索單元的輸入端分別與固定碼本目標(biāo)信號(hào)計(jì)算單元和脈沖響應(yīng)計(jì)算單元的輸出端相連,其輸出端分別與增益矢量化單元和AMR-WB碼流生成單元的輸入端相連。所述的AMR-WB碼流生成單元的輸入端接收擴(kuò)展得到高頻增益索引并分別與固定碼本搜索單元、自適應(yīng)濾波器選擇單元、增益矢量量化單元、閉環(huán)基音搜索單元以及ISF量化單元的輸出端相連,其輸出端輸出AMR-WB寬帶碼流。所述的訓(xùn)練單元如圖6所示,包括窄帶碼流分離單元、窄帶碼流解析單元、AMR-WB編碼單元、SVR訓(xùn)練單元、開環(huán)基音映射函數(shù)訓(xùn)練單元、固定碼本映射碼本訓(xùn)練單元以及高頻增益映射函數(shù)訓(xùn)練單元。所述的窄帶碼流分離單元的輸入端輸入窄帶碼流,其輸出端與窄帶碼流解析單元的輸入端相連;所述的窄帶碼流解析單元的輸入端與窄帶碼流分離單元的輸出端相連,其輸出端分別與SVR訓(xùn)練單元、開環(huán)基音映射函數(shù)訓(xùn)練單元、固定碼本映射碼本訓(xùn)練單元以及高頻增益映射函數(shù)訓(xùn)練單元的輸入端相連;所述的AMR-WB編碼單元的輸入端輸入寬帶語(yǔ)音,其輸出端分別與SVR訓(xùn)練單元、開環(huán)基音映射函數(shù)訓(xùn)練單元、固定碼本映射碼本訓(xùn)練單元以及高頻增益映射函數(shù)訓(xùn)練單元的輸入端相連;所述的SVR訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸出端相連,其輸出端輸出SVR映射模型;所述的開環(huán)基音映射函數(shù)訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸出端相連,其輸出端輸出開環(huán)基音映射函數(shù);所述的固定碼本映射碼本訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸入端相連,其輸出端輸出映射碼本;所述的高頻增益映射函數(shù)訓(xùn)練單元的輸入端分別與窄帶碼流解析單元和AMR-WB編碼單元的輸入端相連,其輸出端輸出高頻增益映射函數(shù)。所述的AMR-WB編碼單元如圖7所示,包括預(yù)處理單元、線性預(yù)測(cè)分析單元、ISP量化單元、4子幀ISP插值單元A、加權(quán)語(yǔ)音計(jì)算單元、4子幀ISP插值單元B、開環(huán)基音搜索單元、目標(biāo)信號(hào)計(jì)算單元、最佳基音延遲和增益搜索單元、自適應(yīng)碼本分量計(jì)算單元、自適應(yīng)碼本濾波器選擇單元、沖激響應(yīng)計(jì)算單元、高頻增益索引計(jì)算單元、固定碼本搜索單元、濾波器更新單元、激勵(lì)計(jì)算單元以及增益量化單元。所述的預(yù)處理單元的輸入端輸入采樣率為16KHz的寬帶語(yǔ)音,其輸出端分別與線性預(yù)測(cè)分析單元、加權(quán)語(yǔ)音計(jì)算單元以及目標(biāo)信號(hào)計(jì)算單元的輸入端相連;所述的線性預(yù)測(cè)分析單元的輸入端與預(yù)處理單元的輸出端相連、其輸出端分別與ISP量化單元和4子幀ISP插值單元B的輸入端相連;所述的ISP量化單元的輸入端與線性預(yù)測(cè)分析單元的輸出端相連,其輸出端與4子幀ISP差值單元A的輸入端相連;所述的4子幀插值單元A的輸入端與ISP量化單元的輸出端相連,其輸出端與沖激響應(yīng)計(jì)算單元的輸入端相連;所述的加權(quán)語(yǔ)音計(jì)算單元的輸入端分別與預(yù)處理單元和四子幀ISP插值單元B的輸出端相連,其輸出端與開環(huán)基音搜索單元的輸入端相連;所述的4子幀插值單元B的輸入端與線性預(yù)測(cè)分析單元的輸出端相連,其輸出端分別與目標(biāo)信號(hào)計(jì)算單元、加權(quán)語(yǔ)音計(jì)算單元以及沖激響應(yīng)計(jì)算單元的輸入端相連;所述的開環(huán)基音搜索單元的輸入端與加權(quán)語(yǔ)音計(jì)算單元的輸出端相連,其輸出端與最佳基音延遲和增益搜索單元的輸入端相連;所述的目標(biāo)信號(hào)計(jì)算單元的輸入端分別與預(yù)處理單元、4子幀ISP插值單元B以及4子幀ISP插值單元A的輸出端相連,其輸出端分別與固定碼本搜索單元和最佳基音延遲和增益搜索單元的輸入端相連;所述的最佳基音延遲和增益搜索單元的輸入端分別與目標(biāo)信號(hào)計(jì)算單元、開環(huán)基音搜索以及沖激響應(yīng)計(jì)算單元的輸出端相連,其輸出端輸出基音索引并與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸入端相連;所述的自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸入端與最佳基因延遲和增益上搜索單元的輸出端相連,其輸出端分別與自適應(yīng)碼本濾波器選擇單元和增益量化單元的輸入端相連;所述的自適應(yīng)碼本濾波器選擇單元的輸入端與自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸出端相連,其輸出端輸出濾波器索引并與脈沖響應(yīng)計(jì)算單元的輸入端相連;所述的沖激響應(yīng)計(jì)算單元的輸入端分別與自適應(yīng)碼本濾波器選擇單元、4子幀ISP插值單元A以及4子幀ISP插值單元B的輸出端相連,其輸出端分別與最佳基音延遲和增益搜索單元以及固定碼本搜索單元的輸入端相連;所述的固定碼本搜索單元的輸入端分別與目標(biāo)信號(hào)計(jì)算單元、自適應(yīng)碼本濾波器選擇單元以及沖激響應(yīng)計(jì)算單元的輸出端相連,其輸出端輸出固定碼本增益索引并與增益量化單元的輸入端相連;所述的增益量化單元的輸入端分別與固定碼本搜索單元以及自適應(yīng)碼本貢獻(xiàn)計(jì)算單元的輸出端相連,其輸出端輸出增益索引并與激勵(lì)計(jì)算單元的輸入端相連;所述的激勵(lì)計(jì)算單元的輸入端與增益量化單元的輸出端相連,其輸出端分別與濾波器狀態(tài)更新單元和高頻增益索引計(jì)算單元的輸入端相連;所述的濾波器狀態(tài)更新單元的輸入端與激勵(lì)計(jì)算單元的輸出端相連;所述的高頻增益索引計(jì)算單元的輸入端輸入采樣率為16KHz的寬帶語(yǔ)音并分別與4子幀ISP插值單元和激勵(lì)計(jì)算單元的輸出端相連,其輸出端輸出高頻增益索引。如圖8所示,AMR支持8種編碼模式;如圖9所示AMR-WB支持9種編碼模式。在如下碼流轉(zhuǎn)換的具體步驟中,本發(fā)明以AMR10.20kbps編碼速率到AMR-WB23.85kbps編碼速率下的碼流轉(zhuǎn)換為例進(jìn)行介紹。一種將AMR窄帶碼流轉(zhuǎn)換到AMR-WB寬帶碼流的轉(zhuǎn)換裝置及其方法,在進(jìn)行碼流在線轉(zhuǎn)換之前,對(duì)于一種工作語(yǔ)種需要且僅需要一次“離線”建立轉(zhuǎn)換時(shí)所需的各種映射關(guān)系;碼流轉(zhuǎn)換的具體步驟如下:A、AMR解碼將采樣率為8KHz的語(yǔ)音信號(hào)經(jīng)AMR10.2kbps編碼器進(jìn)行編碼,得到與之對(duì)應(yīng)的窄帶碼流;將該窄帶碼流經(jīng)AMR解碼器進(jìn)行解碼。A1、碼流分離窄帶碼流分離單元將接收到的AMR窄帶碼流根據(jù)圖10所示的比特分配表分離出VAD標(biāo)志、LSP索引、基音索引、增益索引以及固定碼本索引。A2、LSP解碼根據(jù)窄帶碼流分離單元輸出的LSP量化索引,通過(guò)查表可以重建出量化后的LSP矢量。A3、LSP四子幀插值由A2解碼得到的LSP矢量作為第四子幀的LSP系數(shù),并通過(guò)相鄰幀之間LSP系數(shù)的內(nèi)插得到第一、二和第三子幀的LSP系數(shù),內(nèi)插過(guò)程如式(1)、式(2)和式(3)所示。其中,是解碼得到的上一幀第四子幀的LSP系數(shù),是解碼得到當(dāng)前幀第四子幀的LSP系數(shù),以及分別是內(nèi)插得到的當(dāng)前幀第一、二以及三子幀的LSP系數(shù)。A4、LSP轉(zhuǎn)換到A(z)在內(nèi)插得到每一子幀的LSP系數(shù)之后,需要將其轉(zhuǎn)換到線性預(yù)測(cè)系數(shù)ai(i=1,2,…,10)。循環(huán)變量i取值范圍從1到5,每次增加1。每次變量i循環(huán)時(shí)①f1(i)=-2q2i-1f1(i-1)+2f1(i-2)。②循環(huán)變量j取值范圍從i-1到1,每次循環(huán)變量j循環(huán)時(shí),執(zhí)行f1[i]=f1[i-1](j)-2q2i-1f1[i-1](j-1)+f1[i-1](j-2)操作。其中,f1(0)=1,f1(-1)=0。將q2i-1替換成q2i即可得到f2(i)。A5、自適應(yīng)碼本解碼A51、基音周期解碼根據(jù)A1分離出的基音索引P1來(lái)尋找基音周期T1的整數(shù)部分和分?jǐn)?shù)部分。通過(guò)P1/P3獲取第一/三子幀基音周期的整數(shù)部分int(T1)/int(T1)和分?jǐn)?shù)部分frac1/frac3的步驟如下:第二/四子幀基音周期的整數(shù)部分和分?jǐn)?shù)部分通過(guò)tmin2/tmin4獲得,其中,tmin2/tmin4可以通過(guò)如下的遞推關(guān)系得到:則,第二/四子幀的基音周期T2/T4為:int(T2)=(P2+2)/3-1+tmin(10)frac2=P2-2-3((P2+2)/3-1)(11)int(T4)=(P4+2)/3-1+tmin(12)frac4=P4-2-3((P4+2)/3-1)(13)A52、自適應(yīng)碼本解碼解碼得到基音周期后,可以通過(guò)內(nèi)插過(guò)去的激勵(lì)u(n)得到自適應(yīng)嗎本矢量v(n):其中,內(nèi)插濾波器(截止頻率為3.6KHz)b60是在±59處截?cái)嗟臐h明窗截取樣函數(shù)sin(x)/x得到,b60=0。A6、固定碼本解碼根據(jù)A1分離出的固定碼本索引可以得到固定碼本的脈沖位置、符號(hào)以及固定碼本矢量。若該子幀基音周期整數(shù)部分小于子幀長(zhǎng)度40,則需要修正固定碼本矢量其中,是A71解碼得到自適應(yīng)碼本增益。A7、增益解碼A71、自適應(yīng)碼本增益解碼根據(jù)A1分離出的增益索引從相應(yīng)的量化表中查找相應(yīng)的自適應(yīng)碼本增益和固定碼本增益修正因子A72、固定碼本增益解碼首先,計(jì)算預(yù)測(cè)能量然后,計(jì)算平均固定碼本能量則,預(yù)測(cè)增益為;其中,是固定碼本的平均能量,在10.20kbps編碼速率下為33。最后,量化后的固定碼本增益為:A8、激勵(lì)信號(hào)重建激勵(lì)信號(hào)u(n)可以由自適應(yīng)碼本激勵(lì)和固定碼本激勵(lì)通過(guò)式(19)計(jì)算得到:根據(jù)自適應(yīng)碼本的貢獻(xiàn)對(duì)激勵(lì)信號(hào)進(jìn)行修正:自適應(yīng)增益控制(AGC)用來(lái)補(bǔ)償未加重激勵(lì)u(n)和預(yù)加重激勵(lì)之間的增益差,預(yù)加重激勵(lì)的增益縮放因子η為:則增益縮放后的預(yù)加重激勵(lì)信號(hào)為A8、合成濾波一子幀(40個(gè)采樣點(diǎn))的重構(gòu)語(yǔ)音為A9、后置濾波A8得到的重構(gòu)語(yǔ)音需要通過(guò)一個(gè)后置濾波器,該濾波器是共振峰后置濾波器和譜傾斜補(bǔ)償濾波器的級(jí)聯(lián)。后置濾波器需要每5ms修改一次。其中,共振峰濾波器Hf(z)為其中,為線性預(yù)測(cè)的逆濾波器,γn和γd用來(lái)控制共振峰后置濾波器的階數(shù)。譜傾斜補(bǔ)償濾波器Ht(z)為Ht(z)=1-μz-1(26)其中在10.20kbit/s編碼速率下,γn=0.7,γd=0.75,B、參數(shù)提取B1、VAD標(biāo)志提取A1碼流分離出的前8個(gè)比特即為所需的VAD標(biāo)志B2、LSP提取所需的LSP為A3LSP四子幀插值的結(jié)果。B3、基音提取所需的開環(huán)基音周期為A51解碼得到的第一、三子幀基音周期的整數(shù)部分。B4、固定碼本提取所需的固定碼本是A6解碼得到的固定碼本脈沖位置。B5、窄帶語(yǔ)音能量計(jì)算計(jì)算每一幀合成語(yǔ)音的對(duì)數(shù)域能量nb_ener_log,計(jì)算過(guò)程如下:nb_ener_log=log2(nb_ener)(31)其中,L_FRAME為語(yǔ)音幀的幀長(zhǎng),在AMR里L(fēng)_FRAME=160。寬帶參數(shù)擴(kuò)展C1、VAD參數(shù)擴(kuò)展由于VAD參數(shù)主要是用來(lái)表征話音有無(wú)的,與帶寬無(wú)關(guān),所以將AMR解碼得到的VAD參數(shù)直接映射到AMR-WB的編碼端,從而省去了編碼端VAD參數(shù)的計(jì)算。C、C2、ISP參數(shù)擴(kuò)展將窄帶語(yǔ)音解碼得到的10維LSP參數(shù)通過(guò)F1訓(xùn)練得到SVR模型進(jìn)行預(yù)測(cè),預(yù)測(cè)器的輸出即為16維的ISP參數(shù)C3、開環(huán)基音周期擴(kuò)展由于,10.20kbps編碼速率下的AMR與23.85kbps編碼速率下的AMR-WB基音周期的分辨率不同;所以,若采用基音周期的直接擴(kuò)展將會(huì)引起合成語(yǔ)音質(zhì)量的嚴(yán)重下降。因此,對(duì)于該參數(shù)的擴(kuò)展需要借助AMR解碼器輸出的合成語(yǔ)音,以及AMR-WB的基因周期搜索過(guò)程。首先,將AMR解碼器端得到的第一/三子幀的開環(huán)基音周期作為F22訓(xùn)練得到的映射函數(shù)輸入:Top1_wb=T01*0.819+31.452,(32)Top3_wb=T03*0.728+30.339,(33)這里,Top1_wb/Top3_wb即為與之對(duì)應(yīng)的寬帶語(yǔ)音第一/三子幀的開環(huán)基音周期;為了保證合成語(yǔ)音質(zhì)量,沒有將該參數(shù)直接作為寬帶語(yǔ)音開環(huán)基音搜索的結(jié)果,而是通過(guò)該參數(shù)來(lái)限制開環(huán)基音周期搜索的頻率范圍,這樣在保證語(yǔ)音質(zhì)量的同時(shí),降低了開環(huán)基音搜索的計(jì)算量。具體實(shí)現(xiàn)過(guò)程是:將映射得到的開環(huán)基音周期減去一個(gè)常數(shù)作為開環(huán)基音周期搜索的下界;而將開環(huán)基音周期加上一個(gè)常數(shù)作為開環(huán)基音周期搜索的上界。該常數(shù)的選擇需要在計(jì)算量和語(yǔ)音質(zhì)量之間做一個(gè)折中:大的搜索范圍意味著較高的合成語(yǔ)音質(zhì)量和較大的計(jì)算量,小的搜索范圍意味著較低的合成語(yǔ)音質(zhì)量和較小的計(jì)算量。在本發(fā)明中,該常數(shù)設(shè)為2.C4、高頻增益索引擴(kuò)展高頻增益索引的擴(kuò)展時(shí)通過(guò)函數(shù)映射實(shí)現(xiàn)的。將AMR解碼端得到的窄帶語(yǔ)音能量作為F4訓(xùn)練得到的映射函數(shù)的輸入,所得到的函數(shù)值即為寬帶語(yǔ)音的高頻增益索引值。C5、寬帶固定碼本擴(kuò)展AMR10.20kbps與AMR-WB23.85kbps的固定碼本結(jié)構(gòu)相差較多,且這種CELP的編碼模式對(duì)于固定碼本的誤差非常敏感,所以,為了保證合成語(yǔ)音的質(zhì)量,采用的是同開環(huán)基音周期擴(kuò)展相同的方法。首先,將AMR解碼得到的窄帶固定碼本進(jìn)行碼本搜索,得到窄帶碼本索引;然后,將該索引映射到與之對(duì)應(yīng)的寬帶固定碼本(此處的映射碼本由F3訓(xùn)練得到),將索引所在的行矢量輸出,即為與窄帶對(duì)應(yīng)的寬帶固定碼本。為了使合成語(yǔ)音質(zhì)量降低不嚴(yán)重,根據(jù)映射得到的寬帶碼本,求取每個(gè)軌道脈沖位置的最大,最小值,該步的算法流程圖如圖11所示。軌道脈沖位置確定以后,當(dāng)AMR-WB編碼器搜索每個(gè)軌道脈沖的時(shí)候,不再進(jìn)行16個(gè)位置的全搜索,而只需要搜索該軌道脈沖位置最大和最小值之間的位置。該方法在保證語(yǔ)音質(zhì)量下降不明顯的前提下,有效地縮減了脈沖搜索的范圍,從而降低了固定碼本搜索的計(jì)算量。D、寬帶參數(shù)部分編碼D1、ISP編碼D11、ISP到ISF轉(zhuǎn)化將C2得到的ISP參數(shù)利用式(31)轉(zhuǎn)換成ISF系數(shù)fi(i=0,1,…,15)其中,fs=12800kHz為采樣率。D14、ISF量化假設(shè)z(n)是第n幀去均值后的ISF矢量,則預(yù)測(cè)殘差矢量r(n)可表示為r(n)=z(n)-p(n)(35)其中,p(n)是第n幀根據(jù)式(5.10)預(yù)測(cè)得到的LSF矢量其中,是上一幀的量化殘差矢量。使用分裂多階失量量化器對(duì)r(n)進(jìn)行量化。首先,將矢量r(n)分成9維的矢量r1(n)和7維的矢量r2(n)。然后,通過(guò)兩級(jí)操作對(duì)兩個(gè)子矢量進(jìn)行量化。在第一級(jí)操作過(guò)程中,對(duì)r1(n)和r2(n)進(jìn)行8bit量化;在第二級(jí)操作過(guò)程中,對(duì)兩個(gè)子矢量進(jìn)行二次分裂后根據(jù)編碼模式進(jìn)行量化。D2、基音周期編碼D21、ISP四子幀插值將C2擴(kuò)展得到的ISP作為第四子幀ISP,根據(jù)當(dāng)前幀第四子幀的ISP系數(shù)q4和前一幀第四子幀的ISP系數(shù)q4(n-1),插值得到當(dāng)前幀第1、2、3子幀的ISP系數(shù)。插值過(guò)程同A3。在內(nèi)插得到每一子幀的ISP系數(shù)之后,需要將其按照A4所述的步驟轉(zhuǎn)換到線性預(yù)測(cè)系數(shù)ai(i=1,2,…,16)。D22、計(jì)算加權(quán)語(yǔ)音將升采樣后的合成語(yǔ)音通過(guò)式(37)所示的感知加權(quán)濾波器:W(z)=A(z/γ1)Hde-emph(37)其中,其中,β1=0.68。對(duì)于長(zhǎng)度為L(zhǎng)的子幀,加權(quán)語(yǔ)音sW(n)為:D23、開環(huán)基音周期搜索第一子幀加權(quán)語(yǔ)音的相關(guān)函數(shù)為:第三子幀加權(quán)語(yǔ)音的相關(guān)函數(shù)為:其中,w(d)是加權(quán)函數(shù)。開環(huán)基音周期就是使得C1(d)/C3(d)最大的d值。w(d)=wl(d)wn(d),(43)wl(d)=cw(d),(44)其中,cw(d)的取值見定點(diǎn)計(jì)算描述表。開環(huán)基音增益g的計(jì)算公式為:其中,dmax是使得C(d)取最大值的基音延遲;Told是前5個(gè)半幀的基音延遲的中值濾波值。v是自適應(yīng)因子。如果當(dāng)前幀的開環(huán)基音增益g>0.6,則認(rèn)為該幀是濁音幀,下一幀的v設(shè)為1.0;否則,v=0.9v。D24、量化后的ISP系數(shù)4子幀差值將ISF量化單元輸出的量化后的ISF系數(shù)通過(guò)式(46)轉(zhuǎn)換到ISP系數(shù),量化后的LSP系數(shù)4子幀插值過(guò)程同D21。D25、ISP系數(shù)到線性預(yù)測(cè)系數(shù)轉(zhuǎn)換在內(nèi)插得到每一子幀的ISP系數(shù)之后,需要將其轉(zhuǎn)換到線性預(yù)測(cè)系數(shù)ISP系數(shù)qi(i=1,2,…,16)到線性預(yù)測(cè)系數(shù)ai(i=1,2,…,16)的轉(zhuǎn)換過(guò)程如下:在已知內(nèi)插的ISP系數(shù)的前提下,可以通過(guò)式(84)和(85)得到F1(z)和F2(z),用qi(i=1,2,…,16)可以迭代計(jì)算f1(z)初始值為f1(0)=0,f1(1)=-2q0。同理,用q2i-1代替q2i-2,m/2-1代替m/2且f2(0)=1,f2(1)=-2q1,可以計(jì)算得到f2(z)。在獲得f1(z)和f2(z)之后,將F2(z)乘以1-z-2可以得到F2'(z)f′2(i)=f2(i)-f2(i-2),i=2,…,m/2-1(47)f1'(i)=f1(i),i=0,…,m/2(48)則,線性預(yù)測(cè)系數(shù)ai(i=1,2,…,16)為D26、自適應(yīng)碼本目標(biāo)信號(hào)計(jì)算線性預(yù)測(cè)殘差信號(hào)r(n)為:則,自適應(yīng)碼本搜索的目標(biāo)信號(hào)x(n)是通過(guò)合成濾波器和加權(quán)濾波器A(z/γ1)Hde_exph(z)的輸出。D27、脈沖響應(yīng)計(jì)算在AMR-WB編碼中要計(jì)算的脈沖響應(yīng)h(n)是指感知加權(quán)合成濾波器的單位脈沖響應(yīng)。D28、閉環(huán)基音搜索閉環(huán)基音搜索準(zhǔn)則是使原始語(yǔ)音和重構(gòu)語(yǔ)音之間均方加權(quán)誤差最小,即使Tk最大,Tk為:其中,x(n)是D25得到目標(biāo)信號(hào),yk(n)是濾波激勵(lì),其表達(dá)式為:yk(n)=y(tǒng)k-1(n-1)+u(-k)h(n)(53)其中,u(n),n=-(231+17),…,63是激勵(lì)緩沖器的值;h(n)是感知加權(quán)合成濾波器的脈沖應(yīng)。在搜索階段,u(n),n=0,…,63是未知的,只有當(dāng)基音延遲小于64的時(shí)候才需要。為了簡(jiǎn)化搜索,將線性預(yù)測(cè)殘差存在u(n)里使得(52)所示的關(guān)系對(duì)所有延時(shí)有效。確定最佳整數(shù)基音周期后,在該基音周期附近的分?jǐn)?shù)從-3/4到3/4以步長(zhǎng)1/4作測(cè)試。內(nèi)插Tk,并搜索其最大值得到分?jǐn)?shù)基音周期。D3、基音周期增益分?jǐn)?shù)延遲確定后,在給定段內(nèi)插過(guò)去的激勵(lì)信號(hào)u(n)得到v′(n)。該內(nèi)插操作是通過(guò)兩個(gè)FIR濾波器實(shí)現(xiàn)的,其中一個(gè)是在±17處截?cái)嗟臐h明窗截取樣函數(shù),另一個(gè)是在±63處截?cái)嗟臐h明窗截取樣函數(shù)。自適應(yīng)碼本v(n)為:其中,bLP=[0.18,0.64,0.18]。則自適應(yīng)碼本增益gp為:其中,x(n)是目標(biāo)信號(hào),y(n)=v(n)*h(n)是自適應(yīng)碼本矢量濾波后的結(jié)果。D4、固定碼本搜索D41、自適應(yīng)碼本貢獻(xiàn)計(jì)算自適應(yīng)碼本貢獻(xiàn)為y(n)=y(tǒng)(n)*h(n)(57)D42、固定碼本搜索目標(biāo)信號(hào)固定碼本搜索目標(biāo)信號(hào)x2(n)為如果ck是第k個(gè)固定碼本矢量,使Qk最大的矢量即為所求,其中,H為對(duì)角線元素為h(0)的下三角Toeplitz卷積矩陣,且對(duì)角線一次往下的元素是h(1),…,h(63);其中,mi是第i個(gè)脈沖的位置,ai為其幅度,Np=24為23.85kbps編碼速率下的脈沖個(gè)數(shù)。為了簡(jiǎn)化搜索過(guò)程,用適當(dāng)?shù)牧炕盘?hào)b(n)先做幅度脈沖符號(hào)的預(yù)判決其中,rLTP為長(zhǎng)時(shí)預(yù)測(cè)的殘差信號(hào),Er為其能量,Ed為d能量,α為擴(kuò)展因子,編碼速率越大,α越小,在23.85kbps編碼速率下,α=0.5。AMR-WB在23.85編碼速率下的固定碼本搜索流程圖如圖12所示。在進(jìn)行脈沖搜索的時(shí)候只在C5確定的所在軌道脈沖位置最大值最小值之間的搜索。D5、固定碼本增益固定碼本增益gc可以由式(63)給出其中,x2為固定碼本搜索的目標(biāo)矢量,z是固定碼本矢量與感知加權(quán)合成濾波器的脈沖響應(yīng)h(n)的卷積,即其中h(n)=h(n)-βh(n-T),n=T,T-1,…,63(66)其中,T是這一子幀的基音分?jǐn)?shù)延時(shí)的最大整數(shù)部分,β為量化后的基音增益。D5、基音增益和固定碼本增益量化在23.85kbps編碼速率下,基音增益和固定碼本增益的量化是通過(guò)7-bit碼本實(shí)現(xiàn)的。固定碼本增益的量化是由系數(shù)固定的MA預(yù)測(cè)器。4階MA預(yù)測(cè)器是在固定能量E(n)上實(shí)現(xiàn)的,其中,c(i)是固定碼本激勵(lì),為固定碼本能量。預(yù)測(cè)能量為:其中,[b1b2b3b4]=[0.5,0.4,0.3.0.2]為MA預(yù)測(cè)器系數(shù),E(1)、E(2)、E(3)、E(4)分別為當(dāng)前幀第1、2、3、4子幀的固定能量,E(-1)、E(-2)、E(-3)、E(-4)分別為前一幀第1、2、3、4子幀的固定能量。預(yù)測(cè)固定碼本增益g`c可以通過(guò)預(yù)測(cè)能量計(jì)算得到,具體實(shí)現(xiàn)如下:首先,計(jì)算平均固定能量Ei則,預(yù)測(cè)的固定碼本增益g′c為定義γ為gc和g′c之間的修正因子定義預(yù)測(cè)誤差為R(n),則有在23.85kbps編碼速率下,基音周期增益gp和修正因子γ用7比特碼本進(jìn)行聯(lián)合矢量量化,既由gp和γ構(gòu)成一個(gè)二維矢量[gp,γ]T,然后進(jìn)行碼本增益搜索。增益碼本的搜索就是通過(guò)是原始語(yǔ)音和重建語(yǔ)音的均方誤差最小其中,x是目標(biāo)矢量,y為濾波后的自適應(yīng)碼本矢量,z為濾波后的固定碼本矢量。E、寬帶碼流生成將C和D擴(kuò)展得到的各參數(shù)索引按照?qǐng)D13的順序,寫到碼流中,即可得到與AMR-WB23.85kbps解碼器兼容的寬帶碼流。F、映射關(guān)系訓(xùn)練將與A窄帶語(yǔ)音相對(duì)應(yīng)的,采樣率為16KHz的寬帶語(yǔ)音信號(hào)作為輸入,由AMR-WB編碼器在-dtx模式、23.85kbps的編碼速率下進(jìn)行編碼并提取相關(guān)參數(shù)。F1、ISP系數(shù)映射關(guān)系訓(xùn)練F11、ISP系數(shù)提取F111、預(yù)處理將輸入的采樣率為16KHz的16比特線性PCM語(yǔ)音信號(hào)經(jīng)過(guò)一個(gè)如式(72)所示的高通濾波器和式(73)所示的預(yù)加重處理Hpre_emph=1-0.68z-1(75)F112、加窗和自相關(guān)計(jì)算加窗后的語(yǔ)音信號(hào)sw(n)為sw(n)=w(n)s(n),n=0,1,…,383(76)其中,s(n)為F111預(yù)加重處理后的語(yǔ)音信號(hào),w(n)為其中,L1=256,L2=128。sw(n)的自相關(guān)函數(shù)為將r(k)經(jīng)滯后窗wlag處理使其具有60Hz的帶寬擴(kuò)展,其中,f0=60,fs=12800。此外對(duì)r(0)乘以白噪聲校正因子1.0001。F113、用萊文遜-杜賓算法求解線性預(yù)測(cè)系數(shù)修正后的自相關(guān)函數(shù)為根據(jù)式(78)得到的r′(k)借用萊文遜-杜賓算法可以求得線性預(yù)測(cè)系數(shù)ai(i=1,2,…,16),如式(81)和(82)所示其中,E0=r′(0);求解結(jié)果為:F114、線性預(yù)測(cè)系數(shù)到導(dǎo)譜對(duì)系數(shù)轉(zhuǎn)換為了方便進(jìn)行內(nèi)插和量化,需要將線性預(yù)測(cè)系數(shù)ai(i=1,2,…,16)轉(zhuǎn)換到導(dǎo)譜對(duì)系數(shù)qi(i=1,2,…,16)。ISP系數(shù)定義成差分多項(xiàng)式(80)和(81)的根。F′1(z)=A(z)+z-16A(z-1)(84)F′2(z)=A(z)-z-16A(z-1)(85)可證明這些多項(xiàng)式的所有的解都在單位圓上交替出現(xiàn),F(xiàn)′2有一個(gè)根z=-1(ω=π),有一個(gè)根z=1(ω=0)。通過(guò)定義新的多項(xiàng)式(84)和(85)可以消除這兩個(gè)根:F1(z)=F′1(z)(86)F2(z)=F′2(z)/(1-z-2)(87)其中,F(xiàn)1(z)在單位圓上有8個(gè)共軛根而F2(z)在單位圓上有7個(gè)共軛根,因此,其中,a[16]是最后一個(gè)線性預(yù)測(cè)系數(shù),qi=cos(ωi),ωi是導(dǎo)譜頻率(immittancespectralfrequencies,ISF)并且滿足0<ω1<ω2<…<ω10<π(90)因?yàn)镕1(z)和F2(z)都是對(duì)稱多項(xiàng)式,所以只需要計(jì)算出每個(gè)多項(xiàng)式的前8個(gè)和前7個(gè)系數(shù)以及最后一個(gè)線性預(yù)測(cè)系數(shù)。這些多項(xiàng)式的系數(shù)可以由一下遞推關(guān)系得到fori=0to7f1(i)=ai+am-if2(i)=ai-am-i+f2(i-2)f1(8)=2a8其中,m=16為預(yù)測(cè)器階數(shù),f2(-2)=f2(-1)=0。當(dāng)z=ejω時(shí),則有:F1(ω)=2e-j8ωC1(x)(91)F2(ω)=2e-j7ωC2(x)(92)其中,其中,Tm=cos(mω)是m階Chebyshev多項(xiàng)式。f(i)(i=1,2,…,5)是f1(z)或者f2(z)的系數(shù)。當(dāng)x=cos(ω)時(shí),C(x)的遞推關(guān)系為其中,當(dāng)nf=8時(shí)C(x)=C1(x);當(dāng)nf=7時(shí)C(x)=C2(x)。bnf=f(0),bnf+1=0。至此,已經(jīng)求解得到了寬帶語(yǔ)音的導(dǎo)譜對(duì)系數(shù)qi(i=1,2,…,16)F12、10維LSP參數(shù)到16維ISP參數(shù)映射關(guān)系的訓(xùn)練本專利通過(guò)引入支持向量回歸(SVR)模型,完成從窄帶語(yǔ)音LSP系數(shù)(A2解碼得到)到寬帶語(yǔ)音ISP系數(shù)(F11得到)的預(yù)測(cè)。預(yù)測(cè)的準(zhǔn)確性與預(yù)測(cè)數(shù)據(jù)本身的特性和模型訓(xùn)練過(guò)程的參數(shù)設(shè)置有關(guān),尤其是后者。由于ISP各維之間的相關(guān)性比較弱,所以可以分別進(jìn)行10維LSP到一維ISP的模型訓(xùn)練(共需16次)。本發(fā)明以A2解碼得到的10維LSP到F11得到的第一維ISP為例,介紹SVR模型的訓(xùn)練過(guò)程。首先,要對(duì)A2解碼得到的10維LSP進(jìn)行歸一化。此處歸一化的方法有多種,本專利選用的是按維(列)歸一化。具體實(shí)現(xiàn)過(guò)程如下:(1)分別計(jì)算每一維的最大值maxi其中,frame_num為幀數(shù),表示第j幀第i維的LSP系數(shù)。(2)按維歸一化然后,將歸一化后的frame_num幀10維的LSP系數(shù)作為訓(xùn)練模型的輸入;frame_num幀第一維的ISP系數(shù)(F11得到)作為訓(xùn)練模型的目標(biāo)輸出,由SVR進(jìn)行訓(xùn)練得到模型一個(gè)由10維矢量到一維標(biāo)量的預(yù)測(cè)模型model。本章訓(xùn)練過(guò)程SVR參數(shù)設(shè)置如圖14所示;F2、開環(huán)基音周期映射關(guān)系訓(xùn)練F21、寬帶開環(huán)基音周期提取。F211、ISP系數(shù)到ISF系數(shù)轉(zhuǎn)換同D11。F212、ISF系數(shù)量化同D12。F213、4子幀ISP系數(shù)插值同D21。F214、4子幀量化的ISP系數(shù)插值同D21。F215、ISP系數(shù)到線性預(yù)測(cè)系數(shù)轉(zhuǎn)換同D25。F216、感知加權(quán)同D22。F217、開環(huán)基音搜索同D23。至此,已經(jīng)求解得到了寬帶語(yǔ)音的開環(huán)基音F22、開環(huán)基音周期映射關(guān)系訓(xùn)練分別以A51解碼得到窄帶語(yǔ)音的第一/三子幀的開環(huán)基音周期T01/T03作為函數(shù)輸入,D215搜索得到的寬帶語(yǔ)音的第一/三子幀的開環(huán)基音周期Top1_wb/Top3_wb作為函數(shù)輸出,應(yīng)用最小二乘法擬合LEN幀二者之間的函數(shù)關(guān)系:Twb=cT+d,(97)利用最小二乘法擬合該函數(shù)關(guān)系的系數(shù)化簡(jiǎn)結(jié)果為其中擬合得到的第一子幀之間的映射關(guān)系為Top1_wb=T01*0.819+31.452(100)第三子幀之間的映射關(guān)系為:Top3_wb=T03*0.728+30.339(101)F3、固定碼本映射關(guān)系訓(xùn)練。F31、固定碼本參數(shù)提取。F311、自適應(yīng)碼本目標(biāo)信號(hào)計(jì)算同D26。F312、沖激響應(yīng)計(jì)算同D27。F312、閉環(huán)基音搜索同D28。F31、2閉環(huán)基音搜索同D3。F313、自適應(yīng)碼本貢獻(xiàn)計(jì)算同D41。F314、固定碼本搜索目標(biāo)計(jì)算同D42,只是此處需要搜索脈沖所在軌道的所有位置。F32、固定碼本參數(shù)映射關(guān)系訓(xùn)練在本發(fā)明中寬帶固定碼本擴(kuò)展是通過(guò)碼本映射完成的,所以需要離線建立一對(duì)一一對(duì)應(yīng)的映射碼本。其中窄帶碼本包括A6解碼得到的8維窄帶語(yǔ)音脈沖位置矢量,寬帶碼本包括F314搜索得到的24維寬帶語(yǔ)音脈沖位置矢量。按照先是8維窄帶語(yǔ)音脈沖位置,然后是24維寬帶語(yǔ)音脈沖位置的順序,組合成一個(gè)32維矢量。其中窄碼本生成采用動(dòng)態(tài)聚類中的C-均值算法,寬帶碼本生成采用一種加權(quán)求平均的方法。F321、窄帶碼本生成通過(guò)C-均值聚類方法可以聚類得到低頻包絡(luò)碼本。設(shè)碼本容量(即聚類數(shù))為N,以24維矢量的前8維為聚類對(duì)象進(jìn)行聚類處理,得到每一類的質(zhì)心矢量,所有這些質(zhì)心矢量的集合構(gòu)成低頻碼本。若碼本容量N過(guò)大,則計(jì)算量太大;若N過(guò)小,則碼本增益過(guò)小,恢復(fù)出來(lái)的寬帶語(yǔ)音信號(hào)效果較差。所以需要在計(jì)算復(fù)雜度和擴(kuò)展語(yǔ)音質(zhì)量之間尋求一種折中。在本章中,N取為2048。F322、寬帶碼本生成對(duì)于前8維聚類處理后的每一類,采用加權(quán)求平均的方法來(lái)計(jì)算后24維的中心矢量。該方法具體實(shí)現(xiàn)步驟如下:(1)計(jì)算第i類初始質(zhì)心aver0[i][k]其中,x[j][k]表示一個(gè)28維高頻時(shí)域、頻域包絡(luò)矢量,n為某一類中的高頻時(shí)域、頻域包絡(luò)矢量數(shù),ind[j]表示矢量x[j][k]所在類的類別號(hào)。(2)計(jì)算第j個(gè)矢量x[j][k]與所在類質(zhì)心的距離dist[j](3)計(jì)算第i類中所有矢量與質(zhì)心之間距離倒數(shù)之和w[i](4)計(jì)算第i類新質(zhì)心aver[i][k]其中,Mi是第i類的矢量數(shù)。(5)分別計(jì)算初始質(zhì)心L1范數(shù)sum0和新質(zhì)心L1范數(shù)sum(6)判斷每一類新質(zhì)心和初始質(zhì)心之間的距離是否小于預(yù)定門限T,即是否滿足式(108)若式(108)不滿足,則令aver0[i][k]=aver[i][k],并返回到步驟(2),直到所有分類質(zhì)心都滿足式(108)。迭代結(jié)束之后,所得到的質(zhì)心即為高頻時(shí)域包絡(luò)以及頻域包絡(luò)聚類質(zhì)心,所有這些質(zhì)心組成高頻包絡(luò)碼本。在高頻碼本生成過(guò)程中,門限T的選擇相當(dāng)重要,若T太大,則不能有效減少一些特殊點(diǎn)對(duì)質(zhì)心的影響;若T太小,則計(jì)算量會(huì)明顯增大。因?yàn)?,在本發(fā)明中,碼本生成過(guò)程是離線進(jìn)行的,所以T可以選的盡可能小F4、高頻增益索引映射關(guān)系訓(xùn)練F41、高頻增益索引提取F411、固定碼本增益計(jì)算同D5F412、基音增益計(jì)算同D3F413、增益量化同D6F414、激勵(lì)計(jì)算當(dāng)前幀的激勵(lì)信號(hào)u(n)為其中,和分別為F413中量化后的基音增益和固定碼本增益。F415、高頻增益計(jì)算在23.85kbps編碼速率下,高頻增益gHB為其中,sHB(i)為輸入寬帶語(yǔ)音經(jīng)帶通濾波器(通帶為6.4到7KHz)濾波結(jié)果,sHB2(i)為高頻帶激勵(lì)信號(hào)uHB2(i)經(jīng)高頻帶合成濾波器AHB(i)濾波的結(jié)果由采樣率為12.8KHz的信號(hào)分析得到,而解碼的是16KHz的信號(hào),所以其中,F(xiàn)R12.8(f)為的頻響。這說(shuō)明12.8KHz采樣率下的5.1KHz-5.6KHz將會(huì)映射成16KHz采樣率下的6.4-7.0KHz。F42、高頻增益索引映射關(guān)系訓(xùn)練窄帶語(yǔ)音能量與高頻增益索引的映射關(guān)系,可以由F22所介紹的最小二乘法進(jìn)行線性擬合得出。將B5得到的窄帶語(yǔ)音能量nb_ener_log作為輸入,F(xiàn)415得到的高頻增益索引gHB作為輸出,利用最小二乘法進(jìn)行線性擬合,可以得到二者之間的映射關(guān)系為:gHB=0.535nb_ener_log+1310.7(113)以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。