專利名稱:一種在語音信道傳輸非語音數(shù)據(jù)的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種移動通信方法與裝置,尤其涉及一種在蜂窩移動通信系統(tǒng)的語音信道中適時地傳輸非語音數(shù)據(jù)的方法及裝置。
背景技術(shù):
在目前的第二代或第三代移動通信系統(tǒng)中,語音(speech)信號通過語音信道進行傳輸,而非語音的數(shù)據(jù)則通過專用的數(shù)據(jù)信道進行傳輸,兩者相互獨立。
附
圖1顯示了在兩個常規(guī)的GSM移動終端之間傳輸語音信號的處理流程示意圖。如圖所示,在發(fā)送方移動終端中,待發(fā)射的語音信號通過模數(shù)轉(zhuǎn)換單元10的模數(shù)轉(zhuǎn)換處理和語音壓縮單元20的語音壓縮處理,以及發(fā)送方無線子系統(tǒng)93中的信道編碼單元30的信道編碼處理和調(diào)制發(fā)射單元40的調(diào)制處理后,發(fā)射到網(wǎng)絡(luò)系統(tǒng)。而在接收方移動終端中,來自網(wǎng)絡(luò)系統(tǒng)的語音信號通過接收方無線子系統(tǒng)96中的接收解調(diào)單元50的解調(diào)處理以及信道解碼單元60的信道解碼處理后,再經(jīng)過語音解壓縮單元70的解壓縮處理和數(shù)模轉(zhuǎn)換單元80的數(shù)模轉(zhuǎn)換處理就得到了發(fā)送方移動終端發(fā)送的原始語音信號。
附圖2是常規(guī)的用于GSM全速率語音業(yè)務(wù)的語音處理單元的方框圖,圖中的語音處理單元不僅包括用于發(fā)送數(shù)據(jù)的語音壓縮單元20的功能模塊,而且還包括用于接收數(shù)據(jù)的語音解壓縮單元70的功能模塊。此外,為了描述收發(fā)語音信號過程的完整性,在圖2中還包含了模數(shù)轉(zhuǎn)換單元10、發(fā)送方無線子系統(tǒng)93、接收方無線子系統(tǒng)96和數(shù)模轉(zhuǎn)換單元80。
如附圖2所示,發(fā)送方不連續(xù)發(fā)射處理單元90包括語音編碼器901(在GSM 06.10規(guī)范中定義)、發(fā)送方不連續(xù)發(fā)射控制和操作單元902(在GSM 06.31規(guī)范中定義)、語音激活檢測器903(在GSM06.32規(guī)范中定義)以及發(fā)送方舒適噪聲單元904(在GSM 06.12規(guī)范中定義)。而接收方不連續(xù)發(fā)射處理單元100包括接收方不連續(xù)發(fā)射控制和操作單元1001(在GSM 06.31規(guī)范中定義)、語音解碼器1002(在GSM 06.10規(guī)范中定義)、語音幀替換單元1003(在GSM06.11規(guī)范中定義)以及接收方舒適噪聲單元1004(在GSM 06.12規(guī)范中定義)。
在GSM全速率語音業(yè)務(wù)中,語音激活檢測(VAD)是實現(xiàn)不連續(xù)發(fā)射機制的一個重要模塊,它決定著何時輸出含有語音信息的語音幀,何時輸出用來生成背景噪音的靜音幀(SID幀)。
在附圖2中,語音激活檢測器903實際上可以被看作是一個能量檢測器,它利用由語音編碼器901提供的參數(shù)來調(diào)節(jié)自身的VAD閾值,然后根據(jù)來自語音編碼器901的信號計算得到當前語音信號的能量,并將該語音信號能量與該VAD閾值進行比較。如果語音信號的能量高于VAD閾值,則VAD標志=1,表示當前語音有效,不連續(xù)發(fā)射控制和操作單元902在該語音激活期內(nèi),將來自語音編碼器901的語音幀發(fā)送給發(fā)送方無線子系統(tǒng)(RSS)93;否則VAD標志量=0,表示無語音傳遞,則不連續(xù)發(fā)射控制和操作單元902在該非語音激活期內(nèi),將來自發(fā)送方舒適噪聲單元904的用于生成背景噪音的靜音幀發(fā)送給發(fā)送方無線子系統(tǒng)93。
在移動環(huán)境中,背景噪音的能量有可能會持續(xù)變化,因而,VAD的閾值也需要隨之調(diào)整,以使得語音激活檢測器903能夠適時地正確區(qū)分語音信號和背景噪音信號。為了提供準確的檢測結(jié)果,調(diào)整后的VAD閾值必須高于背景噪音信號的能量,才能避免將噪音信號誤判為語音信號的情況發(fā)生。但是,VAD閾值的調(diào)整也不能過高,否則低功率的語音信號就會被視為噪音信號而被丟棄。
利用VAD檢測方法實現(xiàn)的DTX技術(shù),不僅減少了不必要的無線發(fā)送,從而減少了無線系統(tǒng)內(nèi)的無線干擾,而且在非語音激活期間內(nèi),發(fā)送方、接收方與網(wǎng)絡(luò)系統(tǒng)之間的信道處于低速率傳輸狀態(tài),此時,若利用語音信道來傳輸非語音數(shù)據(jù),則不僅不會影響到正常的語音通信,而且還能夠充分利用無線資源。這些經(jīng)由語音信道傳輸?shù)姆钦Z音數(shù)據(jù),也被稱為帶內(nèi)數(shù)據(jù)(IBDIn Band Data)。在本發(fā)明中,帶內(nèi)數(shù)據(jù)包括除語音數(shù)據(jù)以外的各種信息,如圖象數(shù)據(jù)、控制信令等。
在與本申請同時提交的申請人為皇家飛利浦電子股份有限公司、且申請人案卷號為CN030037、申請?zhí)枮椋撸撸撸撸撸叩念}為“一種在語音信道傳輸非語音數(shù)據(jù)的方法及裝置”的專利申請文件中,提出了一種在非語音激活期間內(nèi)利用語音信道傳遞非語音數(shù)據(jù)的方法,在此以插入的方式,引入該申請中披露的技術(shù)內(nèi)容。
在該申請中,可以采用三種形式的帶內(nèi)數(shù)據(jù)幀(IBD frame)來傳輸非語音數(shù)據(jù)。以下,將結(jié)合附圖3,對該修改后的能夠在語音信道傳輸非語音數(shù)據(jù)的語音處理單元進行描述。
圖3所示的修改后的語音處理單元,在發(fā)送方不連續(xù)發(fā)射處理單元90中,增加了用于存儲欲發(fā)射的帶內(nèi)數(shù)據(jù)幀的發(fā)送緩存905,以及用于表明發(fā)送緩存905中是否存有帶內(nèi)數(shù)據(jù)幀的發(fā)送帶內(nèi)數(shù)據(jù)標志SendIBDFlag。當上層應(yīng)用經(jīng)由數(shù)據(jù)接口將欲發(fā)送的帶內(nèi)數(shù)據(jù)幀存入發(fā)送緩存905中時,SendIBDFlag置為1,以表示發(fā)送緩存905內(nèi)存有欲發(fā)送的IBD幀;當緩存的IBD幀按照發(fā)送方不連續(xù)發(fā)射控制和操作單元902中的排隊算法,被發(fā)送給發(fā)送方無線子系統(tǒng)93后,SendIBDFlag置為0,以表示發(fā)送緩存905內(nèi)沒有待發(fā)數(shù)據(jù)。在接收方不連續(xù)發(fā)射處理單元100中,對接收方不連續(xù)發(fā)射控制和操作單元1001進行了適應(yīng)性修改,以識別具有不同幀結(jié)構(gòu)的三種IBD幀;增加了用于存儲收到的IBD幀的接收緩存1005,以及用于表明該接收緩存1005中是否存有IBD幀的接收帶內(nèi)數(shù)據(jù)標志ReceiveIBDFlag。當ReceiveIBDFlag=1時,表明收到了IBD幀,則上層應(yīng)用經(jīng)由數(shù)據(jù)接口讀取該緩存的IBD幀,并根據(jù)該IBD幀的不同構(gòu)成,將該IBD幀解讀為對應(yīng)的非語音數(shù)據(jù);當ReceiveIBDFlag=0時,表示接收緩存1005中沒有緩存的IBD幀。
當有IBD幀欲發(fā)送時,在發(fā)送方,若VAD標志=1,則TX-DTX控制器按照常規(guī)通信協(xié)議中的規(guī)定處理并傳送語音幀;若VAD標志=0,且SendIBDFlag=0,則按照常規(guī)通信協(xié)議中的規(guī)定處理并傳送靜音幀;當VAD標志=0(非語音激活期),且SendIBDFlag=1,則發(fā)送IBD幀。在接收方,當收到一個傳送的幀時,RX-DTX控制器根據(jù)標志BFI、SID、TAF對接收到的信息碼流進行分類,然后分別將語音幀、靜音幀和IBD幀送入各自的處理模塊。
在該專利申請中,提供了欲在語音信道內(nèi)傳輸IBD幀時,IBD幀的構(gòu)建、存儲和發(fā)送方法,以及接收該IBD幀時的IBD幀的識別、存儲和讀取方法。
發(fā)明內(nèi)容
本發(fā)明是在上述專利申請的基礎(chǔ)上,進一步提出了一種根據(jù)需要,如帶內(nèi)數(shù)據(jù)發(fā)送的緊急程度或帶內(nèi)數(shù)據(jù)發(fā)送的優(yōu)先級別,經(jīng)由語音信道發(fā)送帶內(nèi)數(shù)據(jù)幀的方法。
本發(fā)明的目的是提供一種在語音信道傳輸非語音數(shù)據(jù)的方法和裝置,采用該方法和裝置,通過選擇帶內(nèi)數(shù)據(jù)幀發(fā)送指示生成的模式,可以根據(jù)不同需要,例如帶內(nèi)數(shù)據(jù)要求發(fā)送的緊急程度,適時地發(fā)送帶內(nèi)數(shù)據(jù)信息。
按照本發(fā)明的一種用于一個移動終端的在語音信道傳輸非語音數(shù)據(jù)的方法,包括步驟根據(jù)預先設(shè)定的非語音數(shù)據(jù)幀發(fā)送指示生成模式,生成一個非語音數(shù)據(jù)幀發(fā)送指示;根據(jù)該非語音數(shù)據(jù)幀發(fā)送指示,產(chǎn)生關(guān)于下一幀的一個語音激活檢測(VAD)標志;若該VAD標志表示該下一幀為非語音激活期間,則在該下一幀發(fā)送該非語音數(shù)據(jù)幀。
其中的非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為當存在所述欲發(fā)送的非語音數(shù)據(jù)幀時,生成即刻發(fā)送所述非語音數(shù)據(jù)幀的發(fā)送指示;也可以設(shè)定為當所述欲發(fā)送的非語音數(shù)據(jù)幀的發(fā)送期限到期時,生成即刻發(fā)送所述非語音數(shù)據(jù)幀的發(fā)送指示;還可以設(shè)定為將所述欲發(fā)送的非語音數(shù)據(jù)幀的數(shù)目對應(yīng)于所述的優(yōu)先級別,并根據(jù)所述非語音數(shù)據(jù)幀的數(shù)目,生成所述非語音數(shù)據(jù)幀發(fā)送指示;以及設(shè)定為將所述欲發(fā)送的非語音數(shù)據(jù)幀的緊迫程度對應(yīng)于所述的優(yōu)先級別,并根據(jù)所述非語音數(shù)據(jù)幀的緊迫程度,生成所述非語音數(shù)據(jù)幀發(fā)送指示。
附圖簡述以下將通過參考附圖和結(jié)合實施例,對本發(fā)明進行更加詳細地解釋說明,其中圖1是在兩個常規(guī)GSM移動終端之間傳輸語音信號的示意圖;圖2是常規(guī)用于GSM全速率語音業(yè)務(wù)的語音處理單元的方框圖;圖3是在GSM全速率語音業(yè)務(wù)中支持帶內(nèi)數(shù)據(jù)在語音信道中傳輸?shù)恼Z音處理單元的方框圖;圖4是按照本發(fā)明,當考慮帶內(nèi)數(shù)據(jù)發(fā)送緊急程度時,發(fā)送方的TX-DTX功能模塊示意圖;圖5是按照本發(fā)明,當考慮帶內(nèi)數(shù)據(jù)發(fā)送緊急程度時,語音激活檢測器VAD的功能模塊示意圖;圖6是按照本發(fā)明,當考慮帶內(nèi)數(shù)據(jù)發(fā)送緊急程度時,調(diào)整VAD閾值的示意圖;圖7是按照本發(fā)明,需要即刻發(fā)送帶內(nèi)數(shù)據(jù)時對VAD閾值進行調(diào)整的流程圖;圖8是按照本發(fā)明,根據(jù)帶內(nèi)數(shù)據(jù)發(fā)送的優(yōu)先級進行VAD閾值調(diào)整的流程圖。
在附圖中,相同的標號表示相似或?qū)?yīng)的特征或功能。
發(fā)明詳述如上所述,在圖3所示的發(fā)送方不連續(xù)發(fā)射處理單元(TX-DTX)中,語音幀、靜音幀、IBD幀的發(fā)送是通過語音激活檢測器903生成的VAD標志進行切換的,因而,可以從VAD標志的生成入手,通過控制生成的VAD標志值,選擇IBD幀發(fā)送的時機。
附圖4為按照本發(fā)明,用于考慮到例如帶內(nèi)數(shù)據(jù)發(fā)送的緊急程度時,TX-DTX處理器的組成示意圖。在附圖4的TX-DTX處理器610中,增添了一個由發(fā)送緩存905提供給語音激活檢測器612的IBD指示值(indicator),該IBD指示值可以表示例如當前IBD幀發(fā)送的緊急程度。
附圖5所示為該語音激活檢測器612的具體組成。按照通信協(xié)議中的規(guī)定,非語音激活期的判斷條件是在連續(xù)若干信號幀內(nèi)同時滿足一、頻譜穩(wěn)定;二、信號中檢測不到周期性成份;三、沒有出現(xiàn)信息音(information tone)。當滿足非語音激活期的判斷條件時,語音激活檢測器612將根據(jù)當時背景噪音的能量,適時地調(diào)整其VAD的閾值,以輸出正確的VAD標志。為了不影響正常語音信號的傳輸,VAD閾值的調(diào)整應(yīng)當在非語音激活期間進行。以下,將結(jié)合附圖5中的各個功能模塊,具體描述該語音激活檢測器612中的VAD閾值調(diào)整和VAD標志生成的過程。
如圖5所示,圖中ACF參數(shù)是語音編碼器901在編碼過程中生成的信號自相關(guān)系數(shù)(載有信號能量信息)。ACF在自適應(yīng)濾波和能量計算模塊301中,主要用于計算信號能量。
首先,考慮如何判斷當前狀態(tài)是否滿足非語音激活的三個條件。
1、頻域穩(wěn)定條件由于單個20ms長的信號幀所包含的頻域信息不足以表示輸入信號的完整頻譜特性,所以需要利用大于20ms的信息塊進行計算。因此,如圖5所示,ACF首先被送入ACF平均模塊305中,目的就在于對多個連續(xù)信號幀進行平均。ACF的平均量再送入預測計算模塊304,以計算出自相關(guān)預測值ravl。頻譜比較模塊308,根據(jù)自相關(guān)系數(shù)的平均值和該自相關(guān)預測值ravl,計算出輸入信號的頻譜特性,并與上一次計算結(jié)果進行比較,如果前后的差值在預設(shè)的范圍之內(nèi),則表示頻譜穩(wěn)定,否則表示頻域發(fā)生變化。最后,頻譜比較模塊308向自適應(yīng)閾值調(diào)整模塊307提供一個表示頻域穩(wěn)定與否的參數(shù)stat。
2、是否存在周期性成份周期性檢測模塊302,通過對連續(xù)若干子幀的長時預測滯后值N的比較來實現(xiàn)檢測判斷。這里的滯后值N是語音編碼器901在語音編碼過程中通過長時預測計算得到的,表示的是較長時間內(nèi)前后信號幀最大相關(guān)峰的位置。因此,如果前后兩個滯后值中,其一為另一個的因子,則表示滯后存在規(guī)律,信號中必存在周期性成份。檢測結(jié)果由參數(shù)ptch表示,ptch=1表示存在周期性成份。
3、是否存在信息音
信息音的檢測是比較復雜的,因而總是在完成當前信號幀的語音編碼之后,由信息音檢測模塊303進行估算。信息音與環(huán)境噪音的差別在于,信息音具有更高的預測增益。因此,在實際應(yīng)用中,信息音檢測模塊303,對來自語音編碼器901的偏移補償信號sof進行預測處理,將歸一化的預測差值與某一閾值相比較,如果預測差值小于該閾值,表示此幀信號為信息音,參數(shù)tone=1,否則為噪音。
從周期性檢測模塊302、信息音檢測模塊303和頻譜比較模塊308輸出的三個參數(shù)ptch、tone、stat被分別輸送到自適應(yīng)閾值調(diào)整模塊707。在本發(fā)明的語音激活檢測器612中,自適應(yīng)閾值調(diào)整模塊707不僅接收來自周期性檢測模塊302、信息音檢測模塊303和頻譜比較模塊308的三個參數(shù)ptch、tone、stat,進行非語音激活期的判斷,而且還接收來自發(fā)送緩存905的IBD指示值,以根據(jù)例如IBD幀發(fā)送的緊急程度適當?shù)卣{(diào)整自適應(yīng)閾值調(diào)整模塊707輸出的閾值thvad,并將調(diào)整后的VAD閾值thvad傳送給VAD判決模塊306。同時,自適應(yīng)閾值調(diào)整模塊707還將當前信號幀的自相關(guān)預測值rvad輸送給自適應(yīng)濾波和能量計算模塊301,以設(shè)定濾波器的參數(shù)。
VAD判決模塊306,將來自自適應(yīng)濾波和能量計算模塊301的信號幀能量Pvad與來自自適應(yīng)閾值調(diào)整模塊707的調(diào)整后的閾值thvad進行比較。如果信號幀能量高于VAD閾值,則該信號幀承載為有效語音,VAD判決模塊306輸出的VAD標志Vvad為1;否則該信號幀承載的為噪音,VAD判決模塊306輸出的VAD標志Vvad為0。
按照本發(fā)明的閾值調(diào)整過程的示意圖參見附圖6。如圖6所示,閾值判斷過程開始于對IBD指示值的判斷(步驟S801),如果IBD指示值不為零,則表示在下一幀中應(yīng)發(fā)送IBD幀,需要立即調(diào)整VAD閾值,使之滿足發(fā)送數(shù)據(jù)的要求,即執(zhí)行VAD閾值調(diào)整過程1(步驟S802)。如果IBD指示值為零,則表示暫時不發(fā)送IBD幀,流程進入傳統(tǒng)算法的非語音激活條件判斷部分(步驟S503),依次判斷頻譜穩(wěn)定性(步驟S503.a)、是否不包含周期性成份(步驟S503.b)以及是否沒有信息音(步驟S503.c),只有這三個條件同時成立的情況下,才可以進行VAD閾值調(diào)整過程2(步驟S803)。這里需要指出的是在圖6中給出了兩個VAD閾值調(diào)整過程,可以根據(jù)欲發(fā)送數(shù)據(jù)的緊急程度分別采用不同的調(diào)整參數(shù),甚至可以采用完全不同的調(diào)整方法,使得本發(fā)明的閾值調(diào)整方法更加靈活。
在圖6的本發(fā)明新增加的VAD閾值調(diào)整過程1中,IBD指示值劃分為兩類(I)根據(jù)是否需要立即發(fā)送IBD幀,IBD指示值可以被表示為布爾量的形式(即只有0和1兩個取值),例如以1表示即刻發(fā)送IBD幀,0表示不發(fā)送IBD幀;(II)根據(jù)欲發(fā)送的IBD幀的優(yōu)先級別,對應(yīng)于不同的優(yōu)先級別而調(diào)整VAD閾值,并將調(diào)整后的VAD閾值與當前信號幀的能量比較,基于比較結(jié)果再確定是否發(fā)送IBD幀,這種情況下,IBD指示值可以取不同的數(shù)值。
按照本發(fā)明,可以根據(jù)需要,選擇IBD指示值的表示形式,即設(shè)定IBD幀發(fā)送指示生成的模式。
當IBD指示值為布爾量時,在以下兩種情況下可以生成IBD指示值(1)只要一有IBD幀存入發(fā)送緩存905中,發(fā)送緩存905就立刻向語音激活檢測器提供數(shù)值為1的IBD指示值;相反,則發(fā)送緩存905向語音激活檢測器提供數(shù)值為0的IBD指示值。(2)當有IBD幀存入發(fā)送緩存905中時,開始對該IBD幀進行計時,當IBD幀的最后期限或生存時間TTL(TTLTime To Life)到期時才將IBD指示值置為1,否則一直為0,即當存入發(fā)送緩存905中的IBD幀到達發(fā)送時刻時,發(fā)送緩存905向語音激活檢測器提供數(shù)值為1的IBD指示值;相反,若尚未到達IBD發(fā)送時刻,則發(fā)送緩存905向語音激活檢測器提供數(shù)值為0的IBD指示值。用戶終端根據(jù)需要,可以將IBD幀發(fā)送指示生成模式設(shè)定為當存在欲發(fā)送的IBD幀時就生成IBD指示值,或當欲發(fā)送的IBD幀到期時再生成IBD指示值。
當IBD指示值為不同數(shù)值(整數(shù)或小數(shù)值)時,存在以下兩種情況的IBD指示值(1)當IBD指示值表示IBD幀的數(shù)目時,將存儲在發(fā)送緩存905中的IBD幀的數(shù)目對應(yīng)于一定的優(yōu)先級別,不同的IBD幀數(shù)目表示不同的優(yōu)先等級,此時,發(fā)送緩存905將其中緩存的IBD幀的數(shù)目作為IBD指示值提供給語音激活檢測器。(2)當IBD指示值表示IBD幀的發(fā)送緊急程度時,將存儲在發(fā)送緩存905中的IBD幀的發(fā)送的緊迫程度對應(yīng)于一定的優(yōu)先級別,越緊急則優(yōu)先級別越高,此時,發(fā)送緩存905將其中緩存的第一個待發(fā)送的IBD幀的優(yōu)先級數(shù)作為IBD指示值提供給語音激活檢測器。用戶終端根據(jù)需要,可以將IBD幀發(fā)送指示生成模式設(shè)定為用存儲的IBD幀數(shù)目作為IBD指示值,也可以對IBD幀的發(fā)送緊急程度先進行判斷,并將判斷得到的緊急程度作為IBD指示值提供給語音激活檢測器。
以下,將以發(fā)送緩存905內(nèi)是否存在IBD幀和存儲在發(fā)送緩存905中的IBD幀的優(yōu)先級別兩種情況為例,分別描述當IBD指示值分別為布爾量和整數(shù)值時,對應(yīng)的VAD閾值調(diào)整方法。
一、當發(fā)送緩存905中存在待發(fā)送的IBD幀時生成IBD指示值參見附圖7,在發(fā)送端,當一個IBD幀存儲到IBD發(fā)送緩沖區(qū)內(nèi)時,SendIBDFlag置為1,以此標志告訴TX-DTX操作控制模塊,發(fā)送緩存905內(nèi)存有待發(fā)數(shù)據(jù)。這里的SendIBDFlag只表示存在狀態(tài),并不表示該IBD幀是否需要立即發(fā)送,即SendIBDFlag與IBD指示值之間并不一定需要同步,SendIBDFlag與IBD指示值可以取完全不同的數(shù)值。
如圖7所示,首先,判斷當前信號幀的能量是否低于可接受信號的能量下限pth(步驟S501),其中信號幀的能量由信號的自相關(guān)系數(shù)ACF
表示。如果信號幀能量低于下限,則將VAD閾值thvad設(shè)為某一特定值plev(步驟S502)。當信號滿足能量要求時,對IBD指示值進行判斷(步驟S801)。
如果IBD指示值=0,表示無須發(fā)送IBD幀,則按照通信協(xié)議中的規(guī)定,進行非語音激活條件的判斷(步驟S503)。如果當前為語音激活時段,即三個條件沒有同時得到滿足,則此時不能改變閾值,將閾值調(diào)整計數(shù)器(adaptcount)清零(步驟S504),退出該模塊。當滿足非語音激活條件時,閾值調(diào)整計數(shù)器值adaptcount加1(步驟S505)。緊接著,判斷閾值調(diào)整計數(shù)器值adaptcount是否超過預定值adp(步驟S506),以判斷滿足非語音激活條件的時間是否達到了預定的時間,即應(yīng)當在一預定的時段內(nèi),持續(xù)滿足非語音激活條件,才能視作當前確實處于非語音激活期。若計數(shù)器值adaptcount小于預定值adp,則不再進行操作,退出該模塊。若計數(shù)器值adaptcount大于預定值adp,則首先將當前閾值thvad減少一個小量,如1/dec倍的thvad(步驟S507)。然后,經(jīng)過調(diào)整的thvad與當前信號幀能量Pvad的fac倍進行比較(步驟S508),其中fac為事先設(shè)定的常量。若二者相比,thvad較小,則再給閾值增加一個小量,如1/inc倍的thvad,并且在增加后的閾值和fac倍的Pvad之間選擇一個較小值作為下一幀的thvad(步驟S509),此處的inc和dec均為預先設(shè)定的常值,例如8、16或32。接著,判斷調(diào)整后的thvad是否超出了允許的最大限度,這個限度是由當前信號幀能量Pvad再加上一定的余量決定的(步驟S510)。若步驟S508比較結(jié)果為thvad較大,則直接進行步驟S510的操作。如果步驟S510中,閾值thvad超出該最大限度,則將VAD閾值thvad設(shè)定為該最大限度值(步驟S511)。最后,輸出該閾值thvad、自相關(guān)預測值rvad(步驟S512),同時將adaptcount設(shè)為無效值(步驟S513),以避免在一個非語音激活時段內(nèi)反復調(diào)整VAD閾值。
如果IBD指示值=1,如在本實施例中,按照預先規(guī)定,只要發(fā)送緩存905中一存有IBD幀,就立刻發(fā)送該IBD幀,則當有IBD幀存入發(fā)送緩存905中時,發(fā)送緩存905立刻向語音激活檢測器提供IBD指示值=1,流程轉(zhuǎn)到本發(fā)明的VAD閾值調(diào)整算法部分。在本發(fā)明中,為了立刻發(fā)送該IBD幀,但又不影響IBD幀發(fā)送后的后續(xù)信號幀的VAD閾值比較,首先,備份當前信號幀處理過程中用到的VAD閾值(步驟S901),然后將一個高于當前使用的VAD閾值的數(shù)值設(shè)置為調(diào)整后的新的VAD閾值(步驟S902)。為了能夠為IBD傳輸創(chuàng)造一個時機,這個新的閾值必須高于當前語音信號幀能量Pvad,這樣,信道就可出讓給IBD傳送數(shù)據(jù)。為了不影響當前正在處理的語音幀,應(yīng)等待當前語音幀處理完畢后,再將VAD標志為0,以傳送IBD幀,因此,在將VAD閾值調(diào)整后,流程進入等待狀態(tài),等待當前正在處理的語音幀操作完成(步驟S903)。在當前語音幀處理完成后,將調(diào)整后的VAD閾值與接下來的語音幀的能量進行比較,由于調(diào)整后的VAD閾值較高,因此生成的VAD標志為0,從而,IBD幀可以經(jīng)由語音信道發(fā)送出去。在發(fā)送了該IBD幀后,將IBD指示值恢復為0(步驟S904),并將VAD閾值恢復為備份的閾值,以消除由于引入這個較高閾值而對后續(xù)其他語音幀進行處理時可能造成的影響(步驟S905)。
由于在以上調(diào)整VAD閾值的過程中,在發(fā)送方,有意制造了一個或多個非語音激活時段,用一個或多個IBD幀取代了原本應(yīng)當發(fā)送的一個或多個語音幀。在連續(xù)發(fā)送的IBD幀不是很多的情況下,在接收方的RX-DTX中,可以采用替換幀,來彌補發(fā)送方所丟失的語音幀,不會造成語音通話質(zhì)量的嚴重下降。然而,若是連續(xù)發(fā)送的IBD幀數(shù)目大于一定的標準,如單位時間內(nèi)連續(xù)發(fā)送的IBD幀數(shù)目大于一個閾值,則將影響通信的質(zhì)量,因此,應(yīng)當對發(fā)送的IBD幀的數(shù)目進行計數(shù),當累計發(fā)送的IBD幀的數(shù)目超過一個預定的標準時,暫停發(fā)送IBD幀。
二、IBD指示值表示待發(fā)送的IBD幀的優(yōu)先級別如上所述,當IBD指示值表示存儲在發(fā)送緩存905中的IBD幀的發(fā)送優(yōu)先級別時,IBD指示值通常為發(fā)送緩存905中的第一個待發(fā)送的IBD幀的優(yōu)先級數(shù),當該第一個IBD幀發(fā)送后,發(fā)送緩存905再計算出下一個IBD幀的優(yōu)先級數(shù),并將該下一幀的優(yōu)先級數(shù)作為當前整個IBD幀序列的優(yōu)先級別賦予IBD指示值。
根據(jù)IBD指示值的不同數(shù)值,語音激活檢測器選擇對應(yīng)不同步長的參數(shù),對VAD閾值進行不同程度的調(diào)整。具體的閾值調(diào)整過程如圖8所示首先,判斷當前信號幀的能量是否低于可接受信號的能量下限pth(步驟S501),其中信號幀的能量由信號的自相關(guān)系數(shù)ACF
表示。如果信號幀能量低于下限,則將VAD閾值thvad設(shè)為某一特定值plev(步驟S502)。當信號滿足能量要求時,對IBD指示值進行判斷(步驟S801)。
如果IBD指示值=0,表示無須發(fā)送IBD幀,則按照通信協(xié)議中的規(guī)定,進行非語音激活條件的判斷(步驟S503)。若步驟S503的判斷結(jié)果表明是語音激活期間,則執(zhí)行步驟S1003中,將參數(shù)增量inc和減量dec分別設(shè)為默認值,并結(jié)束該VAD閾值調(diào)整過程。若步驟S503的判斷結(jié)果表明是非語音激活期間,則執(zhí)行步驟S505至步驟S513的VAD閾值調(diào)整過程,步驟S505至步驟S513與附圖7中的對應(yīng)步驟相同。在執(zhí)行步驟S513之后,將IBD指示值仍舊設(shè)定為原值0(步驟S1004)。
如果IBD指示值不為0,如IBD指示值為本實施例中的發(fā)送緩存905中的第一個IBD幀的優(yōu)先級i,那么根據(jù)IBD指示值i,選擇對應(yīng)步長的參數(shù),如增量inci和減量deci,以在閾值調(diào)整過程中使用更新的參數(shù)inc和dec來確定調(diào)整后的閾值(步驟S1001)。對應(yīng)不同的優(yōu)先級別i,IBD指示值不同,而根據(jù)不同的IBD指示值選擇的用于調(diào)整VAD閾值的參數(shù)亦相應(yīng)的不同,從而,VAD閾值的調(diào)整步長可以隨優(yōu)先級的高低而變化。然后,繼續(xù)執(zhí)行步驟S505至步驟S513的VAD閾值調(diào)整過程。在輸出調(diào)整后的閾值thvad后,在步驟S1004中,應(yīng)根據(jù)來自發(fā)送緩存905的下一幀的優(yōu)先級數(shù),將IBD指示值設(shè)置為相應(yīng)數(shù)值。
在該實施例中,除了在步驟S1001中,將參數(shù)inc和dec的數(shù)值賦予與IBD幀發(fā)送的優(yōu)先級相關(guān)的數(shù)值以外,后續(xù)的閾值調(diào)整步驟S505至S513均與IBD指示值為0時對應(yīng)的步驟相同。
在本發(fā)明的第二個實施例中,不同的優(yōu)先級對應(yīng)不同的閾值調(diào)整步長。例如,假設(shè)有8個優(yōu)先級,則應(yīng)當有8個不同的步長值用來調(diào)整VAD閾值。對于優(yōu)先級高的情況,步長值可能較大,相應(yīng)的閾值調(diào)整幅度也比較大。只要下一個信號幀的能量低于該調(diào)整后的閾值,就會被判斷為噪聲,從而可立即傳送擁有該優(yōu)先級別的IBD幀。對于優(yōu)先級低的IBD幀,閾值調(diào)整幅度也相對小,因此,那些具有較高能量的語音幀仍可正常傳輸,只有當具有能量低于該調(diào)整后閾值的語音幀到來時,IBD幀才能夠代替該語音幀而被發(fā)送出去。
以上結(jié)合本發(fā)明的兩個實施例對本發(fā)明進行了詳細描述,需要指出的是IBD指示值并不局限于本發(fā)明上述的四種內(nèi)容,且可以采用本發(fā)明的緩存器905生成IBD指示值,也可以采用其他的IBD指示生成裝置生成IBD指示值。
本發(fā)明的利用語音信道傳輸非語音數(shù)據(jù)的方法,既可以使用軟件模塊實現(xiàn),也可以使用硬件模塊實現(xiàn),還可以采用軟硬件結(jié)合的方式實現(xiàn),其原理和實施過程同樣適用于GSM的其他語音業(yè)務(wù)。
有益效果以上結(jié)合附圖對本發(fā)明的描述,從中可以清楚地看到本發(fā)明所提供的利用語音信道適時地傳輸非語音數(shù)據(jù)的方法,可以通過根據(jù)帶內(nèi)數(shù)據(jù)幀的發(fā)送緊急程度,對于通常情況設(shè)定的VAD閾值進行直接地調(diào)整,從而能夠?qū)崿F(xiàn)適時地更加靈活地發(fā)送IBD數(shù)據(jù)。
按照本發(fā)明的方法,當VAD閾值按照需要被調(diào)整后,并不立刻生成VAD標志,而是等待當前幀的處理完成后,再進行調(diào)整后的VAD閾值與信號幀能量的比較,因此不會影響正在進行的語音幀的處理。
此外,在本發(fā)明的實施中,由于改變VAD閾值而造成的語音幀的丟失,可以通過接收端中替換幀的方式加以彌補,不會造成收聽質(zhì)量的下降(或者對語音質(zhì)量的損失會很小)。
另外,本發(fā)明的利用語音信道傳輸非語音數(shù)據(jù)的方法,僅修改了VAD閾值的調(diào)整方法,沒有涉及移動終端和網(wǎng)絡(luò)系統(tǒng)的硬件設(shè)備的改變,因此本發(fā)明易于在常規(guī)移動終端的硬件基礎(chǔ)上實現(xiàn)。
本領(lǐng)域技術(shù)人員應(yīng)當理解,本發(fā)明提供的VAD閾值調(diào)整方法,還可以在不脫離本發(fā)明內(nèi)容的基礎(chǔ)上做出各種改進。因此,本發(fā)明的保護范圍應(yīng)當由所附的權(quán)利要求書的內(nèi)容確定。
權(quán)利要求
1.一種用于一個移動終端的在語音信道傳輸非語音數(shù)據(jù)的方法,包括步驟(a)根據(jù)預先設(shè)定的非語音數(shù)據(jù)幀發(fā)送指示生成模式,生成一個非語音數(shù)據(jù)幀發(fā)送指示;(b)根據(jù)該非語音數(shù)據(jù)幀發(fā)送指示,產(chǎn)生關(guān)于下一幀的一個語音激活檢測(VAD)標志;(c)若該VAD標志表示該下一幀為非語音激活期間,則在該下一幀發(fā)送該非語音數(shù)據(jù)幀。
2.如權(quán)利要求1所述的方法,其中,步驟(b)進一步包括(b1)根據(jù)所述非語音數(shù)據(jù)幀發(fā)送指示,調(diào)整當前該移動終端中使用的VAD閾值;(b2)根據(jù)該調(diào)整后的VAD閾值,產(chǎn)生所述下一幀的VAD標志。
3.如權(quán)利要求2所述的方法,其中步驟(b1)進一步包括(b11)備份所述當前VAD閾值;(b12)將一個高于所述當前VAD閾值的數(shù)值設(shè)置為調(diào)整后的VAD閾值;(b13)在執(zhí)行了所述步驟(c)之后,將所述調(diào)整后的VAD閾值恢復為該備份的VAD閾值。
4.如權(quán)利要求3所述的方法,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為當存在所述欲發(fā)送的非語音數(shù)據(jù)幀時,生成即刻發(fā)送所述非語音數(shù)據(jù)幀的發(fā)送指示。
5.如權(quán)利要求3所述的方法,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為當所述欲發(fā)送的非語音數(shù)據(jù)幀的發(fā)送期限到期時,生成即刻發(fā)送所述非語音數(shù)據(jù)幀的發(fā)送指示。
6.如權(quán)利要求2所述的方法,其中步驟(b1)進一步包括(b21)根據(jù)所述非語音數(shù)據(jù)幀發(fā)送指示,選擇對應(yīng)不同優(yōu)先級別的參數(shù);(b22)利用該選擇的參數(shù),將所述當前VAD閾值調(diào)整為對應(yīng)不同優(yōu)先級別的數(shù)值。
7.如權(quán)利要求6所述的方法,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為將所述欲發(fā)送的非語音數(shù)據(jù)幀的數(shù)目對應(yīng)于所述的優(yōu)先級別,并根據(jù)所述非語音數(shù)據(jù)幀的數(shù)目,生成所述非語音數(shù)據(jù)幀發(fā)送指示。
8.如權(quán)利要求6所述的方法,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為將所述欲發(fā)送的非語音數(shù)據(jù)幀的緊迫程度對應(yīng)于所述的優(yōu)先級別,并根據(jù)所述非語音數(shù)據(jù)幀的緊迫程度,生成所述非語音數(shù)據(jù)幀發(fā)送指示。
9.如權(quán)利要求1所述的方法,還包括步驟(d)累計所述欲發(fā)送的非語音數(shù)據(jù)幀的數(shù)目;(e)判斷該累計的數(shù)目是否超過一個預定的標準;(f)若該累計的數(shù)目超過該預定標準,則暫停發(fā)送所述非語音數(shù)據(jù)幀。
10.一種能夠在語音信道傳輸非語音數(shù)據(jù)的移動終端,包括一個指示生成單元,用于根據(jù)預先設(shè)定的非語音數(shù)據(jù)幀發(fā)送指示生成模式,生成一個非語音數(shù)據(jù)幀發(fā)送指示;一個VAD標志生成單元,用于根據(jù)該非語音數(shù)據(jù)幀發(fā)送指示,產(chǎn)生關(guān)于下一幀的一個語音激活檢測(VAD)標志;一個發(fā)送單元,用于當該VAD標志表示該下一幀為非語音激活期間時,在該下一幀發(fā)送該非語音數(shù)據(jù)幀。
11.如權(quán)利要求10所述的移動終端,其中,所述VAD標志生成單元進一步包括一個調(diào)整單元,用于根據(jù)所述非語音數(shù)據(jù)幀發(fā)送指示,調(diào)整當前該移動終端中使用的VAD閾值;所述VAD標志生成單元,根據(jù)該調(diào)整后的VAD閾值,產(chǎn)生所述下一幀的VAD標志。
12.如權(quán)利要求11所述的移動終端,其中所述調(diào)整單元還包括一個備份單元,用于備份所述當前VAD閾值;一個設(shè)置單元,用于將一個高于所述當前VAD閾值的數(shù)值設(shè)置為調(diào)整后的VAD閾值;一個恢復單元,用于在發(fā)送了所述非語音數(shù)據(jù)幀后,將所述調(diào)整后的VAD閾值恢復為該備份的VAD閾值。
13.如權(quán)利要求12所述的移動終端,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為當存在所述欲發(fā)送的非語音數(shù)據(jù)幀時,生成即刻發(fā)送所述非語音數(shù)據(jù)幀的發(fā)送指示。
14.如權(quán)利要求12所述的移動終端,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為當所述欲發(fā)送的非語音數(shù)據(jù)幀的發(fā)送期限到期時,生成即刻發(fā)送所述非語音數(shù)據(jù)幀的發(fā)送指示。
15.如權(quán)利要求11所述的移動終端,其中所述調(diào)整單元進一步包括一個選擇單元,用于根據(jù)所述非語音數(shù)據(jù)幀發(fā)送指示,選擇對應(yīng)不同優(yōu)先級別的參數(shù);所述調(diào)整單元,利用該選擇的參數(shù),將所述當前VAD閾值調(diào)整為對應(yīng)不同優(yōu)先級別的數(shù)值。
16.如權(quán)利要求15所述的移動終端,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為將所述欲發(fā)送的非語音數(shù)據(jù)幀的數(shù)目對應(yīng)于所述的優(yōu)先級別,并根據(jù)所述非語音數(shù)據(jù)幀的數(shù)目,生成所述非語音數(shù)據(jù)幀發(fā)送指示。
17.如權(quán)利要求15所述的移動終端,其中所述非語音數(shù)據(jù)幀發(fā)送指示生成模式,可以設(shè)定為將所述欲發(fā)送的非語音數(shù)據(jù)幀的緊迫程度對應(yīng)于所述的優(yōu)先級別,并根據(jù)所述非語音數(shù)據(jù)幀的緊迫程度,生成所述非語音數(shù)據(jù)幀發(fā)送指示。
18.如權(quán)利要求10所述的移動終端,還包括一個計數(shù)器,用于累計所述欲發(fā)送的非語音數(shù)據(jù)幀的數(shù)目;一個判斷單元,用于判斷該累計的數(shù)目是否超過一個預定的標準;一個控制單元,用于當該累計的數(shù)目超過該預定標準時,暫停發(fā)送所述非語音數(shù)據(jù)幀。
全文摘要
一種用于一個移動終端的在語音信道傳輸非語音數(shù)據(jù)的方法,包括步驟根據(jù)預先設(shè)定的非語音數(shù)據(jù)幀發(fā)送指示生成模式,生成一個非語音數(shù)據(jù)幀發(fā)送指示;根據(jù)該非語音數(shù)據(jù)幀發(fā)送指示,產(chǎn)生關(guān)于下一幀的一個語音激活檢測(VAD)標志;若該VAD標志表示該下一幀為非語音激活期間,則在該下一幀發(fā)送該非語音數(shù)據(jù)幀。采用該方法,通過選擇帶內(nèi)數(shù)據(jù)幀發(fā)送指示生成的模式,可以根據(jù)不同需要,例如帶內(nèi)數(shù)據(jù)要求發(fā)送的緊急程度,適時地發(fā)送帶內(nèi)數(shù)據(jù)信息。
文檔編號H04M11/06GK1879431SQ200480033166
公開日2006年12月13日 申請日期2004年11月3日 優(yōu)先權(quán)日2003年11月12日
發(fā)明者杜永剛, 晉曉輝 申請人:皇家飛利浦電子股份有限公司