專利名稱:一種音頻同步對齊測試方法
技術領域:
本發(fā)明涉及音頻非線性處理單元的測試技術,特別涉及一種音頻同步對齊測試方法。
背景技術:
隨著數(shù)字通訊技術和數(shù)字音頻處理技術地不斷發(fā)展,在數(shù)字音頻領域內部越來越地多采用了非線性處理技術。例如采用活動檢測/靜音剪切技術、聲學回聲抵消、音效增強、數(shù)字自動增益控制、數(shù)字自動噪聲抑制等非線性音頻處理技術來提高信道壓縮率和聽覺效果,從而提高音頻信號的保真度和可懂度。
一般模擬/數(shù)字音頻非線性處理單元的測試,最主要的測試就是失真等項目的測試。目前一般的測試方法為先生成一個固定或者可變時間長度的含有音樂或者人聲的特征音頻序列,將這一段測試序列送入被測試系統(tǒng),然后將被測系統(tǒng)輸出的信號記錄下來進行特征比較,之后計算測試原始序列和被測輸出序列的失真度等各個項目的指標,從而得出被測音頻系統(tǒng)質量好壞的評價。
由于被測系統(tǒng)通常都是數(shù)字音頻系統(tǒng),所以輸入和輸出過程就存在一個時間差,而且通常不同的數(shù)字音頻系統(tǒng)(甚至是不同狀態(tài)的同一個數(shù)字音頻系統(tǒng))的時間差都不一致。但在評測音頻的質量效果時候,計算和處理測試原始序列和被測輸出序列的失真度等各個項目的指標時需要在相對統(tǒng)一的時刻下進行。如圖1、圖2所示測試原始序列A時刻需要和被測序列的相關聯(lián)的A時刻相對應,否則就會計算失誤。如將測試序列A時刻的內容和被測序列B或B’時刻的內容進行相關聯(lián)的比較就容易產(chǎn)生關聯(lián)度為“0”或者很小數(shù)值等的錯誤計算結果。這樣測試就無法準確進行。在這種情況下,需要對測試原始序列和被測序列進行音頻同步,通過剪切這被測系統(tǒng)時間延遲,使得它們同步到同一個時間基準上來,
現(xiàn)有技術對音頻同步主要有以下兩種技術方案技術方案一為測試信號頭對齊,參閱圖3。其主要測試流程如下(1)首先產(chǎn)生一個固定或者可變時間長度的模擬/數(shù)字的音頻測試序列。
(2)利用這個音頻測試序列輸入到被測試系統(tǒng)中去。(被測試的音頻系統(tǒng)可以理解為一個黑盒)。
(3)然后在被測系統(tǒng)內部經(jīng)過一個時間延時ΔT后,從被測系統(tǒng)的模擬/數(shù)字輸出端口輸出。
(4)將輸出模擬/數(shù)字的音頻信號捕捉下來,利用測試信號輸入的頭部和輸出信號的頭部的時間差值進行系統(tǒng)延時計算,計算出時間差值Δt(該方法認為Δt=ΔT或者Δt≈ΔT),然后將被測系統(tǒng)的輸出信號剪切去系統(tǒng)延時Δt,最后進行測試序列和被測系統(tǒng)輸出的這兩個音頻信號的失真度或其他音頻測試分析。
但采用技術方案一有如下缺點現(xiàn)有的很多數(shù)字音頻處理系統(tǒng)(例如IP電話、會議電視等)都使用了活動檢測/靜音剪切技術、聲學回聲抵消等非線性音頻處理技術來提高信道壓縮率和聽覺效果,這樣的線性技術最容易造成音頻信號由安靜的非活動狀態(tài)轉變?yōu)橛新曇舻幕顒訝顟B(tài),從而造成0.1秒~0.5秒左右的切頭影響(即約有0.1~0.5秒的音頻頭部被系統(tǒng)消除了),這樣就造成了Δt≠ΔT。所以采用頭部對齊容易造成計算出的時間差值Δt不夠準確,從而影響下一步的音頻測試和比較測試的準確性。
技術方案二為特征測試音引導的信號頭部對齊技術,參閱圖4。其主要測試流程如下(1)首先產(chǎn)生一個固定或者可變時間長度的模擬/數(shù)字的音頻測試序列,然后在這個序列前面追加一個特殊的測試音頻引導頭。例如在測試序列頭加入一個1kHz持續(xù)1秒的正弦音頻信號,利用這個特殊的音頻頭作未來的同步對齊標志。
(2)利用這個音頻測試序列輸入到被測試系統(tǒng)中去。(被測試的音頻系統(tǒng)可以理解為一個黑盒)。
(3)然后在被測系統(tǒng)內部經(jīng)過一個時間延時ΔT后,從被測系統(tǒng)的模擬/數(shù)字輸出端口輸出。
(4)將輸出模擬/數(shù)字的音頻信號捕捉下來,利用測試信號輸入的特殊標志頭部和輸出信號的特殊標志頭部的時間差值進行系統(tǒng)延時計算,計算出時間差值Δt(該方法認為Δt=ΔT或者Δt≈ΔT),然后將被測系統(tǒng)的輸出信號剪切去系統(tǒng)延時Δt,然后進行測試序列和被測系統(tǒng)輸出的這兩個音頻信號的失真度或其他音頻測試分析。
采用特征測試音引導的信號頭部對齊的音頻同步對齊技術,該技術的關鍵在于有一個標志音頻同步特征的特殊引導序列,但現(xiàn)在多數(shù)被測的音頻系統(tǒng)均為非線性的數(shù)字系統(tǒng),將不可能不引入對特征音引導序列的非線性失真。所以存在以下缺點(1)采用特征音引導的同步對齊技術容易造成經(jīng)過被測系統(tǒng)時,造成特征音引導頭丟失,從而不能計算出的時間差值Δt。因為現(xiàn)有的很多數(shù)字音頻處理系統(tǒng)(例如IP電話、會議電視等)都加入了抗嘯叫處理技術,遇到這種單一頻率點的特征音信號容易進行壓制和處理。
(2)采用特征音引導的同步對齊技術容易造成經(jīng)過被測系統(tǒng)時,造成特征音引導頭畸變,從而難以準確計算出的時間差值Δt。因為現(xiàn)有數(shù)字音頻處理系統(tǒng)(例如IP電話、會議電視等)很多加入了自動增益控制(AGC)技術、音效增強技術、聲學回聲抵消等非線性音頻處理技術來提高信道壓縮率和聽覺效果,這樣的非線性技術通常是采用子帶濾波技術,而這種特殊的特征音頻信號最容易落在子帶分割點上,造成特征音信號畸變,例如斷斷續(xù)續(xù),或者頻譜搬移,從而造成特征音對齊不準確,不能準確測試時間差值Δt,從而影響下一步音頻測試的準確性。
(3)非線性音頻處理技術(例如回聲抵消技術)通常都有一個以時間、頻率、幅度參數(shù)為引導變換的系統(tǒng)初始預置狀態(tài),而特征音的引入干擾了該項目的測試結果。從而影響測試準確性。
發(fā)明內容
本發(fā)明的目的在于提供一種音頻同步對齊測試方法,以解決音頻測試技術中數(shù)字音頻的非線性處理技術對音頻同步造成影響的問題。
本發(fā)明的技術方案一種音頻同步對齊測試方法,包括下述步驟A、產(chǎn)生一個音頻測試序列,并為該音頻測試序列設置標志部形成第一測試序列;B、將第一測試序列輸入到被測系統(tǒng),使該第一測試序列在被測系統(tǒng)內經(jīng)系統(tǒng)實際延時后輸出第二測試序列;C、捕捉被測系統(tǒng)輸出的第二測試序列,并利用第一測試序列的標志部和第二測試序列中的標志部計算出輸入和輸出之間的時間差值作為被測系統(tǒng)的延時;D、根據(jù)被測系統(tǒng)的延時,將捕捉到的第二測試序列剪切去系統(tǒng)的延時后與所述第一測試序列進行測試分析。
其中所述的標志部設置在音頻測試序列的尾部或中部。
步驟A中還為所述音頻測試序列增加標記音頻序列形成第一測試序列;以及步驟C中,在計算時間差值前先以第一測試序列和第二測試序列中的該標記音頻序列為參考判斷第二測試序列的尾部是否正常,如果正常則計算時間差值,否則給予提示或/和返回步驟A。
本發(fā)明與現(xiàn)有技術的比較1、由于“靜音抑制”的用途在于無有用信息(例如人的語音)傳輸?shù)臅r候壓制系統(tǒng)噪聲,減小傳輸碼率,而“活動檢測”是為了檢測當前是否存在有用信息(例如語音),決定“靜音抑制”模塊是否開啟工作,如有則不啟動,如沒有則啟動靜音。當非線性系統(tǒng)含有“活動檢測/靜音抑制”模塊時候有一個固有的特性。假定“靜音抑制”已經(jīng)開啟,當輸入聲音從無聲狀態(tài)到有聲狀態(tài)時候,該“活動檢測”模塊不會馬上認定語音信號已經(jīng)來了,因為系統(tǒng)中還有霰彈噪聲(怕造成誤判斷),當語音信號持續(xù)一段時間后,例如0.03~0.2秒左右,“活動檢測”才會認為真的語音信號來了,從而撤銷“靜音抑制”模塊,讓系統(tǒng)正常工作。但這樣一來,這0.03~0.2秒左右的語音信號在系統(tǒng)正常工作前已經(jīng)被“靜音模塊”過濾掉了,從而造成“切頭現(xiàn)象”。
因此,采用發(fā)明的方法,既便測試序列通過被測試系統(tǒng)后被切除了頭部,但本測試方案并沒有采用頭部對齊,所以“切頭”對本發(fā)明的方法沒有影響。
2、由于“聲學回聲抵消”模塊有一個固有特征,該模塊需要在剛剛開始輸入語音信號的一個階段,分別采樣環(huán)境噪聲和語音信號,并用該兩個信號的比值來設定該模塊的初始狀態(tài),否則系統(tǒng)“聲學回聲抵消”功能就實現(xiàn)的不理想。
現(xiàn)有技術二在一開頭就利用了一段時間的特征音(例如1秒鐘的1KHz的正弦信號)作為輸入,但這個非自然語音或非正常使用環(huán)境語音的輸入會造成“聲學回聲抵消”模塊初始設置偏移,造成隨后一段時間的聲學回聲抵消效果不良。從而影響該部分或者相關的音頻序列的準確測試。
而本發(fā)明剛開始就可以輸入真實環(huán)境現(xiàn)場的語音,從而沒有影響“聲學回聲抵消”模塊的初始設置,所以采用本發(fā)明對隨后測試是正常而準確的。
總之,本發(fā)明具有以下有益效果(1)采用的尾部對齊或中間對齊技術,避免了音頻非線性處理模塊靜音檢測/靜音剪切技術容易產(chǎn)生的切頭現(xiàn)象。
(2)在音頻同步對齊技術增加了一個校驗機制,避免了因測試序列的尾部損傷造成的音頻同步對齊系統(tǒng)測試失誤。
(3)尾部同步音頻采用自然聲音,可避免音頻抗嘯叫處理技術引起的誤動作,增加準確性;同時還可避免干擾現(xiàn)有數(shù)字音頻處理系統(tǒng)的自動增益控制(AGC)、音效增強、聲學回聲抵消等技術中的聲音特性,消除了音頻子帶干擾的影響。
(4)測試同步頭在音頻測試序列的尾部,可避免干擾音頻非線性系統(tǒng)測試時候的預置狀態(tài),從而使得音頻測試更為準確。
(5)采用本發(fā)明,能較為簡便、可靠地測試音頻系統(tǒng)的輸入和輸出之間的相對延時差。
圖1為測試序列的輸入和輸出狀態(tài)示意圖;圖2為經(jīng)同步對齊后的輸入和輸出狀態(tài)示意圖;圖3為基于頭部對齊技術的測試序列輸入和輸出的狀態(tài)示意圖;圖4為基于特征測試音引導的信號頭部對齊技術的測試序列輸入和輸出的狀態(tài)示意圖;圖5、圖6為本發(fā)明的測試序列輸入和輸出的狀態(tài)示意圖。
圖7為本發(fā)明實施例的流程圖;圖8為測試示意圖。
具體實施例方式
為了解決數(shù)字音頻處理中活動檢測/靜音抑制等技術造成的切頭線性的對齊問題,本發(fā)明采用中部或尾部對齊技術,即通過在音頻測試序列中部或尾部增加一標志部來對輸入被測系統(tǒng)的測試序列和被系統(tǒng)輸出的測試序列達到測試序列的同步對齊。
以下以音頻序列尾部同步對齊為例對本發(fā)明進行詳細說明。參閱圖5所示,在固定或可變時間長度的模擬或數(shù)字音頻測試序列的尾部設置標志部形成第一測試序列。該標志部可為(1)直接為從有聲到無聲突然截至的靜音臺階,(2)固定時長的特征音(例如正弦波),后跟一個突然截至的靜音臺階(3)帶有聲學特點的人工合成音,后跟一個突然截至的靜音臺階。第一測試序列在經(jīng)過被測系統(tǒng)的實際延時后輸出第二測試序列(模擬音頻序列)。根據(jù)第一測試序列和第二測試序列中的標志部計算出兩者的時間差t,該時間差t即為系統(tǒng)的實際延時T。將被測系統(tǒng)輸出的第二測試序列剪切去系統(tǒng)延時T,即實現(xiàn)了音頻序列的同步對齊,最后進行測試分析。
參閱圖6,為了進一步地保證準確的同步對齊測試,在標志部之后增加一個或多個短的固定時間長度的標記音頻序列形成第一測試序列;在計算時間差值t前,先判斷被測系統(tǒng)輸入的第一測試序列和輸出的第二測試序列中的標記音頻序列是否變化以確定第二測試序列的尾部是否正常,如果正常則計算時間差值;如果不正常則不進行計算。
判斷方法為首先,檢查空閑段的時間長度是否產(chǎn)生了變化,如產(chǎn)生了變化則“靜音抑制”模塊開啟已經(jīng)產(chǎn)生了干擾;其次,檢查標記音頻序列的本身的時間長度是否產(chǎn)生了變化,如果產(chǎn)生變化則可能是“靜音抑制”模塊切除了某部分,或某特殊音頻處理模塊造成了“切尾”情況。
參閱圖7,測試流程如下步驟10首先產(chǎn)生一個固定時間長度的模擬音頻測試序列,然后在這個序列尾部設置標志部(作一個特殊的截止音頻處理),即為音頻測試序列的尾部從有聲到無聲音是突然截止的。
步驟20在標志部后的空閑段落的時間T2(無聲狀態(tài))后再追加一個到多個短的固定時間長度自然聲音序列作為標記音頻序列,例如1~2秒的自然聲音,形成第一測試序列。
其中,標記音頻序列的有聲階段盡量采用自然聲音,避免引入特殊的特征音;固定時間長度的無聲空閑(靜音)狀態(tài)也是用于同步的標志之一,因此在測試序列中加入的無聲(靜音)的階段T1需要盡可能短,例如100~200ms,以避免活動檢測/靜音抑制非線性模塊檢測到無聲階段后將“靜音抑制”模塊開啟而產(chǎn)生靜音的副作用。
步驟30將第一測試序列輸入到被測系統(tǒng)中去,該序列在被測系統(tǒng)內部經(jīng)過一個系統(tǒng)真實時間延時T后,從被測系統(tǒng)的模擬/數(shù)字輸出端口輸出第二測試序列。被測的音頻系統(tǒng)可以理解為一個黑盒。
步驟40將被測系統(tǒng)輸出的第二測試序列(模擬音頻信號)捕捉下來,先檢查第二測試序列中標志部與自然聲音之間的空閑段落時間t1是否等于第一測試序列中的空閑時間T1。如等于則說明這個短時間內的靜音抑制沒有開啟,系統(tǒng)的尾部正常;然后直接利用第一測試序列和第二測試序列的尾部截止部分進行對齊,計算出時間差t作為被測系統(tǒng)的實際延時T(本發(fā)明認為t=T或者t·T)(步驟401)。
如果檢查被測系統(tǒng)輸出的第二測試序列中空閑時間t1不等于第一測試序列中的空閑時間T1。則說明這個短時間內的靜音抑制或者其他非線性處理模塊開啟了,系統(tǒng)的尾部不正常。則給予提示(步驟402)或/和返回步驟A。在重新制作音頻測試序列時,調整時間差T1(縮短或者延長),重新輸入被測系統(tǒng),直到t1=T1為止。
對于音頻信號的捕捉可利用音頻處理軟件,例如CoolEdit或者同類功能的音頻處理軟件。
步驟50將被測系統(tǒng)輸出的第二測試序列剪切去系統(tǒng)延時t1,然后將其與第一測試序列的失真度或其他音頻測試分析。
具體測試方法參閱圖8(并不限于該測試方法)采用雙通道的數(shù)字存儲示波器或者聲卡的雙通道輸入采集記錄功能等,將第一測試序列播放的通道1(原始測試序列)和通道2(通過被測試系統(tǒng)輸出的第二測試序列)同時記錄下來。這樣就得到了如圖5和圖6的測試序列記錄圖。
因記錄是同時開始的,所以雙通道均從測試記錄輸入的起始時間T0開始計算,利用數(shù)字示波器的延時計算功能或CoolEdit等軟件計時功能,測量通道1(第一測試序列)從T0到尾部測試標準部時間差,TS。同理,測量通道2(第二測試序列)從T0到尾部測試標準部時間差Ts。利用t=Ts-TS公式得到t(系統(tǒng)延時測量值)。同理,也可以計算出T1和t1。
本實施例中采用尾部對齊的用意是先讓測試序列通過被測系統(tǒng),而后再加測試序列同步機制,避免干擾音頻非線性系統(tǒng)的預置狀態(tài)。尾部空閑時間的間隔監(jiān)控的用意是監(jiān)控尾部是否被音頻非線性處理單元更改,而無法進行準確的同步對齊測試。也可將標記音頻序列放在序列的中部或直接放在標志部后,通過比較第一測試序列和第二測試序列中該標記音頻序列的長度等參數(shù)的變化來確定被測系統(tǒng)的靜音抑制系統(tǒng)是否開啟,從而判斷被測系統(tǒng)輸出的第二測試序列的尾部是否正常。該標記音頻序列還可為靜音或特征音序列等。
對于本發(fā)明而言,將標志部設置在測試序列段落中部,通過該標志部實現(xiàn)中間對齊。例如在測試序列中間加入一個空閑時間間隔,用于這段空閑時間的其起始和截止邊緣來進行音頻同步對齊。在該基礎上再加上標記音頻序列來監(jiān)控序列尾部是否被音頻非線性處理單元更改,其方法同上。
權利要求
1.一種音頻同步對齊測試方法,其特征在于包括下述步驟A、產(chǎn)生一個音頻測試序列,并為該音頻測試序列設置標志部形成第一測試序列;B、將第一測試序列輸入到被測系統(tǒng),使該第一測試序列在被測系統(tǒng)內經(jīng)系統(tǒng)實際延時后輸出第二測試序列;C、捕捉被測系統(tǒng)輸出的第二測試序列,并利用第一測試序列的標志部和第二測試序列中的標志部計算出輸入和輸出之間的時間差值作為被測系統(tǒng)的延時;D、根據(jù)被測系統(tǒng)的延時,將捕捉到的第二測試序列剪切去系統(tǒng)的延時后與所述第一測試序列進行測試分析。
2.如權利要求1所述的方法,其特征在于,所述音頻測試序列可為模擬音頻測試序列,也可為數(shù)字音頻測試序列。
3.如權利要求1所述的方法,其特征在于,所述的標志部設置在音頻測試序列的尾部或中部。
4.如權利要求1所述的方法,其特征在于,步驟A中還為所述音頻測試序列增加標記音頻序列形成第一測試序列;以及步驟C中,在計算時間差值前先以第一測試序列和第二測試序列中的該標記音頻序列為參考判斷第二測試序列的尾部是否正常,如果正常則計算時間差值,否則給予提示或/和返回步驟A。
5.如權利要求4所述的方法,其特征在于,所述的標記音頻序列為一個或多個短的固定時間長度的音頻序列。
6.如權利要求4或5所述的方法,其特征在于,所述的標記音頻序列位于所述音頻測試序列的中部或標志部之后。
7.如權利要求6所述的方法,其特征在于,所述標記音頻序列為靜音、自然聲音或特征音。
8.如權利要求7所述的方法,其特征在于,所述標記音頻序列為自然聲音的音頻序列并位于標志部之后時,該自然聲音的音頻序列與標志部之間還包括有靜音序列,并根據(jù)第一測試序列中的該空閑段落和第二測試序列中的相應空閑段落是否相同來判斷捕捉到的第二測試序列的中間及其尾部是否正常。
9.如權利要求2所述的方法,其特征在于,所述模擬音頻測試序列或數(shù)字音頻測試序列為固定或者可變時間長度的音頻序列。
10.如權利要求1或3所述的方法,其特征在于,所述標志部為從有聲到無聲突然截至的靜音臺階,或為固定時長的特征音后跟一個突然截至的靜音臺階,或為帶有聲學特點的人工合成音后跟一個突然截至的靜音臺階,設置在所述音頻測試序列的尾部。
11.如權利要求1或3所述的方法,其特征在于,所述標志部為空閑時間間隔,加在所述音頻測試序列中部。
全文摘要
一種音頻同步對齊測試方法,步驟為產(chǎn)生一個音頻測試序列,并為該音頻測試序列設置標志部形成第一測試序列;將第一測試序列輸入到被測系統(tǒng),使該第一測試序列在被測系統(tǒng)內經(jīng)系統(tǒng)實際延時后輸出第二測試序列;捕捉被測系統(tǒng)輸出的第二測試序列,并利用第一測試序列的標志部和第二測試序列中的標志部計算出輸入和輸出之間的時間差值作為被測系統(tǒng)的延時;根據(jù)被測系統(tǒng)的延時,將捕捉到的第二測試序列剪切去系統(tǒng)的延時后與所述第一測試序列進行測試分析。本發(fā)明采用尾部對齊或中間對齊技術,避免了音頻非線性處理模塊靜音檢測/靜音剪切技術容易產(chǎn)生的切頭現(xiàn)象。
文檔編號H04M3/22GK1553597SQ0313839
公開日2004年12月8日 申請日期2003年5月26日 優(yōu)先權日2003年5月26日
發(fā)明者楊海曜 申請人:華為技術有限公司