專利名稱:一種實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法與裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音測(cè)試,尤其涉及一種能夠?qū)崿F(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法與裝置。
背景技術(shù):
為了全面了解設(shè)備的音頻性能,目前進(jìn)行語(yǔ)音評(píng)價(jià)有兩種方式,一種是組織一定數(shù)量的聽眾對(duì)音頻處理設(shè)備輸出的聲音進(jìn)行試聽,試聽者按優(yōu)(5)、良(4)、中(3)、差(2)、劣(1)對(duì)聲音打分,最后得到一個(gè)平均意見分(Mean Opinion Score,MOS),但是該方法需要消耗大量的時(shí)間、人力和費(fèi)用,并且經(jīng)常要受到人的反應(yīng)的內(nèi)在不可重復(fù)性的影響;針對(duì)主觀評(píng)價(jià)方法的不足之處,另一種方法,即基于客觀測(cè)度的聲音客觀評(píng)價(jià)方法相繼被提出,其中基于人耳聽覺模型的客觀評(píng)價(jià)方法與主觀評(píng)價(jià)結(jié)果相關(guān)度高,而且充分考慮到了人的聽覺特性,因此發(fā)展迅速。其基本原理如圖1,原始輸入信號(hào)經(jīng)過待測(cè)設(shè)備后輸出,當(dāng)進(jìn)行主觀評(píng)價(jià)時(shí),試聽者對(duì)待測(cè)設(shè)備的輸入和輸出信號(hào)進(jìn)行比較,從而對(duì)待測(cè)設(shè)備的處理性能進(jìn)行評(píng)價(jià),得到MOS分。當(dāng)采用基于聽覺模型的客觀評(píng)價(jià)方法時(shí),首先對(duì)人的聽覺過程進(jìn)行建模,然后用此模型對(duì)待測(cè)設(shè)備的輸入輸出信號(hào)進(jìn)行比較并給出意見得分,該分值是對(duì)試聽者可能會(huì)給出的MOS分的一個(gè)估計(jì)。目前基于人耳聽覺模型的算法很多,這些客觀測(cè)試算法最后由ITU形成了三個(gè)國(guó)際標(biāo)準(zhǔn),即,ITU-T提出的P.861建議(1996年推出PSQM算法,1998年修訂為PSQM+算法)、P.862建議(PESQ算法,2001年推出)和ITU-R提出的BS.1387建議(PEAQ算法,1998年推出)。其中,BS.1387算法主要針對(duì)20Hz~20kHz寬帶音頻質(zhì)量的客觀測(cè)試,P.861和P.862則針對(duì)300~3400Hz的話音質(zhì)量進(jìn)行評(píng)價(jià)。P.861建議僅適合于對(duì)編解碼器進(jìn)行評(píng)價(jià),而沒有更多的考慮濾波、可變延遲和短的局部失真對(duì)音頻質(zhì)量的影響,而P.862建議則將這些因素也包括進(jìn)來(lái)加以考慮,這使得PESQ算法不僅可以用于音頻編解碼器的評(píng)價(jià),同時(shí)也可以對(duì)網(wǎng)絡(luò)上的分組語(yǔ)音質(zhì)量進(jìn)行測(cè)試。
客觀評(píng)價(jià)方法相對(duì)簡(jiǎn)單、可重復(fù)性好,但是需要有專用的測(cè)試儀器,而且這些儀器通常都比較昂貴。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供簡(jiǎn)單的一種語(yǔ)音質(zhì)量客觀評(píng)價(jià)的方法和裝置,利用雙聲道實(shí)現(xiàn)原始輸入語(yǔ)音信號(hào)和失真輸出語(yǔ)音信號(hào)之間的同步,該測(cè)試操作簡(jiǎn)單實(shí)用,結(jié)果準(zhǔn)確可靠。
為了實(shí)現(xiàn)上述目的,本發(fā)明所采用的技術(shù)方案為一種實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,包括如下步驟A)放音,即用雙聲道文件播放原始語(yǔ)音信號(hào),其中一個(gè)聲道播放的原始語(yǔ)音信號(hào)經(jīng)過待測(cè)設(shè)備處理后輸出為失真輸出語(yǔ)音信號(hào);B)錄音,即以相同的采樣率存儲(chǔ)失真輸出語(yǔ)音信號(hào)和另一個(gè)聲道播放的原始語(yǔ)音信號(hào);C)比較,即對(duì)存儲(chǔ)的失真輸出語(yǔ)音信號(hào)和原始語(yǔ)音信號(hào)進(jìn)行比較計(jì)算,得出評(píng)價(jià)結(jié)果。
上述步驟中,可先啟動(dòng)錄音裝置,再進(jìn)行步驟A和步驟B中的放音和錄音,還可將原始輸入語(yǔ)音信號(hào)循環(huán)放音,在持續(xù)錄音一段時(shí)間后停止錄音,根據(jù)測(cè)試的時(shí)間將原始輸入語(yǔ)音信號(hào)與失真輸出語(yǔ)音信號(hào)分段提取出來(lái)進(jìn)行處理,并對(duì)每一段分別計(jì)算出評(píng)價(jià)結(jié)果。
上述方法中是使用用Cool Edit進(jìn)行步驟A和步驟B中的放音和錄音,將放音用Cool Edit的左聲道輸出的信號(hào)輸入錄音用Cool Edit的左聲道,并存儲(chǔ)為原始輸入語(yǔ)音信號(hào)波形文件,將放音用Cool Edit的右聲道輸出的信號(hào)輸入待測(cè)設(shè)備單元處理后再輸入錄音用Cool Edit的右聲道,并存儲(chǔ)為失真輸出語(yǔ)音信號(hào)波形文件。
一種實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試裝置,包括放音單元、錄音單元和比較單元,其中所述放音單元的輸入端輸入原始語(yǔ)音信號(hào),放音單元的一個(gè)聲道與錄音單元的一個(gè)聲道直接相連,放音單元的另一個(gè)聲道與待測(cè)設(shè)備的輸入端相連,待測(cè)設(shè)備的輸出端與錄音單元的另一個(gè)聲道相連,錄音單元兩個(gè)聲道輸出的信號(hào)再輸入比較單元。錄音單元將放音單元輸出的原始語(yǔ)音信號(hào)和待測(cè)設(shè)備輸出的失真輸出語(yǔ)音信號(hào)存儲(chǔ)為波形文件。
本發(fā)明的有益效果為利用PC機(jī)實(shí)現(xiàn)了語(yǔ)音質(zhì)量的客觀評(píng)價(jià),實(shí)現(xiàn)簡(jiǎn)單實(shí)用,結(jié)果準(zhǔn)確可靠,無(wú)須購(gòu)買昂貴的測(cè)試儀器,方便了客觀評(píng)價(jià)過程,尤其適用于研發(fā)階段對(duì)待測(cè)產(chǎn)品的性能評(píng)價(jià);以及利用聲卡的左右聲道實(shí)現(xiàn)了原始輸入語(yǔ)音信號(hào)和失真輸出語(yǔ)音信號(hào)之間的同步,無(wú)須采用復(fù)雜的算法實(shí)現(xiàn)二者之間的同步控制,簡(jiǎn)單可靠。
圖1為利用聽覺模型對(duì)語(yǔ)音質(zhì)量進(jìn)行客觀評(píng)價(jià)的原理圖;圖2為本發(fā)明的語(yǔ)音質(zhì)量測(cè)試裝置圖;具體實(shí)施方式
下面根據(jù)附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明如圖2所示,本發(fā)明需要的設(shè)備及軟件為1)一臺(tái)裝有聲卡的計(jì)算機(jī),并且需要安裝Cool Edit軟件。聲卡應(yīng)選擇質(zhì)量較好的,否則可能會(huì)影響到語(yǔ)音評(píng)價(jià)結(jié)果。2)Cool Edit軟件Cool Edit是一個(gè)集錄音、混音、編輯于一體的多軌數(shù)字音頻編輯軟件。它可以工作在Windows 95/98/NT環(huán)境下,并要求系統(tǒng)中要裝有一塊兼容Windows的聲卡。在本發(fā)明裝置中用于對(duì)語(yǔ)音信號(hào)文件進(jìn)行播放、錄音、編輯和處理。3)pesqmain.exeDOS下的可執(zhí)行文件,根據(jù)ITU-T P.862標(biāo)準(zhǔn)實(shí)現(xiàn)了PESQ客觀評(píng)價(jià)算法,使用以PCM格式存儲(chǔ)的.wav波形文件,支持8kHz和16kHz聲音采樣,計(jì)算結(jié)果以文本文件的形式保存,其結(jié)果列表中包含PESQ-MOS分值以及參考信號(hào)和降級(jí)信號(hào)之間的延時(shí)。P.862標(biāo)準(zhǔn)提供PESQ算法的標(biāo)準(zhǔn)實(shí)現(xiàn)源代碼,本發(fā)明中利用了該源代碼,無(wú)須另外編程實(shí)現(xiàn)。
在對(duì)待測(cè)設(shè)備進(jìn)行客觀評(píng)價(jià)時(shí),首先應(yīng)確認(rèn)待測(cè)設(shè)備正常工作,然后按照上圖連接測(cè)試裝置和待測(cè)設(shè)備。將測(cè)試用計(jì)算機(jī)的放音單元左聲道通過直連線直接連到錄音的左聲道上,放音單元右聲道連到待測(cè)設(shè)備的音頻輸入端,待測(cè)設(shè)備的音頻輸出端則連到錄音的右聲道上。如果用于測(cè)試一個(gè)通信系統(tǒng),可以將此通信系統(tǒng)看成一個(gè)大的待測(cè)系統(tǒng),因此對(duì)于一個(gè)編解碼設(shè)備或者一個(gè)通信系統(tǒng),其測(cè)試方法是一樣的。下文統(tǒng)稱為待測(cè)設(shè)備。
在測(cè)試用計(jì)算機(jī)上打開兩個(gè)Cool Edit窗口,其中一個(gè)用于播放原始輸入信號(hào),另一個(gè)則用于錄音。兩個(gè)Cool Edit窗口是必須的,因?yàn)镃oolEdit不能在放音的同時(shí)又進(jìn)行錄音。
在錄音用Cool Edit窗口中首先創(chuàng)建一個(gè)雙聲道文件,該文件的采樣率必須和原始輸入語(yǔ)音信號(hào)的采樣率相一致。左聲道用于接收直接來(lái)自放音單元的左聲道信號(hào),右聲道則接收經(jīng)過待測(cè)設(shè)備處理后的失真輸出語(yǔ)音信號(hào)。
在放音用Cool Edit窗口中播放原始輸入語(yǔ)音信號(hào),原始輸入語(yǔ)音信號(hào)的采樣率為8kHz或16kHz。一般來(lái)說(shuō),原始輸入語(yǔ)音信號(hào)是單聲道的,Cool Edit播放單聲道文件時(shí)會(huì)自動(dòng)在左右兩個(gè)聲道上送出相同的信號(hào),也可以用Cool Edit將單聲道文件編輯為雙聲道文件然后播放。
測(cè)試時(shí)需要首先在錄音用Cool Edit窗口中進(jìn)行錄音,然后到在放音用Cool Edit窗口中播放原始輸入語(yǔ)音信號(hào),這樣可以避免由于人工操作延遲而導(dǎo)致先放音后錄音時(shí)語(yǔ)音信號(hào)的開始段被剪切。當(dāng)原始輸入語(yǔ)音信號(hào)放音完畢,停止錄音。
由于放音單元錄音的左聲道直接用線連在一起,因此可以認(rèn)為,除了人工操作錄音和放音之間的延時(shí)之外,從放音單元到錄音之間不會(huì)引入額外的延時(shí),而且不會(huì)引入失真而導(dǎo)致音質(zhì)損傷,可以認(rèn)為左聲道錄下的語(yǔ)音就是原始輸入語(yǔ)音信號(hào)。而錄音輸出的右聲道之間存在待測(cè)設(shè)備的處理過程,因此除了人工操作延時(shí)之外,還存在著待測(cè)設(shè)備的處理延時(shí)或者通信系統(tǒng)的傳輸延時(shí),右聲道錄下的語(yǔ)音就是待測(cè)設(shè)備處理后的失真輸出語(yǔ)音信號(hào)。由于人工操作延時(shí)對(duì)左右聲道來(lái)說(shuō)是相同的,因此該延時(shí)大小是無(wú)關(guān)緊要的,只要比較錄音文件左右聲道之間的相對(duì)延時(shí)就可以得到待測(cè)設(shè)備的處理延時(shí)。這種方法避免了通過在原始輸入語(yǔ)音信號(hào)前面加上同步信號(hào)的方法來(lái)對(duì)輸入輸出信號(hào)進(jìn)行同步。
使用Cool Edit將左右兩個(gè)聲道的信號(hào)分開,分別保存在兩個(gè).wav波形文件中,例如分別存為ref.wav和deg.wav??芍?,ref.wav可以認(rèn)為就是原始輸入語(yǔ)音信號(hào)文件,而deg.wav就是待測(cè)設(shè)備處理得到的失真輸出語(yǔ)音信號(hào)文件。
用pesqmain.exe對(duì)ref.wav和deg.wav進(jìn)行計(jì)算,計(jì)算完成后可以打開結(jié)果文件觀察客觀評(píng)價(jià)結(jié)果PESQ-MOS值以及延時(shí)大小。
可以重復(fù)以上步驟進(jìn)行多次測(cè)量,然后可以檢查最大值、最小值并計(jì)算均方差。如果均方差較大,則本次測(cè)試可能有問題,測(cè)試結(jié)果不準(zhǔn)確,需要重新檢查測(cè)試設(shè)置、測(cè)試環(huán)境等,確認(rèn)無(wú)誤后重新測(cè)試。也可以在放音單元端將測(cè)試用原始輸入語(yǔ)音信號(hào)循環(huán)放音,在錄音端持續(xù)錄音一段時(shí)間后停止錄音,然后根據(jù)測(cè)試信號(hào)的時(shí)間長(zhǎng)度,利用Cool Edit軟件的編輯功能將原始輸入語(yǔ)音信號(hào)與失真輸出語(yǔ)音信號(hào)分段提取出來(lái)進(jìn)行計(jì)算。
權(quán)利要求
1.一種實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于,它包括如下步驟A)放音,即用雙聲道文件播放原始語(yǔ)音信號(hào),其中一個(gè)聲道播放的原始語(yǔ)音信號(hào)經(jīng)過待測(cè)設(shè)備處理后輸出為失真輸出語(yǔ)音信號(hào);B)錄音,即以相同的采樣率存儲(chǔ)失真輸出語(yǔ)音信號(hào)和另一個(gè)聲道播放的原始語(yǔ)音信號(hào);C)比較,即對(duì)存儲(chǔ)的失真輸出語(yǔ)音信號(hào)和原始語(yǔ)音信號(hào)進(jìn)行比較計(jì)算,得出評(píng)價(jià)結(jié)果。
2.根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于,先啟動(dòng)錄音裝置,再進(jìn)行步驟A和步驟B中的放音和錄音。
3.根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于,所述方法進(jìn)一步包括將原始輸入語(yǔ)音信號(hào)循環(huán)放音,在持續(xù)錄音一段時(shí)間后停止錄音,根據(jù)測(cè)試的時(shí)間將原始輸入語(yǔ)音信號(hào)與失真輸出語(yǔ)音信號(hào)分段提取出來(lái)進(jìn)行處理,并對(duì)每一段分別計(jì)算出評(píng)價(jià)結(jié)果。
4.根據(jù)權(quán)利要求1、2或3所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于,用Cool Edit進(jìn)行步驟A和步驟B中的放音和錄音。
5.根據(jù)權(quán)利要求4所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于所述步驟B)還包括將放音用Cool Edit的左聲道輸出的信號(hào)輸入錄音用Cool Edit的左聲道,并存儲(chǔ)為原始輸入語(yǔ)音信號(hào)波形文件,將放音用Cool Edit的右聲道輸出的信號(hào)輸入待測(cè)設(shè)備單元處理后再輸入錄音用Cool Edit的右聲道,并存儲(chǔ)為失真輸出語(yǔ)音信號(hào)波形文件。
6.根據(jù)權(quán)利要求1、2或3所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于所述步驟C)包括對(duì)所述存儲(chǔ)的兩個(gè)語(yǔ)音信號(hào)文件進(jìn)行處理,計(jì)算出對(duì)待測(cè)設(shè)備的PESQ-MOS值以及語(yǔ)音信號(hào)延時(shí)的大小。
7.根據(jù)權(quán)利要求1、2或3所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法,其特征在于重復(fù)以上所述步驟進(jìn)行多次測(cè)量,然后檢查所得結(jié)果的最大值、最小值并計(jì)算其均方差,若均方差較大,則需重新測(cè)試。
8.一種實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試裝置,其特征在于,包括放音單元、錄音單元和比較單元,其中所述放音單元的輸入端輸入原始語(yǔ)音信號(hào),放音單元的一個(gè)聲道與錄音單元的一個(gè)聲道直接相連,放音單元的另一個(gè)聲道與待測(cè)設(shè)備的輸入端相連,待測(cè)設(shè)備的輸出端與錄音單元的另一個(gè)聲道相連,錄音單元兩個(gè)聲道輸出的信號(hào)再輸入比較單元。
9.根據(jù)權(quán)利要求8所述的實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試裝置,其特征在于,錄音單元將放音單元輸出的原始語(yǔ)音信號(hào)和待測(cè)設(shè)備輸出的失真輸出語(yǔ)音信號(hào)存儲(chǔ)為波形文件。
全文摘要
一種實(shí)現(xiàn)語(yǔ)音質(zhì)量客觀評(píng)價(jià)的測(cè)試方法和裝置,其中方法包括A)放音,即用雙聲道文件播放原始語(yǔ)音信號(hào),其中一個(gè)聲道播放的原始語(yǔ)音信號(hào)經(jīng)過待測(cè)設(shè)備處理后輸出為失真輸出語(yǔ)音信號(hào);B)錄音,即以相同的采樣率存儲(chǔ)失真輸出語(yǔ)音信號(hào)和另一個(gè)聲道播放的原始語(yǔ)音信號(hào);C)比較,即對(duì)存儲(chǔ)的失真輸出語(yǔ)音信號(hào)和原始語(yǔ)音信號(hào)進(jìn)行比較計(jì)算,得出評(píng)價(jià)結(jié)果。裝置包括放音單元、錄音單元和比較單元,其中所述放音單元的輸入端輸入原始語(yǔ)音信號(hào),放音單元的一個(gè)聲道與錄音單元的一個(gè)聲道直接相連,放音單元的另一個(gè)聲道與待測(cè)設(shè)備的輸入端相連,待測(cè)設(shè)備的輸出端與錄音單元的另一個(gè)聲道相連,錄音單元兩個(gè)聲道輸出的信號(hào)再輸入比較單元。
文檔編號(hào)H04S1/00GK1523930SQ03104069
公開日2004年8月25日 申請(qǐng)日期2003年2月20日 優(yōu)先權(quán)日2003年2月20日
發(fā)明者龍建軍 申請(qǐng)人:華為技術(shù)有限公司