專利名稱:用于確定語音信號質(zhì)量的改進(jìn)方法
A.發(fā)明背景本發(fā)明在于聲信號如音頻、語音和聲音信號的質(zhì)量測量的領(lǐng)域。更具體而言,它涉及一種方法和設(shè)備,用于依照客觀測量技術(shù)來確定從語音信號處理系統(tǒng)接收的輸出信號相對于基準(zhǔn)信號的語音質(zhì)量。這種類型的方法和設(shè)備通常是已知的。更具體地,遵循近來所接受的ITU-T建議P.862(見參考[1])的方法和對應(yīng)設(shè)備是這種類型的。依照目前的已知技術(shù),來自諸如無線電信系統(tǒng)、互聯(lián)網(wǎng)協(xié)議傳輸系統(tǒng)承載的聲音和語音編解碼器的語音信號處理和/或傳送系統(tǒng)的輸出信號和基準(zhǔn)信號是依照人聽力的心理物理感覺模型來映射于表示信號上的,所述輸出信號通常是降級的信號并且其信號質(zhì)量待被確定。作為基準(zhǔn)信號,可使用被施加了所獲得的輸出信號的系統(tǒng)的輸入信號,如在所引用的參考中。隨后,從所述表示信號來確定微分信號,依照所使用的表示在輸出信號中存在的在系統(tǒng)中維持的擾動(dòng)感覺模型。微分或擾動(dòng)信號構(gòu)成輸出信號依照表示模型而偏離于基準(zhǔn)信號的程度的表達(dá)。然后,依照認(rèn)知模型來處理擾動(dòng)信號,在該模型中,人測試對象的某種特性被模型化以獲得時(shí)間無關(guān)的質(zhì)量信號,其是輸出信號聽覺質(zhì)量的量度。
然而,已知技術(shù)具有以下缺點(diǎn),即由于基準(zhǔn)信號和降級信號之間的嚴(yán)重音質(zhì)差異,降級信號的預(yù)測語音質(zhì)量是不準(zhǔn)確的或者至少是不可靠的。
B.發(fā)明概述本發(fā)明的目的是提供一種沒有所述缺點(diǎn)的改進(jìn)方法和改進(jìn)設(shè)備,用于確定語音信號的質(zhì)量。
本發(fā)明尤其是基于以下觀察。從人感覺的基礎(chǔ),已知的是人的聽覺系統(tǒng)遵循感覺上的恒定性規(guī)則,例如大小、音高、音質(zhì)等的恒定性。這意味著人的聽覺系統(tǒng)原則上以某種程度補(bǔ)償了大小或音高或音質(zhì)等的差異。
例如在從參考[1]已知的方法和設(shè)備中使用的一種感性模型化考慮了借助原始(即基準(zhǔn))信號的音高功率密度的部分補(bǔ)償來部分補(bǔ)償一些嚴(yán)重效應(yīng)。這種補(bǔ)償是通過使用補(bǔ)償因子在頻域中相乘而實(shí)現(xiàn)的。這是因?yàn)檠a(bǔ)償因子是從原始和降級信號的音高功率密度的(時(shí)間平均的)功率譜的比來計(jì)算的。補(bǔ)償因子從不大于(即被截取于(clipped at))特定的預(yù)定常數(shù)值,即20dB。然而在嚴(yán)重音質(zhì)差異(例如功率密度>20dB)的情況下,發(fā)現(xiàn)使用特定預(yù)定常數(shù)界限值之間的部分補(bǔ)償因子的這種補(bǔ)償導(dǎo)致了對語音信號質(zhì)量的不可靠的預(yù)測。然后已認(rèn)識到,例如對于音色,人的聽覺系統(tǒng)以頻率相關(guān)的方式來補(bǔ)償嚴(yán)重差異。更具體而言,例如在正常的聽音室中,由于低頻著色(coloration)的暴露,低頻通常比高頻補(bǔ)償?shù)亩?,從而?dǎo)致客觀預(yù)測和主觀體驗(yàn)的語音色量之間的上述低著色。本發(fā)明的目的是從這個(gè)意義上改進(jìn)人聽覺系統(tǒng)的感性模型化。
依照本發(fā)明的一個(gè)方面,以上種類的方法包括步驟在頻域中補(bǔ)償輸出和基準(zhǔn)信號的功率差。補(bǔ)償步驟是通過以下步驟來實(shí)現(xiàn)的應(yīng)用從所述輸出和基準(zhǔn)信號的信號值的比得到的補(bǔ)償因子,這里使用通過使用頻率相關(guān)函數(shù)確定的截取值。頻率相關(guān)的函數(shù)優(yōu)選為單調(diào)函數(shù),其更優(yōu)選地與一個(gè)冪成比例,更具體而言是頻率的三次冪。
依照本發(fā)明的另外方面,以上種類的設(shè)備包括補(bǔ)償裝置,用于在頻域中補(bǔ)償輸出和基準(zhǔn)信號的功率差。補(bǔ)償裝置包括裝置,用于從所述輸出和基準(zhǔn)信號的信號值的比得到補(bǔ)償因子,其已被設(shè)置使用至少部分地頻率相關(guān)的截取函數(shù)。
C.參考[1]ITU-T Recommendation P.862(02/2001),Series PTelephone Transmission Quality,Telephone Installations,Local Line Networks;Methods for objective and subjectiveassessment of quality-Perceptual evaluation of speechquality(PESQ),an objective method for end-to-end speechquality assessment of narrow-band telephone networks andspeech codes.
參考[1]被引入本申請作為參考。
D.附圖簡述參照包括以下圖的附圖,借助對說明性實(shí)施例的描述,本發(fā)明將被進(jìn)一步說明
圖1示意性地示出已知系統(tǒng)設(shè)置,包括用于確定語音信號質(zhì)量的設(shè)備;圖2以方塊圖詳細(xì)示出被包括在圖1中所示的系統(tǒng)中的設(shè)備的一部分,在其中實(shí)施了補(bǔ)償運(yùn)算;圖3示出一個(gè)圖形圖表,用于說明在確定用于補(bǔ)償運(yùn)算的補(bǔ)償因子的過程中,使用恒定的上和下截取值的現(xiàn)有技術(shù)與使用第一組頻率相關(guān)的上和下截取值的本發(fā)明之間的基本差異;圖4示出畫出第二組頻率相關(guān)的上和下截取值的圖形圖表;圖5示出畫出第三組頻率相關(guān)的上和下截取值的圖形圖表。
E.說明性實(shí)施例的描述圖1示意性地示出客觀測量技術(shù)的應(yīng)用的已知設(shè)置,其基于人聽覺感覺和認(rèn)知模型并遵循例如ITU-T建議P.862,用于估算語音鏈路或編解碼器的感性質(zhì)量。它包括測試中的系統(tǒng)或電信網(wǎng)絡(luò)10,為簡便起見,在以下被稱為系統(tǒng)10;以及質(zhì)量測量設(shè)備11,用于對所提供的語音信號的感性分析。語音信號X0(t)一方面被用作系統(tǒng)10的輸入信號,而另一方面,被用作設(shè)備11的第一輸入信號X(t)。系統(tǒng)10的輸出信號Y(t),實(shí)際上是受系統(tǒng)10影響的語音信號X0(t),被用作設(shè)備11的第二輸入信號。設(shè)備11的輸出信號Q表示通過系統(tǒng)10的語音鏈路的感性質(zhì)量的估算。對于質(zhì)量測量設(shè)備的輸入信號,由于語音鏈路的輸入端和輸出端特別是在它通過電信網(wǎng)絡(luò)運(yùn)行的情況下是遠(yuǎn)程的,因此在大多數(shù)情況下利用了在數(shù)據(jù)庫上存儲的語音信號X(t)。這里,作為慣例,語音信號被理解成意味著基本上可由人的聽力感覺的每個(gè)聲音(sound),如語音和音調(diào)。測試中的系統(tǒng)當(dāng)然也可以是仿真系統(tǒng),其仿真例如電信網(wǎng)絡(luò)或這種網(wǎng)絡(luò)的特定部分。設(shè)備11實(shí)施主處理步驟,其依次包括在預(yù)處理部11.1中,由預(yù)處理裝置12實(shí)施的預(yù)處理步驟;在處理部11.2中,由第一和第二信號處理裝置13和14實(shí)施的進(jìn)一步處理步驟;以及在信號組合部11.3中,由信號微分裝置15和模型化裝置16實(shí)施的組合信號處理步驟。在預(yù)處理步驟中,信號X(t)和Y(t)被準(zhǔn)備用于裝置13和14中的進(jìn)一步處理步驟,所述預(yù)處理包括功率水平按比例縮放和時(shí)間對準(zhǔn)運(yùn)算,由此輸出經(jīng)預(yù)處理的信號XP(t)和YP(t),其是例如基準(zhǔn)和輸出信號的按比例縮放的版本。進(jìn)一步的處理步驟意味著依照人聽覺系統(tǒng)的心理物理感覺模型在表示信號R(Y)和R(X)上映射(降級的)輸出信號Y(t)和基準(zhǔn)信號X(t)。在組合信號處理步驟期間,借助微分裝置15從所述表示信號來確定微分或擾動(dòng)信號D。然后依照模型通過模型化裝置16來處理微分信號D以獲得質(zhì)量信號Q,在所述模型中人測試對象的某種特性例如認(rèn)知特性已被模型化。
最近已經(jīng)知道,當(dāng)前的客觀測量技術(shù)可能具有重大的缺點(diǎn),即由于基準(zhǔn)信號和降級信號之間的嚴(yán)重音色差異,降級信號的語音質(zhì)量不能被正確預(yù)測。因此,對于這種情況,客觀獲得的質(zhì)量信號Q擁有差的與主觀確定的質(zhì)量測量如人測試對象的平均評價(jià)得分(MOS)的相關(guān)性。這種嚴(yán)重的音色差異可作為所使用的用于記錄原始語音信號的結(jié)果而出現(xiàn)。有效的記錄技術(shù)是例如已知為“近傳聲低音提升(closemiking bass boost)”的技術(shù),其涉及低頻范圍內(nèi)的相當(dāng)大的濾出。嚴(yán)重音色差異的進(jìn)一步原因可能在于在諸如相對于產(chǎn)生原始語音信號的房間或區(qū)域和評估降級語音信號的房間或區(qū)域之間的混響的條件下的差異。然而,特別是在低頻域中,房間傳遞函數(shù)示出比在中等和高頻中大的頻率響應(yīng)函數(shù)的不規(guī)則性。然而,人類所感覺的由這種不規(guī)則性導(dǎo)致的擾動(dòng)比當(dāng)前客觀模型所預(yù)測的是小的干擾。
從人感覺的基礎(chǔ),已知的是人的聽覺系統(tǒng)遵循感覺上的恒定性規(guī)則,例如大小、音高、音色等的恒定性。這意味著人的聽覺系統(tǒng)原則上以某種程度補(bǔ)償了大小或音高或音色等的差異。
目前的感性模型化考慮了借助原始(即基準(zhǔn))信號的音高功率密度的部分補(bǔ)償來部分補(bǔ)償一些嚴(yán)重效應(yīng)。通過在頻域中將原始信號的音高功率密度與補(bǔ)償因子(CF)相乘而實(shí)現(xiàn)這種補(bǔ)償。圖2以方塊圖詳細(xì)示出被包括在圖1中所示的設(shè)備11的一部分,即處理部11.2,在其中實(shí)施了補(bǔ)償運(yùn)算。第一信號處理裝置13的信號處理在第一級中包括變換裝置21,在其中例如借助FFT(快速傅立葉變換),經(jīng)預(yù)處理的降級信號Yp(t)從時(shí)域中的信號被變換為時(shí)頻域中的時(shí)間和頻率相關(guān)的輸出信號Y(f,t);并在第二級中包括壓縮裝置22,在其中由此變換的信號Y(f,t)經(jīng)歷信號壓縮,從而導(dǎo)致表示信號R(Y)。以類似的方式,第二信號處理裝置14的信號處理在第一級中包括變換裝置23,在其中經(jīng)預(yù)處理的原始信號Xpt)被變換為時(shí)間和頻率相關(guān)的輸出信號X(f,t);并在第二級中包括壓縮裝置24,在其中由此變換的信號X(f,t)經(jīng)歷信號壓縮以獲得表示信號R(X)。在兩個(gè)級23和24之間,在信號壓縮之前,經(jīng)變換的信號X(f,t)經(jīng)歷通過補(bǔ)償裝置25的補(bǔ)償運(yùn)算,該運(yùn)算導(dǎo)致經(jīng)補(bǔ)償?shù)淖儞Q信號Xc(f,t)。
和平常一樣,經(jīng)預(yù)處理的降級和基準(zhǔn)信號的變換優(yōu)選地為所謂的變形函數(shù)所遵循,該函數(shù)將以赫茲表示的頻率尺度變換為以Bark表示的頻率尺度(亦已知為音高功率密度尺度)。
補(bǔ)償運(yùn)算是借助與補(bǔ)償因子CF的相乘而實(shí)現(xiàn)的,在通過計(jì)算裝置26實(shí)現(xiàn)的計(jì)算運(yùn)算中,所述補(bǔ)償因子是從時(shí)間和頻率相關(guān)的信號Y(f,t)和X(f,t)的頻率響應(yīng)FR(f),即兩個(gè)信號的音高功率密度的(時(shí)間平均的)功率譜的比得到的。頻率響應(yīng)FR(f)可由以下來表達(dá)FR(f)=∫γ(f,t)/∫X(f,t)(1)然后以以下方式從該比率來計(jì)算補(bǔ)償因子CF(i)對于CL-≤FR(f)≤CL+,CF=FR(f),(ii)對于FR(f)<CL-,CF=CL-,和(iii)對于FR(f)>CL+,CF=CL+,其中分別被稱為下和上截取值的CL-和CL+是特定的預(yù)定常數(shù)值,在該值處頻率響應(yīng)被截取以獲得用于以上所示的部分補(bǔ)償?shù)难a(bǔ)償因子CF。這樣的截取值是在例如測量技術(shù)的初始化階段內(nèi)被預(yù)定的。對于依照參考[1]的方法,這些預(yù)定的截取值CL-和CL+分別是0.01(-20dB)和100(+20dB)。然而在嚴(yán)重音色差異(例如功率密度>20dB)的情況下,發(fā)現(xiàn)使用被截取于特定預(yù)定常數(shù)值的補(bǔ)償因子的這種部分補(bǔ)償導(dǎo)致了對語音信號質(zhì)量的不可靠的預(yù)測。然后發(fā)現(xiàn),對人的聽覺系統(tǒng)的感性模型化的改進(jìn)可通過以下來實(shí)現(xiàn)至少在聽覺系統(tǒng)頻率范圍的一部分上,優(yōu)選為在較低部分上,使用不再被截取于常數(shù)值而是頻率相關(guān)的值的補(bǔ)償因子來實(shí)施補(bǔ)償。這種頻率相關(guān)的截取值在以下由被分別稱為下和上截取函數(shù)的頻率相關(guān)函數(shù)cl-(f)和cl+(f)來表示。
補(bǔ)償因子CF再次依照公式(1)從頻率響應(yīng)來計(jì)算,但以以下方式通過使用頻率相關(guān)的下和上截取函數(shù)來截取(i)對于cl-(f)≤FR(f)≤cl+(f),CF=FR(f),(ii)對于FR(f)<cl-(f),CF=cl-(f),和
(iii)對于FR(f)>cl+(f),CF=cl+(f).
原則上,上和下截取函數(shù)可被相互獨(dú)立地選擇。然而,作為頻率響應(yīng)函數(shù)的倒數(shù)特征(reciprocal character)的結(jié)果,上截取函數(shù)cl+(f)優(yōu)選地被選擇成等于或至少近似于(見以下)下截取函數(shù)cl-(f)的顛倒(倒數(shù)),反之亦然。
例如下截取函數(shù)cl-(f)的截取函數(shù)至少在頻率相關(guān)的一部分或多部分上優(yōu)選地隨增加的頻率而單調(diào)增加或單調(diào)減小,而以對應(yīng)的方式,另一個(gè)截取函數(shù)是單調(diào)減小或增加的。截取函數(shù)優(yōu)選地在例如測量系統(tǒng)的初始化階段內(nèi)被預(yù)定。
借助對上和下截取函數(shù)的適當(dāng)選擇,可導(dǎo)致部分補(bǔ)償較好地符合感覺上的恒定性的上述規(guī)則。從實(shí)驗(yàn)上可看到,特別是在低頻范圍內(nèi)與頻率的p次冪即fp(p≠0)成比例的單調(diào)增加函數(shù)是用于下截取函數(shù)的這樣的適當(dāng)選擇。優(yōu)選地p=3。以下參照圖3來說明選擇這樣的頻率相關(guān)的截取函數(shù)cl-(f)和cl+(f)而不是恒定截取值CL-和CL+的不同。
圖3用作為實(shí)例的圖形圖表來示出用于分別由FR1(f)和FR2(f)表示的相互不同的第一和第二語音信號的頻率響應(yīng)函數(shù),沿縱軸布置的頻率響應(yīng)值(以dB表示)是沿橫軸布置的頻率(以Bark表示)的函數(shù)。-20dB和+20dB處的水平虛線31和32分別表示恒定截取值CL-和CL+。曲線33和34分別表示頻率相關(guān)的下和上截取函數(shù)cl-(f)和cl+(f)。對于特定的fmax以上的頻率,頻率響應(yīng)函數(shù)FR1(f)和FR2(f)沒有有意義的值,對于人的聽覺系統(tǒng),所述fmax是大約30Bark。
作為一個(gè)實(shí)例,由曲線33和34表示的圖示下和上截取函數(shù)被選擇為cl-(f)=CL-{f/fmax}3和cl+(f)={cl-(f)+Δ}-1其中Δ是一個(gè)小的數(shù)(例如0.015),從而在對于f的任何值cl-(f)≈0的情況下,避免cl+(f)的過大值。
在該實(shí)例中,頻率響應(yīng)函數(shù)FR1(f)完全存在于兩個(gè)恒定截取值CL-和CL+與截取函數(shù)之間。然而,除了恒定截取值CL-和CL+之間的點(diǎn)以外,函數(shù)FR2(f)還具有向上方向上的第一段(lob)35,其在點(diǎn)A和D之間增加到水平線32以上,并且在點(diǎn)B和C之間增加到甚至曲線34以上。它還具有在向下方向上的第二段36,其在點(diǎn)E和F之間下降到水平線31以下。
對于具有完全存在于截取值組和截取函數(shù)組兩者之間的頻率響應(yīng)函數(shù)如函數(shù)FR1(f)的語音信號,在確定補(bǔ)償因子CF的過程中將沒有差異,這是因?yàn)椴恍枰厝?。對于具有部分存在于截取值組之間并具有一個(gè)或多個(gè)段的頻率響應(yīng)函數(shù)如函數(shù)FR1(f)的語音信號,在確定補(bǔ)償因子CF的過程中將存在相當(dāng)大的差異。為根據(jù)現(xiàn)有技術(shù)方法來計(jì)算補(bǔ)償因子CF,點(diǎn)A和D之間的頻率響應(yīng)函數(shù)FR2(f)的值被截取于上截取值CL+,而根據(jù)新方法,僅點(diǎn)B和C之間的頻率響應(yīng)函數(shù)FR2(f)的值被截取,不僅對于依照上截取函數(shù)cl+(f)的在局部大的多的值,而且還以頻率相關(guān)的方式。以類似方式,點(diǎn)E和F之間的頻率響應(yīng)函數(shù)FR2(f)的值被截取于下截取值CL-,而根據(jù)新方法,點(diǎn)E和F之間的頻率響應(yīng)函數(shù)FR2(f)的值根本不被截取。
對cl-(f)的另一個(gè)選擇可以是對于f≤fA={CL-}1/3fc,cl-(f)={f/fc}3和對于f≥fA={CL-}1/3fc,cl-(f)=CL-。
fc是人聽覺系統(tǒng)的頻率范圍的中心頻率(即fmax/2≈15Bark)。對cl-(f)的這種選擇與對應(yīng)的cl+(f)一起被畫在圖4中。下和上截取函數(shù)分別由數(shù)字43和44來表示,每個(gè)都具有頻率相關(guān)的部分43.1(44.1)和常數(shù)值部分43.2(44.2)。具體而言,對于有大的音色差異的語音信號,該選擇從實(shí)驗(yàn)上示出了預(yù)測質(zhì)量和主觀測量質(zhì)量之間5%以上的相關(guān)性的增加。
更一般地,下截取函數(shù)可以是在增加頻率的方向上連續(xù)頻率范圍上的頻率相關(guān)部分的聯(lián)結(jié),每個(gè)部分都是單調(diào)增加的函數(shù),還具有連續(xù)頻率范圍上的更低的頻率相關(guān)性。例如,所述部分是與頻率的冪成比例的函數(shù),該冪在增加頻率的方向上對每個(gè)隨后的頻率范圍而減小。例如,在最低頻率范圍內(nèi)與已提及的函數(shù)f3成比例的第一部分,隨后是在第二緊接的頻率范圍內(nèi)與f2成比例的第二部分,隨后是在第三緊接的頻率范圍內(nèi)與f2/3成比例的第三部分,等等。
又一個(gè)選擇涉及聽覺系統(tǒng)頻譜中的對稱性對于f≤fA={CL-}1/3fc,cl-(f)={f/fc}3對于f≥fB=fmax-{CL-}1/3fc,cl-(f)={(fmax-f)/fc}3,和對于fA≤f≤fB,cl-(f)=CL-對cl-(f)的這種選擇與對應(yīng)的cl+(f)一起被畫在圖5中。下和上截取函數(shù)分別由數(shù)字53和54來表示,每個(gè)依次具有低頻范圍內(nèi)的第一頻率相關(guān)部分43.1(44.1),中間常數(shù)值部分43.2(44.2),以及高頻范圍內(nèi)的第二頻率相關(guān)部分43.3(44.3)。
不是經(jīng)變換的信號X(f,t),而是經(jīng)變換的信號Y(f,t)可經(jīng)歷補(bǔ)償運(yùn)算,補(bǔ)償因子從頻率響應(yīng)函數(shù)來計(jì)算,該頻率響應(yīng)函數(shù)實(shí)際上是由公式(1)表達(dá)的頻率響應(yīng)FR(f)的倒數(shù)。
權(quán)利要求
1.用于依照客觀語音測量技術(shù)來確定相對于基準(zhǔn)信號(X(t))的語音信號處理系統(tǒng)輸出信號(Y(t))的質(zhì)量(Q)的方法,該方法包括步驟在頻域中補(bǔ)償輸出和基準(zhǔn)信號的功率差,其中補(bǔ)償步驟是通過以下來實(shí)現(xiàn)的應(yīng)用從所述輸出和基準(zhǔn)信號的信號值的比(FR(f))得到的補(bǔ)償因子(CF),這里使用通過至少部分地頻率相關(guān)的函數(shù)(33;34;43;44;53;54)而確定的截取值。
2.權(quán)利要求1的方法,其中補(bǔ)償因子是使用上和下截取值而得到的,上和下截取值兩者是由至少部分頻率相關(guān)的函數(shù)(33;34;43;44;53;54)確定的。
3.權(quán)利要求1或2的方法,其中在相對于人聽覺系統(tǒng)頻率范圍(0≤f≤fmax)的中心頻率(fc)的低頻范圍內(nèi)的至少一個(gè)所述截取值的頻率相關(guān)值是從單調(diào)增加的頻率相關(guān)函數(shù)(43.1;44.1;53.1;54.1)得到的。
4.權(quán)利要求3的方法,特征在于單調(diào)增加的頻率相關(guān)函數(shù)與頻率的冪成比例(43.1;44.1;53.1;54.1)。
5.權(quán)利要求5的方法,特征在于單調(diào)增加的頻率相關(guān)函數(shù)與頻率的三次冪成比例(43.1;44.1;53.1;54.1)。
6.權(quán)利要求3或4的方法,特征在于單調(diào)增加的頻率相關(guān)函數(shù)與頻率和中心頻率的比的冪成比例。
7.權(quán)利要求2-7的任何一個(gè)的方法,特征在于從所述頻率相關(guān)函數(shù)得到的至少一個(gè)所述截取值(53;54)顯示相對于人聽覺系統(tǒng)頻率范圍的中心頻率的對稱性。
8.權(quán)利要求1的方法,特征在于相對于人聽覺系統(tǒng)頻率范圍的中心頻率,頻率相關(guān)函數(shù)的頻率相關(guān)性的量度對于低頻比對于高頻高。
9.用于依照客觀語音測量技術(shù)來確定相對于基準(zhǔn)信號(X(t))的語音信號處理系統(tǒng)輸出信號(Y(t))的質(zhì)量(Q)的設(shè)備,該設(shè)備包括補(bǔ)償裝置(25,26),用于在頻域中補(bǔ)償輸出和基準(zhǔn)信號的功率差,其中補(bǔ)償裝置包括裝置(26),用于從所述輸出和基準(zhǔn)信號的信號值的比(FR(f))得到補(bǔ)償因子(CF),這里使用至少部分地頻率相關(guān)的函數(shù)(33;34;43;44;53;54)。
10.權(quán)利要求9的設(shè)備,其中用于得到補(bǔ)償因子(CF)的裝置(26)已被安排以便使用頻率相關(guān)的下和上截取函數(shù)(33;34;43;44;53;54)。
全文摘要
在降級和基準(zhǔn)信號示出其之間的嚴(yán)重音色差異的情況下,用于預(yù)測在語音處理/傳送系統(tǒng)中降級的語音信號的感性質(zhì)量的客觀測量方法和設(shè)備具有不可靠的預(yù)測結(jié)果。通過使用頻率相關(guān)截取的補(bǔ)償因子在信號處理級中應(yīng)用部分補(bǔ)償步驟以便補(bǔ)償頻域中降級信號和基準(zhǔn)信號之間的功率差,實(shí)現(xiàn)了改進(jìn)。優(yōu)選的是,用于截取補(bǔ)償因子的截取值具有比在高頻范圍中大的相對于人聽覺系統(tǒng)中心頻率的低頻范圍中的頻率相關(guān)性。
文檔編號G10L25/69GK1514996SQ02811511
公開日2004年7月21日 申請日期2002年5月21日 優(yōu)先權(quán)日2001年6月8日
發(fā)明者J·G·比倫斯, J G 比倫斯 申請人:皇家Kpn公司