專利名稱:音頻質(zhì)量的客觀測量的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及對音頻質(zhì)量的客觀測量。
背景技術(shù):
PEAQ是針對音頻質(zhì)量的客觀測量的ITU-R標(biāo)準(zhǔn),參見[1]。這是一種讀取原始音 頻波形和處理后的音頻波形,并且輸出對感知到的整體質(zhì)量的估計(jì)的方法。PEAQ性能受限于其不能評(píng)價(jià)帶寬上有巨大差異的信號(hào)的質(zhì)量。此外,由于PEAQ依 賴于在有限的數(shù)據(jù)庫上訓(xùn)練出的神經(jīng)網(wǎng)絡(luò)權(quán)重,因此當(dāng)對未知數(shù)據(jù)進(jìn)行評(píng)估時(shí),PEAQ表現(xiàn) 出糟糕的性能。PESQ是音頻(語音)質(zhì)量的客觀測量的ITU-T標(biāo)準(zhǔn),參見[2]。PESQ性能也受限 于其不能評(píng)價(jià)帶寬上有巨大差異的信號(hào)的質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明的目的是增強(qiáng)對音頻質(zhì)量的客觀感知評(píng)估的性能。根據(jù)所附專利權(quán)利要求來實(shí)現(xiàn)該目的。簡而言之,本發(fā)明涉及基于一個(gè)或者幾個(gè)模型輸出變量來對音頻質(zhì)量進(jìn)行客觀感 知評(píng)估,并且本發(fā)明包括對至少一個(gè)該模型輸出變量進(jìn)行帶寬補(bǔ)償。
可以通過下面的描述以及附圖來最佳地理解本發(fā)明及其目的和優(yōu)點(diǎn),其中圖1是示意了人類聽覺和質(zhì)量評(píng)價(jià)過程的框圖;圖2是示意了模仿人類質(zhì)量評(píng)價(jià)過程的語音質(zhì)量評(píng)價(jià)的框圖;圖3是用于執(zhí)行原始PEAQ方法的裝置的框圖;圖4是圖1中的裝置依照于本發(fā)明的修改的示例的框圖;圖5是用于依照于本發(fā)明的對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu) 選實(shí)施例的框圖;圖6是依照于本發(fā)明的對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖;圖7是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的實(shí)施 例的框圖;圖8是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的實(shí)施例 的流程圖;圖9是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu)選 實(shí)施例的框圖;以及圖10是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。
具體實(shí)施例方式在下面的描述中,用相同的引用名稱來表示執(zhí)行相同或者相似功能的單元。本發(fā)明一般地涉及模仿聽覺感知以評(píng)價(jià)信號(hào)質(zhì)量的心理聲學(xué)的方法??梢詫⑷祟?的評(píng)價(jià)信號(hào)質(zhì)量過程劃分為兩個(gè)主要步驟,如圖1所示,即聽覺處理和認(rèn)知映射。聽覺處理 塊10包含將實(shí)際聲音變換為神經(jīng)刺激的部分。該過程包括Bark縮放頻率映射以及從信號(hào) 功率到感知到的響度的轉(zhuǎn)換。與聽覺處理塊10相連的認(rèn)知映射塊12是大腦提取信號(hào)最重 要的特征并且評(píng)價(jià)整體質(zhì)量的地方。如圖2所示,客觀質(zhì)量評(píng)價(jià)過程同時(shí)包含感知變換和認(rèn)知處理以模仿人類感知。 感知變換14模仿聽覺處理并且同時(shí)在原始信號(hào)s和失真信號(hào)y上執(zhí)行。輸出是發(fā)送至大 腦的聲音表示的測量。該過程包括根據(jù)非線性的已知的刻度以及從Hertz到Bark刻度的 變換將信號(hào)功率變換為響度。耳朵的敏感度依賴于頻率,并且計(jì)算可聽聲音的閾值。在該 步驟中還要考慮到遮蔽效應(yīng)。從該感知變換,計(jì)算內(nèi)部表示,該內(nèi)部表示預(yù)期模仿發(fā)送至大 腦的信息。在認(rèn)知處理塊16中,選擇預(yù)期描述信號(hào)的特征(分別由&和、所指示)。最終 在塊18中計(jì)算干凈的和失真的信號(hào)之間的距離d(l,、)。該距離得到質(zhì)量分?jǐn)?shù)0。PEAQ以兩種模式運(yùn)行1)基本和2)高級(jí)。為了簡化,我們僅討論基本版本,并且 將其稱作PEAQ,但是也可以將該概念應(yīng)用于高級(jí)版本。作為第一步驟,PEAQ在感知域中通過對人類聽覺系統(tǒng)的屬性進(jìn)行建模來變換輸入 信號(hào)。接下來,算法提取被稱作模型輸出變量(MOV)的11個(gè)參數(shù)。在最后階段,依靠具有 一個(gè)隱形層的人工神經(jīng)網(wǎng)絡(luò)將MOV映射到單一質(zhì)量評(píng)分。在下面表1中給出M0V。列1和 2給出他們的名稱和描述,同時(shí)列3和4介紹在提出的修改的描述中使用的符號(hào)。表 1
7 圖3是用于執(zhí)行原始PEAQ方法的裝置的框圖。將原始和處理后的(改變的)信 號(hào)轉(zhuǎn)發(fā)至相應(yīng)的聽覺處理塊20,該聽覺處理塊20將他們變換為相應(yīng)的內(nèi)部表示。將該內(nèi)部 表示轉(zhuǎn)發(fā)至提取塊22,提取塊22提取M0V,進(jìn)而將MOV轉(zhuǎn)發(fā)至人工神經(jīng)網(wǎng)絡(luò)24,人工神經(jīng)網(wǎng) 絡(luò)24預(yù)測處理后的輸入信號(hào)的質(zhì)量。圖4是圖1中裝置的依照于本發(fā)明的修改的示例的框圖。該實(shí)施例的基本概念是用帶寬補(bǔ)償+基于分位數(shù)的平均模塊(圖4中包括塊26 和28在內(nèi)的虛線方框)來替代原始PEAQ的神經(jīng)網(wǎng)絡(luò)(圖3中的虛線方框)。該提出的方 案是基于與原始PEAQ相同的感知變換和MOV提取的。本發(fā)明的基本方面是顯式地說明(在圖4的塊26中)下述事實(shí)由于原始和處理 后的信號(hào)的帶寬中的巨大差異,大多數(shù)MOV產(chǎn)生不可靠的結(jié)果。從而,根據(jù)本發(fā)明的該方面 對參考信號(hào)和測試(也稱作處理后的)信號(hào)之間的帶寬差異進(jìn)行補(bǔ)償。本發(fā)明的另一個(gè)方面是避免在數(shù)據(jù)庫上訓(xùn)練的映射(在該情況中,具有42個(gè)參數(shù) 的人工神經(jīng)網(wǎng)絡(luò))。當(dāng)處理未知/新類型的數(shù)據(jù)時(shí),該類型的映射可以導(dǎo)致不可靠的結(jié)果。
8提出的映射(基于分位數(shù)的平均,圖4中塊28)不具有訓(xùn)練參數(shù)。下面,我們將把提出的修改成為PEAQ-E (PEAQ-增強(qiáng))。PEAQ-E是基于與PEAQ相 同的MOV的,但是優(yōu)選地被縮放至區(qū)間W,1](當(dāng)然其他縮放或者標(biāo)準(zhǔn)化范圍也是可行的)。 參見圖4,除了向神經(jīng)網(wǎng)絡(luò)饋送(如在PEAQ中進(jìn)行的一樣)之外,優(yōu)選地將這些MOV輸入兩 階段過程,該過程包括帶寬補(bǔ)償和基于分位數(shù)的平均。帶寬補(bǔ)償移除了 MOV之間的主要非 線性依賴性,并且允許使用更簡單的映射方案(基于分位數(shù)的平均,而不是訓(xùn)練的神經(jīng)網(wǎng) 絡(luò))。依照于下列公式,帶寬補(bǔ)償將每 號(hào)說明)
個(gè)MOV Fi變換為新的MOV廠’(參見表1的符 其中
Nly 11 /Iv 以及a = ^Jabw
(3)并且其中I I. I I表示(2)中的絕對值。此處BandwidthRef表示原始信號(hào)的帶寬 的測量,并且BandwidthTest表示處理后的信號(hào)的帶寬的測量。盡管公式(3)給出α是ABW的平方根,ABW的其他壓縮函數(shù)也是可行的,例如
α = ABff1 α = ABff0
0. 4
⑷α = Iog(ABff)在該帶寬補(bǔ)償知州,新的補(bǔ)償?shù)腗OV <可以用于訓(xùn)練PEAQ中的神經(jīng)網(wǎng)絡(luò)。然 而,備選方案是使用下面描述的基于分位數(shù)的平均過程。依照于本發(fā)明的實(shí)施例的基于分位數(shù)的平均是多步驟過程。首先,將相同類型的 帶寬補(bǔ)償?shù)腗OV廠'分為五組。(參見表1的組定義),并且依照于下列公式向每一個(gè)組 分配特征值G1. ..G5:
G2=\(F;+F)
G4= F; G5=K
這些特征值表示信號(hào)的不同方面,即
G1-原始的和處理的信號(hào)的時(shí)間包絡(luò)的差值的測量
G2-噪音對遮蔽閾值的比率的測量
G3-檢測原始的和處理的信號(hào)之間的差值的概率的測量
5 6 7 8 9
G4-誤差信號(hào)的調(diào)和結(jié)構(gòu)的強(qiáng)度的測量G5-失真的部分響度的測量一旦已經(jīng)形成這五個(gè)特征值G1 級(jí),即 接下來計(jì)算剩余子集合的{G,}; 在公式(5)、(6)、(7)以及(11)中,可以用加權(quán)平均來替代平均。圖5是用于依照于本發(fā)明對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu)選 實(shí)施例的框圖。將參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至ABW計(jì)算器30,并且將計(jì) 算出的相對帶寬差值A(chǔ)BW轉(zhuǎn)發(fā)至α計(jì)算器32,該α計(jì)算器32依照于例如上面(3)或(4) 中給出的一個(gè)公式來確定α的值。優(yōu)選地,縮放單元33將模型輸出變量Fi縮放或者標(biāo)準(zhǔn) 化至例如區(qū)間W,l]。將Δ BW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34,該帶寬補(bǔ)償器34還接收優(yōu) 選地縮放的變量F”在該實(shí)施例中,依照于上面的(1)來執(zhí)行帶寬補(bǔ)償??紤]到(3)和(4)中給出的示例,應(yīng)當(dāng)理解可以將α視作ABW的函數(shù),α = α (ABW)。一個(gè)可能性是使α為階梯函數(shù) 其中,Θ是閾值。在該情況下將⑴化簡為 由下列公式給出(1)的進(jìn)一步概括F' = β(ΑΒΨ)^ + a(ABW)ABW其中,β (ABW)是ABW的另一個(gè)函數(shù)。一般地,ABW是BandwidthRef和BandwidthTest之間的距離的測量。從而,由于 不同的映射,與(2)不同的其他測量也是可能的。一個(gè)示例是ABff = (BandwidthRef-BandwidthTest)2 (15)現(xiàn)在返回圖5,與原始PEAQ標(biāo)準(zhǔn)一樣的,可以將帶寬補(bǔ)償?shù)哪P洼敵鲎兞繌S'轉(zhuǎn)發(fā) 至訓(xùn)練人工網(wǎng)絡(luò)。然而,在圖5所示的優(yōu)選實(shí)施例中,將變量<轉(zhuǎn)發(fā)至分組單元36,該分組 單元將他們分為不同組并且如上面(5)_(9)所示的計(jì)算每一個(gè)組的特征值。將這些特征值 Gk轉(zhuǎn)發(fā)至排序和選擇單元38,該排序和選擇單元38對他們進(jìn)行排序并且移除最小和最大 值。將剩余的特征值62、63、64轉(zhuǎn)發(fā)至平均單元40,平均單元40依照于(11)形成表示預(yù)測 的質(zhì)量的測量。
...G5,對這些值進(jìn)行排序,并且移除最小和最大等 (10)
1,平均值,該平均值是PEAQ-E的輸出,即
(11)
(12)
(13) (14)
圖6是依照于本發(fā)明的對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。步驟S 1如上所述的確定ABW。步驟S2如上所述的確定α。步驟S3如 上所述使用優(yōu)選地縮放的模型輸出變量Fi,來確定帶寬補(bǔ)償?shù)哪P洼敵鲎兞?lt;。可以將這 些補(bǔ)償?shù)淖兞哭D(zhuǎn)發(fā)至訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)。然而,在優(yōu)選實(shí)施例中,取而代之地將他們轉(zhuǎn)發(fā)至 基于分位數(shù)的平均過程中,該過程開始于步驟S4。步驟S4將帶寬補(bǔ)償?shù)哪P洼敵鲎兞?lt;分 成不同的模型輸出變量組。步驟S5形成特征值Gk的集合(參考(5)-(9)所描述的),每個(gè) 組一個(gè)特征值。步驟S6刪除極端(最大和最小)特征值。步驟S7通過對剩余的特征值求 平均來形成經(jīng)過預(yù)測的質(zhì)量(ODG)。本發(fā)明相對于原始PEAQ具有幾個(gè)優(yōu)點(diǎn),其中的一些是· PEAQ-E具有更高的預(yù)測準(zhǔn)確度。在數(shù)據(jù)庫集合上,與PEAQ的R = 0. 68相比, PEAQ-E具有顯著地與主觀質(zhì)量更高的相關(guān)性R = 0. 85 (參見表2)。甚至在沒有基于分位 數(shù)的平均的情況下(即僅進(jìn)行帶寬補(bǔ)償),R也是0. 80級(jí)別的。 具有基于分位數(shù)平均的PEAQ-E的優(yōu)選實(shí)施例比PEAQ更魯棒。PEAQ-E針對單一 數(shù)據(jù)庫的最差相關(guān)是R = 0. 70,而PEAQ的是R = 0. 45 (參見表2)。 具有基于分位數(shù)的平均的PEAQ-E的優(yōu)選實(shí)施例由于不具有訓(xùn)練參數(shù),因此可 以更好地推廣到未知數(shù)據(jù),而PEAQ具有針對人工神經(jīng)網(wǎng)絡(luò)的42個(gè)數(shù)據(jù)庫訓(xùn)練權(quán)重。下面的表2給出了原始PEAQ和增強(qiáng)PEAQ在14個(gè)主觀數(shù)據(jù)庫上的相關(guān)系數(shù)。所 有數(shù)據(jù)庫都基于MUSHRA方法學(xué),參見[3]。由于每一個(gè)組與一種類型的失真相對應(yīng),該操作 忽略了與大多數(shù)不一致的失真類型的分布。表 2 還可以在用于對音頻質(zhì)量進(jìn)行感知評(píng)估的其他過程中使用上述帶寬補(bǔ)償?shù)母?念。示例是PESQ(語音質(zhì)量的感知評(píng)估)標(biāo)準(zhǔn),參見[2]。在該標(biāo)準(zhǔn)中,根據(jù)被稱作“干擾 密度”的特征來預(yù)測語音質(zhì)量,下面將干擾密度定義為D。該特征在概念上與PEAQ中的 "RmsNoiseLoud"(表1中的F9)非常接近??梢匀缦驴偨Y(jié)PESQ標(biāo)準(zhǔn)首先在預(yù)處理步驟中,將原始信號(hào)和處理后的信號(hào)進(jìn)行 時(shí)間和級(jí)別上的對齊。接下來,對于兩個(gè)信號(hào),在具有50%重疊的32ms幀上計(jì)算功率譜。 依靠轉(zhuǎn)換至Bark刻度以及之后的轉(zhuǎn)換至響度密度,來執(zhí)行該感知變換。最終,原始信號(hào)和處理后的信號(hào)的響度密度之間帶符號(hào)的差值給出兩個(gè)參數(shù)(模型輸出變量)干擾密度D 以及非對稱干擾密度DA。將這兩個(gè)參數(shù)在頻率和時(shí)間上聚集,以獲得平均干擾密度,依靠 S(sigmoid)函數(shù)將該平均干擾密度映射為客觀質(zhì)量。在PESQ中,可以以例如下列方式來計(jì)算帶寬(該描述遵循在PEAQ標(biāo)準(zhǔn)中計(jì)算帶 寬的過程)。1、在參考信號(hào)上執(zhí)行FFT。選擇具有最大編號(hào)的1/10的頻率區(qū)間(即如果你的頻
率區(qū)間從1到100編號(hào),則選擇編號(hào)91、92、93.....100的區(qū)間)。將閾值級(jí)別T定義為所
選頻率區(qū)間組中的最大能量。當(dāng)后向搜索時(shí)(從高頻率區(qū)間編號(hào)到低頻率區(qū)間編號(hào),在我 們的示例中從90、89到1),將BandwidthRef定義為具有超過閾值級(jí)別T有IOdB的能量的 第一個(gè)頻率區(qū)間。2、對于測試信號(hào),使用從參考信號(hào)計(jì)算出的閾值級(jí)別(S卩,使用相同的T)。再一次 在FFT域中,將BandwidthTest定義為具有超過閾值級(jí)別T有IOdB的能量的頻率區(qū)間??偠灾?BandwidthRef和BandwidthTest就是具有超過特定閾值的能量的區(qū) 間的FFT區(qū)間編號(hào)。將該閾值計(jì)算為具有最高編號(hào)的FFT區(qū)間中的最大能量。在確定 BandwidthRef和BandwidthTest之后,可以用與上面的公式(1)_(3)相同的方式來執(zhí)行 (優(yōu)選縮放的)干擾密度D的帶寬補(bǔ)償。這給出D* = (l-α )D+a ABff (16)其中并且其中I I. I I表示(17)中的絕對值。對于α來說,ABW的其他壓縮函數(shù)也是 可行的,參見上面關(guān)于PEAQ的討論。對(優(yōu)選縮放的)非對稱干擾密度DA的相應(yīng)帶寬補(bǔ)償是DA* = (1-a )DA+a ABff (19)考慮(3)和(4)(或者(18))中給出的示例,應(yīng)當(dāng)理解可以將α視作ABW的函數(shù), 即a =a (ABW)。一個(gè)可能性是使α為階梯函數(shù) 其中θ是閾值。在該情況中將(16)和(19)化簡為 ABW = 以及 由下列公式給出(16)和(19)的進(jìn)一步概括D*= β (ABW)D+α (ABff) ABff(23)DA* = β (Δ Bff) DA+α (Δ Bff) Δ Bff (24)其中,β (ABW)是ABW的另一個(gè)函數(shù)。一般地,ABW是BandwidthRef和BandwidthTest之間的距離的測量。從而,由于 不同的映射,與(17)不同的其他測量也是可能的。一個(gè)示例是ABff = (BandwidthRef-BandwidthTest)2 (25)圖7是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的實(shí)施 例的框圖。將參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至ABW計(jì)算器30,并且將計(jì)算出 的相對帶寬差值Δ BW轉(zhuǎn)發(fā)至α計(jì)算器32,該α計(jì)算器32依照于例如上面(18)或(4)中 給出的一個(gè)公式來確定α的值。優(yōu)選地,縮放單元33將干擾密度D縮放或者標(biāo)準(zhǔn)化至例 如區(qū)間W,l]。將Δ BW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34,該帶寬補(bǔ)償器34還接收優(yōu)選地縮 放的干擾密度D。在該實(shí)施例中,依照于上面的(16)來執(zhí)行帶寬補(bǔ)償。圖8是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。步驟Sl如上所述的確定ABW。步驟S2如上所述的確定α。步驟S3如上 所述使用優(yōu)選地縮放的干擾密度D,來確定帶寬補(bǔ)償?shù)母蓴_密度D*。圖9是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu)選 實(shí)施例的框圖。將參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至ABW計(jì)算器30,并且將計(jì) 算出的相對帶寬差值Δ BW轉(zhuǎn)發(fā)至α計(jì)算器32,該α計(jì)算器32依照于例如上面(18)或 (4)中給出的一個(gè)公式來確定α的值。優(yōu)選地,縮放單元33將干擾密度D和非對稱干擾密 度DA縮放或者標(biāo)準(zhǔn)化至例如區(qū)間W,l]。將Δ BW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34,該帶寬 補(bǔ)償器34還接收優(yōu)選地縮放的干擾密度D和非對稱干擾密度DA。在該實(shí)施例中,依照于 上面的(16)和(19)來執(zhí)行帶寬補(bǔ)償。將帶寬補(bǔ)償?shù)母蓴_密度D*和DA*轉(zhuǎn)發(fā)至線性組合器 42,該線性組合器42形成表示經(jīng)過預(yù)測的質(zhì)量的PESQ分?jǐn)?shù)。圖10是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。步驟Sl如上所述的確定ABW。步驟S2如上所述的確定α。步驟S3如上 所述使用優(yōu)選地縮放的干擾密度D和非對稱干擾密度DA,來確定帶寬補(bǔ)償?shù)母蓴_密度D*和 非對稱干擾密度DA*。典型地由一個(gè)或者幾個(gè)微處理器或微/信號(hào)處理器組合以及相應(yīng)的軟件來實(shí)施 不同塊和步驟的功能。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解可以在不背離由所附權(quán)利要求定義的本發(fā)明的范圍的 情況下,對本發(fā)明做出不同的修改和改變。簡寫
PEAQ音頻質(zhì)量的感知評(píng)估
PESQ語音質(zhì)量的感知評(píng)估
PEAQ-EPEAQ增強(qiáng)(所提議的修改)
MOV模型輸出變量
MUSHRA具有隱藏參考和錨點(diǎn)的多刺激測試
ODG客觀區(qū)分度
參考文獻(xiàn)[1]ITU-R Recommendation BS. 1387-1,Method for objective measurements of perceived audio quality,2001[2]ITU-T Recommendation P. 862,Methods for objective and subjective assessment of quality,2001[3]ITU-R Recommendation BS. 1534, Method for the subjective assessment of intermediate quality level of coding systems,200權(quán)利要求
一種基于至少一個(gè)模型輸出變量的音頻質(zhì)量客觀感知評(píng)估方法,包括對所述至少一個(gè)模型輸出變量進(jìn)行帶寬補(bǔ)償?shù)牟襟E(S1 S3)。
2.根據(jù)權(quán)利要求1所述的方法,包括對PEAQ標(biāo)準(zhǔn)的模型輸出變量Fi中的至少一個(gè)進(jìn) 行帶寬補(bǔ)償?shù)牟襟E,其中F1 = WinModDiffl, F2 = AvgModDiffl, F3 = AvgModDiff2, F4 = TotalNMR, F5 = RelDistFrames, F6 = MFPD, F7 = ADB, F8 = EHS,F(xiàn)9 = RmsNoiseLoud0
3.根據(jù)權(quán)利要求2所述的方法,其中,對所有模型輸出變量F1-F9進(jìn)行帶寬補(bǔ)償。
4.根據(jù)權(quán)利要求2或3所述的方法,其中,依照于下列公式來執(zhí)行帶寬補(bǔ)償 F* =(I-U)F^aABW其中^BandwidthRef - BandwidthTest^ BandwidthRef其中1.11表示絕對值, BandwidthRef是對原始信號(hào)的帶寬的測量, BandwidthTest是對處理后的信號(hào)的帶寬的測量, α是ABW的壓縮函數(shù)
5.根據(jù)權(quán)利要求4所述的方法,其中,α= VX^F ο
6.根據(jù)權(quán)利要求1、2、3、4或5所述的方法,其中,使用帶寬補(bǔ)償后的模型輸出變量<來 訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
7.根據(jù)權(quán)利要求1、2、3、4或5所述的方法,包括下列步驟將預(yù)先確定的帶寬補(bǔ)償后的模型輸出變量<分組為(S4)分別的模型輸出變量組; 形成(S5)特征值集合Gk,所述模型輸出變量組每一個(gè)有一個(gè)特征值; 刪除(S6)極端特征值; 對剩余的特征值求平均(S7)。
8.根據(jù)前述權(quán)利要求2-7中任意一項(xiàng)所述的方法,包括將所述模型輸出變量F縮放至 預(yù)先確定的區(qū)間中的步驟。
9.根據(jù)權(quán)利要求8所述的方法,其中,將所述模型輸出變量Fi縮放至區(qū)間W,l]。
10.根據(jù)權(quán)利要求1所述的方法,包括對PESQ標(biāo)準(zhǔn)的干擾密度D進(jìn)行帶寬補(bǔ)償(S1-S3) 的步驟。
11.根據(jù)權(quán)利要求10所述的方法,其中,依照于下列公式來執(zhí)行帶寬補(bǔ)償D = (l-α )D+a ABff其中八”爐 ^BandwidthRef - BandwidthTest^ BandwidthRef其中(1.11表示絕對值, BandwidthRef是對原始信號(hào)的帶寬的測量, BandwidthTest是對處理后的信號(hào)的帶寬的測量, α是ABW的壓縮函數(shù)
12.根據(jù)權(quán)利要求1所述的方法,包括對PESQ標(biāo)準(zhǔn)的非對稱干擾密度DA進(jìn)行帶寬補(bǔ)償 (Si-S3)的步驟。
13.根據(jù)權(quán)利要求12所述的方法,其中,依照于下列公式來執(zhí)行帶寬補(bǔ)償 DA* = (l-α )DA+a ABff其中IBandwidthRef - BandwidthTest\ BandwidthRef其中1.11表示絕對值, BandwidthRef是對原始信號(hào)的帶寬的測量, BandwidthTest是對處理后的信號(hào)的帶寬的測量, α是ABW的壓縮函數(shù)
14.根據(jù)權(quán)利要求11或13所述的方法,其中,α= VK^。
15.一種用于基于至少一個(gè)模型輸出變量的音頻質(zhì)量客觀感知評(píng)估的設(shè)備,包括用于 對所述至少一個(gè)模型輸出變量進(jìn)行帶寬補(bǔ)償?shù)难b置(26 ;30、32、33、34)。
16.根據(jù)權(quán)利要求15所述的設(shè)備,包括用于對PEAQ標(biāo)準(zhǔn)的模型輸出變量Fi中的至少 一個(gè)進(jìn)行帶寬補(bǔ)償?shù)难b置(26 ;30、32、33、34),其中F1 = WinModDiffl, F2 = AvgModDiffl, F3 = AvgModDiff2, F4 = TotalNMR, F5 = RelDistFrames, F6 = MFPD, F7 = ADB, F8 = EHS,F(xiàn)9 = RmsNoiseLoud0
17.根據(jù)權(quán)利要求16所述的設(shè)備,包括用于對所有模型輸出變量F1-F9進(jìn)行帶寬補(bǔ)償 的裝置(26 ;30、32、33、34)。
18.根據(jù)權(quán)利要求16或17所述的設(shè)備,包括用于依照于下列公式對所述模型輸出變量Fi進(jìn)行帶寬補(bǔ)償?shù)难b置(26 ;30、32、33、34) F' =(\-a)Ft+a^W其中WW IBandwidthRef - BandwidthTest^ BandwidthRef其中I. 11表示絕對值, BandwidthRef是對原始信號(hào)的帶寬的測量, BandwidthTest是對處理后的信號(hào)的帶寬的測量, α是ABW的壓縮函數(shù)
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中,α= V^i7。
20.根據(jù)權(quán)利要求15、16、17、18或19所述的設(shè)備,包括用于使用帶寬補(bǔ)償后的模型輸 出變量廠'來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的裝置。
21.根據(jù)權(quán)利要求15、16、17、18或19所述的設(shè)備,包括分組單元(36),適用于將預(yù)先確定的帶寬補(bǔ)償后的模型輸出變量廣分組為分別的模型 輸出變量組,以及形成特征值集合Gk,所述模型輸出變量組每一個(gè)有一個(gè)特征值; 排序和選擇單元(38),適用于刪除極端特征值; 平均單元(40),適用于對剩余的特征值求平均。
22.根據(jù)前述權(quán)利要求16-21中任意一項(xiàng)所述的設(shè)備,包括適用于將所述模型輸出變 量Fi縮放至預(yù)先確定的區(qū)間中的縮放單元(33)。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中,所述縮放單元(33)適用于將所述模型輸出變 量Fi縮放至區(qū)間
0
24.根據(jù)權(quán)利要求15所述的設(shè)備,包括用于對PESQ標(biāo)準(zhǔn)的干擾密度D進(jìn)行帶寬補(bǔ)償?shù)?裝置(30、32、33、34)。
25.根據(jù)權(quán)利要求24所述的裝置,包括用于依照于下列公式對所述干擾密度D進(jìn)行所 述帶寬補(bǔ)償?shù)难b置(30、32、33、34)D* = (l-α )D+a ABff其中 其中1.11表示絕對值, BandwidthRef是對原始信號(hào)的帶寬的測量, BandwidthTest是對處理后的信號(hào)的帶寬的測量, α是ABW的壓縮函數(shù)
26.根據(jù)權(quán)利要求15所述的裝置,包括用于對PESQ標(biāo)準(zhǔn)的非對稱干擾密度DA進(jìn)行帶 寬補(bǔ)償?shù)难b置(30、32、33、34)。
27.根據(jù)權(quán)利要求26所述的裝置,包括用于依照于下列公式對所述非對稱干擾密度DA進(jìn)行帶寬補(bǔ)償?shù)难b置(30、32、33、34) DA* = (l-α )DA+a ABff 其中 其中·1.11表示絕對值, BandwidthRef是對原始信號(hào)的帶寬的測量, BandwidthTest是對處理后的信號(hào)的帶寬的測量, α是ABW的壓縮函數(shù)
28.根據(jù)權(quán)利要求25或27所述的裝置,其中,α = VK^r
全文摘要
在一種用于對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置中,將表示帶寬的參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至計(jì)算器30,用于計(jì)算參考信號(hào)和測試信號(hào)之間的相對帶寬差ΔBW。將ΔBW轉(zhuǎn)發(fā)至計(jì)算器32,所述計(jì)算器32確定加權(quán)參數(shù)α的值。優(yōu)選地縮放單元33將干擾密度D以及非對稱干擾密度DA縮放或者標(biāo)準(zhǔn)化至例如區(qū)間
。將ΔBW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34,所述帶寬補(bǔ)償器34還接收所述優(yōu)選縮放的干擾密度D和非對稱干擾密度DA。將帶寬補(bǔ)償?shù)母蓴_密度D*、DA*轉(zhuǎn)發(fā)至線性組合器42,所述線性組合器42形成表示所述測試信號(hào)的經(jīng)過預(yù)測的質(zhì)量的分?jǐn)?shù)。
文檔編號(hào)G10L19/00GK101933085SQ200880124719
公開日2010年12月29日 申請日期2008年4月9日 優(yōu)先權(quán)日2008年1月14日
發(fā)明者沃洛佳·格蘭恰諾夫, 蘇珊娜·馬爾姆 申請人:艾利森電話股份有限公司