音頻質(zhì)量的客觀測量的制作方法

文檔序號(hào)：2831914閱讀：384來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻質(zhì)量的客觀測量的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般地涉及對音頻質(zhì)量的客觀測量。
背景技術(shù)：
PEAQ是針對音頻質(zhì)量的客觀測量的ITU-R標(biāo)準(zhǔn)，參見[1]。這是一種讀取原始音頻波形和處理后的音頻波形，并且輸出對感知到的整體質(zhì)量的估計(jì)的方法。PEAQ性能受限于其不能評(píng)價(jià)帶寬上有巨大差異的信號(hào)的質(zhì)量。此外，由于PEAQ依賴于在有限的數(shù)據(jù)庫上訓(xùn)練出的神經(jīng)網(wǎng)絡(luò)權(quán)重，因此當(dāng)對未知數(shù)據(jù)進(jìn)行評(píng)估時(shí)，PEAQ表現(xiàn) 出糟糕的性能。PESQ是音頻(語音)質(zhì)量的客觀測量的ITU-T標(biāo)準(zhǔn)，參見[2]。PESQ性能也受限于其不能評(píng)價(jià)帶寬上有巨大差異的信號(hào)的質(zhì)量。

發(fā)明內(nèi)容
本發(fā)明的目的是增強(qiáng)對音頻質(zhì)量的客觀感知評(píng)估的性能。根據(jù)所附專利權(quán)利要求來實(shí)現(xiàn)該目的。簡而言之，本發(fā)明涉及基于一個(gè)或者幾個(gè)模型輸出變量來對音頻質(zhì)量進(jìn)行客觀感知評(píng)估，并且本發(fā)明包括對至少一個(gè)該模型輸出變量進(jìn)行帶寬補(bǔ)償。

可以通過下面的描述以及附圖來最佳地理解本發(fā)明及其目的和優(yōu)點(diǎn)，其中圖1是示意了人類聽覺和質(zhì)量評(píng)價(jià)過程的框圖；圖2是示意了模仿人類質(zhì)量評(píng)價(jià)過程的語音質(zhì)量評(píng)價(jià)的框圖；圖3是用于執(zhí)行原始PEAQ方法的裝置的框圖；圖4是圖1中的裝置依照于本發(fā)明的修改的示例的框圖；圖5是用于依照于本發(fā)明的對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu) 選實(shí)施例的框圖；圖6是依照于本發(fā)明的對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖；圖7是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的實(shí)施例的框圖；圖8是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的實(shí)施例的流程圖；圖9是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu)選實(shí)施例的框圖；以及圖10是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。
具體實(shí)施例方式在下面的描述中，用相同的引用名稱來表示執(zhí)行相同或者相似功能的單元。本發(fā)明一般地涉及模仿聽覺感知以評(píng)價(jià)信號(hào)質(zhì)量的心理聲學(xué)的方法?？梢詫⑷祟?的評(píng)價(jià)信號(hào)質(zhì)量過程劃分為兩個(gè)主要步驟，如圖1所示，即聽覺處理和認(rèn)知映射。聽覺處理塊10包含將實(shí)際聲音變換為神經(jīng)刺激的部分。該過程包括Bark縮放頻率映射以及從信號(hào) 功率到感知到的響度的轉(zhuǎn)換。與聽覺處理塊10相連的認(rèn)知映射塊12是大腦提取信號(hào)最重要的特征并且評(píng)價(jià)整體質(zhì)量的地方。如圖2所示，客觀質(zhì)量評(píng)價(jià)過程同時(shí)包含感知變換和認(rèn)知處理以模仿人類感知。感知變換14模仿聽覺處理并且同時(shí)在原始信號(hào)s和失真信號(hào)y上執(zhí)行。輸出是發(fā)送至大腦的聲音表示的測量。該過程包括根據(jù)非線性的已知的刻度以及從Hertz到Bark刻度的變換將信號(hào)功率變換為響度。耳朵的敏感度依賴于頻率，并且計(jì)算可聽聲音的閾值。在該步驟中還要考慮到遮蔽效應(yīng)。從該感知變換，計(jì)算內(nèi)部表示，該內(nèi)部表示預(yù)期模仿發(fā)送至大腦的信息。在認(rèn)知處理塊16中，選擇預(yù)期描述信號(hào)的特征(分別由&和、所指示)。最終在塊18中計(jì)算干凈的和失真的信號(hào)之間的距離d(l，、)。該距離得到質(zhì)量分?jǐn)?shù)0。PEAQ以兩種模式運(yùn)行1)基本和2)高級(jí)。為了簡化，我們僅討論基本版本，并且將其稱作PEAQ，但是也可以將該概念應(yīng)用于高級(jí)版本。作為第一步驟，PEAQ在感知域中通過對人類聽覺系統(tǒng)的屬性進(jìn)行建模來變換輸入信號(hào)。接下來，算法提取被稱作模型輸出變量(MOV)的11個(gè)參數(shù)。在最后階段，依靠具有一個(gè)隱形層的人工神經(jīng)網(wǎng)絡(luò)將MOV映射到單一質(zhì)量評(píng)分。在下面表1中給出M0V。列1和 2給出他們的名稱和描述，同時(shí)列3和4介紹在提出的修改的描述中使用的符號(hào)。表 1
7 圖3是用于執(zhí)行原始PEAQ方法的裝置的框圖。將原始和處理后的(改變的)信號(hào)轉(zhuǎn)發(fā)至相應(yīng)的聽覺處理塊20，該聽覺處理塊20將他們變換為相應(yīng)的內(nèi)部表示。將該內(nèi)部表示轉(zhuǎn)發(fā)至提取塊22，提取塊22提取M0V，進(jìn)而將MOV轉(zhuǎn)發(fā)至人工神經(jīng)網(wǎng)絡(luò)24，人工神經(jīng)網(wǎng) 絡(luò)24預(yù)測處理后的輸入信號(hào)的質(zhì)量。圖4是圖1中裝置的依照于本發(fā)明的修改的示例的框圖。該實(shí)施例的基本概念是用帶寬補(bǔ)償+基于分位數(shù)的平均模塊(圖4中包括塊26 和28在內(nèi)的虛線方框)來替代原始PEAQ的神經(jīng)網(wǎng)絡(luò)(圖3中的虛線方框)。該提出的方案是基于與原始PEAQ相同的感知變換和MOV提取的。本發(fā)明的基本方面是顯式地說明(在圖4的塊26中)下述事實(shí)由于原始和處理后的信號(hào)的帶寬中的巨大差異，大多數(shù)MOV產(chǎn)生不可靠的結(jié)果。從而，根據(jù)本發(fā)明的該方面對參考信號(hào)和測試(也稱作處理后的)信號(hào)之間的帶寬差異進(jìn)行補(bǔ)償。本發(fā)明的另一個(gè)方面是避免在數(shù)據(jù)庫上訓(xùn)練的映射(在該情況中，具有42個(gè)參數(shù) 的人工神經(jīng)網(wǎng)絡(luò))。當(dāng)處理未知/新類型的數(shù)據(jù)時(shí)，該類型的映射可以導(dǎo)致不可靠的結(jié)果。
8提出的映射(基于分位數(shù)的平均，圖4中塊28)不具有訓(xùn)練參數(shù)。下面，我們將把提出的修改成為PEAQ-E (PEAQ-增強(qiáng))。PEAQ-E是基于與PEAQ相同的MOV的，但是優(yōu)選地被縮放至區(qū)間W，1](當(dāng)然其他縮放或者標(biāo)準(zhǔn)化范圍也是可行的)。參見圖4，除了向神經(jīng)網(wǎng)絡(luò)饋送(如在PEAQ中進(jìn)行的一樣)之外，優(yōu)選地將這些MOV輸入兩階段過程，該過程包括帶寬補(bǔ)償和基于分位數(shù)的平均。帶寬補(bǔ)償移除了 MOV之間的主要非線性依賴性，并且允許使用更簡單的映射方案(基于分位數(shù)的平均，而不是訓(xùn)練的神經(jīng)網(wǎng) 絡(luò))。依照于下列公式，帶寬補(bǔ)償將每號(hào)說明)
個(gè)MOV Fi變換為新的MOV廠’(參見表1的符其中
Nly 11 /Iv 以及a = ^Jabw
(3)并且其中I I. I I表示(2)中的絕對值。此處BandwidthRef表示原始信號(hào)的帶寬的測量，并且BandwidthTest表示處理后的信號(hào)的帶寬的測量。盡管公式(3)給出α是ABW的平方根，ABW的其他壓縮函數(shù)也是可行的，例如
α = ABff1 α = ABff0
0. 4
⑷α = Iog(ABff)在該帶寬補(bǔ)償知州，新的補(bǔ)償?shù)腗OV <可以用于訓(xùn)練PEAQ中的神經(jīng)網(wǎng)絡(luò)。然而，備選方案是使用下面描述的基于分位數(shù)的平均過程。依照于本發(fā)明的實(shí)施例的基于分位數(shù)的平均是多步驟過程。首先，將相同類型的帶寬補(bǔ)償?shù)腗OV廠'分為五組。(參見表1的組定義)，并且依照于下列公式向每一個(gè)組分配特征值G1. ..G5:
G2=\(F;+F)
G4= F； G5=K
這些特征值表示信號(hào)的不同方面，即
G1-原始的和處理的信號(hào)的時(shí)間包絡(luò)的差值的測量
G2-噪音對遮蔽閾值的比率的測量
G3-檢測原始的和處理的信號(hào)之間的差值的概率的測量
5 6 7 8 9
G4-誤差信號(hào)的調(diào)和結(jié)構(gòu)的強(qiáng)度的測量G5-失真的部分響度的測量一旦已經(jīng)形成這五個(gè)特征值G1 級(jí)，即接下來計(jì)算剩余子集合的{G,}; 在公式(5)、(6)、(7)以及(11)中，可以用加權(quán)平均來替代平均。圖5是用于依照于本發(fā)明對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu)選實(shí)施例的框圖。將參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至ABW計(jì)算器30，并且將計(jì) 算出的相對帶寬差值A(chǔ)BW轉(zhuǎn)發(fā)至α計(jì)算器32，該α計(jì)算器32依照于例如上面(3)或(4) 中給出的一個(gè)公式來確定α的值。優(yōu)選地，縮放單元33將模型輸出變量Fi縮放或者標(biāo)準(zhǔn) 化至例如區(qū)間W，l]。將Δ BW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34，該帶寬補(bǔ)償器34還接收優(yōu) 選地縮放的變量F”在該實(shí)施例中，依照于上面的(1)來執(zhí)行帶寬補(bǔ)償?？紤]到(3)和(4)中給出的示例，應(yīng)當(dāng)理解可以將α視作ABW的函數(shù)，α = α (ABW)。一個(gè)可能性是使α為階梯函數(shù) 其中，Θ是閾值。在該情況下將⑴化簡為由下列公式給出(1)的進(jìn)一步概括F' = β(ΑΒΨ)^ + a(ABW)ABW其中，β (ABW)是ABW的另一個(gè)函數(shù)。一般地，ABW是BandwidthRef和BandwidthTest之間的距離的測量。從而，由于不同的映射，與(2)不同的其他測量也是可能的。一個(gè)示例是ABff = (BandwidthRef-BandwidthTest)2 (15)現(xiàn)在返回圖5，與原始PEAQ標(biāo)準(zhǔn)一樣的，可以將帶寬補(bǔ)償?shù)哪Ｐ洼敵鲎兞繌S'轉(zhuǎn)發(fā) 至訓(xùn)練人工網(wǎng)絡(luò)。然而，在圖5所示的優(yōu)選實(shí)施例中，將變量<轉(zhuǎn)發(fā)至分組單元36，該分組單元將他們分為不同組并且如上面(5)_(9)所示的計(jì)算每一個(gè)組的特征值。將這些特征值 Gk轉(zhuǎn)發(fā)至排序和選擇單元38，該排序和選擇單元38對他們進(jìn)行排序并且移除最小和最大值。將剩余的特征值62、63、64轉(zhuǎn)發(fā)至平均單元40，平均單元40依照于(11)形成表示預(yù)測的質(zhì)量的測量。
...G5,對這些值進(jìn)行排序，并且移除最小和最大等 (10)
1，平均值，該平均值是PEAQ-E的輸出，即
(11)
(12)
(13) (14)
圖6是依照于本發(fā)明的對音頻質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。步驟S 1如上所述的確定ABW。步驟S2如上所述的確定α。步驟S3如上所述使用優(yōu)選地縮放的模型輸出變量Fi,來確定帶寬補(bǔ)償?shù)哪Ｐ洼敵鲎兞?lt;。可以將這些補(bǔ)償?shù)淖兞哭D(zhuǎn)發(fā)至訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)。然而，在優(yōu)選實(shí)施例中，取而代之地將他們轉(zhuǎn)發(fā)至基于分位數(shù)的平均過程中，該過程開始于步驟S4。步驟S4將帶寬補(bǔ)償?shù)哪Ｐ洼敵鲎兞?lt;分成不同的模型輸出變量組。步驟S5形成特征值Gk的集合(參考(5)-(9)所描述的)，每個(gè) 組一個(gè)特征值。步驟S6刪除極端(最大和最小)特征值。步驟S7通過對剩余的特征值求平均來形成經(jīng)過預(yù)測的質(zhì)量(ODG)。本發(fā)明相對于原始PEAQ具有幾個(gè)優(yōu)點(diǎn)，其中的一些是· PEAQ-E具有更高的預(yù)測準(zhǔn)確度。在數(shù)據(jù)庫集合上，與PEAQ的R = 0. 68相比， PEAQ-E具有顯著地與主觀質(zhì)量更高的相關(guān)性R = 0. 85 (參見表2)。甚至在沒有基于分位數(shù)的平均的情況下(即僅進(jìn)行帶寬補(bǔ)償)，R也是0. 80級(jí)別的。具有基于分位數(shù)平均的PEAQ-E的優(yōu)選實(shí)施例比PEAQ更魯棒。PEAQ-E針對單一數(shù)據(jù)庫的最差相關(guān)是R = 0. 70，而PEAQ的是R = 0. 45 (參見表2)。具有基于分位數(shù)的平均的PEAQ-E的優(yōu)選實(shí)施例由于不具有訓(xùn)練參數(shù)，因此可以更好地推廣到未知數(shù)據(jù)，而PEAQ具有針對人工神經(jīng)網(wǎng)絡(luò)的42個(gè)數(shù)據(jù)庫訓(xùn)練權(quán)重。下面的表2給出了原始PEAQ和增強(qiáng)PEAQ在14個(gè)主觀數(shù)據(jù)庫上的相關(guān)系數(shù)。所有數(shù)據(jù)庫都基于MUSHRA方法學(xué)，參見[3]。由于每一個(gè)組與一種類型的失真相對應(yīng)，該操作忽略了與大多數(shù)不一致的失真類型的分布。表 2 還可以在用于對音頻質(zhì)量進(jìn)行感知評(píng)估的其他過程中使用上述帶寬補(bǔ)償?shù)母?念。示例是PESQ(語音質(zhì)量的感知評(píng)估)標(biāo)準(zhǔn)，參見[2]。在該標(biāo)準(zhǔn)中，根據(jù)被稱作“干擾密度”的特征來預(yù)測語音質(zhì)量，下面將干擾密度定義為D。該特征在概念上與PEAQ中的 "RmsNoiseLoud"(表1中的F9)非常接近?？梢匀缦驴偨Y(jié)PESQ標(biāo)準(zhǔn)首先在預(yù)處理步驟中，將原始信號(hào)和處理后的信號(hào)進(jìn)行時(shí)間和級(jí)別上的對齊。接下來，對于兩個(gè)信號(hào)，在具有50%重疊的32ms幀上計(jì)算功率譜。依靠轉(zhuǎn)換至Bark刻度以及之后的轉(zhuǎn)換至響度密度，來執(zhí)行該感知變換。最終，原始信號(hào)和處理后的信號(hào)的響度密度之間帶符號(hào)的差值給出兩個(gè)參數(shù)(模型輸出變量)干擾密度D 以及非對稱干擾密度DA。將這兩個(gè)參數(shù)在頻率和時(shí)間上聚集，以獲得平均干擾密度，依靠 S(sigmoid)函數(shù)將該平均干擾密度映射為客觀質(zhì)量。在PESQ中，可以以例如下列方式來計(jì)算帶寬(該描述遵循在PEAQ標(biāo)準(zhǔn)中計(jì)算帶寬的過程)。1、在參考信號(hào)上執(zhí)行FFT。選擇具有最大編號(hào)的1/10的頻率區(qū)間(即如果你的頻
率區(qū)間從1到100編號(hào)，則選擇編號(hào)91、92、93.....100的區(qū)間)。將閾值級(jí)別T定義為所
選頻率區(qū)間組中的最大能量。當(dāng)后向搜索時(shí)(從高頻率區(qū)間編號(hào)到低頻率區(qū)間編號(hào)，在我們的示例中從90、89到1)，將BandwidthRef定義為具有超過閾值級(jí)別T有IOdB的能量的第一個(gè)頻率區(qū)間。2、對于測試信號(hào)，使用從參考信號(hào)計(jì)算出的閾值級(jí)別(S卩，使用相同的T)。再一次在FFT域中，將BandwidthTest定義為具有超過閾值級(jí)別T有IOdB的能量的頻率區(qū)間?？偠灾?BandwidthRef和BandwidthTest就是具有超過特定閾值的能量的區(qū) 間的FFT區(qū)間編號(hào)。將該閾值計(jì)算為具有最高編號(hào)的FFT區(qū)間中的最大能量。在確定 BandwidthRef和BandwidthTest之后，可以用與上面的公式(1)_(3)相同的方式來執(zhí)行 (優(yōu)選縮放的)干擾密度D的帶寬補(bǔ)償。這給出D* = (l-α )D+a ABff (16)其中并且其中I I. I I表示(17)中的絕對值。對于α來說，ABW的其他壓縮函數(shù)也是可行的，參見上面關(guān)于PEAQ的討論。對(優(yōu)選縮放的)非對稱干擾密度DA的相應(yīng)帶寬補(bǔ)償是DA* = (1-a )DA+a ABff (19)考慮(3)和(4)(或者(18))中給出的示例，應(yīng)當(dāng)理解可以將α視作ABW的函數(shù)，即a =a (ABW)。一個(gè)可能性是使α為階梯函數(shù) 其中θ是閾值。在該情況中將(16)和(19)化簡為 ABW = 以及由下列公式給出(16)和(19)的進(jìn)一步概括D*= β (ABW)D+α (ABff) ABff(23)DA* = β (Δ Bff) DA+α (Δ Bff) Δ Bff (24)其中，β (ABW)是ABW的另一個(gè)函數(shù)。一般地，ABW是BandwidthRef和BandwidthTest之間的距離的測量。從而，由于不同的映射，與(17)不同的其他測量也是可能的。一個(gè)示例是ABff = (BandwidthRef-BandwidthTest)2 (25)圖7是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的實(shí)施例的框圖。將參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至ABW計(jì)算器30，并且將計(jì)算出的相對帶寬差值Δ BW轉(zhuǎn)發(fā)至α計(jì)算器32，該α計(jì)算器32依照于例如上面(18)或(4)中給出的一個(gè)公式來確定α的值。優(yōu)選地，縮放單元33將干擾密度D縮放或者標(biāo)準(zhǔn)化至例如區(qū)間W，l]。將Δ BW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34，該帶寬補(bǔ)償器34還接收優(yōu)選地縮放的干擾密度D。在該實(shí)施例中，依照于上面的(16)來執(zhí)行帶寬補(bǔ)償。圖8是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。步驟Sl如上所述的確定ABW。步驟S2如上所述的確定α。步驟S3如上所述使用優(yōu)選地縮放的干擾密度D，來確定帶寬補(bǔ)償?shù)母蓴_密度D*。圖9是用于依照于本發(fā)明對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置的一部分的優(yōu)選實(shí)施例的框圖。將參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至ABW計(jì)算器30，并且將計(jì) 算出的相對帶寬差值Δ BW轉(zhuǎn)發(fā)至α計(jì)算器32，該α計(jì)算器32依照于例如上面(18)或 (4)中給出的一個(gè)公式來確定α的值。優(yōu)選地，縮放單元33將干擾密度D和非對稱干擾密度DA縮放或者標(biāo)準(zhǔn)化至例如區(qū)間W，l]。將Δ BW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34，該帶寬補(bǔ)償器34還接收優(yōu)選地縮放的干擾密度D和非對稱干擾密度DA。在該實(shí)施例中，依照于上面的(16)和(19)來執(zhí)行帶寬補(bǔ)償。將帶寬補(bǔ)償?shù)母蓴_密度D*和DA*轉(zhuǎn)發(fā)至線性組合器 42，該線性組合器42形成表示經(jīng)過預(yù)測的質(zhì)量的PESQ分?jǐn)?shù)。圖10是依照于本發(fā)明的對語音質(zhì)量進(jìn)行客觀感知評(píng)估的方法的一部分的優(yōu)選實(shí) 施例的流程圖。步驟Sl如上所述的確定ABW。步驟S2如上所述的確定α。步驟S3如上所述使用優(yōu)選地縮放的干擾密度D和非對稱干擾密度DA，來確定帶寬補(bǔ)償?shù)母蓴_密度D*和非對稱干擾密度DA*。典型地由一個(gè)或者幾個(gè)微處理器或微/信號(hào)處理器組合以及相應(yīng)的軟件來實(shí)施不同塊和步驟的功能。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解可以在不背離由所附權(quán)利要求定義的本發(fā)明的范圍的情況下，對本發(fā)明做出不同的修改和改變。簡寫
PEAQ音頻質(zhì)量的感知評(píng)估
PESQ語音質(zhì)量的感知評(píng)估
PEAQ-EPEAQ增強(qiáng)(所提議的修改)
MOV模型輸出變量
MUSHRA具有隱藏參考和錨點(diǎn)的多刺激測試
ODG客觀區(qū)分度
參考文獻(xiàn)[1]ITU-R Recommendation BS. 1387-1,Method for objective measurements of perceived audio quality,2001[2]ITU-T Recommendation P. 862，Methods for objective and subjective assessment of quality,2001[3]ITU-R Recommendation BS. 1534, Method for the subjective assessment of intermediate quality level of coding systems,200權(quán)利要求
一種基于至少一個(gè)模型輸出變量的音頻質(zhì)量客觀感知評(píng)估方法，包括對所述至少一個(gè)模型輸出變量進(jìn)行帶寬補(bǔ)償?shù)牟襟E(S1 S3)。
2.根據(jù)權(quán)利要求1所述的方法，包括對PEAQ標(biāo)準(zhǔn)的模型輸出變量Fi中的至少一個(gè)進(jìn) 行帶寬補(bǔ)償?shù)牟襟E，其中F1 = WinModDiffl, F2 = AvgModDiffl, F3 = AvgModDiff2, F4 = TotalNMR, F5 = RelDistFrames, F6 = MFPD， F7 = ADB， F8 = EHS，F(xiàn)9 = RmsNoiseLoud0
3.根據(jù)權(quán)利要求2所述的方法，其中，對所有模型輸出變量F1-F9進(jìn)行帶寬補(bǔ)償。
4.根據(jù)權(quán)利要求2或3所述的方法，其中，依照于下列公式來執(zhí)行帶寬補(bǔ)償 F* =(I-U)F^aABW其中^BandwidthRef - BandwidthTest^ BandwidthRef其中1.11表示絕對值， BandwidthRef是對原始信號(hào)的帶寬的測量， BandwidthTest是對處理后的信號(hào)的帶寬的測量， α是ABW的壓縮函數(shù)
5.根據(jù)權(quán)利要求4所述的方法，其中，α= VX^F ο
6.根據(jù)權(quán)利要求1、2、3、4或5所述的方法，其中，使用帶寬補(bǔ)償后的模型輸出變量<來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
7.根據(jù)權(quán)利要求1、2、3、4或5所述的方法，包括下列步驟將預(yù)先確定的帶寬補(bǔ)償后的模型輸出變量<分組為(S4)分別的模型輸出變量組；形成(S5)特征值集合Gk，所述模型輸出變量組每一個(gè)有一個(gè)特征值；刪除(S6)極端特征值；對剩余的特征值求平均(S7)。
8.根據(jù)前述權(quán)利要求2-7中任意一項(xiàng)所述的方法，包括將所述模型輸出變量F縮放至預(yù)先確定的區(qū)間中的步驟。
9.根據(jù)權(quán)利要求8所述的方法，其中，將所述模型輸出變量Fi縮放至區(qū)間W，l]。
10.根據(jù)權(quán)利要求1所述的方法，包括對PESQ標(biāo)準(zhǔn)的干擾密度D進(jìn)行帶寬補(bǔ)償(S1-S3) 的步驟。
11.根據(jù)權(quán)利要求10所述的方法，其中，依照于下列公式來執(zhí)行帶寬補(bǔ)償D = (l-α )D+a ABff其中八”爐 ^BandwidthRef - BandwidthTest^ BandwidthRef其中(1.11表示絕對值， BandwidthRef是對原始信號(hào)的帶寬的測量， BandwidthTest是對處理后的信號(hào)的帶寬的測量， α是ABW的壓縮函數(shù)
12.根據(jù)權(quán)利要求1所述的方法，包括對PESQ標(biāo)準(zhǔn)的非對稱干擾密度DA進(jìn)行帶寬補(bǔ)償 (Si-S3)的步驟。
13.根據(jù)權(quán)利要求12所述的方法，其中，依照于下列公式來執(zhí)行帶寬補(bǔ)償 DA* = (l-α )DA+a ABff其中IBandwidthRef - BandwidthTest\ BandwidthRef其中1.11表示絕對值， BandwidthRef是對原始信號(hào)的帶寬的測量， BandwidthTest是對處理后的信號(hào)的帶寬的測量， α是ABW的壓縮函數(shù)
14.根據(jù)權(quán)利要求11或13所述的方法，其中，α= VK^。
15.一種用于基于至少一個(gè)模型輸出變量的音頻質(zhì)量客觀感知評(píng)估的設(shè)備，包括用于對所述至少一個(gè)模型輸出變量進(jìn)行帶寬補(bǔ)償?shù)难b置(26 ;30、32、33、34)。
16.根據(jù)權(quán)利要求15所述的設(shè)備，包括用于對PEAQ標(biāo)準(zhǔn)的模型輸出變量Fi中的至少一個(gè)進(jìn)行帶寬補(bǔ)償?shù)难b置(26 ;30、32、33、34)，其中F1 = WinModDiffl, F2 = AvgModDiffl, F3 = AvgModDiff2, F4 = TotalNMR, F5 = RelDistFrames, F6 = MFPD， F7 = ADB， F8 = EHS，F(xiàn)9 = RmsNoiseLoud0
17.根據(jù)權(quán)利要求16所述的設(shè)備，包括用于對所有模型輸出變量F1-F9進(jìn)行帶寬補(bǔ)償的裝置(26 ；30、32、33、34)。
18.根據(jù)權(quán)利要求16或17所述的設(shè)備，包括用于依照于下列公式對所述模型輸出變量Fi進(jìn)行帶寬補(bǔ)償?shù)难b置(26 ;30、32、33、34) F' =(\-a)Ft+a^W其中WW IBandwidthRef - BandwidthTest^ BandwidthRef其中I. 11表示絕對值， BandwidthRef是對原始信號(hào)的帶寬的測量， BandwidthTest是對處理后的信號(hào)的帶寬的測量， α是ABW的壓縮函數(shù)
19.根據(jù)權(quán)利要求18所述的設(shè)備，其中，α= V^i7。
20.根據(jù)權(quán)利要求15、16、17、18或19所述的設(shè)備，包括用于使用帶寬補(bǔ)償后的模型輸出變量廠'來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的裝置。
21.根據(jù)權(quán)利要求15、16、17、18或19所述的設(shè)備，包括分組單元(36)，適用于將預(yù)先確定的帶寬補(bǔ)償后的模型輸出變量廣分組為分別的模型輸出變量組，以及形成特征值集合Gk，所述模型輸出變量組每一個(gè)有一個(gè)特征值；排序和選擇單元(38)，適用于刪除極端特征值；平均單元(40)，適用于對剩余的特征值求平均。
22.根據(jù)前述權(quán)利要求16-21中任意一項(xiàng)所述的設(shè)備，包括適用于將所述模型輸出變量Fi縮放至預(yù)先確定的區(qū)間中的縮放單元(33)。
23.根據(jù)權(quán)利要求22所述的設(shè)備，其中，所述縮放單元(33)適用于將所述模型輸出變量Fi縮放至區(qū)間
0
24.根據(jù)權(quán)利要求15所述的設(shè)備，包括用于對PESQ標(biāo)準(zhǔn)的干擾密度D進(jìn)行帶寬補(bǔ)償?shù)?裝置(30、32、33、34)。
25.根據(jù)權(quán)利要求24所述的裝置，包括用于依照于下列公式對所述干擾密度D進(jìn)行所述帶寬補(bǔ)償?shù)难b置(30、32、33、34)D* = (l-α )D+a ABff其中其中1.11表示絕對值， BandwidthRef是對原始信號(hào)的帶寬的測量， BandwidthTest是對處理后的信號(hào)的帶寬的測量， α是ABW的壓縮函數(shù)
26.根據(jù)權(quán)利要求15所述的裝置，包括用于對PESQ標(biāo)準(zhǔn)的非對稱干擾密度DA進(jìn)行帶寬補(bǔ)償?shù)难b置(30、32、33、34)。
27.根據(jù)權(quán)利要求26所述的裝置，包括用于依照于下列公式對所述非對稱干擾密度DA進(jìn)行帶寬補(bǔ)償?shù)难b置(30、32、33、34) DA* = (l-α )DA+a ABff 其中其中·1.11表示絕對值， BandwidthRef是對原始信號(hào)的帶寬的測量， BandwidthTest是對處理后的信號(hào)的帶寬的測量， α是ABW的壓縮函數(shù)
28.根據(jù)權(quán)利要求25或27所述的裝置，其中，α = VK^r
全文摘要
在一種用于對語音質(zhì)量進(jìn)行客觀感知評(píng)估的裝置中，將表示帶寬的參數(shù)BandwidthRef和BandwidthTest轉(zhuǎn)發(fā)至計(jì)算器30，用于計(jì)算參考信號(hào)和測試信號(hào)之間的相對帶寬差ΔBW。將ΔBW轉(zhuǎn)發(fā)至計(jì)算器32，所述計(jì)算器32確定加權(quán)參數(shù)α的值。優(yōu)選地縮放單元33將干擾密度D以及非對稱干擾密度DA縮放或者標(biāo)準(zhǔn)化至例如區(qū)間
。將ΔBW和α的值轉(zhuǎn)發(fā)至帶寬補(bǔ)償器34，所述帶寬補(bǔ)償器34還接收所述優(yōu)選縮放的干擾密度D和非對稱干擾密度DA。將帶寬補(bǔ)償?shù)母蓴_密度D*、DA*轉(zhuǎn)發(fā)至線性組合器42，所述線性組合器42形成表示所述測試信號(hào)的經(jīng)過預(yù)測的質(zhì)量的分?jǐn)?shù)。
文檔編號(hào)G10L19/00GK101933085SQ200880124719
公開日2010年12月29日申請日期2008年4月9日優(yōu)先權(quán)日2008年1月14日
發(fā)明者沃洛佳·格蘭恰諾夫, 蘇珊娜·馬爾姆申請人:艾利森電話股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：沃洛佳.格蘭恰諾夫;蘇珊娜.馬爾姆
技術(shù)所有人：艾利森電話股份有限公司
我是此專利的發(fā)明人

上一篇：音頻編碼器和解碼器的制作方法
上一篇：記錄再現(xiàn)裝置的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

示波器測量音頻信號(hào)相關(guān)技術(shù)

音頻測量軟件相關(guān)技術(shù)

圖像質(zhì)量客觀評(píng)價(jià)標(biāo)準(zhǔn)相關(guān)技術(shù)

圖像質(zhì)量客觀評(píng)價(jià)相關(guān)技術(shù)

數(shù)字圖像客觀質(zhì)量評(píng)價(jià)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

音頻質(zhì)量的客觀測量的制作方法