本發(fā)明屬于視頻質(zhì)量檢測領(lǐng)域,尤其涉及一種基于GOP的視頻質(zhì)量評價方法。
背景技術(shù):
隨著計算機(jī)與網(wǎng)絡(luò)通信技術(shù)的飛速發(fā)展,人們對獲得多媒體信息的需求日益旺盛。近年來,與視頻相關(guān)的應(yīng)用涵蓋各個領(lǐng)域,如視頻會議、視頻監(jiān)控和移動電視等。在這些應(yīng)用中,視頻信息送達(dá)接受者之前需要經(jīng)過壓縮和傳輸,而這些過程往往會造成視頻質(zhì)量損失。為了獲得更好的主觀效果,有必要對視頻質(zhì)量作出評價,根據(jù)結(jié)果調(diào)整編碼器和傳輸信道的相關(guān)參數(shù)。視頻的最終受體是人的眼睛,人眼觀察是評價視頻質(zhì)量最精確的方法。然而,由于視頻的信息量非常大,依靠人工觀察的主觀方法對視頻質(zhì)量進(jìn)行評價需要消耗大量的人力和時間,不適合大規(guī)模實際應(yīng)用。因此,如何根據(jù)人眼視覺系統(tǒng)特性建立視頻質(zhì)量評價模型,在此基礎(chǔ)上由計算機(jī)自動完成視頻的質(zhì)量評價,成為一個非常有意義的課題。
視頻客觀質(zhì)量評價方法(Video Objective Quality Assessment):是指通過設(shè)計數(shù)學(xué)模型對視頻進(jìn)行智能化分析,并按設(shè)定的尺度對視頻進(jìn)行自動評分的客觀評價方法。視頻客觀質(zhì)量評價可以取代人眼,公正地比較不同視頻編解碼器輸出的視頻質(zhì)量,為視頻接收端提供參考,做出最優(yōu)選擇。在與網(wǎng)絡(luò)多媒體相關(guān)的視頻應(yīng)用中,視頻客觀質(zhì)量評價在服務(wù)器質(zhì)量檢測(Quality of Service,QoS)和終端質(zhì)量體驗(Quality of Experience,QoE)上面起到重要作用,根據(jù)視頻質(zhì)量評價反饋信息,視頻服務(wù)器可以動態(tài)調(diào)整視頻編碼器參數(shù)和傳輸信道參數(shù),以保證傳輸穩(wěn)定性,提高接收端視頻質(zhì)量。
視頻質(zhì)量評價從方法上可以分為主觀評價方法和客觀評價方法前者憑感知者主觀感受評價對象的質(zhì)量;后者依據(jù)模型給出的量化指標(biāo)衡量視頻圖像質(zhì)量。
視頻質(zhì)量評價方法可以分為三類:全參考方法、部分參考方法和無參考方法。全參考方法需要完整的原始視頻,部分參考方法則利用原始視頻相關(guān)的部分信息,而無參考方法只根據(jù)待評價視頻得出視頻質(zhì)量。
現(xiàn)在視頻質(zhì)量評價方法主要是把視頻序列中的所有幀圖像都進(jìn)行質(zhì)量評價,然后把得到的每一幀的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)處理;
第一,每幀圖像都進(jìn)行評價,工作量很大;
第二,對GOP中的某一幀圖像的評價沒有側(cè)重點,對最后的質(zhì)量評價的結(jié)果加權(quán)處理時,沒有區(qū)分每幀圖像的權(quán)重。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是針對背景技術(shù)技術(shù)的不足提供了一種基于GOP的視頻質(zhì)量評價方法。
本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案
一種基于GOP的視頻質(zhì)量評價方法,具體包含如下步驟:
步驟1,獲取視頻序列中的GOP;
步驟2,對步驟1獲取的GOP中的I幀與P幀進(jìn)行質(zhì)量評價;
步驟3,對I幀與P幀分配權(quán)重加權(quán)得出GOP質(zhì)量分?jǐn)?shù);
步驟4,對所有的GOP進(jìn)行加權(quán)處理,得出視頻序列的質(zhì)量分?jǐn)?shù)。
作為本發(fā)明一種基于GOP的視頻質(zhì)量評價方法的進(jìn)一步優(yōu)選方案,所述步驟2具體包含如下步驟:
步驟2.1,對獲取的GOP中的I幀與P幀進(jìn)行塊效應(yīng)評價;
步驟2.2,對獲取的GOP中的I幀與P幀進(jìn)行模糊部分評價。
作為本發(fā)明一種基于GOP的視頻質(zhì)量評價方法的進(jìn)一步優(yōu)選方案,在步驟3中,GOP質(zhì)量分?jǐn)?shù)的具體計算如下:
其中,QG為對I幀與P幀分配權(quán)重加權(quán)得出的GOP質(zhì)量分?jǐn)?shù),a為I幀對于整個GOP在視頻質(zhì)量評價中得分影響所占的權(quán)重,QI為I幀單幀的評價分值,bi為Pi幀對于整個GOP在視頻質(zhì)量評價中得分影響所占的權(quán)重,QPi為Pi幀單幀的評價分值,n為P幀的數(shù)量。
作為本發(fā)明一種基于GOP的視頻質(zhì)量評價方法的進(jìn)一步優(yōu)選方案,在步驟4中,視頻序列的質(zhì)量分?jǐn)?shù)的具體計算如下:
其中,QV為視頻序列的質(zhì)量分?jǐn)?shù),M為GOP的數(shù)量,QGV為視頻序列中單個GOP的評價分值,V指代的是評價的視頻序列。
作為本發(fā)明一種基于GOP的視頻質(zhì)量評價方法的進(jìn)一步優(yōu)選方案,在步驟2.2中,I幀與P幀進(jìn)行模糊部分評價的模糊分?jǐn)?shù)為:
其中,QT為I幀與P幀進(jìn)行模糊部分評價的模糊分?jǐn)?shù),NT紋理塊的總數(shù),i為紋理塊的索引,H為水平方向,V為垂直方向,為單幀水平方向的每個塊的模糊分?jǐn)?shù),為單幀垂直方向的每個塊的模糊分?jǐn)?shù)。
根據(jù)權(quán)利要求2所述的一種基于GOP的視頻質(zhì)量評價方法,在步驟2.3中,I幀與P幀的圖像質(zhì)量評價分?jǐn)?shù)為:
Q=QSαQTβ
其中α=0.9,β=0.1,Q為I幀或P幀的圖像質(zhì)量評價分?jǐn)?shù)。
本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:
第一,本發(fā)明因為在現(xiàn)有視頻壓縮編碼的過程中很編碼方式中的GOP是由I、P、B三種不同幀類型組成的,在每個GOP中,一般為15:2的類型,從每個GOP中選擇出I與P幀,舍棄B幀,這樣就會大大減少了需要評價的圖像的數(shù)量;
第二,本發(fā)明在視頻質(zhì)量評價中對每一幀的圖像進(jìn)行評價有后的加權(quán),這樣沒有側(cè)重點,因為在每一個GOP中I、P、B的重要性不一樣,所以可以根據(jù)I、P的不同的重要性分配權(quán)重,得到的評價結(jié)果更準(zhǔn)確。
附圖說明
圖1是本發(fā)明視頻質(zhì)量評價方法分類示意圖;
圖2是本發(fā)明的框架建結(jié)構(gòu)原理圖;
圖3是本發(fā)明I幀、P幀、B幀的參考關(guān)系圖;
圖4是本發(fā)明15:2的GOP的結(jié)構(gòu)示意圖;
圖5是本發(fā)明I幀與P幀的評價過程示意圖;
圖6是本發(fā)明I幀受損對視頻的影響的示意圖;
圖7是本發(fā)明P幀受損對視頻的影響的示意圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)說明:
如圖1所示,視頻質(zhì)量評價方法可以分為三類:全參考方法、部分參考方法和無參考方法。全參考方法需要完整的原始視頻,部分參考方法則利用原始視頻相關(guān)的部分信息,而無參考方法只根據(jù)待評價視頻得出視頻質(zhì)量。
如圖2所示,本發(fā)明講述了一種新的視頻質(zhì)量評價的方法,其主要目的是提高對視頻質(zhì)量評價的結(jié)果的準(zhǔn)確性,減少視頻質(zhì)量評價過程的工作量。該方法主要包括這幾部分:1.界定分好視頻序列中GOP(Group of picture),2.對GOP中的I幀與P幀進(jìn)行質(zhì)量評價,3.對I幀與P幀分配權(quán)重加權(quán)得出GOP質(zhì)量分?jǐn)?shù),4.最后對所有的GOP進(jìn)行加權(quán)處理,得出視頻序列的質(zhì)量分?jǐn)?shù)。
一種新的視頻質(zhì)量評價的方法,具體包含如下步驟:
步驟1,獲取視頻序列中的GOP;
步驟2,對步驟1獲取的GOP中的I幀與P幀進(jìn)行質(zhì)量評價;
步驟3,對I幀與P幀分配權(quán)重加權(quán)得出GOP質(zhì)量分?jǐn)?shù);
步驟4,對所有的GOP進(jìn)行加權(quán)處理,得出視頻序列的質(zhì)量分?jǐn)?shù)。
步驟1,得到視頻序列中的GOP:
如圖3所示,分析測試視頻序列,分離出單幀和幀類型,通過分離的幀類型得出每個GOP。對于一個視頻序列,在解碼器讀取視頻包,進(jìn)行解碼的時候,就可以得知當(dāng)前處理的屬于什么類型幀。通常,一個視頻序列有若干I幀,P幀和B幀構(gòu)成。I幀稱為參考幀,它包含有原始圖像的完整信息,因此往往也最重要;P幀稱為單向預(yù)測幀,通過編碼當(dāng)前圖像與前一個I幀或者P幀的差值得到;B幀為雙向預(yù)測幀,通過前后兩個P幀進(jìn)行雙向預(yù)測得倒。根據(jù)得出的幀類型,將視頻序列分離成單個的GOP序列。一個常見的視頻序列通常由一個前導(dǎo)的I幀加上若干預(yù)測幀P幀與B幀,由時間順序構(gòu)成,如IBBPBBPBBP…。通常,兩個I幀之間的部分,稱為一個GOP,如圖4。在編碼器對視頻編碼時,I幀的插入通常意味場景的切換,或者預(yù)測幀已經(jīng)夠多,當(dāng)前圖像與第一個I幀差異已經(jīng)夠大。
步驟2,對每一組的GOP中的I幀與P幀進(jìn)行質(zhì)量評價:從第一部分我們我們可以得到GOP中的I幀與P幀,我們可以選用對圖像質(zhì)量評價的一些算法對得到的這些幀圖像分別進(jìn)行質(zhì)量評價,得到每一幀的質(zhì)量分?jǐn)?shù),如圖5。在視頻編解碼過程中,造成的失真原因主要有塊和模糊,所以我們可以將幀分離得出的所有I幀與P幀選擇用同一種針對塊和模糊的效應(yīng)的評價方法進(jìn)行評價,例如可以選擇Leida Li、Yu Zhou.No-reference quality assessment of deblocked images這篇文章中的算法,也可以選擇其他的關(guān)于圖像評價的算法,對得出的每一幀圖像進(jìn)行質(zhì)量評價,在這簡要描述一下上面這篇文章中的算法中運用的公式。
首先塊效應(yīng)的評價:
在評價塊效應(yīng)圖像時,目標(biāo)塊應(yīng)該包含編碼塊的邊界。對于兩個相鄰的水平編碼塊(BL,BR),目標(biāo)塊(BT)包含BL的右半邊和BR的左半邊。同理,對于兩個相鄰的垂直編碼塊(BU,BB),目標(biāo)塊(BT)包含BU的下半邊和BB的上半邊。
在平坦區(qū)域中,人眼對于塊效應(yīng)較之模糊失真更敏感。而在紋理較為復(fù)雜的區(qū)域,人眼對于模糊失真更加敏感。所以,需要將目標(biāo)塊分為平坦塊和紋理復(fù)雜塊。所以,編碼圖像塊的劃分是根據(jù)圖像塊中所有非直流分量的平方和(SSM):
其中,B表示編碼圖像塊,表示編碼圖像塊的均值。通過設(shè)置閾值t來劃分圖像塊。如果編碼圖像塊的SSM<t,則該編碼圖像塊被視為平坦塊,否則被視為非平坦塊。
最終獲得的塊效應(yīng)分?jǐn)?shù)記為Qs。
然后是模糊部分評價
模糊分?jǐn)?shù)為:
其中,其中,QT為I幀與P幀進(jìn)行模糊部分評價的模糊分?jǐn)?shù),NT紋理塊的總數(shù),i為紋理塊的索引,H為水平方向,V為垂直方向,為單幀水平方向的每個塊的模糊分?jǐn)?shù),為單幀垂直方向的每個塊的模糊分?jǐn)?shù)。
得到最終的圖像質(zhì)量分?jǐn)?shù)Q為:
Q=QSαQTβ,
其中α=0.9,β=0.1。
步驟3,對I幀與P幀分配權(quán)重加權(quán)得出GOP質(zhì)量分?jǐn)?shù):
在編碼器對視頻編碼時,I幀直接或間接作為GOP中其它視頻幀的參考幀,如圖3的參考關(guān)系(列舉的是15:2的GOP模型)。如果在GOP開始的I幀丟失或損壞,誤碼將擴(kuò)散到整個GOP中,直到接收到下一個不被損壞的I幀,由于I幀編碼時不參考其它任何幀,視頻質(zhì)量才會恢復(fù)。如果I幀的幀頭信息損壞或丟棄等同于丟棄整個I幀,則將會影響整個GOP的視頻主觀感知質(zhì)量,直到接收到下一個不被損壞的I幀,視頻質(zhì)量才會恢復(fù)。同樣I幀中包丟失并沒有損壞幀頭信息,將會引起片信息的損壞,并且也會持續(xù)到整個GOP結(jié)束,直到接收到下一個不被損壞的I幀,視頻質(zhì)量才會恢復(fù),如圖6所示。
視頻序列的P幀在編碼時僅僅參考前幀圖像,進(jìn)行運動預(yù)測補(bǔ)償,即第一個P幀參考前一個I幀,隨后的P幀參考前一個P幀,如圖7所示。如果視頻序列中的P幀丟失或者損壞,誤碼對視頻的主觀感知質(zhì)量的影響將會持續(xù)到整個GOP結(jié)束,直到解碼器接收到下一個沒有被損壞的I幀。同I幀一樣,如果P幀的頭信息被損壞或丟棄,對視頻的主觀感知質(zhì)量的影響則等同于整個P幀被丟棄,參考該P幀后續(xù)的所有解碼幀都會受到影響直到GOP結(jié)束。如果丟包發(fā)生在P幀內(nèi),則會引起片損傷,對視頻的主觀感知質(zhì)量的影響同樣持續(xù)到GOP結(jié)束,直到接收到下一個不被損壞的I幀,視頻質(zhì)量才會恢復(fù)。從圖3和圖7可以看到B2幀和B3幀都是參考I幀和P4幀,P4幀作為整個GOP后續(xù)幀提供參考,如果P4幀受損,P4幀后的所有幀都肯定會受到P4幀直接或者間接的影響,因此,如果丟包發(fā)生在P4幀則會影響后續(xù)幀直到B15幀。這說明,P幀丟失或P幀被損壞對視頻的主觀感知質(zhì)量的效果,以此類推,如果是P7幀受損,則會影響整個P7幀后面的所有幀圖像,直到接收到下一個不被損壞的I幀。
在MPEG-4編碼器中,B幀不作為其它幀的參考幀,因此,丟棄一個B幀或B幀損壞,則該幀被丟棄或者只是影響到該幀。在幀率為30fps的視頻片段里,如果B幀損壞,在解碼器端觀看者能感受一撇也就是1/30秒的影響,幾乎不會影響觀看者的主觀感受。
由上面的分析我們可以得出,在一個GOP中I幀的失真會影響整個GOP,P幀的損傷會影響P幀后面的所有P幀與B幀,而B幀的損傷對其他幀圖像沒有影響,所以I幀、P幀與B幀的重要性應(yīng)該有所體現(xiàn)。在對整個GOP的質(zhì)量評價時,不能對GOP中的圖像進(jìn)行簡單的平均加權(quán)處理,而應(yīng)該在分配權(quán)重時,I幀分配的權(quán)值最大,其他的P幀根據(jù)在GOP中位置的先后順序(影響后面P幀與B幀的多少)來分配權(quán)重比例,因為B幀的圖像對其他幀的圖像沒有影響,可以舍棄掉,不進(jìn)行評價,只對I幀與P幀進(jìn)行質(zhì)量評價,這樣就會節(jié)省了很大一部分工作量。例如以15:2的GOP來計算,I幀圖像有1幀,P幀圖像有4幀,假設(shè)這5幀圖像的權(quán)重分別為a、b1、b2、b3、b4。權(quán)重的分配推薦兩種方法:方法一,尋優(yōu)擬合找到最好的分配比例(多次隨機(jī)選取進(jìn)行結(jié)果擬合,一直得到最好的評價結(jié)果);方法二,可以根據(jù)影響的GOP中幀數(shù)的多少來分配權(quán)重。下面講解一下方法二,以15:2的GOP來計算。I幀影響15幀,P1幀影響12幀,P2幀影響9幀,P3幀影響6幀,P4幀影響3幀;假設(shè)影響的總幀數(shù)為N;
a+b1+b2+b3+b4=1
N=15+12+9+6+3
a=15/N
b1=12/N
b2=9/N
b3=6/N
b4=3/N
得到每個權(quán)值以后,最后在得出這個組的GOP的時候進(jìn)行加權(quán)可以得到這個GOP的質(zhì)量評價分?jǐn)?shù)(假設(shè)P幀有n幅):
其中,QG為對I幀與P幀分配權(quán)重加權(quán)得出的GOP質(zhì)量分?jǐn)?shù),a為I幀對于整個GOP在視頻質(zhì)量評價中得分影響所占的權(quán)重,QI為I幀單幀的評價分值,bi為Pi幀對于整個GOP在視頻質(zhì)量評價中得分影響所占的權(quán)重,QPi為Pi幀單幀的評價分值,n為P幀的數(shù)量。
步驟4,所有GOP的質(zhì)量分?jǐn)?shù)加權(quán),得到最終結(jié)果:
用第三部分的方法,我們可以得出視頻序列中的所有GOP的質(zhì)量分?jǐn)?shù),把得到的所有的GOP的質(zhì)量分?jǐn)?shù)加權(quán),假設(shè)有M個GOP,那么最終得到的視頻序列的質(zhì)量分?jǐn)?shù)為QV:
其中,QV為視頻序列的質(zhì)量分?jǐn)?shù),M為GOP的數(shù)量,QGV為視頻序列中單個GOP的評價分值,V指代的是評價的視頻序列。
綜上所述,第一,首先本發(fā)明沒有對視頻序列直接進(jìn)行評價,而是分析測試視頻序列,分離出單幀和幀類型,通過分離的幀類型得出每個GOP,再根據(jù)每個GOP中I幀、P幀、B幀的重要性,舍棄掉GOP中相對不重要的B幀,只選取到每個GOP中的I幀與P幀圖像進(jìn)行質(zhì)量評價。通過每個GOP里的I幀與P幀的評價結(jié)果,可以得出每個GOP的質(zhì)量評價分?jǐn)?shù),最后再把整個視頻序列中組有的GOP的質(zhì)量評價結(jié)果進(jìn)行加權(quán)得出視頻序列的質(zhì)量評價分?jǐn)?shù)。
第二,在得到每個GOP的質(zhì)量分?jǐn)?shù)時,不僅僅是對這個GOP中得到I幀與P幀的質(zhì)量分?jǐn)?shù)結(jié)果進(jìn)行簡單的平均加權(quán),根據(jù)本發(fā)明中的第三部分中講述的:GOP中I幀、P幀對其他幀影響的重要性不同分配不同的權(quán)值,I幀影響的本GOP中幀的數(shù)量最多,分配最大的權(quán)重;排列在前邊的P幀比排列在后面的P幀影響的本GOP中的幀的數(shù)量多一些,所以越排列在前邊的P幀在分配權(quán)重時比排列在后面的P幀擁有更大的權(quán)重,具體的權(quán)重分配例如本發(fā)明中第三部分的方法一或者方法二,通過得到的I幀與P幀不同權(quán)值,進(jìn)行加權(quán)得到這個GOP的質(zhì)量分?jǐn)?shù)。