專利名稱:視頻清晰度自動(dòng)識(shí)別系統(tǒng)及其方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻清晰度識(shí)別技術(shù)領(lǐng)域,特別涉及一種視頻清晰度自動(dòng)識(shí)別系統(tǒng)及
其方法。
背景技術(shù):
隨著視頻網(wǎng)絡(luò)的發(fā)展,視頻節(jié)目呈海量增長(zhǎng)之勢(shì),如何高效自動(dòng)地識(shí)別出視頻節(jié) 目的清晰度成為一個(gè)重要的問(wèn)題。這里的視頻清晰度指的是視頻的視覺(jué)內(nèi)容方面的清晰 度,也稱為是視頻質(zhì)量。清晰度(質(zhì)量)的決定因素,通常包括模糊度、塊狀或稱馬賽克 (Mosaic)的數(shù)量、噪聲數(shù)量、光亮明暗程度、編碼誤差以及其他因素。這些因素通常是由于 原始視頻被壓縮、傳輸、再拍攝、編輯等引起的。人類通過(guò)眼睛進(jìn)行觀看,可以非常準(zhǔn)備地判 斷一部視頻節(jié)目出是否清晰。但是,對(duì)于智能化程度不高的計(jì)算機(jī)來(lái)說(shuō),要自動(dòng)識(shí)別出一個(gè) 視頻節(jié)目的清晰度,仍然十分困難。其原因在于(l)影響視頻清晰度的因素很多,而且每 種因素都難以用數(shù)學(xué)定量地描述。例如再拍攝的燈光因素,是引起視頻模糊的一個(gè)重要 因素,如何通過(guò)計(jì)算燈光產(chǎn)生的模糊度是一個(gè)難題;(2)計(jì)算機(jī)很難識(shí)別視頻中哪些是真 實(shí)模糊和哪些非真實(shí)模糊,例如攝像機(jī)拍攝的時(shí)候前景清晰,但背景是模糊,而這種模糊和 上述由于編碼和壓縮所帶來(lái)的模糊,人類可以快速識(shí)別此類模糊。其他的例如馬賽克、噪聲 等,也存在同樣的困難;(3)計(jì)算機(jī)智能系統(tǒng)是根據(jù)量化后的清晰度來(lái)識(shí)別未知視頻的清 晰度,而這種智能系統(tǒng)的實(shí)現(xiàn)還不能和人的智能相提并論。 通常的視頻清晰度測(cè)量方法有三類(l)全參考視頻清晰度測(cè)量,主要通過(guò)一個(gè) 對(duì)比參考視頻和測(cè)試視頻之間的差異進(jìn)行測(cè)量的;(2)半?yún)⒖家曨l清晰度測(cè)量,主要在通 過(guò)在變換域上進(jìn)行參考視頻和測(cè)試視頻比較的方式進(jìn)行測(cè)量的;(3)無(wú)參考視頻清晰度 測(cè)量,這種測(cè)量方式不需要原始的參考視頻,它直接通過(guò)對(duì)測(cè)試視頻的清晰度進(jìn)行測(cè)量, 它的原理和人類觀看視頻的原理一樣,首先得到清晰度的可量化的各種度量,然后分析 和識(shí)別出清晰度的數(shù)值大小。舉個(gè)例子,一種無(wú)參考的流視頻質(zhì)量評(píng)估方法(專利號(hào) 200810207695. 5)通過(guò)分析丟包數(shù)據(jù)來(lái)進(jìn)行無(wú)參考視頻清晰度測(cè)量。但是丟包數(shù)據(jù)并不能 全面反映視頻的清晰度。正如本發(fā)明前面的分析,影響視頻的清晰度的因素包括模糊度、 塊狀或稱馬賽克的數(shù)量、噪聲數(shù)量、光亮明暗程度、編碼誤差以及其他因素。如何有效地對(duì) 視頻清晰度進(jìn)行自動(dòng)識(shí)別是本發(fā)明所有解決的技術(shù)問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種視頻清晰度自動(dòng)識(shí)別系統(tǒng)及其方法,通過(guò)采用多種
度量進(jìn)行清晰度的測(cè)量,然后采用訓(xùn)練智能模型系統(tǒng)的原理進(jìn)行學(xué)習(xí)和預(yù)報(bào)。 本發(fā)明采用如下技術(shù)方案 —種視頻清晰度自動(dòng)識(shí)別系統(tǒng),包括 視頻收集模塊,用于收集多個(gè)不同清晰度的視頻文件或視頻片段; 人工評(píng)分模塊,與所述視頻收集模塊相連接,用于對(duì)所述視頻文件或視頻片段的
4清晰度進(jìn)行人工評(píng)分,得到清晰度分值; 清晰度特征向量計(jì)算模塊,與所述人工評(píng)分模塊相連接,用于分別計(jì)算每個(gè)視頻 或視頻片段的各種清晰度特征向量,并計(jì)算未知視頻或視頻片段的各種清晰度特征向量;
支持向量回歸模型訓(xùn)練模塊,與所述清晰度特征向量計(jì)算模塊相連接,用于通過(guò) 所述各種清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型; 視頻清晰度識(shí)別模塊,與所述清晰度特征向量計(jì)算模塊和支持向量回歸模型訓(xùn)練 模塊相連接,將未知視頻或視頻片段的各種清晰度特征向量輸入所述支持向量回歸模型中 進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值。 進(jìn)一步地,所述清晰度特征向量計(jì)算模塊中訓(xùn)練得到的支持向量回歸模型為
Model = ( a丄,X丄,a 2, X2, , a M, XM, b) 參數(shù)a p a 2, . . . , a m為對(duì)應(yīng)的各種清晰度特征向量&, x2, . . . , xm在視頻清晰度 中的權(quán)重,b為修正值,X(&, X2, . . . , XM)是一個(gè)清晰度未知的視頻的清晰度特征向量;
所述視頻清晰度識(shí)別模塊中預(yù)測(cè)后的清晰度y的計(jì)算公式為y 二 SVR(Model,X) = J]a, .i:(Z,J^.) + 6
其中,K(x, y)是支持向量機(jī)的核函數(shù)。 進(jìn)一步地,所述清晰度特征向量計(jì)算模塊中每個(gè)視頻或視頻片段的各種清晰度特 征向量為對(duì)應(yīng)以下清晰度特征中的一種或多種 視頻的模糊度、視頻編碼產(chǎn)生的塊狀特征、視頻幀的色度和飽和度、色度和飽和度 的比率、視頻的銳化程度、模糊化程度、視頻的編碼比特率和視頻的幀率。
本發(fā)明還提供一種視頻清晰度自動(dòng)識(shí)別方法,包括以下步驟
1)收集多個(gè)不同清晰度的視頻文件或視頻片段; 2)采用人工評(píng)分的方式,得到所述視頻文件或視頻片段的清晰度的分值;
3)分別計(jì)算每個(gè)視頻或視頻片段的各種清晰度特征向量; 4)用到得的所述清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型;
5)在預(yù)測(cè)未知視頻或視頻片段的清晰度時(shí),采用步驟3)中相同的方法計(jì)算未知 視頻或視頻片段的清晰度特征向量,將計(jì)算得到的清晰度特征向量輸入步驟4)得到的支 持向量回歸模型中進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值。
進(jìn)一步地,所述步驟3)中訓(xùn)練得到的支持向量回歸模型為
Model = ( a丄,X丄,a 2, X2, , a M, XM, b) 參數(shù)a p a 2, . . . , a m為對(duì)應(yīng)的各種清晰度特征向量&, X2, . . . , XM在視頻清晰度 中的權(quán)重,b為修正值,X(&, X2, . . . , XM)是一個(gè)清晰度未知的視頻的清晰度特征向量;
所述步驟5)中,預(yù)測(cè)后的清晰度y的計(jì)算公式如下 <formula>formula see original document page 5</formula>
其中,K(x, y)是支持向量機(jī)的核函數(shù)。 進(jìn)一步地,所述步驟3)中每個(gè)視頻或視頻片段的各種清晰度特征向量為對(duì)應(yīng)以 下清晰度特征中的一種或多種 視頻的模糊度、視頻編碼產(chǎn)生的塊狀特征、視頻幀的色度和飽和度、色度和飽和度的比率、視頻的銳化程度、模糊化程度、視頻的編碼比特率和視頻的幀率。 本發(fā)明通過(guò)人工評(píng)分的方式對(duì)已知不同清晰度的視頻文件或視頻片段進(jìn)行評(píng)分,
然后計(jì)算每個(gè)視頻文件或視頻片段的各種清晰度度量,分別得到特征向量;用這些清晰度
特征向量的訓(xùn)練樣本集合訓(xùn)練一個(gè)支持向量回歸模型,用于對(duì)未知視頻的清晰度進(jìn)行預(yù)
測(cè),有效地解決了現(xiàn)有技術(shù)中視頻的清晰度無(wú)法自動(dòng)識(shí)別的問(wèn)題。
圖1為本發(fā)明視頻清晰度自動(dòng)識(shí)別系統(tǒng)實(shí)施例的框圖;
圖2為本發(fā)明視頻清晰度自動(dòng)識(shí)別方法實(shí)施例的流程圖。
具體實(shí)施方式
實(shí)施例一 如圖1所示,一種視頻清晰度自動(dòng)識(shí)別系統(tǒng),包括 視頻收集模塊,用于收集多個(gè)不同清晰度(質(zhì)量)的視頻文件或視頻片段;
人工評(píng)分模塊,與所述視頻收集模塊相連接,用于對(duì)所述視頻文件或視頻片段的 清晰度進(jìn)行人工評(píng)分,得到清晰度分值; 清晰度特征向量計(jì)算模塊,與所述人工評(píng)分模塊相連接,用于分別計(jì)算每個(gè)視頻 或視頻片段的各種清晰度特征向量,并計(jì)算未知視頻或視頻片段的各種清晰度特征向量;
支持向量回歸模型訓(xùn)練模塊,與所述清晰度特征向量計(jì)算模塊相連接,用于通 過(guò)所述各種清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型(Support Vector RegressionModel); 視頻清晰度識(shí)別模塊,與所述清晰度特征向量計(jì)算模塊和支持向量回歸模型訓(xùn)練 模塊相連接,將未知視頻或視頻片段的各種清晰度特征向量輸入所述支持向量回歸模型中 進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值,從而實(shí)現(xiàn)自動(dòng)識(shí)別視頻清晰度 的目的。
其中,所述清晰度特征向量計(jì)算模塊中訓(xùn)練得到的支持向量回歸模型為
Model = ( a丄,X丄,a 2, X2, , a M, XM, b) 參數(shù)a p a 2, . . . , a m為對(duì)應(yīng)的各種清晰度特征向量&, X2, . . . , XM在視頻清晰度 中的權(quán)重,b為修正值,X(&, X2, . . . , XM)是一個(gè)清晰度未知的視頻的清晰度特征向量;
所述視頻清晰度識(shí)別模塊中預(yù)測(cè)后的清晰度y的計(jì)算公式為y = SVR(Model,X) = Z",+ 6 K(x,y)是支持向量機(jī)的核函數(shù)。 實(shí)施例二 如圖2所示,一種視頻清晰度自動(dòng)識(shí)別方法,包括以下步驟 1)收集多個(gè)不同清晰度(質(zhì)量)的視頻文件或視頻片段; 2)采用人工評(píng)分的方式,得到所述視頻文件或視頻片段的清晰度的分值; 3)分別計(jì)算每個(gè)視頻或視頻片段的各種清晰度特征向量; 4)用到得的所述清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型(SupportVector Regression Model); 5)在預(yù)測(cè)未知視頻或視頻片段的清晰度時(shí),采用步驟3)中相同的方法計(jì)算未知 視頻或視頻片段的清晰度特征向量,將計(jì)算得到的清晰度特征向量輸入步驟4)得到的支 持向量回歸模型中進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值,從而實(shí)現(xiàn)自 動(dòng)識(shí)別視頻清晰度的目的。 假設(shè)X(&,X2,. . ,XM)是一個(gè)清晰度未知的視頻的清晰度特征向量,步驟3)中訓(xùn)練 得到的支持向量回歸模型為 Model = ( a !, X" a 2, X2, , a M, XM, b) 參數(shù)a p a 2, . . . , a m為對(duì)應(yīng)的各種清晰度特征向量&, X2, . . . , XM在視頻清晰度 中的權(quán)重,b為修正值。 K(x, y)是支持向量機(jī)的核函數(shù),預(yù)測(cè)后的清晰度y的計(jì)算公式如下
y = SVR(Model, X) = Za,-iC(Z,X,) + 6 本發(fā)明中視頻或視頻片段的所述各種清晰度特征向量&, X2, . . , Xm包含但不局限 于視頻的模糊度、視頻編碼產(chǎn)生的塊狀特征、視頻幀的色度和飽和度、色度和飽和度的比 率、視頻的銳化程度、模糊化程度、視頻的編碼比特率和視頻的幀率等等。清晰度特征向量 X包含其中的一種或者一種以上的上述清晰度特征作為特征向量。 以上所述的實(shí)施例僅用于說(shuō)明本發(fā)明的技術(shù)思想及特點(diǎn),其目的在使本領(lǐng)域內(nèi)的 技術(shù)人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實(shí)施,當(dāng)不能僅以本實(shí)施例來(lái)限定本發(fā)明的專利范 圍,即凡依本發(fā)明所揭示的精神所作的同等變化或修飾,仍落在本發(fā)明的專利范圍內(nèi)。
權(quán)利要求
一種視頻清晰度自動(dòng)識(shí)別系統(tǒng),其特征在于包括視頻收集模塊,用于收集多個(gè)不同清晰度的視頻文件或視頻片段;人工評(píng)分模塊,與所述視頻收集模塊相連接,用于對(duì)所述視頻文件或視頻片段的清晰度進(jìn)行人工評(píng)分,得到清晰度分值;清晰度特征向量計(jì)算模塊,與所述人工評(píng)分模塊相連接,用于分別計(jì)算每個(gè)視頻或視頻片段的各種清晰度特征向量,并計(jì)算未知視頻或視頻片段的各種清晰度特征向量;支持向量回歸模型訓(xùn)練模塊,與所述清晰度特征向量計(jì)算模塊相連接,用于通過(guò)所述各種清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型;視頻清晰度識(shí)別模塊,與所述清晰度特征向量計(jì)算模塊和支持向量回歸模型訓(xùn)練模塊相連接,將未知視頻或視頻片段的各種清晰度特征向量輸入所述支持向量回歸模型中進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值。
2. 根據(jù)權(quán)利要求1所述的視頻清晰度自動(dòng)識(shí)別系統(tǒng),其特征在于 所述清晰度特征向量計(jì)算模塊中訓(xùn)練得到的支持向量回歸模型為 Model = (a丄,Xp a 2, X2, , a M, XM, b)參數(shù)a p a 2, . . . , a m為對(duì)應(yīng)的各種清晰度特征向量&, X2, . . . , XM在視頻清晰度中的 權(quán)重,b為修正值,X(&, X2, . . . , XM)是一個(gè)清晰度未知的視頻的清晰度特征向量; 所述視頻清晰度識(shí)別模塊中預(yù)測(cè)后的清晰度y的計(jì)算公式為<formula>formula see original document page 2</formula> 其中,K(x, y)是支持向量機(jī)的核函數(shù)。
3. 根據(jù)權(quán)利要求1或2所述的視頻清晰度自動(dòng)識(shí)別系統(tǒng),其特征在于 所述清晰度特征向量計(jì)算模塊中每個(gè)視頻或視頻片段的各種清晰度特征向量為對(duì)應(yīng)以下清晰度特征中的一種或多種視頻的模糊度、視頻編碼產(chǎn)生的塊狀特征、視頻幀的色度和飽和度、色度和飽和度的比 率、視頻的銳化程度、模糊化程度、視頻的編碼比特率和視頻的幀率。
4. 一種視頻清晰度自動(dòng)識(shí)別方法,其特征在于包括以下步驟1) 收集多個(gè)不同清晰度的視頻文件或視頻片段;2) 采用人工評(píng)分的方式,得到所述視頻文件或視頻片段的清晰度的分值;3) 分別計(jì)算每個(gè)視頻或視頻片段的各種清晰度特征向量;4) 用到得的所述清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型;5) 在預(yù)測(cè)未知視頻或視頻片段的清晰度時(shí),采用步驟3)中相同的方法計(jì)算未知視頻 或視頻片段的清晰度特征向量,將計(jì)算得到的清晰度特征向量輸入步驟4)得到的支持向 量回歸模型中進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值。
5. 根據(jù)權(quán)利要求4所述的視頻清晰度自動(dòng)識(shí)別方法,其特征在于 所述步驟3)中訓(xùn)練得到的支持向量回歸模型為Model = (a丄,Xp a 2, X2, , a M, XM, b)參數(shù)a p a 2, . . . , a m為對(duì)應(yīng)的各種清晰度特征向量&, X2, . . . , XM在視頻清晰度中的 權(quán)重,b為修正值,X(&, X2, . . . , XM)是一個(gè)清晰度未知的視頻的清晰度特征向量; 所述步驟5)中,預(yù)測(cè)后的清晰度y的計(jì)算公式如下y = SVR(Model,X):Z"廣〖(I,義,.)+ 6 其中,K(x, y)是支持向量機(jī)的核函數(shù)。
6.根據(jù)權(quán)利要求5所述的視頻清晰度自動(dòng)識(shí)別方法,其特征在于 所述步驟3)中每個(gè)視頻或視頻片段的各種清晰度特征向量為對(duì)應(yīng)以下清晰度特征中 的一種或多種視頻的模糊度、視頻編碼產(chǎn)生的塊狀特征、視頻幀的色度和飽和度、色度和飽和度的比 率、視頻的銳化程度、模糊化程度、視頻的編碼比特率和視頻的幀率。
全文摘要
視頻清晰度自動(dòng)識(shí)別系統(tǒng)及其方法,所述系統(tǒng)包括視頻收集模塊,用于收集多個(gè)不同清晰度的視頻文件或視頻片段;人工評(píng)分模塊,用于對(duì)所述視頻文件或視頻片段的清晰度進(jìn)行人工評(píng)分,得到清晰度分值;清晰度特征向量計(jì)算模塊,用于分別計(jì)算每個(gè)視頻或視頻片段的各種清晰度特征向量,并計(jì)算未知視頻或視頻片段的各種清晰度特征向量;支持向量回歸模型訓(xùn)練模塊,用于通過(guò)所述各種清晰度特征向量的樣本集合來(lái)訓(xùn)練一個(gè)支持向量回歸模型;視頻清晰度識(shí)別模塊,將未知視頻或視頻片段的各種清晰度特征向量輸入所述支持向量回歸模型中進(jìn)行預(yù)測(cè),將預(yù)測(cè)后的結(jié)果作為該未知視頻的清晰度分值。本發(fā)明有效地解決了現(xiàn)有技術(shù)中視頻的清晰度無(wú)法自動(dòng)識(shí)別的問(wèn)題。
文檔編號(hào)G06N99/00GK101789091SQ201010106438
公開(kāi)日2010年7月28日 申請(qǐng)日期2010年2月5日 優(yōu)先權(quán)日2010年2月5日
發(fā)明者連惠城 申請(qǐng)人:上海全土豆網(wǎng)絡(luò)科技有限公司