本發(fā)明涉及圖像信號(hào)處理方法,特別是涉及一種高效的基于學(xué)習(xí)的高效視頻編碼方法。
背景技術(shù):
:由于能夠提供更好的感知質(zhì)量和更逼真的視覺(jué)體驗(yàn),高清(HighDefinition,HD)與超高清(UltraHighDefinition)視頻越來(lái)越流行并受到人們的喜愛(ài)。這些高清和超高清視頻具有廣闊的應(yīng)用市場(chǎng),包括高清電視廣播、MAX電影、沉浸式視頻通信、網(wǎng)絡(luò)視頻點(diǎn)播以及高清視頻監(jiān)控等。然而,由于高清與超高清視頻具有更高的清晰度和視頻幀率,視頻數(shù)據(jù)量也極具增加。例如,一個(gè)8K×4K@120幀每秒的高清/超高清視頻具有11.5GB每秒的視頻原始數(shù)據(jù),將其有效的存儲(chǔ)和傳輸就需要非常高效的視頻壓縮。為了有效的解決高清視頻的壓縮問(wèn)題,視頻編碼聯(lián)合工作組(JointCollaborativeTeamonVideoCoding,JCT-VC)提出了高效視頻編碼(HighEfficiencyVideoCoding,HEVC)標(biāo)準(zhǔn)。相比于H.264/AVC標(biāo)準(zhǔn)的高檔次(highprofile)在相同視覺(jué)質(zhì)量的前提下降低50%的碼率,即壓縮比提高一倍。高效視頻編碼HEVC引入了多種先進(jìn)的編碼技術(shù),包括靈活的四叉樹(shù)塊分割模式,35種幀內(nèi)預(yù)測(cè)模式,離散正弦變換,以及復(fù)雜的插值和濾波技術(shù)等等。這些相關(guān)編碼技術(shù)有效提高了視頻壓縮效率,然而極大地增加了編碼復(fù)雜度,包括計(jì)算復(fù)雜度、CPU消耗、內(nèi)存訪問(wèn)消耗、電池消耗等,不利于高清和超高清的實(shí)時(shí)性應(yīng)用。高效視頻編碼HEVC中的編碼樹(shù)單元結(jié)構(gòu)(CodingTreeUnit,CTU)類(lèi)似于H.264/AVC中的宏塊的概念。CTU包含一個(gè)亮度塊(CodingTreeBlock,CTB)和若干色度塊,以及若干語(yǔ)法元素。每個(gè)亮度塊CTB根據(jù)視頻內(nèi)容包含一個(gè)編碼單元(CodingUnit,CU)或被分割為多個(gè)編碼單元。高效視頻編碼HEVC中每個(gè)編碼單元的尺寸支持8×8、16×16、32×32和64×64,亮度塊CTB中的編碼單元分割樣例如圖1所示,Depth0至Depth4分別表示64×64至8×8的編碼單 元尺寸。此外,每個(gè)編碼單元又可進(jìn)一步分為不同模式和尺寸的預(yù)測(cè)單元(PredictionUnit,PU),其中,包括SKIP、MERGE模式、8種幀間模式以及2種幀內(nèi)模式。最后,每個(gè)預(yù)測(cè)單元PU又將采用不同尺寸的變換單元(TransformUnit,TU)進(jìn)行變換編碼。高效視頻編碼HEVC中編碼單元、預(yù)測(cè)單元和變換單元是層次遞歸關(guān)系,每個(gè)編碼單元、預(yù)測(cè)單元和變換單元層次都有多個(gè)模式,而各個(gè)層的最佳的模式主要通過(guò)計(jì)算率失真代價(jià)(Rate-DistortionCost)得到,即選擇率失真代價(jià)最小的模式為最佳模式。然而,這就需要計(jì)算所有的層次和模式的率失真代價(jià)并比較以獲得最佳模式,非常耗時(shí),計(jì)算復(fù)雜度非常高。由此,眾多研究人員提出了針對(duì)高效視頻編碼HEVC的低復(fù)雜度優(yōu)化方法。如通過(guò)預(yù)測(cè)已編碼片(Slice)或者編碼單元來(lái)預(yù)測(cè)當(dāng)前編碼單元所在的編碼片的編碼單元的深度范圍,對(duì)于預(yù)測(cè)范圍之外的不進(jìn)行測(cè)試從而降低計(jì)算復(fù)雜度。又如人利用運(yùn)動(dòng)的差異化信息作為主要特征,通過(guò)相鄰編碼單元塊以及當(dāng)前編碼單元塊的運(yùn)動(dòng)差異來(lái)決策當(dāng)前編碼單元是否分割。又有則利用率失真代價(jià),不同深度層、以及相鄰編碼單元的模式相關(guān)性進(jìn)行幀內(nèi)編碼單元深度的預(yù)測(cè)。機(jī)器學(xué)習(xí)是人工智能、模式識(shí)別以及信號(hào)處理中的熱點(diǎn),通過(guò)學(xué)習(xí)的方式給予有效的最優(yōu)解。研究人員也將學(xué)習(xí)的相關(guān)算法應(yīng)用于視頻編碼。如將歸一化的率失真代價(jià)等作為特征量,輸入支持向量機(jī)(SupportVectorMachine,SVM)實(shí)現(xiàn)其有效模式分類(lèi)問(wèn)題。同時(shí)由于誤分類(lèi)導(dǎo)致的率失真增加也被考慮了。因此有利用后向傳播神經(jīng)網(wǎng)絡(luò)(BackPropagationNeuralNetwork,BPNN)解決視頻編碼中的模式分類(lèi)問(wèn)題。此外,決策樹(shù)(DecisionTree)等被用于H.264/AVC及其立體視頻編碼中的模式分類(lèi),如將SKIP模式為最佳模式的塊區(qū)分取來(lái)進(jìn)行早期終止模式選擇過(guò)程。這些算法主要用于H.264/AVC的編碼優(yōu)化,難以簡(jiǎn)單移植到高效視頻編碼HEVC中。針對(duì)基于機(jī)器學(xué)習(xí)的高效視頻編碼優(yōu)化,有提出基于加權(quán)的SVM進(jìn)行編碼單元分割與不分割的早期終止算法,其中對(duì)特征選取進(jìn)行了優(yōu)化,同時(shí),率失真代價(jià)參與并作為SVM離線學(xué)習(xí)的加權(quán)信息。因此,有利用了MPEG-2以及H.264/AVC視頻流中的碼流信息進(jìn)行HEVC的CU模式預(yù)測(cè)。與此同時(shí),統(tǒng)計(jì)閾值加入進(jìn)來(lái),對(duì)預(yù)測(cè)不準(zhǔn)確的情況進(jìn)行進(jìn)一步篩選。總體上,已有的基于機(jī) 器學(xué)習(xí)的編碼單元模式預(yù)測(cè)方法非常依賴(lài)于特征選擇以及學(xué)習(xí)機(jī)的分類(lèi)精度,一旦預(yù)測(cè)不準(zhǔn)確將導(dǎo)致巨大的壓縮效率下降。同時(shí),傳統(tǒng)方法一旦確定,難以通過(guò)參數(shù)調(diào)整實(shí)現(xiàn)編碼效率、計(jì)算復(fù)雜度的轉(zhuǎn)換,由此難以適用于不同視頻系統(tǒng)的編碼要求。技術(shù)實(shí)現(xiàn)要素:基于此,有必要提供一種高效的基于學(xué)習(xí)的高效視頻編碼方法。一種基于學(xué)習(xí)的高效視頻編碼方法,包括以下步驟:步驟110、采用高效視頻編碼器編碼視頻序列,提取每個(gè)編碼單元塊對(duì)應(yīng)的特征向量;步驟120、將提取的特征向量與最佳編碼單元尺寸輸入三值輸出的學(xué)習(xí)機(jī),配置學(xué)習(xí)參數(shù)和學(xué)習(xí)模式,建立學(xué)習(xí)模型;步驟130、在高效視頻編碼器中進(jìn)行編碼單元尺寸的選擇過(guò)程加入早期終止策略結(jié)構(gòu),其中,在每個(gè)編碼單元深度層i,首先執(zhí)行直接模式(SKIP模式)和融合模式(MERGE模式)當(dāng)前塊,提取與步驟110對(duì)應(yīng)的當(dāng)前編碼對(duì)應(yīng)的特征向量;步驟140、將步驟130中的特征向量輸入已學(xué)習(xí)好了的學(xué)習(xí)機(jī)模型,輸出預(yù)測(cè)值,若預(yù)測(cè)值為不分割,則執(zhí)行并測(cè)試當(dāng)前編碼單元尺寸,同時(shí)跳過(guò)分割編碼單元尺寸的測(cè)試與編碼;若預(yù)測(cè)值為分割,則跳過(guò)測(cè)試當(dāng)前編碼單元尺寸,直接執(zhí)行分割的編碼尺寸的測(cè)試與編碼;若為不確定,則測(cè)試當(dāng)前編碼單元尺寸,然后測(cè)試分割的編碼單元尺寸;步驟150、重復(fù)步驟130和步驟140直至編碼樹(shù)單元中所有的編碼單元層都編碼完成;步驟160、重復(fù)步驟130-步驟150直至所有視頻幀中編碼樹(shù)單元都編碼完成。在其中一個(gè)實(shí)施例中,所述特征向量包括當(dāng)前編碼單元塊的特征、運(yùn)動(dòng)信息、上下文信息、量化參數(shù)等以及最佳編碼單元尺寸。在其中一個(gè)實(shí)施例中,所述當(dāng)前編碼單元塊的特征包括編碼塊標(biāo)識(shí)位xCBF_Meg(i)、率失真代價(jià)值xRD_Meg(i)、失真xD_Meg(i)以及編碼比特?cái)?shù)xBit_Meg(i);其 中,i為當(dāng)前編碼單元的深度;所述運(yùn)動(dòng)信息的計(jì)算公式為xMV_Meg(i)=|MVx|+|MVy|,其中MVx和MVy分別表示運(yùn)動(dòng)和垂直運(yùn)動(dòng)幅度,i為當(dāng)前編碼單元的深度。將視頻分塊模式的時(shí)間、空間的率失真代價(jià)以及編碼單元深度作為當(dāng)前編碼單元深度決策的特征量,分別記為xNB_RD(i)和xCU_depth(i);其中,率失真代價(jià)xNB_RD(i)為相鄰左邊和上邊編碼單元的率失真代價(jià)值的評(píng)價(jià)值;編碼單元深度xCU_depth(i)為相鄰編碼單元的平均深度;通過(guò)以下公式計(jì)算得到:xCU_depth(i)=1NLFT(i)+NABV(i)Σj=1NLFT(i)+NABV(i)dj;]]>其中dj是左邊和上邊編碼單元中以4×4塊為單元的深度值,NLFT(i)和NABV(i)為左邊和上邊編碼單元中4×4塊個(gè)數(shù)。在其中一個(gè)實(shí)施例中,所述將提取的特征向量與最佳編碼單元尺寸輸入三值輸出的學(xué)習(xí)機(jī),配置學(xué)習(xí)參數(shù)和學(xué)習(xí)模式,建立學(xué)習(xí)模型的步驟包括:將特征矢量輸入m個(gè)二值輸出的學(xué)習(xí)機(jī),學(xué)習(xí)機(jī)通過(guò)已學(xué)習(xí)的模型,輸出預(yù)測(cè)值Oi,+1或-1,其中i表示學(xué)習(xí)機(jī)的標(biāo)號(hào),為1至m;對(duì)m個(gè)輸出Oi進(jìn)行融合,得到最終輸出為QALL;OALL=1Σi=1mOi≥TAUothers-1Σi=1mOi<TB;]]>其中,TA和TB為0至m的兩個(gè)閾值。在其中一個(gè)實(shí)施例中,還包括將特征輸入分類(lèi)器,所述分類(lèi)器將根據(jù)當(dāng)前視頻內(nèi)容特性和已學(xué)的模型參數(shù)做出預(yù)測(cè)A(+1)、B(-1)或C(U不確定);當(dāng)預(yù)測(cè)為A,則將直接模式Dn作為最佳模式,則只執(zhí)行Dn;當(dāng)預(yù)測(cè)為B,則將容錯(cuò)模式Pn+1作為為最佳模式,則只執(zhí)行Pn+1;當(dāng)預(yù)測(cè)為C,則表示不確定Dn或Pn+1,則執(zhí)行Dn和4個(gè)Pn+1。在其中一個(gè)實(shí)施例中,誤預(yù)測(cè)導(dǎo)致的率失真代價(jià)的增加量可以表示為:ΔηRD(i)=ΔηnS→S(i)×pBA(i)+ΔηS→nS(i)×pAB(i);其中pBA(i)=NBA,1(i)/NALL(i),pAB(i)=NAB,2(i)/NALL(i)是分割(B)與不分割(A)的錯(cuò)誤預(yù)測(cè)率,NBA,1(i)和NAB,2(i)分別為一號(hào)分類(lèi)器中B誤預(yù)測(cè)為A的樣本個(gè)數(shù),2號(hào)分類(lèi)器中A誤預(yù)測(cè)為B的樣本個(gè)數(shù),NALL(i)為第i層編碼單元需要進(jìn)行預(yù)測(cè)的樣本個(gè)數(shù),其中NALL(1)即為整個(gè)圖像的編碼單元個(gè)數(shù);分割與不分割優(yōu)化后的計(jì)算復(fù)雜度計(jì)算為ΔT(i)=ΔTS(i)×qS,1(i)+ΔTnS(i)×qnS,2(i);其中ΔTS(i)和ΔTnS(i)分別為在編碼單元深度層i中,通過(guò)分割與不分割的預(yù)測(cè)而導(dǎo)致的計(jì)算復(fù)雜度降低百分比,ΔTS(i)=1-TS(i)/TALL(i),ΔTnS(i)=1-TnS(i)/TALL(i),其中TS(i)、TnS(i)和TALL(i)分別為分割、不分割以及原操作的計(jì)算復(fù)雜度;根據(jù)所述誤預(yù)測(cè)導(dǎo)致的率失真代價(jià)的增加量和所述分割與不分割優(yōu)化后的計(jì)算復(fù)雜度設(shè)定目標(biāo)函數(shù);所述目標(biāo)函數(shù)表示為minxi,yi1-ΔT(i),s.t.Δη(i)≤ΔηT,i;]]>其中,ΔηT,i為壓縮效率降低百分比,xi和yi是第i層三值輸出分類(lèi)器的兩個(gè)模型參數(shù),表示為WA(j,i)和WB(j,i)分別表示第i層編碼單元中第j個(gè)分類(lèi)器中正、負(fù)樣本的權(quán)重值。在其中一個(gè)實(shí)施例中,還包括對(duì)配置學(xué)習(xí)參數(shù)和學(xué)習(xí)模式設(shè)置最優(yōu)學(xué)習(xí)參數(shù);對(duì)若干測(cè)試序列中的部分視頻幀,采用高效視頻編碼統(tǒng)計(jì)得到ΔTnS(i)、ΔTS(i)、ΔηS→nS(i)和ΔηnS→S(i),并擬合得到參數(shù)bi、ai、ti、Bi、Ai、ui、vi和Ti,C1(i)+k1(i)(tih1(i)λiTik1(i))TiTi-ti+k2(i)Tiln-λik2(i)Tih2(i)-ΔηT,i=0;]]>給定ΔηT,i即可采用最小二乘法得到參數(shù)λi,再將λi帶入公式xi=tiTiTi-tilntih1(i)λiTik1(i)yi=Tiln-λik2(i)Tih2(i);]]>可以計(jì)算得到xi和yi,最終根據(jù)xi=log(WA(1,i)WB(1,i)),yi=log(WA(2,i)WB(2,i));]]>得到WA(j,i)/WB(j,i)的比率,作為學(xué)習(xí)機(jī)的訓(xùn)練參數(shù),其中,ΔTnS(i)、ΔTS(i)、ΔηS→nS(i)、ΔηnS→S(i)、bi、ai、ti、Bi、Ai、ui、vi、Ti、xi和yi均為中間參數(shù)。在其中一個(gè)實(shí)施例中,所述學(xué)習(xí)機(jī)的訓(xùn)練方式包括在線方式和離線方式。在其中一個(gè)實(shí)施例中,所述在線方式包括對(duì)n幀視頻采用原始HM模型編碼,輸出面向每一類(lèi)編碼單元深度i的學(xué)習(xí)機(jī)的特征矢量Xi以及每個(gè)編碼單元的最佳分塊模式Y(jié);將Xi和Y輸入支持向量機(jī)學(xué)習(xí)機(jī)訓(xùn)練;將訓(xùn)練好的支持向量機(jī)學(xué)習(xí)機(jī)用于視頻幀編碼中的編碼單元深度預(yù)測(cè)。在其中一個(gè)實(shí)施例中,所述離線方式包括選取若干特定序列和每個(gè)序列的若干幀,采用原始HM模型進(jìn)行編碼,輸出這些已編碼視頻幀中面向每一類(lèi)編碼單元深度i的學(xué)習(xí)機(jī)的特征矢量Xi以及每個(gè)編碼單元的最佳分塊模式Y(jié);將Xi和Y輸入支持向量機(jī)學(xué)習(xí)機(jī)訓(xùn)練;將訓(xùn)練好的支持向量機(jī)學(xué)習(xí)機(jī)用于視頻序列、視頻幀的編碼與編碼單元深度預(yù)測(cè)。上述基于學(xué)習(xí)的高效視頻編碼方法通過(guò)設(shè)定不同的分類(lèi)精度的分類(lèi)器,并建立早期終止策略結(jié)構(gòu)。該早期終止策略結(jié)構(gòu)可以通過(guò)調(diào)整輸出的比例轉(zhuǎn)換變?yōu)閭鹘y(tǒng)若干種經(jīng)典的決策結(jié)構(gòu)。因此,可以根據(jù)實(shí)際需求和分類(lèi)器的特性進(jìn)行切換。針對(duì)提取的特征向量預(yù)先學(xué)習(xí)好的學(xué)習(xí)機(jī)模型能夠?qū)?yīng)輸出預(yù)測(cè)值,根據(jù)預(yù)測(cè)值選擇不同的編碼模式。即能夠根據(jù)高效視頻編碼中的率失真代價(jià)以及計(jì)算復(fù)雜度對(duì)應(yīng)輸出最優(yōu)的編碼過(guò)程,從而提高分類(lèi)器的學(xué)習(xí)和分類(lèi)性能,進(jìn)而提高視頻編碼的編碼效率。附圖說(shuō)明圖1為基于學(xué)習(xí)的高效視頻編碼方法的流程圖;圖2為編碼樹(shù)單元中編碼單元的分割模式圖;圖3為編碼樹(shù)單元編碼過(guò)程示意圖;圖4為編碼單元決策分割示意圖;圖5(a)為遞歸的編碼單元尺寸決策過(guò)程Pn(i)結(jié)構(gòu)圖之一;圖5(b)為遞歸的編碼單元尺寸決策過(guò)程Pn(i)結(jié)構(gòu)圖之一;圖5(c)為遞歸的編碼單元尺寸決策過(guò)程Pn(i)結(jié)構(gòu)圖之一;圖5(d)為遞歸的編碼單元尺寸決策過(guò)程Pn(i)結(jié)構(gòu)圖之一;圖6為三輸出分類(lèi)器流程圖;圖7為ΔηT,i配置情況下的平均計(jì)算復(fù)雜度降低與碼率增加的曲線圖;圖8為在線方式訓(xùn)練示意圖;圖9為離線方式訓(xùn)練示意圖。具體實(shí)施方式如圖1所示,為基于學(xué)習(xí)的高效視頻編碼方法的流程圖。一種基于學(xué)習(xí)的高效視頻編碼方法,包括以下步驟:步驟110、采用高效視頻編碼器編碼視頻序列,提取每個(gè)編碼單元塊對(duì)應(yīng)的特征向量。所述特征向量包括當(dāng)前編碼單元塊的特征、運(yùn)動(dòng)信息、上下文信息、量化參數(shù)等以及最佳編碼單元尺寸。當(dāng)前編碼單元塊的特征包括編碼塊標(biāo)識(shí)位xCBF_Meg(i)、率失真代價(jià)值xRD_Meg(i)、失真xD_Meg(i)以及編碼比特?cái)?shù)xBit_Meg(i);其中,i為當(dāng)前編碼單元的深度。運(yùn)動(dòng)信息的計(jì)算公式為xMV_Meg(i)=|MVx|+|MVy|,其中MVx和MVy分別表示運(yùn)動(dòng)和垂直運(yùn)動(dòng)幅度,i為當(dāng)前編碼單元的深度。具體的,當(dāng)前編碼單元的信息,主要包括采用SKIP模式和MERGE模式編碼當(dāng)前編碼單元過(guò)程的輸出信息,包括編碼塊標(biāo)識(shí)位(CodedBlockFlag,標(biāo)識(shí) 編碼殘差系數(shù)個(gè)數(shù))、率失真代價(jià)值、失真以及編碼比特?cái)?shù),這四個(gè)信息分別表示為xCBF_Meg(i)、xRD_Meg(i)、xD_Meg(i)、xBit_Meg(i),其中i為當(dāng)前編碼單元的深度,為0、1、2、3。此外,還有一個(gè)SKIP標(biāo)記位是編碼后的輸出信息位、0或1,記為xSKIP(i)。運(yùn)動(dòng)信息主要用來(lái)表征當(dāng)前編碼單元的運(yùn)動(dòng)劇烈程度,一般運(yùn)動(dòng)劇烈比較大的概率采用小尺寸的編碼單元,即分割的概率較高。本實(shí)施例中采用merge模式編碼后的運(yùn)動(dòng)矢量表征當(dāng)前編碼單元的運(yùn)動(dòng),具體計(jì)算為xMV_Meg(i)=|MVx|+|MVy|,其中MVx和MVy分別表示運(yùn)動(dòng)和垂直運(yùn)動(dòng)幅度。由于視頻的分塊模式通常具有較強(qiáng)的時(shí)、空間相關(guān)性,由此,時(shí)、空間的率失真代價(jià)以及編碼單元深度作為當(dāng)前編碼單元深度決策的特征量,分別記為xNB_RD(i)和xCU_depth(i)。本實(shí)施例中,xNB_RD(i)為相鄰左邊和上邊編碼單元的率失真代價(jià)值的評(píng)價(jià)值;xCU_depth(i)為相鄰編碼單元的平均深度,通過(guò)以下公式計(jì)算得到xCU_depth(i)=1NLFT(i)+NABV(i)Σj=1NLFT(i)+NABV(i)dj;]]>其中,dj是左邊和上邊編碼單元中以4×4塊為單元的深度值,NLFT(i)和NABV(i)為左邊和上邊編碼單元中4×4塊個(gè)數(shù)。編碼當(dāng)前編碼單元的量化參數(shù),記為xQP,通常量化參數(shù)越大,當(dāng)前編碼單元更有可能采用較大的塊進(jìn)行編碼。本實(shí)施例中列舉的以上特征量是主要特征量,包括但不限定于以上內(nèi)容,此外也可以對(duì)其中進(jìn)行刪減。步驟120、將提取的特征向量與最佳編碼單元尺寸輸入三值輸出的學(xué)習(xí)機(jī),配置學(xué)習(xí)參數(shù)和學(xué)習(xí)模式,建立學(xué)習(xí)模型。請(qǐng)結(jié)合圖6。具體的,三值輸出分類(lèi)器由m(m>=2)個(gè)二值輸出的分類(lèi)器組成,結(jié)構(gòu)如圖5所示,這些二值輸出分類(lèi)器可以是公知的支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)或貝葉斯分類(lèi)器等。最后,通過(guò)一個(gè)合并單元將不同的輸出結(jié)果融合,形成三值輸出,分別為正(+1)、負(fù)(-1)以及不確定(U),分別對(duì)應(yīng)于圖5(d)中的A、B和C,融合方式具體表示為。OALL=1Σi=1mOi≥TAUothers-1Σi=1mOi<TB;]]>其中TA和TB為0至m的兩個(gè)閾值,當(dāng)TA=m,則圖5(d)中的A為0,當(dāng)TB=0則三輸出分類(lèi)器的B為0,TA=m同時(shí)TB=0,則輸出C為100%。若TA<TB,則C輸出為0。實(shí)際操作中,一般TA>TB。一個(gè)三值輸出的分類(lèi)器可以有m個(gè)不同學(xué)習(xí)機(jī)組成,也可以由同一個(gè)學(xué)習(xí)機(jī)但參數(shù)和學(xué)習(xí)方式不同組成,或者是不同學(xué)習(xí)機(jī)同時(shí)不同參數(shù)組成。本實(shí)施例中,采用多個(gè)支持向量機(jī),不同的加權(quán)系數(shù),m=2,TA=2,TB=1。本實(shí)施例中采用了支持向量機(jī)學(xué)習(xí)機(jī),訓(xùn)練過(guò)程可分為兩大類(lèi),離線方式和在線方式。如圖8所示,為在線方式訓(xùn)練示意圖。在線方式中,通過(guò)對(duì)n幀視頻采用原始HM模型編碼,輸出面向每一類(lèi)編碼單元深度i的學(xué)習(xí)機(jī)的特征矢量Xi(包含上述的9個(gè)特征量)以及每個(gè)編碼單元的最佳分塊模式Y(jié),將Xi和Y輸入支持向量機(jī)學(xué)習(xí)機(jī)訓(xùn)練,然后將訓(xùn)練好的支持向量機(jī)學(xué)習(xí)機(jī)用于后續(xù)視頻幀編碼中的編碼單元深度預(yù)測(cè);該方式中每編碼一個(gè)序列都需要重新訓(xùn)練。如圖9所示,為離線方式訓(xùn)練示意圖。離線方式中,選取若干特定序列和每個(gè)序列的若干幀,采用原始HM模型進(jìn)行編碼,輸出這些已編碼視頻幀中面向每一類(lèi)編碼單元深度i的學(xué)習(xí)機(jī)的特征矢量Xi(包含上述的9個(gè)特征量)以及每個(gè)編碼單元的最佳分塊模式Y(jié),將Xi和Y輸入支持向量機(jī)學(xué)習(xí)機(jī)訓(xùn)練。然后將訓(xùn)練好的支持向量機(jī)學(xué)習(xí)機(jī)用于其他視頻序列、視頻幀的編碼與編碼單元深度預(yù)測(cè)。該方式可以按照需要進(jìn)行訓(xùn)練視頻的選擇以及訓(xùn)練更新。步驟130、在高效視頻編碼器中進(jìn)行編碼單元尺寸的選擇過(guò)程加入早期終止策略結(jié)構(gòu),其中,在每個(gè)編碼單元深度層i,首先執(zhí)行SKIP模式和MERGE模式當(dāng)前塊,提取與步驟110對(duì)應(yīng)的當(dāng)前編碼對(duì)應(yīng)的特征向量。在高效視頻編碼器HEVC視頻編碼中,每一個(gè)圖像由一些列的CTU組成,其中的編碼樹(shù)單元中獲得最終的編碼單元分割與不分割的決策不是一個(gè)單獨(dú)的二值判斷問(wèn)題,而且由多個(gè)判斷問(wèn)題組成。在高效視頻編碼器HEVC編碼中,每個(gè)64x64的編碼樹(shù)單元亮度單元將首先采用64x64的編碼單元尺寸編碼,計(jì)算率失真代價(jià);然后,將其分割為4個(gè)32x32的編碼單元尺寸,分別計(jì)算4個(gè)單元的率失真代價(jià)。在此過(guò)程中,每個(gè)32x32的編碼單元尺寸又會(huì)分割為4個(gè)16x16的尺寸編碼單元,依次遞歸,直到8x8的編碼單元單元。如圖3所示,其中Dn表示編碼當(dāng)前編碼單元并計(jì)算率失真代價(jià),n為0、1、2、3分別對(duì)應(yīng)編碼尺寸64x64至8x8尺寸,Pn(i)則為遞歸的編碼單元尺寸決策過(guò)程,i為四個(gè)子塊的索引號(hào)。最后,從小尺寸的編碼單元依次向上遞歸,與上一層的比較率失真代價(jià),代價(jià)小的定為更好的模式選擇;依次遞歸、并比較到最后,由此得到編碼樹(shù)單元的最優(yōu)編碼單元尺寸分割方式。在編碼單元尺寸選擇過(guò)程中,選擇當(dāng)前編碼單元尺寸或者更小的4個(gè)編碼單元尺寸可以定義為一個(gè)分與不分的問(wèn)題。由此,整個(gè)編碼樹(shù)單元的編碼單元尺寸決策問(wèn)題可以描述為一下3個(gè)層次的二值決策問(wèn)題。如圖4所示,64x64或4個(gè)32x32的選擇可以定義為一個(gè)分與不分的二值決策問(wèn)題,需要一個(gè)分類(lèi)器,定義為L(zhǎng)1第一層;然后,對(duì)于第二次,將有4個(gè)分與不分的問(wèn)題,由此需要4個(gè)分類(lèi)器(L2);類(lèi)似的,第三層需要16個(gè)分類(lèi)器。這些分類(lèi)器,同一層屬于同一個(gè)屬性的分類(lèi)器,可以一個(gè)分類(lèi)器多次使用或者多個(gè)相同的分類(lèi)器。由于圖3中的Pn(i)結(jié)構(gòu)是個(gè)遞歸結(jié)構(gòu),在不同層次重復(fù)出現(xiàn),由此為了方便起見(jiàn),我們采用Pn(i)結(jié)構(gòu)的優(yōu)化來(lái)描述整個(gè)編碼單元尺寸決策過(guò)程的優(yōu)化。針對(duì)圖3中的Pn(i),在高效視頻編碼器HEVC的校驗(yàn)?zāi)P?即原始的視頻編碼器)中可以描述為由一個(gè)Dn和4個(gè)Pn+1(i)組成,其流程為如圖5(a)的順序執(zhí)行結(jié)構(gòu),該結(jié)構(gòu)的優(yōu)點(diǎn)是選擇最佳模式編碼效率高,缺點(diǎn)是有大量非必要的計(jì)算,計(jì)算復(fù)雜度極高。這個(gè)過(guò)程中,由于最佳模式會(huì)選擇Dn或者4個(gè)Pn+1,是二選一的過(guò)程。由此多個(gè)預(yù)測(cè)結(jié)構(gòu),圖5(b)為其中一個(gè)早期終止方案,在做完Dn之后,采用一個(gè)預(yù)測(cè)分類(lèi)器,預(yù)測(cè)當(dāng)前最佳模式并判斷是否跳過(guò)執(zhí)行后續(xù)的Pn+1,由此 降低計(jì)算復(fù)雜度。然而該方法對(duì)所有的塊都要執(zhí)行Dn操作,對(duì)于選擇Pn+1為最佳模式顯然浪費(fèi)不必要的。由此,提出早期終止方案如圖5(c)所示,即當(dāng)執(zhí)行Dn和Pn+1前首先通過(guò)分類(lèi)器預(yù)測(cè)當(dāng)前的最佳模式,如果是Dn,則設(shè)為Y并只執(zhí)行Dn,否則設(shè)為N并執(zhí)行Pn+1。該結(jié)構(gòu)的優(yōu)點(diǎn)是只要預(yù)測(cè)準(zhǔn)確,沒(méi)有額外的計(jì)算代價(jià);缺點(diǎn)是非常依賴(lài)于分類(lèi)器的預(yù)測(cè)精度,一旦預(yù)測(cè)不夠準(zhǔn)確,將會(huì)導(dǎo)致較大的壓縮效率下降。為此,提出了如圖5(d)所示,分類(lèi)器將根據(jù)當(dāng)前視頻內(nèi)容特性做出預(yù)測(cè)A、B或C,對(duì)于A,即預(yù)測(cè)Dn為最佳模式,則只執(zhí)行Dn;對(duì)于B則預(yù)測(cè)Pn+1為最佳模式,則只執(zhí)行Pn+1;對(duì)于C則表示不確定Dn或Pn+1,則執(zhí)行Dn和4個(gè)Pn+1。該結(jié)構(gòu)非常靈活,具有多個(gè)優(yōu)勢(shì):由于可以通過(guò)分類(lèi)算法以及參數(shù)調(diào)整分類(lèi)器中的ABC三個(gè)輸出項(xiàng),由此,當(dāng)A和B為0,C為100%時(shí),該結(jié)構(gòu)可轉(zhuǎn)換為圖5(a),具有最高的壓縮效率最大復(fù)雜度。當(dāng)B為0時(shí),則該結(jié)構(gòu)變?yōu)閳D5(b);最后,當(dāng)C為0時(shí),則該結(jié)構(gòu)轉(zhuǎn)換為圖5(c)所示結(jié)構(gòu)。該結(jié)構(gòu)可以通過(guò)調(diào)整A、B、C實(shí)現(xiàn)編碼效率與計(jì)算復(fù)雜度的轉(zhuǎn)換,其編碼效率以及編碼復(fù)雜度介于結(jié)構(gòu)圖5(a)和圖5(c)之間,可按照實(shí)際應(yīng)用系統(tǒng)需求調(diào)整。步驟140、將步驟130中的特征向量輸入已學(xué)習(xí)好了的學(xué)習(xí)機(jī)模型,輸出預(yù)測(cè)值,若預(yù)測(cè)值為不分割,則執(zhí)行并測(cè)試當(dāng)前編碼單元尺寸,同時(shí)跳過(guò)分割編碼單元尺寸的測(cè)試與編碼;若預(yù)測(cè)值為分割,則跳過(guò)測(cè)試當(dāng)前編碼單元尺寸,直接執(zhí)行分割的編碼尺寸的測(cè)試與編碼;若為不確定,則測(cè)試當(dāng)前編碼單元尺寸,然后測(cè)試分割的編碼單元尺寸。步驟150、重復(fù)步驟130和步驟140直至編碼樹(shù)單元中所有的編碼單元層都編碼完成。步驟160、重復(fù)步驟130-步驟150直至所有視頻幀中編碼樹(shù)單元都編碼完成?;趯W(xué)習(xí)的高效視頻編碼方法還包括將視頻分塊模式的時(shí)間、空間的率失真代價(jià)以及編碼單元深度作為當(dāng)前編碼單元深度決策的特征量,分別記為xNB_RD(i)和xCU_depth(i);其中,率失真代價(jià)xNB_RD(i)為相鄰左邊和上邊編碼單元的率失真代價(jià)值的評(píng)價(jià)值;編碼單元深度xCU_depth(i)為相鄰編碼單元的平均深度。通過(guò)以下公式計(jì)算得到:xCU_depth(i)=1NLFT(i)+NABV(i)Σj=1NLFT(i)+NABV(i)dj;]]>其中dj是左邊和上邊編碼單元中以4×4塊為單元的深度值,NLFT(i)和NABV(i)為左邊和上邊編碼單元中4×4塊個(gè)數(shù)。所述將提取的特征向量與最佳編碼單元尺寸輸入三值輸出的學(xué)習(xí)機(jī),配置學(xué)習(xí)參數(shù)和學(xué)習(xí)模式,建立學(xué)習(xí)模型的步驟包括:將特征矢量輸入m個(gè)二值輸出的學(xué)習(xí)機(jī),學(xué)習(xí)機(jī)通過(guò)已學(xué)習(xí)的模型,輸出預(yù)測(cè)值Oi,+1或-1,其中i表示學(xué)習(xí)機(jī)的標(biāo)號(hào),為1至m。對(duì)m個(gè)輸出Oi進(jìn)行融合,得到最終輸出為QALL;OALL=1Σi=1mOi≥TAUothers-1Σi=1mOi<TB]]>其中,TA和TB為0至m的兩個(gè)閾值。學(xué)習(xí)機(jī)為支持向量機(jī),但加權(quán)參數(shù)不同。優(yōu)選的,m設(shè)為2,TA=2,TB=1?;趯W(xué)習(xí)的高效視頻編碼方法還包括將特征輸入分類(lèi)器,所述分類(lèi)器將根據(jù)當(dāng)前視頻內(nèi)容特性和已學(xué)的模型參數(shù)做出預(yù)測(cè)A(+1)、B(-1)或C(U不確定)。當(dāng)預(yù)測(cè)為A,則將直接模式Dn作為最佳模式,則只執(zhí)行Dn。當(dāng)預(yù)測(cè)為B,則將容錯(cuò)模式Pn+1作為為最佳模式,則只執(zhí)行Pn+1。當(dāng)預(yù)測(cè)為C,則表示不確定Dn或Pn+1,則執(zhí)行Dn和4個(gè)Pn+1?;趯W(xué)習(xí)的高效視頻編碼方法還包括對(duì)配置學(xué)習(xí)參數(shù)和學(xué)習(xí)模式設(shè)置最優(yōu)學(xué)習(xí)參數(shù)。對(duì)若干測(cè)試序列中的部分視頻幀,采用高效視頻編碼統(tǒng)計(jì)得到ΔTnS(i)、ΔTS(i)、ΔηS→nS(i)和ΔηnS→S(i),并擬合得到參數(shù)bi、ai、ti、Bi、Ai、ui、vi和Ti。C1(i)+k1(i)(tih1(i)λiTik1(i))TiTi-ti+k2(i)Tiln-λik2(i)Tih2(i)-ΔηT,i=0;]]>給定ΔηT,i即可采用最小二乘法得到參數(shù)λi,再將λi帶入公式xi=tiTiTi-tilntih1(i)λiTik1(i)yi=Tiln-λik2(i)Tih2(i);]]>可以計(jì)算得到xi和yi,最終根據(jù)xi=log(WA(1,i)WB(1,i)),yi=log(WA(2,i)WB(2,i));]]>得到WA(j,i)/WB(j,i)的比率,作為學(xué)習(xí)機(jī)的訓(xùn)練參數(shù),其中,ΔTnS(i)、ΔTS(i)、ΔηS→nS(i)、ΔηnS→S(i)、bi、ai、ti、Bi、Ai、ui、vi、Ti、xi和yi均為中間參數(shù)。具體的,在三值輸出的支持向量機(jī)學(xué)習(xí)機(jī)訓(xùn)練過(guò)程中,需要為兩個(gè)支持向量機(jī)學(xué)習(xí)機(jī)配置合理的參數(shù),已達(dá)到最佳的預(yù)測(cè)效果。本實(shí)施例中主要通過(guò)調(diào)節(jié)支持向量機(jī)學(xué)習(xí)機(jī)中的加權(quán)系數(shù)WA和WB,來(lái)調(diào)整訓(xùn)練過(guò)程。WA和WB分別表示樣本中正、負(fù)樣本的重要性,越大表示越容易被分為該類(lèi),錯(cuò)誤接受率將增大,錯(cuò)誤拒絕率將減少。這些錯(cuò)誤分類(lèi)或預(yù)測(cè)的結(jié)果將導(dǎo)致最終編碼的編碼效率和計(jì)算復(fù)雜度的編碼。定義ΔηS→nS(i)為采用不分割模式編碼那些選擇分割模式為最佳模式的編碼單元所引起的率失真代價(jià)的增加量,可表示為ΔηS→nS(i)=(1-JnS(i)/JBest(i))×100%,其中i為編碼單元決策層,i∈{1,2,3}、JnS(i)和JBest(i)分別表示采用不分割模式和最佳模式編碼當(dāng)前編碼單元時(shí)的率失真代價(jià)。同樣,定義ΔηnS→S(i)為采用分割模式編碼那些選擇不分割模式為最佳模式的編碼單元所引起的率失真代價(jià)的增加量,可表示為ΔηnS→S(i)=(1-JS(i)/JBest(i))×100%,其中JS(i)是采用分割模式編碼當(dāng)前編碼單元的率失真代價(jià)。由此,每一層編碼單元的決策過(guò)程中,由于誤預(yù)測(cè)導(dǎo)致的率失真代價(jià)的增加量可以表示為:ΔηRD(i)=ΔηnS→S(i)×pBA(i)+ΔηS→nS(i)×pAB(i);其中pBA(i)=NBA,1(i)/NALL(i),pAB(i)=NAB,2(i)/NALL(i)是分割(B)與不分割(A)的錯(cuò)誤預(yù)測(cè)率,NBA,1(i)和NAB,2(i)分別為一號(hào)分類(lèi)器中B誤預(yù)測(cè)為A的樣本個(gè)數(shù),2號(hào)分類(lèi)器中A誤預(yù)測(cè)為B的樣本個(gè)數(shù),NALL(i)為第i層編碼單元需要進(jìn)行預(yù)測(cè)的樣本個(gè)數(shù),其中NALL(1)即為整個(gè)圖像的編碼單元個(gè)數(shù)。定義qS,1(i)=NS,1(i)/NALL(i)為被三值輸出的分類(lèi)器預(yù)測(cè)為分割的百分比,定義 qnS,2(i)=NnS,2(i)/NALL(i)為預(yù)測(cè)為不分割的百分比,其中NS,1(i)和NnS,2(i)分別為三值輸出分類(lèi)器中分類(lèi)器1和2分別預(yù)測(cè)的分割和不分割的樣本個(gè)數(shù)。由此,通過(guò)分割與不分割優(yōu)化后的計(jì)算復(fù)雜度可以計(jì)算為ΔT(i)=ΔTS(i)×qS,1(i)+ΔTnS(i)×qnS,2(i);其中ΔTS(i)和ΔTnS(i)分別為在編碼單元深度層i中,通過(guò)分割與不分割的預(yù)測(cè)而導(dǎo)致的計(jì)算復(fù)雜度降低百分比,ΔTS(i)=1-TS(i)/TALL(i),ΔTnS(i)=1-TnS(i)/TALL(i),其中TS(i)、TnS(i)和TALL(i)分別為分割(跳過(guò)Dn操作),不分割(省略4個(gè)Pn+1操作),以及原操作(Dn和4個(gè)Pn+1都執(zhí)行)的計(jì)算復(fù)雜度。針對(duì)BQMall、FourPeople等5個(gè)不同測(cè)試序列的20幀進(jìn)行編碼和統(tǒng)計(jì),將上述參數(shù)擬合為pBA(i)=bi+aiexitipAB(i)=Bi+Aiyi;]]>其中bi、ai、ti、Bi和Ai為擬合參數(shù);qS,k(i)=ui+viexiTiqnS,k(i)=1-qS,k(i);]]>其中ui、vi和Ti為擬合參數(shù),這些擬合參數(shù)將隨著選擇的測(cè)試序列、編碼幀數(shù)等不同,而有所變化。此外,ΔTnS(i)、ΔTS(i)、ΔηS→nS(i)和ΔηnS→S(i)也可以通過(guò)對(duì)部分測(cè)試序列的編碼而統(tǒng)計(jì)得到。在本實(shí)施例中,上述擬合參數(shù)如下表:其中R2表示擬合精度,越接近于1越好。由此為了得到最優(yōu)化的性能,設(shè)立目標(biāo)函數(shù),即在率失真代價(jià)增加有限的條件下,最小化編碼器的計(jì)算復(fù)雜度1-ΔT(i),可表示為minxi,yi1-ΔT(i),s.t.Δη(i)≤ΔηT,i;]]>其中,ΔηT,i為壓縮效率降低百分比,xi和yi是第i層三值輸出分類(lèi)器的兩個(gè)模型參數(shù),表示為WA(j,i)和WB(j,i)分別表示第i層編碼單元中第j個(gè)分類(lèi)器中正、負(fù)樣本的權(quán)重值。上述問(wèn)題轉(zhuǎn)化為:{xi,yi}=argminxi,yiJ(i)J(i)=1-ΔT(i)+λi(Δη(i)-ΔηT,i);]]>對(duì)上述公式分別對(duì)xi、yi和λi求偏導(dǎo),并將其設(shè)為0,得到∂J∂xi=∂(-h1(i)exiTi+λik1exiti)∂xi=-h1(i)TiexiTi+λik1(i)tiexiti=0∂J(i)∂yi=∂(λik2(i)yi+h2(i)eyiTi)∂yi=λik2(i)+h2(i)TieyiTi=0∂J(i)∂λi=C1(i)+k1(i)exiti+k2(i)yi-ΔηT,i=0;]]>求解上述公式,可以得到:xi=tiTiTi-tilntih1(i)λiTik1(i)yi=Tiln-λik2(i)Tih2(i);]]>C1(i)+k1(i)(tih1(i)λiTik1(i))TiTi-ti+k2(i)Tiln-λik2(i)Tih2(i)-ΔηT,i=0;]]>在本實(shí)施例中,只有λi和ΔηT,i為參數(shù),其他系數(shù)均為已知的常數(shù),雖然無(wú)法顯性表示,但只要給定一個(gè)ΔηT,i就可以通過(guò)公知最小二乘法等方法得到對(duì)應(yīng)的λi,再將λi帶入公式,可以計(jì)算得到xi和yi,最終得到WA(j,i)/WB(j,i)的比率,作為支持向量機(jī)學(xué)習(xí)機(jī)的訓(xùn)練參數(shù)?;谏鲜鏊袑?shí)施例,采用高效視頻編碼器的參考軟件平臺(tái)HM12.0驗(yàn)證上述基于學(xué)習(xí)的高效視頻編碼方法。配置信息包括低延時(shí)B幀檔次,編碼序列第一幀為I幀,其余幀為P幀,編碼單元尺寸支持64×64至8×8,運(yùn)動(dòng)估計(jì)范圍為64,其他參數(shù)為默認(rèn)參數(shù)。編碼實(shí)驗(yàn)在電腦上實(shí)施。編碼驗(yàn)證實(shí)驗(yàn)分為兩部分,首先編碼5個(gè)測(cè)試序列Basketballpass(416×240),Partyscene(832×480),Johnny(1280×720),Kimono(1920×1080),Traffic(2560×1600),采用不同的用戶(hù)配置參數(shù)ΔηT,i,分別可以表示為{0.1%,0.1%,0.1%},{0.3%,0.3%,0.3%},{0.5%,0.5%,0.5%},{0.7%,0.7%,0.7%},記為Para_111,Para_333,Para_555和Para_777。此外,{0.3%,0.2%,0.1%},{0.6%,0.4%,0.2%}, {0.9%,0.6%,0.3%},記為Para_321,Para_642,Para_963,并由此得到訓(xùn)練參數(shù)WA和WB訓(xùn)練學(xué)習(xí)機(jī),然后將學(xué)習(xí)機(jī)用于編碼過(guò)程中編碼單元深度預(yù)測(cè)。如圖7所示為采用優(yōu)化后的編碼器編碼5個(gè)視頻與優(yōu)化前的編碼器編碼視頻的編碼效率和計(jì)算復(fù)雜度對(duì)比,Y軸位計(jì)算復(fù)雜度的節(jié)省度,X軸位后話后相比于優(yōu)化前的碼率的增加百分比,由圖可知,在不同配置參數(shù)ΔηT,i的調(diào)節(jié)下,平均計(jì)算復(fù)雜度可以降低42%~56%。此外,采用參數(shù)Para_642訓(xùn)練學(xué)習(xí)機(jī),并將訓(xùn)練得到的模型用于編碼中的CU深度預(yù)測(cè)優(yōu)化復(fù)雜度,本實(shí)驗(yàn)中編碼了21個(gè)序列的所有幀,同時(shí)對(duì)比了現(xiàn)有最先進(jìn)的三種編碼方法ShenEVIP、ShenTMM和XiongTMM比較,本發(fā)明相比于原高效視頻編碼器HEVC校驗(yàn)?zāi)P蛙浖脚_(tái)HM可降低計(jì)算復(fù)雜度28.82%至70.93%,平均51.45%,平均BDPSNR和BDBR分別為-0.061dB和1.98%,與原HM的壓縮效率基本一致。從壓縮效率和計(jì)算復(fù)雜度上由于目前先進(jìn)的三個(gè)方案ShenEVIP,ShenTMM和XiongTMM。如下表,為編碼效率和計(jì)算復(fù)雜度對(duì)比:在上述所有實(shí)施例中采用的由兩個(gè)支持向量學(xué)習(xí)機(jī)組成一個(gè)三值輸出的學(xué)習(xí)機(jī),其中的學(xué)習(xí)機(jī)可以替換為其他類(lèi)型的學(xué)習(xí)機(jī),如貝葉斯、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等,同時(shí)學(xué)習(xí)機(jī)的數(shù)量可以多于2個(gè)。此外三值輸出的學(xué)習(xí)機(jī)既可以由多個(gè)二值輸出學(xué)習(xí)機(jī)組成,也可以由一個(gè)多分類(lèi)學(xué)習(xí)機(jī)直接實(shí)現(xiàn)。輸入學(xué)習(xí)機(jī)的特征向量包括,但不局限于上述實(shí)施例中提到的四類(lèi),還可包括圖像紋理邊緣、亮度等等;同時(shí),本發(fā)明中的特征量可以具有多種表現(xiàn)形式,如當(dāng)前編碼單元塊的特征、運(yùn)動(dòng)信息計(jì)算為xMV_Meg(i)=|MVx|+|MVy|、上下文信息、量化參數(shù)等以及最佳編碼單元尺寸等,實(shí)際可以采用其他的表現(xiàn)形式來(lái)替換?;趯W(xué)習(xí)的分類(lèi)方法用于編碼單元深度的決策,以降低編碼中的模式選擇復(fù)雜度。實(shí)際視頻編碼過(guò)程中具有多種類(lèi)似于編碼的那樣尺寸/深度選擇的“多選一”的過(guò)程,除編碼單元深度決策外,還有預(yù)測(cè)單元模式選擇預(yù)測(cè)單元,變換單元模式選擇變換單元,多參考幀選擇,運(yùn)動(dòng)估計(jì)等過(guò)程,均可采用上述實(shí)施例中基于學(xué)習(xí)的分類(lèi)方法,解決相關(guān)“多選一”的問(wèn)題。上述基于學(xué)習(xí)的高效視頻編碼方法通過(guò)設(shè)定不同的分類(lèi)精度的分類(lèi)器,并建立早期終止策略結(jié)構(gòu)。該早期終止策略結(jié)構(gòu)可以通過(guò)調(diào)整輸出的比例轉(zhuǎn)換變?yōu)閭鹘y(tǒng)若干種經(jīng)典的決策結(jié)構(gòu)。因此,可以根據(jù)實(shí)際需求和分類(lèi)器的特性進(jìn)行切換。針對(duì)提取的特征向量預(yù)先學(xué)習(xí)好的學(xué)習(xí)機(jī)模型能夠?qū)?yīng)輸出預(yù)測(cè)值,根據(jù)預(yù)測(cè)值選擇不同的編碼模式。即能夠根據(jù)高效視頻編碼中的率失真代價(jià)以及計(jì)算復(fù)雜度對(duì)應(yīng)輸出最優(yōu)的編碼過(guò)程,從而提高分類(lèi)器的學(xué)習(xí)和分類(lèi)性能,進(jìn)而提高視頻編碼的編碼效率。以上所述實(shí)施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡(jiǎn)潔,未對(duì)上述實(shí)施例中的各個(gè)技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說(shuō)明書(shū)記載的范圍。以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)發(fā)明專(zhuān)利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專(zhuān)利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。當(dāng)前第1頁(yè)1 2 3