1.一種基于人臉顯著性的圖像壓縮方法,包括以下幾個步驟:
步驟一、建立數(shù)據(jù)庫,具體步驟如下:
步驟101、通過眼球追蹤實驗,記錄觀測者在自由觀看模式下對人臉圖片的關(guān)注點,建立對人臉圖像的視覺關(guān)注點分布的數(shù)據(jù)庫;
步驟102、通過分析在人臉以及臉部特征的視覺關(guān)注度,建立關(guān)注度與人臉、臉部特征之間的關(guān)系;
步驟二、建立并訓(xùn)練顯著度檢測模型,具體步驟如下:
步驟201、對人臉區(qū)域關(guān)注點進(jìn)行預(yù)處理;
步驟202、用預(yù)處理后的關(guān)注點數(shù)據(jù),基于訓(xùn)練圖片,訓(xùn)練并學(xué)習(xí)混合高斯模型;
步驟203、利用得到的混合高斯模型,基于測試圖片,分別預(yù)測圖像的各個特征通道的顯著性;
步驟204、得到五個通道不同的顯著性圖譜后,通過學(xué)習(xí)關(guān)注點數(shù)據(jù),得到每個通道的顯著性的最佳權(quán)重ωC,ωI,ωO,ωF,ωG;
步驟205、利用步驟202至步驟204得到的每個通道的顯著性圖譜以及關(guān)于最佳權(quán)重系數(shù)的函數(shù),計算得到最終的顯著性圖譜;
步驟三、進(jìn)行圖像壓縮;
在編碼之前,采用步驟一、步驟二對輸入圖像進(jìn)行預(yù)處理,得到輸入圖像的顯著性圖譜,然后輸入圖像通過低通濾波器,低通濾波器的截止頻率通過顯著性圖譜決定,低通濾波器為:
其中,(i,j)為輸入圖片進(jìn)行離散余弦變換后對應(yīng)的坐標(biāo),Tn是設(shè)置的截止頻率,dn是該坐標(biāo)原來的頻率;
輸入圖片分割成8×8像素的相互不重合的塊,即每個小圖塊的預(yù)處理表示為:
最后將低通濾波器處理后的圖片,經(jīng)過國際圖像壓縮標(biāo)準(zhǔn)編碼,進(jìn)行JPEG壓縮。
2.根據(jù)權(quán)利要求1所述的一種基于人臉顯著性的圖像壓縮方法,所述的步驟二中201具體包括以下步驟:
步驟(1)、建立固定坐標(biāo)系,通過坐標(biāo)變換,對每張圖像中的關(guān)注點進(jìn)行校正;
設(shè)右臉的第一個特征點為坐標(biāo)原點,將每個關(guān)注點的(x,y),按式(1)進(jìn)行坐標(biāo)變換,實現(xiàn)對關(guān)注點的校正;
其中:(x,y)是關(guān)注點的坐標(biāo),(x*,y*)是校正后的坐標(biāo);
步驟(2)、利用式(2),對關(guān)注點進(jìn)行歸一化處理;
其中:l為兩點之間的歐式距離,即兩點之間的橫向距離,(x′,y′)是歸一化處理后的坐標(biāo)。
3.根據(jù)權(quán)利要求1所述的一種基于人臉顯著性的圖像壓縮方法,所述的步驟二中202具體包括以下步驟:
步驟(1)、建立GMM模型;
假設(shè)經(jīng)過校正和歸一化的關(guān)注點的坐標(biāo)為x=(x′,y′),建立GMM模型:
其中:πk,μk,∑k分別為第k個高斯分量的混合比例、均值以及方差,K為混合高斯模型中分量的個數(shù);
步驟(2)、通過最大期望算法,學(xué)習(xí)得到臉部特征通道關(guān)注點與人臉通道的混合高斯模型分布;
設(shè)k=4,4個GMM分量分別對應(yīng)左眼、右眼、鼻子、嘴巴四個臉部特征,假設(shè)均值為臉部特征的中心點,經(jīng)過學(xué)習(xí)得到的各項參數(shù)數(shù)值,如下表1所示;
表1 GMM各項參數(shù)數(shù)值,其中K的不同取值對應(yīng)不同的五官區(qū)域
4.根據(jù)權(quán)利要求1所述的一種基于人臉顯著性的圖像壓縮方法,所述的步驟二中的203具體包括:
步驟(1)、通過混合高斯模型,利用訓(xùn)練圖片學(xué)習(xí)高斯分布的參數(shù),得到兩個top-down顯著圖,人臉和臉部特征;其中,通過步驟202,得到測試圖像的人臉及臉部特征兩個通道的顯著性圖譜,記做
步驟(2)、通過Itti的模型,得到顏色、對比度、方向三個bottom-up的顯著性圖譜;
利用Itts的模型,構(gòu)造顏色(C),對比度(I),方向性(O)三個顯著性圖譜,分別記為同時構(gòu)造最終顯著性圖譜的模型:
5.根據(jù)權(quán)利要求1所述的一種基于人臉顯著性的圖像壓縮方法,所述的步驟二中204具體包括以下步驟:
步驟(1)、通過求解方程(6)學(xué)習(xí)得到每個通道的權(quán)重系數(shù):
其中,V為矩陣,矩陣的列是通道的顯著圖,w=(ωc,ωI,ωO,ωF,ωG),mh為向量化的每幅圖像的關(guān)注點圖,使用凸線性回歸求解方程,得到每張圖片的最佳權(quán)重;
步驟(2)得到每個通道最佳權(quán)重ωC,ωI,ωO,ωF,ωG后,采用高階多項式擬合方法建立人臉尺寸大小和最佳權(quán)重系數(shù)的函數(shù)關(guān)系;
采用多項式擬合得到ωF,ωG與人臉大小的關(guān)系:
其中:s為人臉大小尺度,即人臉區(qū)域像素占圖片總像素的比例,為擬合ωF,ωG的多項式的系數(shù);
采用4次多項式進(jìn)行擬合,多項式系數(shù)如下表2所示
表2多項式系數(shù)a,b數(shù)值
在得到ωF,ωG之后,將權(quán)重ωC,ωI,ωO在所有圖像中做平均,得到它們之間的比例關(guān)系ωC∶ωI∶ωO=8∶3∶30,再由||ω||I=1,求解得到ωC,ωI,ωO。