專利名稱::一種基于隱寫測評的隱寫分析方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種隱寫分析(Steganalysis)方法,具體涉及一種基于隱寫測評的隱寫分析方法,該方法屬于信息安全
技術(shù)領(lǐng)域:
中的信息隱藏子領(lǐng)域。
背景技術(shù):
:隨著計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字內(nèi)容的使用越來越普遍,以數(shù)字內(nèi)容為載體的現(xiàn)代隱寫技術(shù)獲得了越來越廣泛的關(guān)注。隱寫能夠在不影響載體數(shù)據(jù)感知內(nèi)容和質(zhì)量的前提下在其中嵌入機密信息,通過隱蔽保密通信或者保密存儲的存在性事實,提高了機密數(shù)據(jù)傳輸或者存儲的安全。據(jù)報道,隱寫已經(jīng)被不法分子和惡意代碼所利用。與隱寫相對應(yīng),隱寫分析則是用于分析判斷數(shù)據(jù)中是否含有隱蔽信息的技術(shù)。由于數(shù)字多媒體的數(shù)據(jù)冗余較大,現(xiàn)代隱寫的重要特征是,載體數(shù)據(jù)多為多媒體數(shù)據(jù);一般稱隱寫前的媒體為原文,隱寫后的媒體為隱文。雖然隱寫嵌入過程對載體數(shù)據(jù)的感知內(nèi)容和質(zhì)量的影響很難被人眼所識別,但其對載體數(shù)據(jù)的改變一般能夠被某些統(tǒng)計特征的變化反應(yīng)出來。隱寫分析技術(shù)利用這些對隱寫嵌入過程比較敏感的統(tǒng)計特征對媒體數(shù)據(jù)進行分析,從而識別隱蔽信息的存在?,F(xiàn)代隱寫分析技術(shù)的基本手段是構(gòu)造一個二類分類器,通過預(yù)先生成或者得到的包含原文/隱文樣本的訓(xùn)練集進行訓(xùn)練,從而能夠?qū)ΜF(xiàn)實中待測的媒體進行隱寫存在性分類判決。具體步驟一般是,首先選取載體數(shù)據(jù)的一組統(tǒng)計特征作為隱寫分析特征;隨后分別從訓(xùn)練集的原文集和隱文集中提取相應(yīng)的特征,并輸入分類器進行訓(xùn)練,得到實際中可用的隱寫分析分類器;在實際應(yīng)用中,隱寫分析方法從可疑媒體中提取以上隱寫分析特征輸入分類器,后者即可判斷該樣本中是否含有隱蔽信息。其中,隱寫分析特征的選擇是決定隱寫分析方法效果的關(guān)鍵因素。由于隱寫的嵌入過程會改變載體數(shù)據(jù)的概率分布,選擇對分布變化敏感的統(tǒng)計量作為隱寫分析特征能夠有效檢測出隱蔽信息的存在(參考文獻N.ProvosandP.Honeyman.Hideandseekanintroductiontosteganography.IEEETransactionsonSecurity&Privacy,Vol.I(3):32-44,2003.;J.J.Harmsenandff.A.Pearlman.Steganalysisofadditivenoisemodelableinformationhiding.InProc.ElectronicImaging,SecurityandWatermarkingofMultimediaContentsV,SPIE,Vol.5020:131-142,2003.;T.Pevny,P.Bas,andJ.Fridrich.Steganalysisbysubtractivepixeladjacencymatrix.IEEETransactionsonInformationForensicsandSecurity,Vol.5(2):215-224,2010.;G.GulandF.Kurugollu.Anewmethodologyinsteganalysisbreakinghighlyundetectablesteganography(HUGO).InProc.InformationHiding,13thInternationalworkshop,LectureNotesinComputerScience,vol.6958:71-84,2011.;J.Fridrich,J.V.Kodovsky,HolubandM.Goljan.Steganalysisofcontent-adaptivesteganographyinspatialdomain.InProc.InformationHiding,13thInternationalworkshop,LectureNotesinComputerScience,vol.6958:102-117,2011.)。由于隱寫技術(shù)的不斷發(fā)展提高,隱寫引起的特征擾動越來越不明顯。隱寫分析的研究者一般需要對隱寫算法進行深入的人工分析和實驗,才可能得到較為有效的隱寫特征并實現(xiàn)相應(yīng)的隱寫分析方法(參考文獻Y.Miche,B.Roue,A.LendasseandB.Bas.Afeatureselectionmethodologyforsteganalysis.InProc.InternationalWorkshoponMultimediaContentRepresentation,ClassificationandSecurity,LectureNotesinComputerScience,vol.4105:49-56,2006.;M.Kharrazi,Η.T.Senear,andN.Memon.Improvingsteganalysisbyfusiontechniques-Acasestudywithimagesteganography.TransactionsonDataHidingandMultimediaSecurityI,LectureNotesinComputerScience,vol.4300(2006)123-137,2006.;G.GulandF.Kurugollu.Anewmethodologyinsteganalysisbreakinghighlyundetectablesteganography(HUGO).InProc.InformationHiding,13thInternationalworkshop,LectureNotesinComputerScience,vol.6958:71-84,2011.;J.Fridrich,J.Kodovsky,V.HolubandM.Goljan.Steganalysisofcontent-adaptivesteganographyinspatialdomain.InProc.InformationHiding,13thInternationalworkshop,LectureNotesinComputerScience,vol.6958:102-117,2011.)。當(dāng)前,這種傳統(tǒng)隱寫分析研制方法沒有較一致的研發(fā)流程,在算法分析、隱寫分析設(shè)計和實現(xiàn)方面需要較長的時間,因此,如何針對新出現(xiàn)的隱寫,以較為確定性的方法,及時、高效、自動化地得到相應(yīng)的隱寫分析方法,是隱寫分析研發(fā)領(lǐng)域一個需要解決的問題。經(jīng)過專利查詢,在本發(fā)明領(lǐng)域內(nèi)已有的相關(guān)專利申請情況如下(I)專利申請?zhí)枮?00710067781.6的中國專利“隱寫分析系統(tǒng)中基于主元特征的隱寫分析算法”公開了一種隱寫分析系統(tǒng)中基于主元特征的隱寫分析算法。該專利方法將微分運算引入圖像隱寫分析,計算信道內(nèi)相鄰像素之間以及信道之間像素亮度的共生矩陣,并將共生矩陣的應(yīng)用擴展到高階微分和梯度,以描述信道內(nèi)數(shù)據(jù)與空間位置相關(guān)的特性;計算這些統(tǒng)計量微分特征函數(shù)的一階和二階統(tǒng)計矩,從一幅圖像得到136維特征并使用主元分析法降為18維,最后采用支持向量機為分類方法構(gòu)造隱寫分析算法。該專利方法僅僅描述了一種具體的隱寫分析方法,并未考慮給出一個較普遍適用的隱寫分析設(shè)計方法,也沒有考慮采用計算機輔助設(shè)計的形式提高隱寫分析方法的設(shè)計和實現(xiàn)效率,因此,該專利申請與本專利申請的基本目的、思路與具體實現(xiàn)方式明顯不同。(2)專利申請?zhí)枮?00610018494.I的中國專利“基于三層架構(gòu)的智能圖像隱寫分析系統(tǒng)”公開了一種基于三層架構(gòu)的智能圖像隱寫分析系統(tǒng)。該專利的方法采用三層架構(gòu),針對隱寫算法所屬類型構(gòu)建專門的隱寫分析系統(tǒng),利用專家系統(tǒng)將現(xiàn)有的專用隱寫分析方法建成模型庫和規(guī)則庫,并通過人機交互不斷更新隱寫分析規(guī)則庫,并采用主元素特征提取與樣本圖像庫分類訓(xùn)練相結(jié)合,提高計算效率和準確性。該專利方法主要給出了一種更好使用已有隱寫分析方法的框架,并未涉及各類特征的評價、優(yōu)選以及設(shè)計新的隱寫分析方法;而本專利主要給出一種新隱寫分析方法的設(shè)計與實現(xiàn)方法,該專利申請與本專利申請的基本目的、思路與具體實現(xiàn)方式明顯不同。
發(fā)明內(nèi)容針對現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明的目的是提供一種基于隱寫測評的隱寫分析方法,通過計算機輔助設(shè)計提高隱寫分析的設(shè)計和實現(xiàn)效率。本發(fā)明給出的基本方法流程是1)廣泛地選取統(tǒng)計特征組成一組基準特征集,將它作為考察隱寫對載體影響的觀察對象;2)針對一個或者一類隱寫算法,通過評估基準特征集中特征在隱寫前后的變化(即進行隱寫安全性的測評),將那些變化程度大的特征作為相應(yīng)的隱寫分析特征,通過主成分分析(PrincipalComponentAnalysis,PCA)方法去除冗余信息,將最后得到的特征作為隱寫分類器的分類特征,在經(jīng)過分類器訓(xùn)練后,自動形成新的隱寫分析方法;3)由于以上過程的執(zhí)行在一定的配置下是確定性的,因此可以將以上過程作為計算機程序自動執(zhí)行,結(jié)合所需的人機交互,形成隱寫分析的計算機輔助設(shè)計手段,提高隱寫分析設(shè)計和實現(xiàn)的效率。為了更好地支撐以上方法的實現(xiàn),更好地選擇隱寫分析特征,在具體技術(shù)環(huán)節(jié)上,本發(fā)明還提出了一種最大平均偏差隱寫測評指標(該指標反映整個特征向量的變化)與互信息指標(該指標反映單個特征的變化)的綜合方法,得到的綜合指標能夠同時反映單個獨立特征在隱寫后的變化以及其作為高維特征向量中一個維度上的特征的變化情況,有利于對隱寫分析特征進行較為全面的評價。本發(fā)明方法基于互信息和最大平均偏差指標的隱寫測評結(jié)果,根據(jù)對隱寫算法的安全測評結(jié)果,評估測評中所用各種統(tǒng)計特征作為隱寫分析特征的有效性,據(jù)此選擇有效的隱寫分析特征,通過特征融合后,最終將得到的特征向量作為分類器的分類特征,自動或者以人機交互式的方法形成新的隱寫分析方法投入系統(tǒng)使用。本發(fā)明所采用的技術(shù)方案總體包括如下步驟(所有方法都可由計算機程序按照用戶的配置和操作指令完成),該方案針對一個或者一類隱寫算法,給出一個新的隱寫分析方法(I)確定基準特征集。選擇當(dāng)前已經(jīng)發(fā)現(xiàn)的主要隱寫特征以及可能作為隱寫分析特征的統(tǒng)計特征,將它們組成基準特征集;基準特征集一旦確定,并不需要每次執(zhí)行本步驟。(2)制備原文和隱文樣本組。基于一組原文{XJ,采用待分析的隱寫算法生成相應(yīng)的一組隱文{YJ。(3)確定考察的特征向量。用戶根據(jù)經(jīng)驗和需求在基準特征集中選取部分特征作為考察特征;計算原文和隱文樣本集合中每個樣本的考察特征向量,計算原文樣本集合{XJ中每個樣本的考察特征向量,得到原文特征向量集合IxJ,計算隱文樣本集合{YJ中每個樣本的考察特征向量,得到隱文特征向量集合{yj。用戶可根據(jù)需求不斷返回此步驟調(diào)整考察特征的范圍。(4)基于考察的特征向量進行隱寫安全測評并估計所考察特征作為隱寫特征的有效性。通過計算Xi和Ji之間在所選指標量的平均偏差(具體指標見后)衡量特征的有效性,偏差越大,說明隱寫算法對特征量的擾動越大,不夠安全,反之則安全,因此,以上過程構(gòu)成一種隱寫的安全測評方法,偏差指標量可以反映隱寫的隱蔽程度;從另一個角度看,Xi和yi之間的平均偏差越大,說明被考察特征作為隱寫分析特征更加有效,Xij和之間的平均偏差越大(其中,和yu分別表示Xi和Ji向量的第j維),說明被考察特征的第j維分量作為隱寫分析特征的一個維度分量更加有效。本發(fā)明使用最大平均偏差考察Xi和Ii之間的總體差異,使用單維互信息量考察每個特征維度&和之間的平均偏差,并綜合這兩種評價指標計算出能夠反映每個特征維度作為隱寫分析特征有效性的最終指標值;此過程可以回到以上步驟(3)通過改變考察特征的范圍重新計算,已獲得更準確的指標值結(jié)果;最后,依據(jù)用戶指定的策略(按所需維度數(shù)量選擇或按指標值閾值選擇)選取若干個分量作為有效的隱寫分析特征分量,將這些分量在基準特征集中的序號記錄備用。(5)特征去冗余。按照步驟⑷記錄的序號分別從{Xi}和{yj中的每個特征向量中抽取相應(yīng)的特征維度組成初步的新特征向量集合IV^}和{<J,然后使用主成分分析方法分別對集合IV^和{<J進行主成分分解,選取前k個主成分(k的取值由用戶指定)作為去除冗余之后的最終特征向量集合Ix"^和{7"J,即最終確定的新隱寫分析特征向量。有關(guān)主成分分解的詳細操作方法參見后面的“具體實施方式”部分。(6)隱寫分析分類器自動生成和訓(xùn)練配置。通過支持向量機(SupportVectorMachine,SVM)分類器對步驟(5)獲得的原文、隱文樣本集的最終特征向量集合|x"J和{y"J進行訓(xùn)練,生成新的隱寫分析分類器。其中,SVM分類器的參數(shù)配置可通過交叉驗證過程確定,遍歷所有的可選參數(shù)組合,選擇其中多次交叉驗證的平均分類正確率最高的一組作為最佳參數(shù)配置。交叉驗證的具體方法是,將原文、隱文樣本集的最終特征向量集合合并在一起,按一定比例隨機劃分為模擬訓(xùn)練集和模擬測試集,使用SVM分類器進行訓(xùn)練和分類判決,記錄下模擬測試集的分類正確率作為一次交叉驗證的結(jié)果;重復(fù)多次交叉驗證并計算平均正確率即可作為挑選SVM分類器最佳參數(shù)配置的依據(jù)。至此,隱寫分析所需的隱寫分析特征向量、相應(yīng)配置下的分類器均已獲得,針對前述待分析隱寫的隱寫分析方法已經(jīng)得到實現(xiàn),可以投入系統(tǒng)運行。本發(fā)明對相關(guān)
技術(shù)領(lǐng)域:
的效果包括(I)提高了隱寫分析設(shè)計的效率。通過隱寫測評結(jié)果協(xié)助用戶合理地選擇有效性較強的隱寫分析特征,通過PCA去除冗余的特征維度以確定最終的隱寫分析特征,并自動搜索分類器的最佳參數(shù)配置,提高了隱寫分析設(shè)計的效率。(2)提高了隱寫分析實現(xiàn)的效率。以上隱寫分析特征向量選擇、特征降維、分類器配置參數(shù)搜索等過程均是確定性的,能夠用計算機軟件自動執(zhí)行(部分環(huán)節(jié)亦可人工參與),自動或者半自動地生成新的隱寫分析軟件,提高了隱寫分析實現(xiàn)的效率。圖I是本發(fā)明方法的總流程圖;圖2是本發(fā)明的隱寫測評方法流程圖;圖3是本發(fā)明的特征選擇及融合方法流程圖。具體實施例方式本發(fā)明提出基于隱寫測評的隱寫分析計算機輔助設(shè)計方法,其主要過程框架包括基準特征計算、特征分布估計、特征分布偏差指標計算(即隱寫測評)、特征有效性評估、分類器的自動配置等,其中,采用的特征分布偏差指標包括互信息、最大平均偏差以及它們的綜合。通過本發(fā)明,隱寫分析者可以針對新出現(xiàn)或者關(guān)注的隱寫(即待分析隱寫),從基準特征集中優(yōu)選出部分特征組合成新的隱寫分析特征向量,并搜索分類器相應(yīng)的最佳配置參數(shù)組合,最后生成新的隱寫分析方法。下面結(jié)合附圖和實施示例,對本發(fā)明的技術(shù)方案做進一步描述。圖I描述了本發(fā)明的整體流程。首先,由用戶從基準特征集中挑選若干種特征作為考察特征,從已制備的原文、隱文樣本中分別提取考察特征向量集合,以備后續(xù)的基準測試和輔助設(shè)計使用。其次,計算單維互信息量和最大平均偏差這兩種特征分布偏差指標,并綜合其指標值獲得最終的特征有效性評估結(jié)果(該結(jié)果同時可作為隱寫測評結(jié)果輸出)。再次,根據(jù)特征有效性評估結(jié)果,以人機交互或計算機自動執(zhí)行的方式挑選若干特征維度分量,并使用PCA方法進一步去除冗余,獲得新的隱寫分析特征(以上幾個步驟可以迭代執(zhí)行,逐步擴大被考察特征的范圍)。最后,通過交叉驗證的方法搜索隱寫分析分類器的最佳參數(shù)配置,通過使用以上新的分類特征以及更新配置參數(shù),自動形成新的隱寫分析方法和軟件。以下描述上述步驟采用的技術(shù)手段。I.特征計算步驟制備原文集合,利用待分析的隱寫算法生成隱文樣本集合;由用戶從基準特征集中挑選若干種作為考察特征,從已制備的原文、隱文樣本集合中分別計算特征向量集合保存?zhèn)溆谩S脩艨筛鶕?jù)樣本集包含的文件格式、對待分析隱寫算法的先驗知識等因素調(diào)節(jié)考察特征的范圍反復(fù)執(zhí)行特征有效性評估過程,以獲得最佳評估效果。2.特征有效性評估根據(jù)前一步驟獲得的特征向量集合,計算特征分布偏差指標,并綜合各項指標值獲得最終的特征有效性評估結(jié)果。特征分布偏差指標的具體計算方法如圖2所示。其中,單維互信息量和最大平均偏差的計算分別采取不同的流程。單維互信息量的計算基于對考察特征分量(單維特征)概率密度函數(shù)的估計,它能反映兩個單維特征之間的統(tǒng)計偏差,具體計算步驟是(I)將考察特征向量劃分為若干單一維度的特征分量。(2)使用直方圖估計的方法依次估算原文、隱文特征特征向量集合IxJ和{yj的每個特征分量的概率密度函數(shù)P(A)、P(B)及聯(lián)合概率密度函數(shù)P(AB)。具體方法是,分別統(tǒng)計IxJ和{yj的分布直方圖,并計算直方圖中各個區(qū)間的樣本出現(xiàn)頻率作為概率密度函數(shù)P(A)和P(B)的估計值;統(tǒng)計IxJ和{yj的二維聯(lián)合分布直方圖,并計算直方圖中各個二維區(qū)間的樣本出現(xiàn)頻率作為聯(lián)合概率密度函數(shù)P(AB)的估計值。計算P(A)的公式為、niP(A)=—,aGCs,s.丨]nh其中,A表示隨機變量(在本發(fā)明中即指原文集的一個特征分量),a表示隨機變量的一個觀測樣本(即該單維特征在原文集的某個具體樣本上的取值),I為特征值a落在直方圖第j個區(qū)間里的樣本個數(shù),η為總的樣本個數(shù),Sj和&為第j個區(qū)間的兩個端點,h為每個區(qū)間的寬度,即=計算P(B)的公式為P(B)=」·.,be(s丨,S1,]nh其中,B表示隨機變量(在本發(fā)明中即指隱文集的一個特征分量),b表示隨機變量的一個觀測樣本(即該單維特征在原文集的某個具體樣本上的取值),I為特征值b落在直方圖第j個區(qū)間里的樣本個數(shù),η為總的樣本個數(shù),Sj和&為第j個區(qū)間的兩個端點,h為每個區(qū)間的寬度,即h=Spv115計算P(AB)的方法與上述過程類似,公式為nkP(AB)=^-ae(sisi+1],be(skSi]nH其中ηΛ為落在二維直方圖第j行第k列的區(qū)間里的樣本個數(shù),H為區(qū)間面積,即H=(Sjtl-Sj)X(sk+1-sk)。(3)使用估計獲得的概率密度函數(shù)計算每個特征分量的單維互信息量,計算公式為_P(AR)Mi=VaTrP(AB)log~~。1bP(a)P(B)最大平均偏差的計算基于對原文與隱又考察特征(多維特征)在某個函數(shù)空間Γ上最大差異的評估,它能反映兩組多維特征之間的統(tǒng)計偏差。將特征向量集合作為函數(shù)輸入,分別計算函數(shù)空間Γ中各個函數(shù)輸出在原文和隱文樣本集上的平均值,并以其中的最大者(即最大平均偏差)衡量原文和隱文特征的分布差異。上述過程可表示為如下公式■//)[「,Xp,r,J=SupI-^Xfix,)-士X)!=\L);-IJ其中Xd=(X1,…,xD}和Yd=Iy1,…,yD}分別表示在原文和隱文集上計算得到的兩個多維特征向量集合,Xi是原文集中第i個樣本計算出的考察特征向量,Ii是隱文集中第i個樣本計算出的考察特征向量。函數(shù)空間Γ的選擇是影響最大平均偏差指標評估效果的重要因素。Γ需要涵蓋足夠豐富的函數(shù)類型以全面衡量原文和隱文特征的分布差異,并盡可能減少函數(shù)數(shù)量以降低計算復(fù)雜度。使用對稱非負核函數(shù)生成再生核希爾伯特空間(RKHS,ReproducingKernelHilbertSpaces)是構(gòu)造Γ的一種典型方法,即/(·)=々(9,·),ν和<其中R表示與考察特征維度數(shù)量相同的全體實數(shù)向量空間,Θ為空間上的任意實數(shù)向量。在確定核函數(shù)的具體形式之后,選擇一組Θ即可生成包含相應(yīng)函數(shù)的函數(shù)空間Γ以用于計算最大平均偏差值。一般認為,使用高斯核函數(shù)能獲得最佳的評估效果,即k(x,y)=exp(-y\\x-_y||^)χ>0本發(fā)明綜合上述兩種分別針對單維和多維特征的特征偏差指標,構(gòu)造出一種衡量隱寫分析特征每個單一維度(即特征分量)對待測隱寫有效性的評價指標。用{MIJ,i=I,2,…N表示按上述步驟計算得出的單維特征互信息量,MMD表示某個包含該維度的特征向量的最大平均偏差值,則最終的特征分量有效性評價指標可表示為Wi=F(MIi,MMD)它可衡量該特征分量作為隱寫分析特征向量中的一維特征的有效性,它的值越大說明越有效。在上式中,特征評價函數(shù)F(·)的具體形式可以通過回歸分析獲得??晒┻x擇的回歸分析模型包括二元線性回歸模型、二元多項式回歸模型等,并可以使用自變量對數(shù)代換法提高回歸分析的效果。一個這樣獲得的計算公式是Wi=I.403+0.07571og(MIi)+0.089041og(MMD)+0.0078921og(MIi)log(MMD)3.特征優(yōu)選和去除冗余根據(jù)特征有效性評估結(jié)果,以人機交互或計算機自動執(zhí)行的方式挑選若干特征維度,并使用PCA方法進一步去除冗余,獲得新的隱寫分析特征,它的維度有所降低,有利于提高后繼處理的計算效率。具體流程如圖3所示,其具體步驟為(I)根據(jù)特征分量有效性評價指標值對特征維度(特征向量中的單維特征,即特征分量)進行降序排序。(2)按一定的策略進行特征選擇。如果使用“按所需維度數(shù)量選擇”的策略,則記錄和保留特征分量有效性評價指標值較大的前若干個維度的序號,其具體數(shù)量由隱寫分析者決定;如果使用“按指標值閾值選擇”的策略,則記錄并保留指標值高于某閾值的全部維度序號,該閾值由隱寫分析者決定。(3)按保留的維度特征組合成新的隱寫分析特征向量,并使用PCA方法進一步去除冗余,獲得最終的隱寫分析特征向量。PCA方法的作用是抽取特征向量的主要成分,降低特征向量的維數(shù)以有利于提高后繼計算的效率,具體計算步驟為首先,將隱寫分析特征(即所述新特征向量)排列為mXm維的矩陣X,X的每行表示一個特征向量樣本,每列表示隱寫分析特征的一個維度;其次,計算nXn維的矩陣R=XtX,并對矩陣R進行特征分解,即C1RC=Λ,其中C為nXn維的正交矩陣,A為nXn維的對角陣;再次,計算mXn維的矩陣Y=XCt;最后,選取矩陣Y的前k列(即前k個主成分,I^k^η)作為去除冗余之后的最終特征向量,即最終確定的新隱寫分析特征向量。4.搜索隱寫分析分類器的最佳參數(shù)配置通過交叉驗證的方法搜索隱寫分析分類器的最佳參數(shù)配置,形成新的隱寫分析方法。交叉驗證過程的具體方法是,對原文集合與隱文集合分別計算上述新隱寫分析特征的值,得到兩個特征向量集合,將這些隱寫分析特征向量按一定比例隨機劃分為訓(xùn)練集和測試集,通過SVM分類器進行訓(xùn)練和分類判決。重復(fù)若干次這樣的隨機劃分和訓(xùn)練分類操作作為一次交叉驗證,并計算相應(yīng)的平均分類正確率,以此為準則在可選參數(shù)配置的范圍內(nèi)搜索正確率最高的參數(shù)組合,作為最終生成的隱寫分析分類器的參數(shù)配置。至此,隱寫分析所需的隱寫分析特征向量、相應(yīng)配置下的分類器均已獲得,所設(shè)計的新隱寫分析方法可以得到自動實現(xiàn)并投入系統(tǒng)運行。權(quán)利要求1.一種基于隱寫測評的隱寫分析方法,其步驟為1)建立一包含若干隱寫特征的基準特征集;2)采用待分析的隱寫算法對一組原文{XJ進行隱寫,生成相應(yīng)的一組隱文{YJ;3)在所述基準特征集中選取部分特征作為考察特征,計算原文和隱文集合中每個樣本的考察特征向量,分別得到原文集合和隱文集合的特征向量集合IxJ和{yj;4)根據(jù)特征向量集合IxJ和{yj對考察特征向量進行隱寫安全測評并估計所考察特征向量每一分量作為隱寫特征的有效性;5)重復(fù)步驟3)、4)若干次,得到一組特征向量分量有效性評估結(jié)果;6)從所述有效性評估結(jié)果中選取若干個分量構(gòu)建一新特征向量,然后對其進行去冗余處理,得到該待分析的隱寫算法的特征向量對該待分析隱寫算法進行隱寫分析,檢測其中是否含有隱蔽信息。2.如權(quán)利要求I所述的方法,其特征在于所述估計所考察特征作為隱寫特征的有效性的方法為根據(jù)特征向量Xi和Ji之間的最大平均偏差MMD,以及每個特征維度和yu之間的平均偏差MIi,確定能夠反映每個特征維度作為隱寫分析特征有效性的最終指標值;Xij表示特征向量Xi的第j維,Yij表示特征向量Ji的第j維。3.如權(quán)利要求2所述的方法,其特征在于通過公式Wi=F(MIi,MMD)確定能夠反映每個特征維度作為隱寫分析特征有效性的最終指標值;F(·)為通過回歸分析獲得的特征評價函數(shù)。4.如權(quán)利要求3所述的方法,其特征在于通過公式5.如權(quán)利要求4所述的方法,其特征在于使用對稱非負核函數(shù)生成再生核希爾伯特空間方法構(gòu)造所述函數(shù)空間Γ。6.如權(quán)利要求3所述的方法,其特征在于所述平均偏差MIi為Xij和yij之間的單維互信息量;獲取所述平均偏差MIi的方法為1)將考察特征劃分為若干單一維度的特征;2)使用直方圖估計的方法依次估算所述特征向量集合IxJ和{yj中每個單一維度特征的概率密度函數(shù)P(A)、P(B)及聯(lián)合概率密度函數(shù)P(AB);A,B分別表示特征向量\和5^中的一個單維特征;3)根據(jù)概率密度函數(shù)P(A)、P(B)及聯(lián)合概率密度函數(shù)P(AB)計算每個特征維度的單維互信息量MIit57.如權(quán)利要求6所述的方法,其特征在于根據(jù)公式8.如權(quán)利要求I或2或3所述的方法,其特征在于所述步驟6)的具體實現(xiàn)方法為61)對所述有效性評估結(jié)果中的特征分量進行降序排列;62)記錄和保留特征分量有效性評價指標值較大的前若干個分量的序號,或者記錄并保留指標值高于設(shè)定閾值的全部分量序號;63)將保留的特征分量組合成初步的新特征向量集合{VJ和{y'J;64)使用主成分分析方法對所述集合{V^和{<J進行主成分分解,選取前k個主成分作為去除冗余之后的最終特征向量集合Ix"^和{y"J,即所述待分析的隱寫算法的特征向量。9.如權(quán)利要求8所述的方法,其特征在于所述步驟64)的具體實現(xiàn)方法為首先將所述新特征向量排列為mXn維的矩陣X,X的每行表示一個特征向量樣本,每列表示所述新特征向量的一個分量;然后計算nXn維的矩陣R=XtX,并對矩陣R進行特征分解,即CtRC=A;然后計算mXn維的矩陣Y=XCt;最后選取矩陣Y的前k列,作為去除冗余之后的最終特征向量,即該待分析隱寫分析算法的特征向量;其中,C為nXn維的正交矩陣,ASnXn維的對角陣,Ik^rio10.如權(quán)利要求8所述的方法,其特征在于通過支持向量機分類器對所述待分析的隱寫算法的特征向量進行訓(xùn)練,生成新的隱寫分析分類器;其中,分類器的參數(shù)配置通過交叉驗證過程確定,所述交叉驗證的具體方法是將所述最終特征向量集合Ix"^}和{7"3合并在一起,按一定比例隨機劃分為模擬訓(xùn)練集和模擬測試集,然后使用SVM分類器進行訓(xùn)練和分類判決,記錄下模擬測試集的分類正確率作為一次交叉驗證的結(jié)果;重復(fù)多次交叉驗證并計算平均正確率作為挑選SVM分類器最佳參數(shù)配置的依據(jù)。全文摘要本發(fā)明公開了一種基于隱寫測評的隱寫分析方法,本方法為1)建立一包含若干隱寫特征的基準特征集;2)采用待分析的隱寫算法對一組原文{Xi}進行隱寫,生成相應(yīng)的一組隱文{Yi};3)在基準特征集中選取部分特征作為考察特征,計算原文和隱文集合中每個樣本的考察特征向量,分別得到原文和隱文集合的特征向量集合{xi}和{yi};4)根據(jù){xi}和{yi}估計所考察特征向量每一分量作為隱寫特征的有效性;5)重復(fù)步驟3)、4)若干次,得到一組特征向量分量有效性評估結(jié)果;6)從有效性評估結(jié)果中選取若干個分量構(gòu)建一新特征向量,去冗余處理得到隱寫算法的特征向量對該待分析隱寫算法進行隱寫分析,檢測其中是否含有隱蔽信息。本發(fā)明大大提高了隱寫分析實現(xiàn)的效率。文檔編號G06T1/00GK102930495SQ20121039410公開日2013年2月13日申請日期2012年10月16日優(yōu)先權(quán)日2012年10月16日發(fā)明者趙險峰,夏冰冰,黃煒申請人:中國科學(xué)院信息工程研究所