一種mp3音頻壓縮歷史檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種數(shù)字音頻取證方法,尤其是涉及一種MP3音頻壓縮歷史檢測(cè)方 法。
【背景技術(shù)】
[0002] 隨著多媒體技術(shù)的不斷發(fā)展,各種多媒體編輯軟件應(yīng)運(yùn)而生,例如CoolEditPro、 GoldWave等。這些多媒體編輯軟件的產(chǎn)生對(duì)完善多媒體信息、增強(qiáng)多媒體信息的視聽(tīng)效果 具有重要意義。但是,多媒體編輯軟件給人們生活帶來(lái)便利的同時(shí)也帶來(lái)了一些負(fù)面的影 響,例如一些不法分子為達(dá)到不可告人的目的,通過(guò)操作多媒體編輯軟件對(duì)多媒體信息進(jìn) 行各種篡改和偽造,由于這些篡改和偽造往往具有惡意性且不易被察覺(jué),因此會(huì)對(duì)個(gè)人乃 至國(guó)家的安全造成威脅,會(huì)嚴(yán)重影響社會(huì)穩(wěn)定。
[0003] 音頻是多媒體信息中的重要組成部分,它具有易獲取、便于存儲(chǔ)等特點(diǎn)。MP3作為 當(dāng)今網(wǎng)絡(luò)上最流行的音頻格式,判定MP3音頻是否被篡改是目前急需解決的問(wèn)題。由于音 頻的篡改必須在非壓縮域的格式中才能有效進(jìn)行,因此對(duì)壓縮域音頻如MP3音頻的篡改就 必須先將其解壓成非壓縮域的WAV音頻,然后才能對(duì)該WAV音頻進(jìn)行增加、刪除、剪切、拼接 等其他篡改操作,最后再將篡改后的WAV音頻壓縮成MP3音頻。從這一系列的篡改操作過(guò) 程中可以發(fā)現(xiàn),被篡改的MP3音頻必然經(jīng)歷過(guò)多次壓縮解壓的過(guò)程,因此通過(guò)研究MP3音頻 的壓縮歷史,可以有效推測(cè)MP3音頻是否有被篡改。而目前壓縮歷史檢測(cè)研究主要針對(duì)圖 像領(lǐng)域,且音頻壓縮歷史檢測(cè)研究主要針對(duì)MP3音頻雙壓縮檢測(cè),對(duì)MP3音頻兩次以上的壓 縮歷史檢測(cè)關(guān)注甚少。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種MP3音頻壓縮歷史檢測(cè)方法,其能夠有效 地檢測(cè)出MP3音頻的壓縮歷史,即能夠準(zhǔn)確地確定待測(cè)MP3音頻是經(jīng)過(guò)一次、二次或者是三 次壓縮的MP3音頻。
[0005] 本發(fā)明解決上述技術(shù)問(wèn)題所采用的技術(shù)方案為:一種MP3音頻壓縮歷史檢測(cè)方 法,其特征在于包括以下步驟:
[0006] ①選取N個(gè)風(fēng)格不同且未壓縮的WAV音頻樣本,其中,N彡10 ;
[0007] ②獲取與每個(gè)未壓縮的WAV音頻樣本對(duì)應(yīng)的一次壓縮MP3音頻樣本,具體過(guò)程為: 利用MP3編碼器對(duì)每個(gè)未壓縮的WAV音頻樣本進(jìn)行壓縮編碼,得到每個(gè)未壓縮的WAV音頻 樣本經(jīng)過(guò)一次壓縮后形成的一次壓縮MP3音頻樣本;
[0008] ③獲取與每個(gè)未壓縮的WAV音頻樣本對(duì)應(yīng)的二次壓縮MP3音頻樣本,具體過(guò)程為: ③-1、利用MP3編碼器對(duì)每個(gè)未壓縮的WAV音頻樣本進(jìn)行壓縮編碼,得到每個(gè)未壓縮的WAV 音頻樣本經(jīng)過(guò)一次壓縮后形成的一次壓縮MP3音頻樣本,再利用MP3解碼器將得到的每個(gè) 一次壓縮MP3音頻樣本解壓成WAV音頻樣本;③-2、利用MP3編碼器對(duì)步驟③-1中解壓成 的每個(gè)WAV音頻樣本進(jìn)行壓縮編碼,得到與每個(gè)未壓縮的WAV音頻樣本對(duì)應(yīng)的二次壓縮MP3 音頻樣本;
[0009] 其中,所述的步驟③-1和所述的步驟③-2中使用的MP3編碼器均與所述的步驟 ②中使用的MP3編碼器相同,且所述的步驟③-1中的MP3編碼器的編碼比特率與所述的步 驟②中的MP3編碼器的編碼比特率相同或不相同,所述的步驟③-2中的MP3編碼器的編碼 比特率與所述的步驟②中的MP3編碼器的編碼比特率相同;
[0010] ④獲取與每個(gè)未壓縮的WAV音頻樣本對(duì)應(yīng)的三次壓縮MP3音頻樣本,具體過(guò)程為: ④-1、利用MP3編碼器對(duì)每個(gè)未壓縮的WAV音頻樣本進(jìn)行壓縮編碼,得到每個(gè)未壓縮的WAV 音頻樣本經(jīng)過(guò)一次壓縮后形成的一次壓縮MP3音頻樣本,再利用MP3解碼器將得到的每個(gè) 一次壓縮MP3音頻樣本解壓成WAV音頻樣本;④-2、利用MP3編碼器對(duì)步驟④-1中解壓成 的每個(gè)WAV音頻樣本進(jìn)行壓縮編碼,得到與每個(gè)未壓縮的WAV音頻樣本對(duì)應(yīng)的二次壓縮MP3 音頻樣本,再利用MP3解碼器將得到的每個(gè)二次壓縮MP3音頻樣本解壓成WAV音頻樣本; ④-3、利用MP3編碼器對(duì)步驟④-2中解壓成的每個(gè)WAV音頻樣本進(jìn)行壓縮編碼,得到與每 個(gè)未壓縮的WAV音頻樣本對(duì)應(yīng)的三次壓縮MP3音頻樣本;
[0011] 其中,所述的步驟④-1、所述的步驟④-2和所述的步驟④-3中使用的MP3編碼 器均與所述的步驟②中使用的MP3編碼器相同,所述的步驟④-1和所述的步驟④-2中使 用的MP3解碼器均與所述的步驟③-1中使用的MP3解碼器相同,且所述的步驟④-1中的 MP3編碼器的編碼比特率與所述的步驟③-1中的MP3編碼器的編碼比特率相同,所述的步 驟④-2和所述的步驟④-3中的MP3編碼器的編碼比特率均與所述的步驟③-2中的MP3 編碼器的編碼比特率相同;
[0012] ⑤將每個(gè)一次壓縮MP3音頻樣本標(biāo)記為-1,將每個(gè)二次壓縮MP3音頻樣本標(biāo)記為 〇,將每個(gè)三次壓縮MP3音頻樣本標(biāo)記為1,再將所有的一次壓縮MP3音頻樣本、所有的二次 壓縮MP3音頻樣本及所有的三次壓縮MP3音頻樣本構(gòu)成一個(gè)訓(xùn)練樣本集合,其中,訓(xùn)練樣本 集合中的每個(gè)子樣本為一次壓縮MP3音頻樣本或?yàn)槎螇嚎sMP3音頻樣本或?yàn)槿螇嚎s MP3音頻樣本;
[0013] ⑥提取出訓(xùn)練樣本集合中的每個(gè)子樣本的47個(gè)特征值,并將訓(xùn)練樣本集合中的 每個(gè)子樣本的47個(gè)特征值構(gòu)成一個(gè)行向量,將訓(xùn)練樣本集合中的第k個(gè)子樣本的47個(gè)特 征值構(gòu)成的行向量記為Fk;然后采用min-max歸一化方法對(duì)訓(xùn)練樣本集合中的每個(gè)子樣本 的47個(gè)特征值進(jìn)行歸一化處理,得到訓(xùn)練樣本集合中的每個(gè)子樣本的47個(gè)歸一化處理后 的特征值;其中,k的初始值為1,I<k<K,K表示訓(xùn)練樣本集合中包含的子樣本的總個(gè) 數(shù),K= 3N;
[0014] ⑦利用LibSVM分類器對(duì)訓(xùn)練樣本集合中的所有子樣本各自的47個(gè)歸一化處理后 的特征值進(jìn)行訓(xùn)練,得到訓(xùn)練模板;其中,訓(xùn)練過(guò)程中采用交叉驗(yàn)證方式在[2 5, 25]區(qū)間內(nèi) 選取最佳懲罰參數(shù)c和最佳RBF核參數(shù)g,其余參數(shù)均使用默認(rèn)值;
[0015] ⑧任意選取M個(gè)待檢測(cè)MP3音頻,其中,M多1,每個(gè)待檢測(cè)MP3音頻為一次壓縮 MP3音頻或?yàn)槎螇嚎sMP3音頻或?yàn)槿螇嚎sMP3音頻,且每個(gè)待檢測(cè)MP3音頻的獲取過(guò)程 中最后一次壓縮編碼所使用的MP3編碼器的編碼比特率與訓(xùn)練樣本集合中的子樣本的獲 取過(guò)程中最后一次壓縮編碼所使用的MP3編碼器的編碼比特率相同;然后按照步驟⑥中提 取出訓(xùn)練樣本集合中的每個(gè)子樣本的47個(gè)特征值的過(guò)程,以相同的方式提取出每個(gè)待檢 測(cè)MP3音頻的47個(gè)特征值;接著采用min-max歸一化方法對(duì)每個(gè)待檢測(cè)MP3音頻的47個(gè) 特征值進(jìn)行歸一化處理,得到每個(gè)待檢測(cè)MP3音頻的47個(gè)歸一化處理后的特征值;再將每 個(gè)待檢測(cè)MP3音頻的47個(gè)歸一化處理后的特征值輸入到訓(xùn)練模板中進(jìn)行檢測(cè),如果訓(xùn)練模 板的輸出結(jié)果為-1,則確定對(duì)應(yīng)的待檢測(cè)MP3音頻為一次壓縮MP3音頻,如果訓(xùn)練模板的輸 出結(jié)果為〇,則確定對(duì)應(yīng)的待檢測(cè)MP3音頻為二次壓縮MP3音頻,如果訓(xùn)練模板的輸出結(jié)果 為1,則確定對(duì)應(yīng)的待檢測(cè)MP3音頻為三次壓縮MP3音頻。
[0016] 所述的步驟⑥中Fk的獲取過(guò)程為:
[0017] ⑥-1、將訓(xùn)練樣本集合中的第k個(gè)子樣本中利用長(zhǎng)窗編碼方式進(jìn)行處理的幀定義 為長(zhǎng)窗編碼幀;然后利用步驟③-1中所使用的MP3解碼器對(duì)訓(xùn)練樣本集合中的第k個(gè)子樣 本中的每幀進(jìn)行解碼處理,得到訓(xùn)練樣本集合中的第k個(gè)子樣本解碼后的WAV音頻,在解碼 處理過(guò)程中,提取出訓(xùn)練樣本集合中的第k個(gè)子樣本中的每幀長(zhǎng)窗編碼幀的位置;接著根 據(jù)訓(xùn)練樣本集合中的第k個(gè)子樣本中的每幀長(zhǎng)窗編碼幀的位置,獲取訓(xùn)練樣本集合中的第 k個(gè)子樣本中的所有長(zhǎng)窗編碼幀的位置的比例因子矩陣,記為Sfa,其中,如果訓(xùn)練樣本集合 中的第k個(gè)子樣本為單聲道音頻,則奸3的維數(shù)為2wX21,如果訓(xùn)練樣本集合中的第k個(gè)子 樣本為雙聲道音頻,則維數(shù)為4wX21,w表示訓(xùn)練樣本集合中的第k個(gè)子樣本中的長(zhǎng) 窗編碼幀的總幀數(shù);
[0018] ⑥-2、利用步驟②中所使用的MP3編碼器對(duì)步驟⑥-1中得到的解碼后的WAV音頻 進(jìn)行編碼處理,得到新的MP3音頻,在編碼處理過(guò)程中,根據(jù)步驟⑥-1中提取出的訓(xùn)練樣本 集合中的第k個(gè)子樣本中的每幀長(zhǎng)窗編碼幀的位置,獲取步驟⑥-1中得到的解碼后的WAV 音頻在編碼處理過(guò)程中的所有長(zhǎng)窗編碼幀的位置的比例因子矩陣,記為sfb,其中,本步驟 中的MP3編碼器的編碼比特率與訓(xùn)練樣本集合中的第k個(gè)子樣本的獲取過(guò)程中最后一次壓 縮編碼所使用的MP3編碼器的編碼比特率相同,如果訓(xùn)練樣本集合中的第k個(gè)子樣本為單 聲道音頻,則Sfb的維數(shù)為2wX21,如果訓(xùn)練樣本集合中的第k個(gè)子樣本為雙聲道音頻,則 8&的維數(shù)為4wX21 ;
[0019] ⑥-3、計(jì)算sfa中的比例因子1至5轉(zhuǎn)移為sfb中的比例因子0至3的轉(zhuǎn)移概率矩 陣,記為P,其中,P的維數(shù)為5X4,P中的第1行第1列元素的值為sfa中的比例因子1轉(zhuǎn) 移為sfb中的比例因子0的轉(zhuǎn)移概率,P中的第1行第2列元素的值為sfa中的比例因子1 轉(zhuǎn)移為Sfb中的比例因子1的轉(zhuǎn)移概率,P中的第1行第3列元素的值為sfa中的比例因子 1轉(zhuǎn)移為sfb中的比例因子2的轉(zhuǎn)移概率,P中的第1行第4列元素的值為sfa中的比例因 子1轉(zhuǎn)移為sfb中的比例因子3的轉(zhuǎn)移概率,依次類推,P中的第5行第4列元素的值為sfa 中的比例因子5轉(zhuǎn)移為sfb中的比例因子3的轉(zhuǎn)移概率;然后將P中的20個(gè)元素的值按序 作為訓(xùn)練樣本集合中的第k個(gè)子樣本的前20個(gè)特征值;
[0020] ⑥_4、計(jì)算sf!^勺差值矩陣,記為Asf,Asf=sfa_sfb;然后計(jì)算Asf中 的所有元素的值的均值,將該均值作為訓(xùn)練樣本集合中的第k個(gè)子樣本的第21個(gè)特征值;
[0021] ⑥_5、計(jì)算sfa中的比例因子0至8的概率分布向量,記為。,其中,Aa的維數(shù)為 IX9, 4中的第1個(gè)元素的值為Sfa中的比例因子0的概率分布,仏中的第2個(gè)元素的值 為Sfa中的比例因子1的概率分布,依次類推,仏中的第9個(gè)元素的值為Sfa中的比例因子