,如果待檢 測MP3音頻為雙聲道音頻,則sfb'的維數(shù)為4w' X 21。
[0071] ⑧-3、計算sfa'中的比例因子1至5轉(zhuǎn)移為sfb'中的比例因子0至3的轉(zhuǎn)移概 率矩陣,記為P',其中,P'的維數(shù)為5X4,P'中的第1行第1列元素的值為Sfa'中的比例 因子1轉(zhuǎn)移為sfb'中的比例因子0的轉(zhuǎn)移概率,P'中的第1行第2列元素的值為Sfa'中 的比例因子1轉(zhuǎn)移為sfb'中的比例因子1的轉(zhuǎn)移概率,P'中的第1行第3列元素的值為 sfa'中的比例因子1轉(zhuǎn)移為sfb'中的比例因子2的轉(zhuǎn)移概率,P'中的第1行第4列元素的 值為sfa'中的比例因子1轉(zhuǎn)移為sfb'中的比例因子3的轉(zhuǎn)移概率,依次類推,P'中的第5 行第4列元素的值為sfa'中的比例因子5轉(zhuǎn)移為sfb'中的比例因子3的轉(zhuǎn)移概率;然后將 P'中的20個元素的值按序作為待檢測MP3音頻的前20個特征值。
[0072] ⑧ _4、計算sfa'與sfb' 的差值矩陣,記為Asf',Asf' =sfa' _sfb',BPsfa'中的 每個元素的值與sfb'中的每個元素的值一一對應(yīng)相減,得到ASf'中的每個元素的值;然 后計算ASf'中的所有元素的值的均值,將該均值作為待檢測MP3音頻的第21個特征值;
[0073] ⑧-5、計算sfa'中的比例因子0至8的概率分布向量,記為弋,其中,的維數(shù) 為1X9,I呻的第1個元素的值為sfa'中的比例因子0的概率分布,仏沖的第2個元素 的值為sfa'中的比例因子1的概率分布,依次類推,C//中的第9個元素的值為sfa'中的比 例因子8的概率分布。
[0074] 并計算sfb'中的比例因子0至8的概率分布向量,記為^,其中,仏< 的維數(shù)為 1X9, %?中的第1個元素的值為sfb'中的比例因子0的概率分布,中的第2個元素的 值為sfb'中的比例因子1的概率分布,依次類推,A6?中的第9個元素的值為sfb'中的比例 因子8的概率分布。
[0075] ⑧_6、計算與^的差值向量,記為AP',處AP'代表比例因子 〇至8的使用概率增量向量,AP'中的第1個元素的值為&沖的第1個元素的值與中 的第1個元素的值的差值,AP'中的第1個元素的值代表比例因子〇的使用概率增量,依 次類推,AP'中的第9個元素的值為仏.中的第9個元素的值與☆中的第9個元素的值的 差值,AP'中的第9個元素的值代表比例因子8的使用概率增量;然后將AP'中的9個元 素的值按序作為待檢測MP3音頻的第22個特征值至第30個特征值。
[0076] ⑧-7、計算與/^:的商值向量,記為dP'dP'代表比例因子0至 8的使用概率增長倍數(shù)向量,dP'中的第1個元素的值為匕/中的第1個元素的值除以&中 的第1個元素的值得到的商值,dP'中的第1個元素的值代表比例因子0的使用概率增長 倍數(shù),依次類推,dP'中的第9個元素的值為中的第9個元素的值除以中的第9個元 素的值得到的商值,dP'中的第9個元素的值代表比例因子8的使用概率增長倍數(shù);然后將dP'中的9個元素的值按序作為待檢測MP3音頻的第31個特征值至第39個特征值。
[0077] ⑧-8、計算比例因子0的使用概率增長倍數(shù)與比例因子1至8各自的使用概率增 長倍數(shù)的差值,將得到的8個差值按序作為待檢測MP3音頻的第40個特征值至第47個特 征值。
[0078] 本實施例中的所有步驟中的MP3編碼器和MP3解碼器均采用目前較流行的 lame3. 99. 5,實驗人員只要通過在lame3. 99. 5上設(shè)置不同的參數(shù)即可實現(xiàn)MP3編碼器和 MP3解碼器的切換。
[0079] 為進一步說明本發(fā)明方法的可行性和有效性,進行實驗。
[0080] 在本實施例中,MP3 編碼器依次米用 64kbps、80kbps、96kbps、112kbps、128kbps、 160kbps、192kbps七種編碼比特率對所選取的539首未壓縮的WAV音頻樣本進行壓縮獲得 對應(yīng)的一次壓縮MP3音頻樣本,再根據(jù)限定的MP3編碼器的編碼比特率的選取方式,獲得對 應(yīng)的二次壓縮MP3音頻樣本以及三次壓縮MP3音頻樣本。本實施例中共包含49組實驗, 每組實驗樣本集合中包括539個一次壓縮MP3音頻樣本、539個二次壓縮MP3音頻樣本以 及539個三次壓縮MP3音頻樣本,并提取每個樣本的47個特征值并對其進行歸一化處理。 將每組實驗中的所有一次壓縮MP3音頻樣本的歸一化處理后的特征值的70%用于訓(xùn)練分 類模型、所有二次壓縮MP3音頻樣本的歸一化處理后的特征值的70%用于訓(xùn)練分類模型以 及所有三次壓縮MP3音頻樣本的歸一化處理后的特征值的70%用于訓(xùn)練分類模型,輸入到 LibSVM分類器中,將所有一次壓縮MP3音頻樣本的歸一化處理后的特征值的剩余的30 %、 所有二次壓縮MP3音頻樣本的歸一化處理后的特征值的剩余的30%、所有三次壓縮MP3音 頻樣本的歸一化處理后的特征值的剩余的30%用于測試,每組實驗測試進行10次。最后通 過求10次的檢測結(jié)果的平均值來計算每組實驗測試的預(yù)測準確率,每組實驗測試的預(yù)測 準確率的結(jié)果如表1所示。
[0081] 表1每組實驗測試的預(yù)測準確率的結(jié)果
[0082]
[0083] 表1中,BRl、BR2和BR3分別表示三次壓縮MP3音頻樣本的第一次、第二次和第三 次壓縮時所采用編碼比特率。例如第一行的第二個數(shù)據(jù)表示經(jīng)過80kbps編碼比特率一次 壓縮MP3樣本,經(jīng)過64kbps和80kbps編碼比特率兩次的二次壓縮MP3樣本與經(jīng)過64kbps、 80kbps和80kbps編碼比特率三次壓縮的MP3樣本的預(yù)測準確率為81. 85%。從表1中可 以看出在不同的編碼比特率下,壓縮歷史檢測率較好,尤其適用于較高的編碼比特率下。
[0084] 綜上,本發(fā)明的MP3音頻壓縮歷史檢測方法具有有效性,突破了MP3音頻壓縮歷史 檢測的空白,而且適用于較高碼率下MP3音頻壓縮歷史檢測,且計算復(fù)雜度較低。
【主權(quán)項】
1. 一種MP3音頻壓縮歷史檢測方法,其特征在于包括以下步驟: ① 選取N個風格不同且未壓縮的WAV音頻樣本,其中,N彡10 ; ② 獲取與每個未壓縮的WAV音頻樣本對應(yīng)的一次壓縮MP3音頻樣本,具體過程為:利用 MP3編碼器對每個未壓縮的WAV音頻樣本進行壓縮編碼,得到每個未壓縮的WAV音頻樣本經(jīng) 過一次壓縮后形成的一次壓縮MP3音頻樣本; ③ 獲取與每個未壓縮的WAV音頻樣本對應(yīng)的二次壓縮MP3音頻樣本,具體過程為: ③ -1、利用MP3編碼器對每個未壓縮的WAV音頻樣本進行壓縮編碼,得到每個未壓縮的WAV 音頻樣本經(jīng)過一次壓縮后形成的一次壓縮MP3音頻樣本,再利用MP3解碼器將得到的每個 一次壓縮MP3音頻樣本解壓成WAV音頻樣本;③-2、利用MP3編碼器對步驟③-1中解壓成 的每個WAV音頻樣本進行壓縮編碼,得到與每個未壓縮的WAV音頻樣本對應(yīng)的二次壓縮MP3 音頻樣本; 其中,所述的步驟③-1和所述的步驟③-2中使用的MP3編碼器均與所述的步驟②中 使用的MP3編碼器相同,且所述的步驟③-1中的MP3編碼器的編碼比特率與所述的步驟② 中的MP3編碼器的編碼比特率相同或不相同,所述的步驟③-2中的MP3編碼器的編碼比特 率與所述的步驟②中的MP3編碼器的編碼比特率相同; ④ 獲取與每個未壓縮的WAV音頻樣本對應(yīng)的三次壓縮MP3音頻樣本,具體過程為: ④ -1、利用MP3編碼器對每個未壓縮的WAV音頻樣本進行壓縮編碼,得到每個未壓縮的WAV 音頻樣本經(jīng)過一次壓縮后形成的一次壓縮MP3音頻樣本,再利用MP3解碼器將得到的每個 一次壓縮MP3音頻樣本解壓成WAV音頻樣本;④-2、利用MP3編碼器對步驟④-1中解壓成 的每個WAV音頻樣本進行壓縮編碼,得到與每個未壓縮的WAV音頻樣本對應(yīng)的二次壓縮MP3 音頻樣本,再利用MP3解碼器將得到的每個二次壓縮MP3音頻樣本解壓成WAV音頻樣本; ④-3、利用MP3編碼器對步驟④-2中解壓成的每個WAV音頻樣本進行壓縮編碼,得到與每 個未壓縮的WAV音頻樣本對應(yīng)的三次壓縮MP3音頻樣本; 其中,所述的步驟④-1、所述的步驟④-2和所述的步驟④_3中使用的MP3編碼器均 與所述的步驟②中使用的MP3編碼器相同,所述的步驟④-1和所述的步驟④-2中使用的 MP3解碼器均與所述的步驟③-1中使用的MP3解碼器相同,且所述的步驟④-1中的MP3編 碼器的編碼比特率與所述的步驟③-1中的MP3編碼器的編碼比特率相同,所述的步驟④-2 和所述的步驟④-3中的MP3編碼器的編碼比特率均與所述的步驟③-2中的MP3編碼器的 編碼比特率相同; ⑤ 將每個一次壓縮MP3音頻樣本標記為-1,將每個二次壓縮MP3音頻樣本標記為0,將 每個三次壓縮MP3音頻樣本標記為1,再將所有的一次壓縮MP3音頻樣本、所有的二次壓縮 MP3音頻樣本及所有的三次壓縮MP3音頻樣本構(gòu)成一個訓(xùn)練樣本集合,其中,訓(xùn)練樣本集合 中的每個子樣本為一次壓縮MP3音頻樣本或為二次壓縮MP3音頻樣本或為三次壓縮MP3音 頻樣本; ⑥ 提取出訓(xùn)練樣本集合中的每個子樣本的47個特征值,并將訓(xùn)練樣本集合中的每個 子樣本的47個特征值構(gòu)成一個行向量,將訓(xùn)練樣本集合中的第k個子樣本的47個特征值 構(gòu)成的行向量記為F k;然后采用min-max歸一化方法對訓(xùn)練樣本集合中的每個子樣本的47 個特征值進行歸一化處理,得到訓(xùn)練樣本集合中的每個子樣本的47個歸一化處理后的特 征值;其中,k的初始值為1,I < k < K,K表示訓(xùn)練樣本集合中包含的子樣本的總個數(shù),K =3N ; ⑦ 利用LibSVM分類器對訓(xùn)練樣本集合中的所有子樣本各自的47個歸一化處理后的特 征值進行訓(xùn)練,得到訓(xùn)練模板;其中,訓(xùn)練過程中采用交叉驗證方式在[2 5,25]區(qū)間內(nèi)選取 最佳懲罰參數(shù)c和最佳RBF核參數(shù)g,其余參數(shù)均使用默認值; ⑧ 任意選取M個待檢測MP3音頻,其中,M多1,每個待檢測MP3音頻為一次壓縮MP3音 頻或為二次壓縮MP3音頻或為三次壓縮MP3音頻,且每個待檢測MP3音頻的獲取