專利名稱:一種音頻重復(fù)插入的檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種音頻信號(hào)篡改鑒定領(lǐng)域的方法,特別涉及一種wav音頻重復(fù)插入檢測(cè)方法。
背景技術(shù):
近年來隨著科學(xué)技術(shù)的進(jìn)步和信息技術(shù)的快速發(fā)展和廣泛應(yīng)用,特別是計(jì)算機(jī)技術(shù)、多媒體技術(shù)的不斷發(fā)展,計(jì)算機(jī)應(yīng)用領(lǐng)域得到了進(jìn)一步的擴(kuò)展。在音頻領(lǐng)域中,數(shù)字音頻技術(shù)迅速發(fā)展,出現(xiàn)了各種功能強(qiáng)大的音頻編輯軟件,使得人們能夠隨意重復(fù)插入各種音頻信息。音頻信息的完整性、可靠性越來越受到質(zhì)疑;一段音頻是元數(shù)據(jù),還是重復(fù)插入的;是新產(chǎn)生的,還是曾經(jīng)已經(jīng)失效的,這些問題都時(shí)刻困擾著用戶。尤其近年來隨著音頻開始應(yīng)用于法庭舉證、歷史文獻(xiàn)備份、部門機(jī)密文件等一些特殊場(chǎng)景,音頻文件內(nèi)容的真實(shí)性完整性就顯得更加重要。比如軍事行動(dòng)命令,政治外交中講話時(shí),毫無疑問,有些話語一旦被重復(fù),極有可能導(dǎo)致嚴(yán)重后果。所以作為數(shù)字音頻取證的重要內(nèi)容,如何能夠檢測(cè)出一個(gè)音頻文件中是否有重復(fù)音頻插入現(xiàn)象的存在,具有重要研究?jī)r(jià)值和現(xiàn)實(shí)意義。發(fā)明內(nèi)容
針對(duì)音頻取證技術(shù)所存在的上述問題,本發(fā)明提供一種音頻重復(fù)插入的檢測(cè)方法。
本發(fā)明解決技術(shù)問題所采用的技術(shù)手段為: 一種音頻重復(fù)插入的檢測(cè)方法,其中,包括如下步驟: 步驟a、將一總時(shí)長(zhǎng)為Tf的音頻文件分為每段時(shí)長(zhǎng)為T的小段,最后時(shí)長(zhǎng)不足T的部分也作為一段,所述音頻文件包含的所述小段數(shù)為t個(gè),t = T/7+1 ; 步驟b、與所述每個(gè)小段中以乂為采樣率設(shè)置漢個(gè)采樣點(diǎn),定義所述每個(gè)小段中的采樣點(diǎn)為 ,.,且!=U...,況; 步驟C、在另一段音頻文件中取[Jj + Γ]時(shí)間長(zhǎng)度的一段,其中將該L/,J+T]時(shí)間長(zhǎng)度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對(duì)應(yīng)的采樣點(diǎn)為4,且 = 1,2,…,況; 步驟 d、構(gòu)造函數(shù)/(m, J) = 22/2 ft2 + ), I < < i ; 步驟e、計(jì)算步驟c中構(gòu)造的所述函數(shù),得出所述函數(shù)的值;步驟f、定義門限值f,將所述函數(shù)的值與所述門限值d故比較,如則判定兩段音頻重復(fù)。
上述音頻重復(fù)插入的檢測(cè)方法,其中,所述步驟a中的音頻文件為WAV波形文件。
上述音頻重復(fù)插入的檢測(cè)方法,其中,所述步驟d中計(jì)算所述函數(shù)的方法具體包括如下步驟: 步驟dl、利用快速傅 里葉變換原理,計(jì)算Τ(λ) = FFIlhixm = 步驟d2、利用卷積原理,計(jì)算:= T(k)X(k);步驟d3、計(jì)算Λ.=h木七。
上述音頻重復(fù)插入的檢測(cè)方法,其中,所述WAV波形文件的采樣頻率為44.1KHz。
本發(fā)明的有益效果是: 1、本發(fā)明不需要額外的輔助設(shè)施,只需要輸入所要檢測(cè)的wav音頻文件即可,操作十分簡(jiǎn)便。
2、本發(fā)明是利用卷積定理來計(jì)算相似度的,極大地縮短了程序運(yùn)行時(shí)間,提高運(yùn)行效率。
3、本發(fā)明定義了一個(gè)相似度的概念,使得兩個(gè)時(shí)間段之間的相似或者重復(fù)情況一目了然,概念也更加清楚。
4、本發(fā)明對(duì)于輸出結(jié)果的門限值,可以根據(jù)應(yīng)用的不同的要求而具體設(shè)置,這使得本發(fā)明應(yīng)用起來十分靈活。
5、本發(fā)明是根據(jù)一個(gè)音頻文件的固有采樣率為依據(jù)來計(jì)算各個(gè)時(shí)間段之間的相似度的,不容易因?yàn)橥饨绲囊恍└蓴_而對(duì)輸出結(jié)果造成影響,故輸出結(jié)果穩(wěn)定可靠。
圖1是本發(fā)明一種音頻重復(fù)插入的檢測(cè)方法的流程圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明,但不作為本發(fā)明的限定。
本實(shí)施例提供了一種wav音頻重復(fù)檢測(cè)的方法,只需輸入一個(gè)wav音頻文件便可迅速的得出結(jié)論。整個(gè)工作流程如圖1所示,本實(shí)施例包括如下步驟(其中前兩個(gè)步驟是做的準(zhǔn)備工作): 步驟a、首先選擇一個(gè)合適的常數(shù)T對(duì)音頻文件進(jìn)行沒有重疊的分割,通常情況下,在此以0.2秒作為一個(gè)分割單元進(jìn)行說明。之所以選擇0.2秒是因?yàn)橹貜?fù)音頻一般都會(huì)大于0.4秒,所以不必去檢測(cè)這0.2秒內(nèi)是否有重復(fù)音頻的插入,就可以保證沒有重復(fù)音頻遺漏情況的發(fā)生,同時(shí)也最大化的降低了計(jì)算量。須注意選擇0.2秒作為分割單元僅僅是為了可以更直觀的說明,而不是將本發(fā)明的實(shí)施方式限制于此,以下所舉出的具體數(shù)字均可作此理解。
不妨設(shè)給定的音頻材料的播放時(shí)間P =10秒,則我們可以把該音頻文件分成t =50個(gè)播放時(shí)間都為0.2秒的 小片段。
步驟b、采樣率是=44.1KHz,并且每個(gè)小片段中所包含的采樣點(diǎn)個(gè)數(shù)為0.2 X44.ΙΚΗζ,即F= 3020海個(gè)小片段中采樣點(diǎn)依次可以設(shè)為<3820。
步驟c,在另一段音頻文件中取Laj + Γ]時(shí)間長(zhǎng)度的一段,其中O SjST-Γ,將該[J,J + T]時(shí)間長(zhǎng)度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對(duì)應(yīng)的采樣點(diǎn)為%且s = 1,2,…,N。
步驟d,構(gòu)造兩個(gè)0.2秒的音頻文件之間的相似度函數(shù)/( ,/)/( J) =IYjJ2i + xij) 其中表示音頻文件上第^個(gè)了時(shí)間段,是表示L/,j + 'r]時(shí)間段上的起始時(shí)間。所以,函數(shù)分子 就代表這兩段音頻文件中所有對(duì)應(yīng)采樣點(diǎn)的積的和;同樣,分母上的Σ€,Σ 則代表了這兩段音頻文件中各個(gè)采樣點(diǎn)的平方的和。
根據(jù)定義,函數(shù)/() ,/)的值就是這兩個(gè)時(shí)間段上的相似度,代表了這兩個(gè)音頻文件波形的相似情況。不難得出,兩段音頻文件波形越相近的值也就越大;反之,JrCu)的值就越小。當(dāng)兩段音頻文件完全相同時(shí),函數(shù)達(dá)到最大值1.步驟e、讀取音頻文件的音頻采樣數(shù)據(jù),并將相似度函數(shù)計(jì)算轉(zhuǎn)化為三個(gè)卷積的計(jì)算,并根據(jù)卷積定理計(jì)算各個(gè)卷積,進(jìn)而得到各個(gè)時(shí)間段之間的相似度。
具體計(jì)算過程如下:
權(quán)利要求
1.一種音頻重復(fù)插入的檢測(cè)方法,其特征在于,包括如下步驟: 步驟a、將一總時(shí)長(zhǎng)為的音頻文件分為每段時(shí)長(zhǎng)為T的小段,最后時(shí)長(zhǎng)不足T的部分也作為一段,所述音頻文件包含的所述小段數(shù)為I:個(gè); 步驟b、與所述每個(gè)小段中以/f為采樣率設(shè)置況個(gè)采樣點(diǎn),定義所述每個(gè)小段中的采樣點(diǎn)為巧,且pU...,況; 步驟C、在另一段音頻文件中取時(shí)間長(zhǎng)度的一段,其中將該L/,J + Γ]時(shí)間長(zhǎng)度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對(duì)應(yīng)的采樣點(diǎn)為%且2 = 1,2,-, N ; 步驟 d、構(gòu)造函數(shù)
2.如權(quán)利要求1所述音頻重復(fù)插入的檢測(cè)方法,其特征在于,所述步驟a中的音頻文件為WAV波形文件。
3.如權(quán)利要求1所述音頻重復(fù)插入的檢測(cè)方法,其特征在于,所述步驟d中計(jì)算所述函數(shù)的方法具體包括如下步驟: 步驟dl、利用快速傅里葉變換原理,計(jì)算
全文摘要
本發(fā)明公開了一種音頻重復(fù)插入的檢測(cè)方法,其中,包括如下步驟步驟a、將一總時(shí)長(zhǎng)為的音頻文件分為每段時(shí)長(zhǎng)為的小段,最后時(shí)長(zhǎng)不足的部分也作為一段,所述音頻文件包含的所述小段數(shù)為個(gè),=/+1;步驟b、與所述每個(gè)小段中以為采樣率設(shè)置個(gè)采樣點(diǎn),定義所述每個(gè)小段中的采樣點(diǎn)為,且;步驟c、在另一段音頻文件中取時(shí)間長(zhǎng)度的一段,其中,將該時(shí)間長(zhǎng)度的一段以所述步驟a中的方法分段,并以所述步驟b中的方法采樣,其所對(duì)應(yīng)的采樣點(diǎn)為,且。本發(fā)明的有益效果是操作十分簡(jiǎn)便,運(yùn)行效率高,概念清楚,應(yīng)用靈活,不易受干擾,輸出穩(wěn)定。
文檔編號(hào)G10L25/48GK103137138SQ201110380169
公開日2013年6月5日 申請(qǐng)日期2011年11月25日 優(yōu)先權(quán)日2011年11月25日
發(fā)明者施少培, 黃征, 楊旭, 李巖, 卞新偉 申請(qǐng)人:司法部司法鑒定科學(xué)技術(shù)研究所