錄音時(shí)間識(shí)別方法
【專利摘要】本發(fā)明提供一種錄音時(shí)間識(shí)別方法,包含以下幾個(gè)部分:語音信號(hào)預(yù)處理、電網(wǎng)頻率的提取、歸一化處理、相關(guān)器的設(shè)計(jì)、并行匹配算法設(shè)計(jì)、匹配信號(hào)中值濾波、匹配結(jié)果輸出。該方法首先將提取到的待匹配的音頻中的電網(wǎng)頻率信號(hào)分割成三段與電力線中電網(wǎng)頻率各幀進(jìn)行并行匹配,得到兩者的相關(guān)程度,并與閾值進(jìn)行比較,判斷出相關(guān)性最大的幀數(shù),進(jìn)而得出音頻信號(hào)的錄音時(shí)間。該方法采用并行機(jī)制,提高了匹配效率,同時(shí)也使得錄音時(shí)間的識(shí)別更加精確,對(duì)音頻取證具有著重要的意義。
【專利說明】錄音時(shí)間識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及錄音證據(jù)的鑒定領(lǐng)域,具體涉及一種錄音時(shí)間識(shí)別方法。
【背景技術(shù)】
[0002] 2002年4月《最高人民法院關(guān)于民事訴訟證據(jù)的若干規(guī)定》規(guī)定,以合法手段取得 的錄音可以作為證據(jù)提交法庭。然而往往由于法庭缺乏音頻取證技術(shù),導(dǎo)致獲得的錄音證 明力不足。所謂音頻取證,就是是針對(duì)給出的錄音信號(hào)能夠確定是何人在何時(shí)何地講的什 么話,采用的何種設(shè)備錄制,而且該錄音信號(hào)是否被篡改過,篡改的地方在哪里。
[0003] 2009年R. c. Mahe討論了語音取證技術(shù)的研究進(jìn)展,同年,J. ECampbell等人對(duì)取 證說話人識(shí)別進(jìn)行了分析和討論。Grigora和E. B. Brixen認(rèn)為可以通過從待測(cè)音頻中提取 電網(wǎng)頻率曲線并與地區(qū)電網(wǎng)頻率數(shù)據(jù)庫(kù)進(jìn)行匹配搜索以確定錄音日期和時(shí)間。
[0004] 目前,國(guó)際上對(duì)語音取證方面的研究也僅僅局限于判斷語音信號(hào)中電網(wǎng)頻率參數(shù) 的基頻幅度、相位是否與地區(qū)數(shù)據(jù)庫(kù)曲線變化一致從而對(duì)錄音時(shí)間、地點(diǎn)作出判斷。而我國(guó) 電網(wǎng)頻率的波動(dòng)范圍大,容易受到噪聲和其他等干擾因素影響加上我國(guó)并沒有像國(guó)外建有 龐大的電網(wǎng)頻率數(shù)據(jù)庫(kù)使得語音取證的研究較為困難。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服上述缺陷,提供一種錄音時(shí)間識(shí)別方法,將提取到的待匹 配的音頻中的電網(wǎng)頻率信號(hào)分割成三段與電力線中電網(wǎng)頻率信號(hào)各幀進(jìn)行并行匹配,得到 兩者的相關(guān)程度,并與閾值進(jìn)行比較,判斷出相關(guān)性最大的幀數(shù),進(jìn)而得出音頻信號(hào)的錄音 時(shí)間。相比于使用將語音中電網(wǎng)頻率信號(hào)和電網(wǎng)頻率求方差而得到兩者相似程度的方法, 該方法能夠在短時(shí)間內(nèi)進(jìn)行高效的并行計(jì)算,迅速地計(jì)算出錄音時(shí)間,并且更加可靠,準(zhǔn)確 率更高。
[0006] 為了解決上述問題,本發(fā)明裝置所采用的技術(shù)方案為:一種錄音時(shí)間的識(shí)別方法, 其特征在于,包括如下步驟:
[0007] S1、分別提取電網(wǎng)ENF(電網(wǎng)頻率)及語音ENF(電網(wǎng)頻率),并對(duì)提取到的電網(wǎng) ENF(電網(wǎng)頻率)及語音ENF(電網(wǎng)頻率)分別進(jìn)行測(cè)頻算法得到電網(wǎng)ENF頻率值組成的序 列及語音ENF頻率值組成的序列。
[0008] S2、對(duì)經(jīng)過測(cè)頻算法得到的電網(wǎng)ENF序列及語音ENF序列進(jìn)行歸一化處理。
[0009] S3、將語音ENF分割成三段等長(zhǎng)序列A、B、C ;
[0010] S4、將電網(wǎng)ENF進(jìn)行75%重疊分幀,共N幀,幀長(zhǎng)L,長(zhǎng)度與分割后的一段語音ENF 序列等長(zhǎng);
[0011] S5、將語音ENF序列A、B、C和電網(wǎng)ENF序列第K幀、第K+1幀、第K+2幀同時(shí)進(jìn)行 并行相關(guān)運(yùn)算,取運(yùn)算結(jié)果中的最大值分別為;當(dāng)K= 1時(shí),將運(yùn)算 得到的三個(gè)相關(guān)數(shù)值Si (Κ),S2 (K+1),S3 (Κ+2)中的最小值的3/4設(shè)為初始閾值Λ,其中為電 網(wǎng)ENF中某一幀,取值范圍為0, 1,2, 3···Ν ;
[0012] S6、將電網(wǎng)ENF后移1/4幀,此時(shí):K = K+1/4,重復(fù)S5的相關(guān)運(yùn)算,此時(shí)若式 min(SjK)S2(K+l)S3(K+2)) > Λ成立,則執(zhí)行式Λ 更新閾值,并將K值賦 給Q,再執(zhí)行S7 ;若min餌⑷S2 (K+l) S3 (K+2)) > Λ不成立,則直接執(zhí)行S7 ;
[0013] S7、繼續(xù)進(jìn)行S6的操作,直至第Ν幀匹配結(jié)束;
[0014] S8、匹配結(jié)束后,若最終閾值大于0.9,則匹配成功,輸出Q值,根據(jù)采樣頻率及測(cè) 頻算法得到每秒的電網(wǎng)頻率點(diǎn)的個(gè)數(shù),再根據(jù)分幀規(guī)則(即每秒多少幀)及Q值即可獲得 錄音錄制時(shí)間;否則匹配失敗。
[0015] 前述的一種錄音時(shí)間的識(shí)別方法,電網(wǎng)頻率信號(hào)的分幀采用可移動(dòng)的有限長(zhǎng)度的 窗口進(jìn)加權(quán)的方法實(shí)現(xiàn),加窗函數(shù)為矩形窗:
[0016]
【權(quán)利要求】
1. 一種錄音時(shí)間的識(shí)別方法,其特征在于,包括如下步驟: 51、 分別提取電網(wǎng)ENF及語音ENF,并對(duì)提取到的電網(wǎng)ENF及語音ENF分別進(jìn)行測(cè)頻算 法得到電網(wǎng)ENF頻率值組成的序列及語音ENF頻率值組成的序列; 52、 對(duì)經(jīng)過測(cè)頻算法得到的電網(wǎng)ENF序列及語音ENF序列進(jìn)行歸一化處理; 53、 將語音ENF分割成三段等長(zhǎng)序列A、B、C ; 54、 將電網(wǎng)ENF進(jìn)行75(%重疊分幀,共N幀,幀長(zhǎng)L,長(zhǎng)度與分割后的一段語音ENF序列 等長(zhǎng); 55、 將語音ENF序列A、B、C和電網(wǎng)ENF序列第K幀、第K+1幀、第K+2幀同時(shí)進(jìn)行并行 相關(guān)運(yùn)算,取運(yùn)算結(jié)果中的最大值分別為;當(dāng)K= 1時(shí),將運(yùn)算得到 的三個(gè)相關(guān)數(shù)值31〇(),52〇(+1),53〇(+2)中的最小值的3/4設(shè)為初始閾值八,其中為電網(wǎng) ENF中某一巾貞,取值范圍為0, 1,2, 3···Ν ; 56、 將電網(wǎng)ENF后移1/4幀,此時(shí):K = Κ+1/4,重復(fù)S5的相關(guān)運(yùn)算,此時(shí)若式min (Si (Κ) S2(K+l)S3(K+2)) > Λ成立,貝1J執(zhí)行式Λ =砧11(51,32,53),更新閾值,并將1(值賦給〇,再執(zhí) 行37 ;若11^11(51船52〇(+1)53〇(+2))>八不成立,則直接執(zhí)行57 ; 57、 繼續(xù)進(jìn)行S6的操作,直至第Ν幀匹配結(jié)束; 58、 匹配結(jié)束后,若最終閾值大于0. 9,則匹配成功,輸出Q值,根據(jù)采樣頻率及測(cè)頻算 法得到每秒的電網(wǎng)頻率點(diǎn)的個(gè)數(shù),再根據(jù)分幀規(guī)則及Q值即可獲得錄音錄制時(shí)間;否則匹 配失敗。
2. 根據(jù)權(quán)利要求1所述的一種錄音時(shí)間的識(shí)別方法,其特征在于: 電網(wǎng)頻率信號(hào)的分幀采用可移動(dòng)的有限長(zhǎng)度的窗口進(jìn)加權(quán)的方法實(shí)現(xiàn),加窗函數(shù)為矩 形窗: fl 1 win) = i .... 。 s典他
3. 根據(jù)權(quán)利要求1所述的錄音時(shí)間的識(shí)別方法,其特征在于,所述步驟SI中,提取語音 信號(hào)中的電網(wǎng)頻率信號(hào)時(shí),首先經(jīng)過300Hz低通濾波器,再經(jīng)過帶通濾波器,得到50Hz左右 的電網(wǎng)頻率信號(hào),再經(jīng)過傅里葉測(cè)頻算法得到語音ENF序列。
4. 根據(jù)權(quán)利要求1所述的錄音時(shí)間的識(shí)別方法,其特征在于:所述步驟S1中,提取電 網(wǎng)中的電網(wǎng)頻率信號(hào)是將測(cè)試模塊接到220V電力線上獲得電網(wǎng)ENF,測(cè)試模塊包括精密電 壓互感器、信號(hào)調(diào)理電路、模數(shù)轉(zhuǎn)換模塊、抗混疊濾波模塊和窄帶濾波模塊;220V電力線上 的電壓信號(hào)經(jīng)過精密電壓互感器降壓后得到一個(gè)等比例的縮小的工頻交流電,信號(hào)調(diào)理電 路完成直流偏置的添加,使得調(diào)理后的輸出電壓在模數(shù)轉(zhuǎn)換模塊的輸入電壓范圍內(nèi),抗混 疊濾波模塊濾除高頻成分,使得滿足奈奎斯特采樣定律;得其電壓后經(jīng)過窄帶濾波后再經(jīng) 過傅里葉測(cè)頻算法得到電網(wǎng)ENF序列。
5. 根據(jù)權(quán)利要求1所述的錄音時(shí)間的識(shí)別方法,其特征在于:所述步驟S2中,對(duì)電網(wǎng) ENF序列和語音ENF序列進(jìn)行歸一化處理,歸一化處理公式如下: 弋=(H- ) --^色+ P* Λ γ _ y "^max Amin
式中:Ρ· = l,Pmin = -l,x_為電網(wǎng)ENF序列中頻率最大值,Xniin為電網(wǎng)ENF序列中頻 率最小值,ymax為語音ENF序列中頻率最大值,ymin為語音ENF序列中頻率最小值,x i2為經(jīng) 過歸一化處理的電網(wǎng)ENF頻率值,為經(jīng)過歸一化處理的語音ENF頻率值,Xi為未經(jīng)過處理 的電網(wǎng)ENF頻率值,yj為未經(jīng)過處理的語音ENF頻率值,針對(duì)Xi和xi2, i為1,2, 3......Μ; 針對(duì)y」和夂' j為1,2,3......P。
6. 根據(jù)權(quán)利要求1中所述的錄音時(shí)間的識(shí)別方法,其特征在于,所述步驟S5中的相關(guān) 運(yùn)算的具體過程為:對(duì)語音ENF序列與電網(wǎng)ENF序列的對(duì)應(yīng)位做乘法運(yùn)算,然后利用求和網(wǎng) 絡(luò)得到兩者的相關(guān)值;設(shè)提取的電網(wǎng)ENF序列為 :X(n) = f^i+n),式中:i為某一時(shí)刻,η 的值為:l,2,3,4···;設(shè)提取的語音ENF序列為 :Y(n)=f2(j+n)式中:j為某一時(shí)刻,n的值 為:1,2, 3, 4···,將一段序列的語音ENF和電網(wǎng)ENF進(jìn)行互相關(guān):
其中τ為兩信號(hào)相差的時(shí)刻; 兩信號(hào)的相關(guān)系數(shù)為:
R值介于-1和1之間,找出相關(guān)系數(shù)最大值所對(duì)應(yīng)的時(shí)刻,即確定錄音的時(shí)間。
7. 根據(jù)權(quán)利要求6所述的錄音時(shí)間的識(shí)別方法,其特征在于:將語音ENF序列A、B、C 和電網(wǎng)ENF序列第Κ幀、第Κ+1幀、第Κ+2幀同時(shí)進(jìn)行并行相關(guān)運(yùn)算后,采用中值濾波,消除 毛刺。
【文檔編號(hào)】G06F19/00GK104156578SQ201410375382
【公開日】2014年11月19日 申請(qǐng)日期:2014年7月31日 優(yōu)先權(quán)日:2014年7月31日
【發(fā)明者】吉建梅, 王學(xué)強(qiáng) 申請(qǐng)人:南京工程學(xué)院