1.一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別方法,其特征在于,包括:
背景噪聲特征提取步驟,用于提取待測語音信號前預(yù)設(shè)時(shí)段語音信號的功率譜特征作為背景噪聲能量特征值;
靜音段特征提取步驟,用于從待測語音信號中劃分出靜音段并計(jì)算靜音段語音幀的平均功率譜特征值作為待測信號靜音段特征值;
語音回放判斷步驟,用于將背景噪聲能量特征值與待測信號靜音段特征值進(jìn)行比較,若兩者特征變化超過閾值,則判斷為錄音回放。
2.根據(jù)權(quán)利要求1所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別方法,其特征在于,所述背景噪聲特征提取步驟中,基于以下步驟計(jì)算背景環(huán)境噪聲段終止時(shí)間:
(1)對于說話人開始發(fā)聲點(diǎn)Tv處,前移一小段時(shí)間至t時(shí)刻,計(jì)算t-△t到t+△t之間的平均強(qiáng)度Pt,其中,△t為預(yù)先設(shè)定的時(shí)間變化量,可根據(jù)使用環(huán)境與需求人工設(shè)定;
(2)然后選擇一步幅s,計(jì)算t-s-△t到t-s+△t的平均強(qiáng)度Pt-s,比較Pt和Pt-s的差的絕對值是否小于預(yù)先給定的閾值;
(3)若Pt和Pt-s之間差的絕對值大于閾值,則表明臨界點(diǎn)在t-s和t之間,即可以t-s為背景環(huán)境噪聲臨界點(diǎn)的終止時(shí)刻;
(4)若Pt和Pt-s之間差的絕對值小于閾值,則表明從t-s到t時(shí)間段內(nèi),噪聲強(qiáng)度沒有發(fā)生明顯變化,即表征沒有找到臨界點(diǎn)或臨界點(diǎn)不存在,則繼續(xù)以步幅s從t-s開始向前移動,重復(fù)步驟(2);
(5)若進(jìn)過ns步后,仍未找到臨界點(diǎn),則表明在t-ns到t時(shí)間段內(nèi),環(huán)境噪聲無明顯變化,則以Pt表示背景噪聲強(qiáng)度,其中n為經(jīng)驗(yàn)系數(shù),預(yù)先設(shè)定。
3.根據(jù)權(quán)利要求1所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別方法,其特征在于,所述靜音段特征提取步驟中,靜音段劃分采用臨界平均能量閾值的方式,通過對整段待測語音信號平均能量的計(jì)算,同時(shí)加入調(diào)整系數(shù),來判斷某語音幀是否處于靜音段。
4.根據(jù)權(quán)利要求1所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別方法,其特征在于,所述靜音段特征提取步驟中,將原始語音段減去經(jīng)維納斯濾波后的語音得到的噪聲部分作為無說話人語音的靜音段。
5.根據(jù)權(quán)利要求1所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別方法,其特征在于,所述語音回放判斷步驟中,若背景噪聲強(qiáng)度和待測語音噪聲強(qiáng)度的絕對值差小于設(shè)定的閾值,則判斷兩者具有相同的噪聲源,即判定待測語音為真實(shí)說話人語音;若背景噪聲強(qiáng)度和猜測語音噪聲強(qiáng)度的絕對值大于閾值,則采用自適應(yīng)濾波和譜減法結(jié)合的方式再次提取無說話人語音的靜音段;然后比較分析背景噪聲強(qiáng)度和待測語音噪聲強(qiáng)度。
6.根據(jù)權(quán)利要求1所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別方法,其特征在于,還包括:
閾值調(diào)整步驟,用于采用時(shí)序閾值優(yōu)化和/或監(jiān)督學(xué)習(xí)閾值法對語音回放判斷步驟中的閾值進(jìn)行調(diào)整;其中,時(shí)序閾值優(yōu)化基于檢測時(shí)所處的時(shí)段調(diào)整閾值選取方案;監(jiān)督學(xué)習(xí)閾值優(yōu)化通過人工設(shè)定樣本,經(jīng)過多次重復(fù)測試及結(jié)果反饋,更新閾值大小。
7.一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別裝置,其特征在于,包括:
背景噪聲特征提取模塊,用于提取待測語音信號前預(yù)設(shè)時(shí)段語音信號的功率譜特征作為背景噪聲能量特征值;
靜音段特征提取模塊,用于從待測語音信號中劃分出靜音段并計(jì)算靜音段語音幀的平均功率譜特征作為待測信號靜音段特征值;
語音回放判斷模塊,用于將背景噪聲能量特征值與待測信號靜音段特征值進(jìn)行比較,若兩者特征變化超過閾值,則判斷為錄音回放。
8.根據(jù)權(quán)利要求7所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別模塊,其特征在于,所述靜音段特征提取模塊中,靜音段劃分采用臨界平均能量閾值的方式,通過對整段待測語音信號平均能量的計(jì)算,同時(shí)加入調(diào)整系數(shù),來判斷某語音幀是否處于靜音段。
9.根據(jù)權(quán)利要求7所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別模塊,其特征在于,所述靜音段特征提取模塊中,將原始語音段減去維納斯濾波后的語音后得到的噪聲部分作為無說話人語音的靜音段。
10.根據(jù)權(quán)利要求7所述的一種基于環(huán)境噪聲變化檢測的說話人錄音回放鑒別模塊,其特征在于,所述語音回放判斷模塊中,若背景噪聲強(qiáng)度和待測語音噪聲強(qiáng)度的絕對值差小于設(shè)定的閾值,則判斷兩者具有相同的噪聲源,即判定待測語音為真實(shí)說話人語音;若背景噪聲強(qiáng)度和猜測語音噪聲強(qiáng)度的絕對值大于閾值,則采用自適應(yīng)濾波和譜減法結(jié)合的方式提取無說話人語音的靜音段;再次比較分析背景噪聲強(qiáng)度和待測語音噪聲強(qiáng)度。