語音監(jiān)控方法及裝置制造方法
【專利摘要】本發(fā)明提供一種語音監(jiān)控方法及裝置,涉及語音信號處理【技術(shù)領(lǐng)域】。該方法包括:S1、獲取電話的語音數(shù)據(jù),提取語音數(shù)據(jù)的語音特征;S2、進行說話人跳變檢測,將語音特征按兩個說話人進行分離,得到兩類分離的語音特征;S3、對于分離的每一類語音特征,判斷是否存在與之匹配的詐騙分子的說話人模型,如為是,則判定存在詐騙份子;如為否,則執(zhí)行步驟S4;S4、檢測所述分離的語音特征中是否存在預(yù)先設(shè)置的詐騙行為相關(guān)的關(guān)鍵詞,如果存在至少一個關(guān)鍵詞,則判定存在詐騙行為,訓(xùn)練該詐騙分子的說話人模型,并保存該詐騙分子的說話人模型;否則,判定不存在詐騙行為。本發(fā)明實現(xiàn)電話環(huán)境下對詐騙分子自動進行監(jiān)控,節(jié)約了公安系統(tǒng)的打擊電信詐騙的成本。
【專利說明】語音監(jiān)控方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音信號處理【技術(shù)領(lǐng)域】,具體涉及一種語音監(jiān)控方法及裝置。
【背景技術(shù)】
[0002]近年來,我國電信詐騙案件呈高發(fā)態(tài)勢,已演變成為一個突出的社會治安問題。盡管公安機關(guān)在打擊和防范電信詐騙犯罪上投入了大量的人力物力,但此類犯罪組織嚴(yán)密,分工明確,大多屬于跨區(qū)域、跨境作案,其智能化、科技化程度高,作案隱蔽,反偵查能力強。這使得偵破此類案件面臨著極大的困難。
[0003]為了有效應(yīng)對,一方面需要全國警力的有效協(xié)作,另一方面需要更為有效的高科技手段。由于此類犯罪主要以電話為媒體進行犯罪,留下的語音線索最多,目前公安機關(guān)對此類犯罪的偵破還主要依靠傳統(tǒng)手段,諸如受騙人舉報,警察四處盤查等方式;也采用電話監(jiān)控方式。
[0004]現(xiàn)行在電話監(jiān)控方面智能化程度很低,幾乎完全靠人力聽辨完成。這種措施只有詐騙行為被確定后才有可能實施,而且耗費大量人力物力,無法在犯罪行為發(fā)生時就掌握所有情況;這也使得公安系統(tǒng)的打擊效果大打折扣。
【發(fā)明內(nèi)容】
[0005](一)解決的技術(shù)問題
[0006]針對現(xiàn)有技術(shù)的不足,本發(fā)明提供一種語音監(jiān)控方法及裝置,能夠由系統(tǒng)自動實現(xiàn)電話監(jiān)控。
[0007](二)技術(shù)方案
[0008]為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):
[0009]一種語音監(jiān)控方法,包含以下步驟:
[0010]S1、獲取電話的語音數(shù)據(jù),提取所述語音數(shù)據(jù)的語音特征;
[0011]S2、進行說話人跳變檢測,將所述語音特征按兩個說話人進行分離,得到兩類分離的語音特征;
[0012]S3、對于分離的每一類語音特征,判斷是否存在與之匹配的詐騙分子的說話人模型,如為是,則判定存在詐騙份子;如為否,則執(zhí)行步驟S4 ;
[0013]S4、檢測所述分離的語音特征中是否存在預(yù)先設(shè)置的詐騙行為相關(guān)的關(guān)鍵詞,如果存在至少一個關(guān)鍵詞,則判定存在詐騙行為,訓(xùn)練該詐騙分子的說話人模型,并保存該詐騙分子的說話人模型;否則,判定不存在詐騙行為。
[0014]優(yōu)選的,步驟SI中包含步驟:
[0015]S11、對所述獲取的電話語音數(shù)據(jù)進行預(yù)處理;
[0016]S12、對預(yù)處理過后的電話語音數(shù)據(jù)作離散傅立葉變換,求得功率譜;
[0017]S13、基于梅爾濾波器組求得所述功率譜的梅爾倒譜系數(shù);
[0018]S14、計算所述梅爾倒譜系數(shù)的一階差分和二階差分,將所述一階差分和二階差分的系數(shù)與所述梅爾倒譜系數(shù)拼接,形成語音特征。
[0019]優(yōu)選的,步驟Sll中的預(yù)處理包括分幀操作和加窗操作;
[0020]其中,加窗操作采用的窗函數(shù)為漢明窗,表達式w(n)為:
[0021]
【權(quán)利要求】
1.一種語音監(jiān)控方法,其特征在于,包含以下步驟: 51、獲取電話的語音數(shù)據(jù),提取所述語音數(shù)據(jù)的語音特征; 52、進行說話人跳變檢測,將所述語音特征按兩個說話人進行分離,得到兩類分離的語首特征; 53、對于分離的每一類語音特征,判斷是否存在與之匹配的詐騙分子的說話人模型,如為是,則判定存在詐騙份子;如為否,則執(zhí)行步驟S4 ; 54、檢測所述分離的語音特征中是否存在預(yù)先設(shè)置的詐騙行為相關(guān)的關(guān)鍵詞,如果存在至少一個關(guān)鍵詞,則判定存在詐騙行為,訓(xùn)練該詐騙分子的說話人模型,并保存該詐騙分子的說話人模型;否則,判定不存在詐騙行為。
2.如權(quán)利要求1所述的一種語音監(jiān)控方法,其特征在于,步驟SI中包含步驟: 511、對所述獲取的電話語音數(shù)據(jù)進行預(yù)處理; 512、對預(yù)處理過后的電話語音數(shù)據(jù)作離散傅立葉變換,求得功率譜; 513、基于梅爾濾波器組求得所述功率譜的梅爾倒譜系數(shù); 514、計算所述梅爾倒譜系數(shù)的一階差分和二階差分,將所述一階差分和二階差分的系數(shù)與所述梅爾倒譜系數(shù)拼接,形成語音特征。
3.如權(quán)利要求2所述的語音監(jiān)控方法,其特征在于, 步驟Sll中的預(yù)處理包括分幀操作和加窗操作; 其中,加窗操作采用的窗函數(shù)為漢明窗,表達式W(η)為:
4.如權(quán)利要求1所述的語音監(jiān)控方法,其特征在于,步驟S2中進行說話人跳變檢測的方法為:采用k-均值聚類法將語音特征分為兩類,然后對各幀語音進行分類;當(dāng)語音從一個說話人過渡到另一個說話人時,則說話人發(fā)生了跳變; 其中,k-均值聚類法包括以下步驟: 521、假定語音特征為F= If1, f2,...,fM},其中M為幀序號; 522、從F中任意選擇2幀語音數(shù)據(jù)作為類別均值,得到兩類類別均值; 523、采用歐式距離計算F中每幀語音特征與這兩類類別均值的距離,并根據(jù)最小距離重新對F中的語音特征進行分類; 524、對重新分類的結(jié)果,再次計算類別均值; 525、循環(huán)S23到S24直到兩類類別均值不再發(fā)生變化為止; 526、對于幀序號為M以后的語音數(shù)據(jù),計算其與兩個類別均值的距離,并將其分類到距離它最近的一個類別上。
5.如權(quán)利要求1所述的語音監(jiān)控方法,其特征在于,步驟S3中判斷是否存在與之匹配的詐騙分子的說話人模型包含以下步驟: s31、假定登記在冊的詐騙分子有N個,每個人的語音用一個高斯混合模型建模,分別為A1, λ2,...,λ Ν,在識別階段,輸入的觀測特征矢量序列為O= {0ι,02,...,0τ},Τ為輸入語音的幀數(shù); s32、計算說話人為第η個詐騙分子的后驗概率,I^η^Ν; s3s s34、根據(jù)所述預(yù)判結(jié)果得到最終的判決結(jié)果。
6.如權(quán)利要求5所述的語音監(jiān)控方法,其特征在于, 步驟S32中的計算后驗概率表達式為:
7.如權(quán)利要求1所述的語音監(jiān)控方法,其特征在于,步驟S4中的采用高斯混合模型來為訓(xùn)練詐騙分子的說話人建模,M階高斯混合模型的概率密度函數(shù)如下:
8.如權(quán)利要求1所述的語音監(jiān)控方法,其特征在于,步驟S3中判定存在詐騙行為后進一步包括更新詐騙記錄的步驟;步驟S4中保存該詐騙分子的說話人模型后進一步包括:登記詐騙分子,更新詐騙記錄的步驟。
9.如權(quán)利要求8所述的語音監(jiān)控方法,其特征在于,更新的詐騙記錄包括詐騙者編號、詐騙時間、說話人模型編號、所用號碼和受騙者號碼。
10.一種語音監(jiān)控裝置,其特征在于,包含以下模塊: 提取語音特征模塊,獲取電話的語音數(shù)據(jù),提取所述語音數(shù)據(jù)的語音特征; 說話人跳變檢測模塊,進行說話人跳變檢測,將所述語音特征按兩個說話人進行分離,得到兩類分離的語音特征; 語音特征識別模塊,對于分離的每一類語音特征,判斷是否存在與之匹配的詐騙分子的說話人模型,如為是,則判定存在詐騙份子;如為否,則執(zhí)行語音特征檢測模塊; 語音特征檢測模塊,檢測所述分離的語音特征中是否存在預(yù)先設(shè)置的詐騙行為相關(guān)的關(guān)鍵詞,如果存在至少一個關(guān)鍵詞,則判定存在詐騙行為,訓(xùn)練該詐騙分子的說話人模型,并保存該詐騙分子的說話人模型;否則,判定不存在詐騙行為。
【文檔編號】G10L25/51GK103971700SQ201310332075
【公開日】2014年8月6日 申請日期:2013年8月1日 優(yōu)先權(quán)日:2013年8月1日
【發(fā)明者】何勇軍, 孫廣路, 謝怡寧, 劉嘉輝 申請人:哈爾濱理工大學(xué)