專利名稱:一種控制語音通信的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及ー種控制語音通信的方法和系統(tǒng)。
背景技術(shù):
語音通信系統(tǒng)一般包括通信終端、傳輸網(wǎng)絡(luò)、交換機(jī)等基本単元,下面以無線移動(dòng)通信系統(tǒng)中的語音通信系統(tǒng)為例,對語音通信過程進(jìn)行介紹。無線移動(dòng)通信系統(tǒng)進(jìn)行語音通信的過程包括當(dāng)用戶發(fā)起呼叫請求后,主叫移動(dòng)臺(tái)首先通過隨機(jī)接入信道,向基站發(fā)出接入網(wǎng)絡(luò)的請求?;窘邮蘸?,根據(jù)廣播信道(BCCH)所發(fā)布的信道忙、閑信息,為用戶尋找出一條合適的業(yè)務(wù)信道(TCH);再通過尋呼信道(PCH)和允許接入信道(AGCH)去尋找該信道,找到后立即通知該移動(dòng)臺(tái)信道已經(jīng)分配。然后,基站將被叫用戶號(hào)碼,通過移動(dòng)通信網(wǎng)絡(luò)中的交換機(jī),傳輸給地面公用電話網(wǎng)絡(luò),找到被叫用戶的話機(jī);再經(jīng)振鈴、摘機(jī),完成了通信線路的建立。通信線路建立后,主叫移動(dòng)臺(tái)將語音信號(hào)變換成電信號(hào)傳輸?shù)揭苿?dòng)通信網(wǎng)絡(luò)中的基站,再由基站將代表語音的電信號(hào)變成電磁頻譜,通過移動(dòng)通信網(wǎng)絡(luò)中的交換機(jī)將電磁頻譜傳送到受話人的電信網(wǎng)絡(luò)中,受話人的通信設(shè)備接收到無線電波,轉(zhuǎn)換成語音信號(hào)。目前,語音通信系統(tǒng)在對語音通信進(jìn)行控制吋,通常采取的方法是,識(shí)別主叫用戶號(hào)碼或者被叫用戶號(hào)碼,根據(jù)識(shí)別結(jié)果控制語音通信,例如,屏蔽特定主叫用戶對某一被叫用戶的呼叫。然而,目前這種語音控制方法無法對語音通信實(shí)現(xiàn)精確控制,適用場景有限,遠(yuǎn)不能滿足當(dāng)前的通信需求。例如,目前電信詐騙類通話較多,由于詐騙源的用戶號(hào)碼無法事先獲知,因此無法通過現(xiàn)有的語音控制方法來控制電信詐騙類通話。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了ー種控制語音通信的方法和系統(tǒng),以便對語音通信實(shí)現(xiàn)精確控制。本發(fā)明的技術(shù)方案具體是這樣實(shí)現(xiàn)的ー種控制語音通信的方法,該方法包括提取語音通話內(nèi)容的語音特征;將所述語音特征與敏感詞庫中的語音樣本進(jìn)行匹配,根據(jù)匹配結(jié)果對語音通信進(jìn)行控制。ー種控制語音通信的系統(tǒng),該系統(tǒng)包括敏感詞庫、語音檢測模塊和控制模塊;所述敏感詞庫,用于存儲(chǔ)語音樣本;所述語音檢測模塊,用于提取語音通話內(nèi)容的語音特征,將所述語音特征與所述敏感詞庫中的語音樣本進(jìn)行匹配;所述控制模塊,用于根據(jù)所述語音檢測模塊的匹配結(jié)果對語音通信進(jìn)行控制。
由上述技術(shù)方案可見,本發(fā)明通過提取語音通話內(nèi)容的語音特征,將該語音特征與預(yù)先存儲(chǔ)的敏感詞庫中的語音樣本進(jìn)行匹配,根據(jù)匹配結(jié)果對語音通信進(jìn)行控制,可以實(shí)現(xiàn)對語音通話內(nèi)容的監(jiān)測,根據(jù)監(jiān)測到的語音通話內(nèi)容來對語音進(jìn)行控制,因而能夠?qū)φZ音通信實(shí)現(xiàn)精確控制。本發(fā)明的方法和系統(tǒng)可以適用于語音通信的任何場景,例如,對于電信詐騙類通話,可以通過在敏感詞庫中預(yù)先存儲(chǔ)電信詐騙類通話中出現(xiàn)頻率較高的語音樣本,然后如果某ー用戶開通了本發(fā)明方法或系統(tǒng)對應(yīng)的語音檢測服務(wù),則監(jiān)測其他用戶與該某ー用戶的語音通話內(nèi)容中是否出現(xiàn)了電信詐騙類通話中出現(xiàn)頻率較高的語音樣本,根據(jù)監(jiān)測結(jié)果進(jìn)行語音提醒等語音控制服務(wù)。
圖1是本發(fā)明提供的控制語音通信的方法流程圖。圖2是LVQ神經(jīng)網(wǎng)絡(luò)的組成示意圖。圖3是本發(fā)明提供的控制語音通信的系統(tǒng)組成示意圖。圖4是語音控制系統(tǒng)在移動(dòng)通信系統(tǒng)中的部署示意圖。
具體實(shí)施例方式圖1是本發(fā)明提供的控制語音通信的方法流程圖。如圖1所示,該方法包括步驟101,提取語音通話內(nèi)容的語音特征。步驟102,將所述語音特征與預(yù)先存儲(chǔ)的敏感詞庫中的語音樣本進(jìn)行匹配。步驟103,根據(jù)匹配結(jié)果對語音通信進(jìn)行控制。其中,所述敏感詞庫中存儲(chǔ)有敏感詞的語音樣本,根據(jù)應(yīng)用場景的不同,敏感詞庫中可以存儲(chǔ)有不同的語音樣本,也可以開辟不同的存儲(chǔ)空間分別存儲(chǔ)不同應(yīng)用場景下的語音樣本。例如,當(dāng)需要監(jiān)控電信詐騙類通話時(shí),可以在敏感詞庫中預(yù)先存儲(chǔ)電信詐騙類通話中出現(xiàn)頻率較高的語音樣本。在提取語音通話內(nèi)容的語音特征時(shí),為了提高語音特征提取的速度和準(zhǔn)確性,本發(fā)明提出,首先對采集的語音信號(hào)進(jìn)行端點(diǎn)檢測,剔除通話空白段的干擾,然后再提取語音特征,換言之,先從采集的語音信號(hào)中檢測出語音通話的起點(diǎn)和終點(diǎn),提取所述起點(diǎn)和所述終點(diǎn)之間的語音信號(hào)的語音特征。為了進(jìn)一歩提高語音特征提取的速度和準(zhǔn)確性,還可以進(jìn)行在語音特征提取之前進(jìn)行其他預(yù)處理,例如進(jìn)行降噪處理。本發(fā)明將語音特征與敏感詞庫中的語音樣本進(jìn)行匹配的方法可以為,將所述語音特征作為學(xué)習(xí)矢量量化(Learning Vector Quantization,LVQ)神經(jīng)網(wǎng)絡(luò)的輸入矢量,利用該LVQ網(wǎng)絡(luò)識(shí)別所述語音特征是否與所述語音樣本匹配。其中,所述LVQ神經(jīng)網(wǎng)絡(luò)是通過將所述敏感詞庫中的語音樣本作為輸入矢量進(jìn)行訓(xùn)練得到的。下面對LVQ神經(jīng)網(wǎng)絡(luò)在本發(fā)明中的應(yīng)用進(jìn)行詳細(xì)介紹圖2是LVQ神經(jīng)網(wǎng)絡(luò)的組成示意圖。
如圖2所示,LVQ神經(jīng)網(wǎng)絡(luò)由三層神經(jīng)元組成輸入層、隱含層和輸出層。LVQ神經(jīng)網(wǎng)絡(luò)在輸入層和隱含層間為完全連接,而在隱含層和輸出層間為部分連接,每個(gè)輸出神經(jīng)元與隱含層神經(jīng)元的不同組相連接。隱含層和輸出神經(jīng)元之間的連接權(quán)值為固定值1。輸入和隱含層間神經(jīng)元連接權(quán)值建立參考矢量的分量,每個(gè)隱含神經(jīng)元指定一個(gè)參考矢量。網(wǎng)絡(luò)訓(xùn)練時(shí),這些權(quán)值被修改。隱含神經(jīng)元和輸出神經(jīng)元都具有ニ進(jìn)制輸出值。當(dāng)某個(gè)輸入模型被輸入網(wǎng)絡(luò),參考矢量最接近輸入模式的隱含神經(jīng)元因獲得激發(fā)而贏得競爭,此隱含神經(jīng)元產(chǎn)生ー個(gè)‘1’,其他隱含神經(jīng)元被迫產(chǎn)生‘0’。與獲得競爭的隱含神經(jīng)元相連的輸出神經(jīng)元輸出也為1,因此獲得競爭,其他輸出神經(jīng)元均產(chǎn)生‘0’。每個(gè)輸出神經(jīng)元表示不同的模式或類別。本發(fā)明通過尋找LVQ神經(jīng)網(wǎng)絡(luò)的輸入/輸出關(guān)系建立自動(dòng)語音識(shí)別模型,具體流程如下(1)輸入矢量和目標(biāo)矢量設(shè)計(jì)設(shè)計(jì)ー組輸入矢量及輸入矢量對應(yīng)的目標(biāo)矢量,這兩組質(zhì)量直接決定網(wǎng)絡(luò)(定義為net)的輸入輸出關(guān)系,設(shè)計(jì)的優(yōu)劣直接影響語音識(shí)別的效果。具體地,本發(fā)明中,輸入矢量選取歸一化的敏感詞樣本特征參數(shù),目標(biāo)矢量根據(jù)敏感詞樣本數(shù)量進(jìn)行目標(biāo)矢量的設(shè)計(jì),盡量將不同目標(biāo)矢量設(shè)計(jì)為無關(guān)、正交。(2)網(wǎng)絡(luò)創(chuàng)建及訓(xùn)練創(chuàng)建網(wǎng)絡(luò)模型,設(shè)計(jì)初始化連接權(quán)值。用設(shè)計(jì)好的輸入矢量作為LVQ神經(jīng)網(wǎng)絡(luò)的輸入,目標(biāo)矢量作為LVQ神經(jīng)網(wǎng)絡(luò)的輸出來訓(xùn)練創(chuàng)建的LVQ神經(jīng)網(wǎng)絡(luò)。通過反復(fù)的訓(xùn)練,直到輸入矢量落入目標(biāo)分類對應(yīng)的矢量之中。終止訓(xùn)練一般是達(dá)到分類準(zhǔn)確度預(yù)定的閥值或訓(xùn)練的次數(shù)超限,其中在訓(xùn)練的次數(shù)超限時(shí)終止訓(xùn)練一般是出于網(wǎng)絡(luò)計(jì)算速度的考慮。(3)語音識(shí)別將待識(shí)別的語音樣本數(shù)據(jù)輸入訓(xùn)練好的LVQ神經(jīng)網(wǎng)絡(luò),LVQ神經(jīng)網(wǎng)絡(luò)根據(jù)決策功能對輸入數(shù)據(jù)進(jìn)行分類,輸出即為識(shí)別結(jié)果。具體地,本發(fā)明中,將從語音通話內(nèi)容中提取的語音特征作為輸入矢量,輸入到預(yù)先訓(xùn)練好的LVQ神經(jīng)網(wǎng)絡(luò),該LVQ神經(jīng)網(wǎng)絡(luò)對該語音特征進(jìn)行分類,即與敏感詞庫中的各個(gè)語音樣本進(jìn)行匹配,如果與某個(gè)語音樣本匹配,則將該語音特征屬于該語音樣本所屬的類別。采用LVQ神經(jīng)網(wǎng)絡(luò)進(jìn)行語音特征識(shí)別時(shí),可以不將語音特征組成的輸入矢量進(jìn)行歸ー化和正交化處理,只需要計(jì)算輸入矢量和競爭層之間的距離,即可實(shí)現(xiàn)語音識(shí)別。當(dāng)然,為了提高語音識(shí)別速度,優(yōu)選地,將語音特征參數(shù)進(jìn)行歸一化處理后再作為輸入矢量輸入LVQ神經(jīng)網(wǎng)絡(luò)。另外,為了進(jìn)一步提高LVQ神經(jīng)網(wǎng)絡(luò)進(jìn)行語音特征識(shí)別的速度,本發(fā)明還提出在
LVQ神經(jīng)網(wǎng)絡(luò)中采用
權(quán)利要求
1.ー種控制語音通信的方法,其特征在于,該方法包括 提取語音通話內(nèi)容的語音特征;將所述語音特征與敏感詞庫中的語音樣本進(jìn)行匹配,根據(jù)匹配結(jié)果對語音通信進(jìn)行控制。
2.根據(jù)權(quán)利要求1所述的方法,其特征在干,所述提取語音通話內(nèi)容的語音特征包括 從采集的語音信號(hào)中檢測出語音通話的起點(diǎn)和終點(diǎn),提取所述起點(diǎn)和所述終點(diǎn)之間的語音信號(hào)的語音特征。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,將所述語音特征與所述敏感詞庫中的語音樣本進(jìn)行匹配包括將所述語音特征作為學(xué)習(xí)矢量量化(LVQ)神經(jīng)網(wǎng)絡(luò)的輸入矢量,利用該LVQ網(wǎng)絡(luò)識(shí)別所述語音特征是否與所述語音樣本匹配;其中,所述LVQ神經(jīng)網(wǎng)絡(luò)是通過將所述敏感詞庫中的語音樣本作為輸入矢量進(jìn)行訓(xùn)練得到的。
4.根據(jù)權(quán)利要求3所述的方法,其特征在干,利用該LVQ網(wǎng)絡(luò)識(shí)別所述語音特征是否與所述語音樣本匹配包括將所述語音特征作為輸入矢量,輸入所述LVQ神經(jīng)網(wǎng)絡(luò)的傳輸函數(shù)
5.根據(jù)權(quán)利要求1所述的方法,其特征在干,所述根據(jù)匹配結(jié)果對語音通信進(jìn)行控制包括根據(jù)匹配成功的語音樣本個(gè)數(shù)、類型和內(nèi)容中的任意一項(xiàng)或多項(xiàng),按照預(yù)先設(shè)定的策略對語音通信進(jìn)行控制。
6.根據(jù)權(quán)利要求5所述的方法,其特征在干,所述按照預(yù)先設(shè)定的策略對語音通信進(jìn)行控制包括中斷所述語音通信、或進(jìn)行語音提醒、或屏蔽所述語音通信、或?qū)⑺稣Z音通信自動(dòng)轉(zhuǎn)接至指定號(hào)碼。
7.—種控制語音通信的系統(tǒng),其特征在干,該系統(tǒng)包括敏感詞庫、語音檢測模塊和控制模塊;所述敏感詞庫,用于存儲(chǔ)語音樣本;所述語音檢測模塊,用于提取語音通話內(nèi)容的語音特征,將所述語音特征與所述敏感詞庫中的語音樣本進(jìn)行匹配;所述控制模塊,用于根據(jù)所述語音檢測模塊的匹配結(jié)果對語音通信進(jìn)行控制。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在干,所述語音檢測模塊包括端點(diǎn)檢測單元、語音特征提取単元和識(shí)別單元;所述端點(diǎn)檢測單元,用于從采集的語音信號(hào)中檢測出語音通話的起點(diǎn)和終點(diǎn); 所述語音特征提取単元,用于提取所述起點(diǎn)和所述終點(diǎn)之間的語音信號(hào)的語音特征; 所述識(shí)別単元,用于將所述語音特征與所述敏感詞庫中的語音樣本進(jìn)行匹配。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在干,所述識(shí)別単元包括LVQ神經(jīng)網(wǎng)絡(luò),用于以所述語音特征為輸入矢量,識(shí)別所述語音特征是否與所述敏感詞庫中的語音樣本匹配;其中,所述LVQ神經(jīng)網(wǎng)絡(luò)是通過將所述敏感詞庫中的語音樣本作為輸入矢量進(jìn)行訓(xùn)練得到的。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在干,所述LVQ神經(jīng)網(wǎng)絡(luò)將所述語音特征作為輸入矢量,輸入傳輸函數(shù)
11.根據(jù)權(quán)利要求7至10任ー權(quán)利要求所述的系統(tǒng),其特征在干,所述控制模塊,用于根據(jù)成功的語音樣本個(gè)數(shù)、類型和內(nèi)容中的任意一項(xiàng)或多項(xiàng),按照預(yù)先設(shè)定的策略對語音通信進(jìn)行控制。
12.根據(jù)所述權(quán)利要求11所述的系統(tǒng),其特征在干,所述控制模塊,用于中斷所述語音通信、或進(jìn)行語音提醒、或屏蔽所述語音通信、或?qū)⑺稣Z音通信自動(dòng)轉(zhuǎn)接至指定號(hào)碼。
全文摘要
本發(fā)明實(shí)施例公開了一種控制語音通信的方法和系統(tǒng)。該方法包括預(yù)先存儲(chǔ)敏感詞庫,該敏感詞庫中存儲(chǔ)有語音樣本;提取語音通話內(nèi)容的語音特征;將所述語音特征與所述敏感詞庫中的語音樣本進(jìn)行匹配,根據(jù)匹配結(jié)果對語音通信進(jìn)行控制。應(yīng)用本發(fā)明能夠?qū)φZ音通信實(shí)現(xiàn)精確控制。
文檔編號(hào)H04W12/12GK102572839SQ20101060306
公開日2012年7月11日 申請日期2010年12月14日 優(yōu)先權(quán)日2010年12月14日
發(fā)明者吳鳳輝, 溫健軍 申請人:中國移動(dòng)通信集團(tuán)四川有限公司