專利名稱:垃圾語音過濾的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)語音通信領(lǐng)域,特別涉及一種垃;及語音過濾的方法、 一種垃圾語音過濾的系統(tǒng)、 一種語音郵件系統(tǒng)及一種基于信令交互的垃 圾語音過濾裝置。
背景技術(shù):
為充分利用資源、降低運營成本、豐富業(yè)務(wù)樣式,使得用戶無論在固定還是移動環(huán)境中,都可以享受同樣的服務(wù),F(xiàn)MC (Fixed Mobile Convergence,固定與移動網(wǎng)絡(luò)融合)目前已成為網(wǎng)絡(luò)發(fā)展的必然趨勢。 FMC是指網(wǎng)絡(luò)的業(yè)務(wù)提供與接入技術(shù)和終端設(shè)備相獨立。從用戶角度看, FMC的目的是使用戶通過不同接入網(wǎng)絡(luò),享受相同的服務(wù),獲得相同的 業(yè)務(wù)。其主要特征是用戶訂閱的業(yè)務(wù)與接入點和終端無關(guān),也就是允許 用戶從固定或移動終端通過任何合適的接入點使用同一業(yè)務(wù)。FMC可以 使得用戶在一個終端、 一個帳號的前提下,在辦公室或家里使用固定網(wǎng) 絡(luò)進(jìn)行通信,而在戶外,則通過無線/移動網(wǎng)絡(luò)進(jìn)行通信。FMC同時也包 含了這樣一個概念,就是在固定網(wǎng)絡(luò)和移動網(wǎng)絡(luò)之間,終端能夠無縫漫 游。對于用戶而言,這也意味著簡單和方l更。在FMC的這種大趨勢下,具有實現(xiàn)簡單、擴(kuò)展性好、多媒體會話提 供能力強等特點的SIP協(xié)議(Session Initiation Protocol,會話初始協(xié)議) 成為了當(dāng)前應(yīng)用的主流。SIP協(xié)議是基于IP的一個應(yīng)用層控制協(xié)議,也 是一個基于純文本的信令協(xié)議,可以管理不同接入網(wǎng)絡(luò)上的會晤等。會 晤可以是終端設(shè)備之間任何類型的通信,如視頻會晤、即時信息處理或 協(xié)作會晤等。支持SIP協(xié)議的網(wǎng)絡(luò)將提供一個網(wǎng)橋,以擴(kuò)展向互聯(lián)網(wǎng)和無 線網(wǎng)絡(luò)的各種設(shè)備提供融合業(yè)務(wù)能力。這將允許運營商為其移動用戶提 供大量的信息處理業(yè)務(wù),通過SMS互通能力與固定用戶和2G無線用戶 交互。SIP也是在UMTS3GPP R5/R6版本中使用的信令協(xié)議,因此可以 保護(hù)運營商目前的投資而極具技術(shù)優(yōu)勢和商業(yè)價值。然而,由于SIP協(xié)議在設(shè)計之初缺乏完善的安全機制,導(dǎo)致垃圾語音信息(Spam over Internet Telephony, SPIT)作為一種非預(yù)期的語音發(fā)送 行為,成為基于SIP協(xié)議的應(yīng)用中(如VoIP, (Voice over IP,基于IP的 語音技術(shù))) 一種重要的安全威脅。一種常見的SPIT攻擊方式為,通過偽造和篡改發(fā)送方URI的方式對 被叫方實施攻擊。現(xiàn)有技術(shù)中,通常采用"黑名單"和/或"白名單"的垃圾 語音防護(hù)機制,即每次接收到語音呼叫,則提取該呼叫用戶URI,如果 該呼叫用戶URI屬于"黑名單"的用戶列表,則阻止該語音呼叫;如果該 呼叫用戶URI屬于"白名單"的用戶列表,則接收該語音呼叫。但這種黑/ 白名單機制存在的缺點在于不能正確鑒別首次出現(xiàn)的呼叫用戶,即"黑 名單"機制的采用不能對一些首次呼叫的垃圾語音信息進(jìn)行過濾;而"白名 單"機制對于首次呼叫的IP語音用戶會造成應(yīng)用上的困難;如果垃圾語音 攻擊者通過偽造或篡改發(fā)送方URI的方式,4吏當(dāng)前URI發(fā)生改變,成為 首次呼叫的用戶,則很容易達(dá)到實施攻擊的目的,所以,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是如 何能夠創(chuàng)新的提出一種垃圾語音的過濾機制,用以簡單、實時、準(zhǔn)確地 進(jìn)行垃圾語音過濾,有效避免非黑/白名單用戶首次呼叫的攻擊,提高應(yīng) 用SIP協(xié)議的業(yè)務(wù)安全性。發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種垃圾語音的過濾方法及系 統(tǒng),用以簡單、實時、準(zhǔn)確地進(jìn)行垃圾語音過濾,有效避免非黑/白名單 用戶首次呼叫的攻擊,提高應(yīng)用SIP協(xié)議的業(yè)務(wù)安全性。本發(fā)明還提供了一種語音郵件系統(tǒng)和一種基于信令交互的垃圾語音 過濾裝置,用以保證上述方法及裝置在實際中的實現(xiàn)及應(yīng)用。為解決上述技術(shù)問題,本發(fā)明實施例公開了 一種垃圾語音的過濾方 法,包括獲取語音數(shù)據(jù)包,提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信息; 若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中不 存在匹配項,則獲取所述語音數(shù)據(jù)包的聲紋特征;將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹配,若存在匹配項,則將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中;否則,對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。優(yōu)選的,所述獲取語音數(shù)據(jù)包為接收并緩存語音數(shù)據(jù)包,所述的方法還包括將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語音數(shù)據(jù)包,從緩 存轉(zhuǎn)移至接收方。優(yōu)選的,所述獲取語音數(shù)據(jù)包的步驟包括接收方向發(fā)送方發(fā)起語 音數(shù)據(jù)獲耳又請求,發(fā)送方依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 所述的方法還包括所述接收方接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語音數(shù)據(jù)包。 優(yōu)選的,所述獲取語音數(shù)據(jù)包的步驟還包括接收方在向發(fā)送方發(fā) 起語音數(shù)據(jù)獲取請求的同時啟動計時程序,監(jiān)控是否超過預(yù)置時間閾值; 所述的方法還包括若超過預(yù)置時間閾值,則將所述發(fā)送方標(biāo)識信息添加至所述黑名單 數(shù)據(jù)庫中。優(yōu)選的,所述的方法,還包括依據(jù)接收方的垃圾語音鑒別信息將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo) 識信息添加至黑名單數(shù)據(jù)庫或白名單數(shù)據(jù)庫。 優(yōu)選的,所述的方法,還包括提取所述黑名單數(shù)據(jù)庫中發(fā)送方所發(fā)語音數(shù)據(jù)包的聲紋特征,添加 至垃圾語音聲紋特征庫。優(yōu)選的,所述語音數(shù)據(jù)包的獲取為從VoIP網(wǎng)絡(luò)中實時獲取。 優(yōu)選的,所述的方法,還包括所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息形成灰名單數(shù)據(jù)庫。 優(yōu)選的,所述的方法,還包括若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫存在匹配項,則過濾所 述語音數(shù)據(jù)包;若所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹配項,則接收所 述語音數(shù)據(jù)包。本發(fā)明實施例還公開了 一種垃圾語音的過濾系統(tǒng),所述過濾系統(tǒng)包 括用于存儲黑名單用戶標(biāo)識信息的黑名單數(shù)據(jù)庫、用于存儲白名單用戶 標(biāo)識信息的白名單數(shù)據(jù)庫、以及用于存儲垃圾語音聲紋特征的垃圾語音聲紋特征庫,所述的過濾系統(tǒng)還包括語音數(shù)據(jù)獲取單元,用于獲取語音數(shù)據(jù)包;發(fā)送方標(biāo)識提取單元,用于提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信白 匹配單元,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項;聲紋特征提取單元,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù) 庫和白名單數(shù)據(jù)庫中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;聲紋特征匹配單元,用于將所述聲紋特征在所述垃圾語音聲紋特征 庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加單元;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識單元;黑名單添加單元,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù) 據(jù)庫中;灰名單標(biāo)識單元,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。優(yōu)選的,所述語音數(shù)據(jù)獲取單元包括用于接收并緩存語音數(shù)據(jù)包的 緩存子單元,所述系統(tǒng)還包括轉(zhuǎn)移單元,用于將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語 音數(shù)據(jù)包,從緩存轉(zhuǎn)移至接收方。優(yōu)選的,所述語音數(shù)據(jù)獲取單元包括接收方請求子單元,用于向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求;發(fā)送方發(fā)送子單元,用于依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包;所述的系統(tǒng)還包括接收方接收單元,用于接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語 音數(shù)據(jù)包。優(yōu)選的,所述語音數(shù)據(jù)獲取單元還包括計時子單元,用于在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計 時器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則觸發(fā)黑名單添加單元。優(yōu)選的,所述的系統(tǒng),還包括數(shù)據(jù)庫更新單元,用于依據(jù)接收方的垃圾語音鑒別信息,將所述具 有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息添加至黑名單數(shù)據(jù)庫或白名單數(shù)據(jù)庫。 優(yōu)選的,所述的系統(tǒng),還包括聲紋特征庫添加單元,用于提取所述黑名單數(shù)據(jù)庫中發(fā)送方所發(fā)語 音數(shù)據(jù)包的聲紋特征,添加至垃圾語音聲紋特征庫。 優(yōu)選的,所述的系統(tǒng),還包括灰名單數(shù)據(jù)庫,用于存儲所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息。 優(yōu)選的,所述的系統(tǒng),還包括過濾單元,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫存在匹 配項時,過濾所述語音數(shù)據(jù)包;保留單元,用于在所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹 配項時,接收所述語音數(shù)據(jù)包。優(yōu)選的,所述系統(tǒng)位于服務(wù)器端或客戶端。本發(fā)明實施例還公開了一種語音郵件系統(tǒng),包括接口判斷模塊,用于接收并緩存語音郵件,并判斷所述語音郵件的 發(fā)送方是否為新用戶,若是,則觸發(fā)垃圾語音過濾組件;所述垃圾語音過濾組件包括發(fā)送方標(biāo)識提取模塊,用于提取所述語音郵件中的發(fā)送方標(biāo)識信息; 匹配模塊,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單用戶列表和白名單用戶列表中是否存在匹配項;聲紋特征提取模塊,用于在所述發(fā)送方標(biāo)識信息在所述黑名單用戶列表和白名單用戶列表中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;聲紋特征匹配模塊,用于將所述聲紋特征在所述垃圾語音聲紋特征 庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加模塊;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識模塊;黑名單添加模塊,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單用 戶列表中;灰名單標(biāo)識模塊,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。 優(yōu)選的,所述的系統(tǒng)還包括老用戶郵件處理組件,所述老用戶郵件處理組件包括鑒別模塊,用于在所述接口判斷模塊判斷所述語音郵件的發(fā)送方為 老用戶時,鑒別所述老用戶發(fā)送的語音郵件是否為垃圾郵件;如果是, 則觸發(fā)所述黑名單添加模塊和聲紋特征庫添加模塊;如果否,則觸發(fā)白 名單添加模塊;聲紋特征庫添加模塊,用于提取所述老用戶所發(fā)語音數(shù)據(jù)包的聲紋 特征,添加至垃圾語音聲紋特征庫。白名單添加模塊,用于將所述老用戶的標(biāo)識信息添加至所述白名單 用戶列表中。優(yōu)選的,所述的系統(tǒng),還包括轉(zhuǎn)移模塊,用于將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語 音數(shù)據(jù)包,從緩存轉(zhuǎn)移至郵件接收方。本發(fā)明實施例還公開了 一種基于信令交互的垃圾語音過濾裝置,包括接收方請求模塊,用于向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求; 發(fā)送方發(fā)送模塊,用于依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 發(fā)送方標(biāo)識提取模塊,用于提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信臺 匹配模塊,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白 名單數(shù)據(jù)庫中是否存在匹配項;聲紋特征提取模塊,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù) 庫和白名單數(shù)據(jù)庫中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;聲紋特征匹配單元,用于將所述聲紋特征在所述垃圾語音聲紋特征 庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加單元;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識單元;黑名單添加單元,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù) 據(jù)庫中;灰名單標(biāo)識單元,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。12優(yōu)選的,所述的裝置,還包括計時子單元,用于在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計 時器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則觸發(fā)黑名單添加單元。優(yōu)選的,所述的裝置,還包括接收方接收單元,用于接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語 音數(shù)據(jù)包。與現(xiàn)有技術(shù)相比,本發(fā)明實施例具有以下優(yōu)點首先,本發(fā)明通過對既不屬于黑名單用戶,也不屬于白名單用戶的 發(fā)送方所發(fā)送的語音數(shù)據(jù)包進(jìn)行聲紋檢測,判斷是否為垃圾語音,從語 音內(nèi)容上對垃圾語音進(jìn)行防范,提高垃圾語音的識別率,并能避免垃圾 語音消息語義級別翻譯所造成的復(fù)雜度,獲得了實時的效果。再者,本發(fā)明利用聲紋特征的唯一性進(jìn)行垃圾語音識別,能夠有效 防止基于身份偽造和篡改的垃圾語音攻擊,具有更普遍的適用性和有效 性。此外,本發(fā)明的垃圾語音過濾可以在接收方接收語音數(shù)據(jù)包前過濾, 也可以在接收方接收語音數(shù)據(jù)包后過濾,可以適用于實際中的各種應(yīng)用 情形,具有很好的通用性。最后,本發(fā)明對于服務(wù)提供商來說,技術(shù)實現(xiàn)簡單,無技術(shù)障礙, 無特殊保密算法,成本和風(fēng)險較低。
圖1是本發(fā)明的一種垃圾語音的過濾方法實施例1的流程圖;.圖2是本發(fā)明的一種垃圾語音的過濾方法實施例2的流程圖;圖3是本發(fā)明的一種垃圾語音的過濾方法實施例3的流程圖;圖4是本發(fā)明的一種垃圾語音的過濾方法實施例4的流程圖;圖5是本發(fā)明的一種垃圾語音的過濾系統(tǒng)實施例1的結(jié)構(gòu)框圖;圖6是本發(fā)明的 一 種語音郵件系統(tǒng)實施例的結(jié)構(gòu)框圖;圖7是應(yīng)用圖6所示的優(yōu)選實施例進(jìn)行郵件處理的流程圖;圖8是本發(fā)明的一種基于信令交互的垃圾語音過濾裝置實施例的結(jié)構(gòu)框圖;圖9是應(yīng)用圖8所示的優(yōu)選實施例進(jìn)行垃圾語音過濾的流程圖。
具體實施方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合 附圖和具體實施方式
對本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如個 人計算機、服務(wù)器計算機、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處 理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費電子設(shè)備、網(wǎng) 絡(luò)PC、小型計算機、大型計算機、包括以上任何系統(tǒng)或設(shè)備的分布式計 算環(huán)境等等。本發(fā)明可以在由計算機執(zhí)行的計算機可執(zhí)行指令的 一般上下文中描 述,例如程序模塊。 一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽 象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布 式計算環(huán)境中實踐本發(fā)明,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡(luò) 而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊 可以位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機存儲介質(zhì)中。本發(fā)明實施例的核心構(gòu)思之一在于,將IP語音的聲紋特征過濾方式 與改進(jìn)的黑白名單控制機制相結(jié)合,來完成語音數(shù)據(jù)包的分類和處理。 設(shè)計核心在于,在發(fā)送方既不屬于黑名單用戶,也不屬于白名單用戶的 情況下,采用對其語音信息通過聲紋特征提取及匹配的方法,對垃圾語 音進(jìn)行過濾,從垃圾語音的內(nèi)容程度上對其進(jìn)行防范。從而避免垃圾語 音消息語義級別翻譯所造成的復(fù)雜度,達(dá)到實時的效果。且利用聲紋特 征的唯一性,能夠有效防止基于身份偽造和篡改的垃圾語音攻擊,因此 具有更普遍的適用性和有效性。參考圖1,示出了本發(fā)明的一種垃圾語音的過濾方法實施例1的流程 圖,可以包括以下步驟步驟IOI、獲取語音數(shù)據(jù)包,提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信息;步驟102、若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù) 據(jù)庫中不存在匹配項,則獲取所述語音數(shù)據(jù)包的聲紋特征;
步驟103、將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹 配,若存在匹配項,則執(zhí)行步驟104;若不存在匹配項,則執(zhí)行步驟105;
步驟104、將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中;
步驟105、對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。
由于網(wǎng)絡(luò)上可用的每種資源,例如,HTML文檔、圖像、視頻片段、 程序等,都可以通過一個通用資源標(biāo)志符(Universal Resource Identifier, URI)進(jìn)行定位,因而所述標(biāo)識信息可以為URI。在這種情況下,所述黑 名單數(shù)據(jù)庫與白名單數(shù)據(jù)庫可以由黑名單URI列表或白名單URI列表構(gòu) 成。在判斷發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是 否存在匹配項時,則可以判斷郵件發(fā)送者的URI,是否全部或部分與黑 名單URI列表和白名單URI列表中的某個URI匹配,如果是,則為存在 匹配項;否則為不存在匹配項。當(dāng)然,以上但J叉作為一種示例,本領(lǐng)i或 技術(shù)人員采用任一種用戶標(biāo)識信息按照任一 匹配規(guī)則進(jìn)行處理都是可行 的,本發(fā)明對此無需作出限定。
如果發(fā)送方的標(biāo)識信息在黑名單數(shù)據(jù)庫中不存在匹配項,在白名單 數(shù)據(jù)庫中也不存在匹配項,則需要對該發(fā)送方所發(fā)送的語音數(shù)據(jù)包進(jìn)行 聲紋檢測。進(jìn)行聲紋檢測的主要目的在于,判斷該用戶是否為已有的黑 名單用戶通過篡改、偽造呼叫用戶URI的方式對被叫用戶進(jìn)行重復(fù)騷擾, 從而避免這種偽造身份的用戶首次呼叫的攻擊。
所謂聲紋(Voiceprint),是用電聲學(xué)儀器顯示的、攜帶言語信息的聲 波頻譜。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生 理物理過程,人在講話時使用的發(fā)聲器官-舌、牙齒、喉頭、肺、鼻腔在 尺寸和形態(tài)方面每個人的差異很大,所以任何兩個人的聲紋圖i普都有差 異。聲紋識別有兩個關(guān)鍵問題, 一是聲紋特征提取,二是聲紋模式匹配。 (一)聲紋特征提取
聲紋特征提取的任務(wù)是提取并選擇對語音數(shù)據(jù)的聲紋具有可分性 強、穩(wěn)定性高等特性的聲學(xué)或語言特征。該特征能有效地區(qū)分不同說話 人的語音數(shù)據(jù),且對同一說話人的變化保持相對穩(wěn)定??紤]到特征的可量化性、訓(xùn)練樣本的數(shù)量和聲紋識別系統(tǒng)性能的評價問題。目前主要對 較低層次的聲學(xué)特征進(jìn)行識別。說話人特征大體歸為以下幾類
1. 基音輪廓、共振峰頻率帶寬及其軌跡?;诎l(fā)聲器官生理結(jié)構(gòu)提 取的特征參數(shù)。
2. 譜包絡(luò)參數(shù)。聲音通過濾波器組輸出,并以合適的速率對輸出抽
樣作為聲紋識別特征。
3,聽覺特性參數(shù)。模擬人耳對聲音頻率感知特性而提出的,如美倒 譜系數(shù)、感知線性預(yù)測等。
4.線性預(yù)測系數(shù)。線性預(yù)測與聲道參數(shù)模型相符合,由它導(dǎo)出的各 種參數(shù),如反射系數(shù)、自相關(guān)系數(shù)、線性預(yù)測系數(shù)等作為識別特征,效 果較好。
(二)聲紋模式匹配
目前常用的匹配方式包括
1. 矢量量化。通過把每個人的特定文本編成碼本,識別時將測試文 本按此碼本進(jìn)行編碼,以量化產(chǎn)生的失真度作為判決標(biāo)準(zhǔn)。其識別精度 較高,判斷速度較快。
2. 概率統(tǒng)計。考慮到短時間內(nèi)聲音信息相對平穩(wěn),通過對穩(wěn)態(tài)特征 如基音、聲門增益、低隊反射系數(shù)的統(tǒng)計分析,利用均值、方差等統(tǒng)計 量和概率密度函數(shù)進(jìn)行判決。其優(yōu)點是不用對特征參量在時域上進(jìn)行規(guī) 整,適合文本無關(guān)的說^舌人識別。
3. 動態(tài)時間規(guī)整。說話人聲音信息既有穩(wěn)定的因素如發(fā)聲習(xí)慣、發(fā) 聲器官結(jié)構(gòu),又有時變的因素如請速、語調(diào)、重音、韻律等。將識別模 板與參考模板進(jìn)行時間.對比,并按照某種距離測定得出兩模板間的相似 程度。常用方法是基于最近鄰原則的動態(tài)對間規(guī)整DTW。
4. 人工神經(jīng)網(wǎng)絡(luò)。這種分布式并行處理結(jié)構(gòu)的網(wǎng)絡(luò)模型在某種程度 上模擬生物感知特性,具有自組織和自學(xué)習(xí)能力、很強的復(fù)雜分類邊界 區(qū)分能力,及對不完全信息的魯棒性,其性能近似理想的分類器。缺點 是訓(xùn)練時間長、動態(tài)時間規(guī)整能力弱,且網(wǎng)絡(luò)規(guī)??赡茈S說話人數(shù)目增 加到難以訓(xùn)練的程度。
5. 隱馬爾可夫模型。這種基于轉(zhuǎn)移概率和傳輸概率的隨機模型,最早被美國的IBM公司用于聲音識別。它把聲音看成由可觀察到的符號序
列組成的隨機過程,該序列是發(fā)聲系統(tǒng)狀態(tài)序列的輸出。識別時,為每 個說話人建立發(fā)聲模型,通過訓(xùn)練得到狀態(tài)轉(zhuǎn)移概率矩陣和符號輸出概 率矩陣。具體應(yīng)用時,計算未知聲音在狀態(tài)轉(zhuǎn)移過程中最大概率,根據(jù) 最大概率對應(yīng)的模型進(jìn)行判決。它不需時間規(guī)整,可節(jié)約判決的計算時 間和存儲量。這是目前廣泛采用的一種技術(shù),其缺點是訓(xùn)練時的計算量 較大。
優(yōu)選的,本發(fā)明的聲紋;險測過程可以包括以下子步驟
子步驟A1、提取語音數(shù)據(jù)包的聲紋特征,所述聲紋特征包括線性
預(yù)測倒譜系數(shù)LPCC以及美爾倒數(shù)譜MFCC 。
具體地,序列的傅氏變換取復(fù)對數(shù)后的傅氏反變換結(jié)果稱為復(fù)倒譜。如果將序列的傅氏變換的模取對數(shù)后再計算傅氏反變換,得到的序列稱
為原序列的倒譜(Cepstmm)。所述LPCC倒譜系數(shù)的提取過程為 al、將原始語音信號切割成多個獨立幀(frame); a2、對每幀語音信號通過一階高通濾波器進(jìn)行預(yù)加重處理; a3、將預(yù)加重后的取樣值進(jìn)行加窗處理,通常為對取樣值乘以一個漢
明窗;
a4、利用Durbin輪回程序求出線性預(yù)估系數(shù)LPC; a5 、利用線性預(yù)估系數(shù)求出倒頻譜系數(shù)LPCC; a6、計算差分LPCC; a7、輸出保存。
Mel倒譜是說話人識別中另 一個最常用的聲紋特征參量,其計算是基 于語音信號的濾波器組分析。 -所述Mel倒i普的提取過程為
bl、原始語音信號s(n)經(jīng)過預(yù)加重、分幀、加窗等處理,得到每個語 音幀的時域信號x(n);
b2、將時域信號x(n)后補若干0以形成長為N(—般取N=512)的 序列,然后經(jīng)過離散傅立葉變換(DFT)后得到線性頻譜X(k),轉(zhuǎn)換公式 為<formula>formula see original document page 18</formula>
b3、將上述線性頻譜X(k)通過Mel頻率濾波器組得到Mel頻謙并 通過對數(shù)能量的處理,得到對數(shù)頻譜S(m)。
<formula>formula see original document page 18</formula>
b4、將上述對數(shù)頻謙S(m)經(jīng)過離散余弦變換(DCT)變換到倒頻語域, 即可得到Mel頻率倒譜系數(shù)(MFCC參數(shù))c(n),
<formula>formula see original document page 18</formula>
子步驟A2、采用混合高斯模型GMM以及矢量量化(VQ)方法對上 述聲紋特征進(jìn)行建模以及匹配。
具體地,基于矢量量化的聲紋特征處理方法為
矢量量化用于聲紋識別,是將說話人的語音作為信源,利用矢量量 化技術(shù)對其建模,由訓(xùn)練n維特征參數(shù)序列聚類,生成矢量量化碼書, 建立說話人和碼書——對應(yīng)的關(guān)系;在辨別時,用所有的碼書對測試的 特征序列進(jìn)行編碼,計算平均失真進(jìn)行比較,取失真最小的碼書對應(yīng)的 說話人為辨別結(jié)果;在鑒別時,則取測試者聲明的身份所對應(yīng)的碼書對 測試特征序列進(jìn)行失真度計算,與失真閾值比較,若大于則接受,否則 拒絕。
例如,設(shè)X={xl, x2,…,xT》是灰名單用戶的特征矢量,共有T 幀。在訓(xùn)練階段所形成的碼書為{Bl, B2,…,BN}(N表示黑名單用 戶數(shù)目)。則對于灰名單用戶聲紋匹配的具體步驟如下
cl、設(shè)i二l根據(jù)第i個碼書Bi依據(jù)最小距離原則對X進(jìn)行聚類,即 求出
附G似 J
其中j表示X中第j (j=l, 2,…,T)幀的特征向量,m表示第i 個說話人的第m個碼字,共有M個碼字,d為歐氏距離測度。
c2、按照平均失真測度J j'=1 —— 計算X到第i個碼書的平均失真距離Di。如果小于某一閾值,則予以確認(rèn),否則拒絕,執(zhí)
行步驟c3;
c3、 i=i+l,計算D(i+l),直到i=N,求出所有的D1, D2,…,DN。
本發(fā)明中使用的碼書設(shè)計算法可以為LBG算法,LBG算法是一個迭
代的算法,其基本思想是在每次迭代時都用最小距離準(zhǔn)則對訓(xùn)練樣本重
新分類,使每次迭代后總的量化失真減小。例如,可以包括以下步驟 Stepl:設(shè)置量化失真閥值s、初始量化失真d(o)及最大迭代次數(shù)Max
以及碼字初值 7(j=l,…,M); Step2:設(shè)迭代次數(shù)m二l;
《附) 《附)
Step3:以碼字為中心,根據(jù)最近鄰準(zhǔn)則將Y分成M類1 ,''" M , 若d(yi , 7) ^ d(yi , ) V/t #7則把yi歸入^ ,且
其中,上標(biāo)m表示迭代次數(shù)。距離d(.)表示某種距離度量, 一般可 以采用歐氏距離。
Step4:計算總量化失真d;
Step5:計算量化失真改進(jìn)量A" 的相對值,其中 —l^)—^-1) I ^ 。
基于混合高斯模型的聲紋特征處理方法為
在基于GMM的說話人識別系統(tǒng)中,訓(xùn)練階段首先用高斯混合模型
為系統(tǒng)中的每個說話人建立概率模型;在識別階段,利用系統(tǒng)中所有人
的GMM模型計算待識別矢量集的對數(shù)似然函數(shù),根據(jù)最大似然準(zhǔn)則作
出判決?;贕MM模型的說話人辨識系統(tǒng)結(jié)構(gòu)框圖如圖5所示。
GMM以M個垃圾語音發(fā)送者的密度函數(shù)的加權(quán)和表示,
卓|義)=2>,;|>,1 ^m
'=1 '=1。其中X是D維隨機向量,A ;表示為成員密度;z'表示混合權(quán)重。每個成員密度是一個D維變量的高<formula>formula see original document page 20</formula> 斯分布函數(shù),為 訓(xùn)練階段首先用高斯混合模型為系統(tǒng)中的每個說話人建立概率模型;在識別階段,利用系統(tǒng)中所有人的GMM模型計算待識別矢量集的對數(shù)似然函數(shù),根據(jù)最大似然準(zhǔn)則作出判決。dl、將原始聲音信號經(jīng)過聲紋特征提取得到聲紋特征序列X;d2、將聲紋特征序列X輸入混合高斯模型GMM中,尋找黑名單用戶i*,其對應(yīng)的模型2 ,可以使待測語音特征矢量組X具有最大后驗概率I I ),且該最大后驗概率大于門限值,則判定為垃圾 語音發(fā)送者。當(dāng)然,本領(lǐng)域技術(shù)人員采用任一種聲紋檢測的方法都是可行的,本 發(fā)明對此不作限制。當(dāng)^r測出聲紋特征在預(yù)置的垃圾語音聲紋特征庫中存在匹配項時, 則可以判定該發(fā)送方屬于黑名單用戶,所以需要將所述發(fā)送方標(biāo)識信息 添加至黑名單數(shù)據(jù)庫中;當(dāng)檢測出聲紋特征在預(yù)置的垃圾語音聲紋特征 庫中不存在匹配項時,則可以判定該發(fā)送方發(fā)送的是有效信息,但對于 其是否為白名單用戶,最好是由經(jīng)過進(jìn)一步鑒別后再將其添加至白名單 數(shù)據(jù)庫,所以暫時只對該發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽??梢岳斫猓隼Z音聲紋特征庫中至少包含所有黑名單用戶發(fā) 送過的語音數(shù)據(jù)包的聲紋特征。在這種情況下易于得知,所述垃圾語音 聲紋特征庫的生成和更新方法可以為提取所述黑名單數(shù)據(jù)庫中發(fā)送方 所發(fā)語音數(shù)據(jù)包的聲紋特征,添加至垃圾語音聲紋特征庫。優(yōu)選的,在本實施例中,還可以依據(jù)^接收方的垃圾語音鑒別信息, 將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息添加至黑名單數(shù)據(jù)庫或白名單別的情形,例如,盡管當(dāng)前發(fā)送方用戶依據(jù)上述流程被添加灰名單標(biāo)簽, 但接收方用戶仍認(rèn)為其發(fā)送的內(nèi)容是不想要獲得的內(nèi)容,那么,則可以 判定該發(fā)送方是垃圾語音發(fā)送方,在這種情況下,就將該發(fā)送方URI添加至黑名單數(shù)據(jù)庫;反之,在用戶鑒別當(dāng)前發(fā)送方用戶為合法語音發(fā)送 方的情況下,就可以將發(fā)送方URI添加至白名單數(shù)據(jù)庫。筒而言之,本 發(fā)明還可以依據(jù)用戶針對具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息的,垃圾語音發(fā)起者或合法語音發(fā)起者的鑒別,將相應(yīng)的發(fā)送方標(biāo)識信息添加至黑 名單數(shù)據(jù)庫或白名單數(shù)據(jù)庫中。優(yōu)選的是,在將垃圾語音發(fā)起者的發(fā)送方標(biāo)識信息添加至黑名單數(shù) 據(jù)庫的同時,還可以提取其所發(fā)送語音數(shù)據(jù)包的聲紋特征,添加至垃圾 語音聲紋特征庫,以實時更新所述垃圾語音聲紋特征庫。參考圖2,示出了本發(fā)明的一種垃圾語音的過濾方法實施例2的流程 圖,可以包括以下步驟步驟201、獲取語音數(shù)據(jù)包,提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信息;在實際中,所述語音數(shù)據(jù)包的獲取為可以從VoIP網(wǎng)絡(luò)中實時獲取。 步驟202、判斷所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫是否存在匹 配項,如果是,則執(zhí)行步驟203;如果否,則執(zhí)行步驟204; 步驟203、過濾所述語音數(shù)據(jù)包;步驟204、判斷所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫是否存在匹 配項;如果是,則執(zhí)行步驟205;如果否,則執(zhí)行步驟206; 步驟205、接收所述語音數(shù)據(jù)包; 步驟206、獲取所述語音數(shù)據(jù)包的聲紋特征;步驟207、將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹 配,若存在匹配項,則執(zhí)行步驟208;若不存在匹配項,則執(zhí)行步驟209; 步驟208、將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中; 步驟209、對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。參考圖3,示出了本發(fā)明的一種垃圾語音的過濾方法實施例3的流程 圖,可以包括以下步驟步驟301、接收并緩存語音數(shù)據(jù)包,提取所述語音數(shù)據(jù)包中的發(fā)送方 標(biāo)識信息;步驟302、若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中不存在匹配項,則獲取所述語音數(shù)據(jù)包的聲紋特征;步驟303、將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹配,若存在匹配項,則執(zhí)行步驟304;若不存在匹配項,則執(zhí)行步驟305; 步驟304、將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中; 步驟305、對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽; 步驟306、將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語音數(shù)據(jù)包,從緩存轉(zhuǎn)移至接收方。其中,所述接收方標(biāo)識信息可以從所述語音數(shù)據(jù)包中獲得,在實際中,為滿足傳輸需求,語音數(shù)據(jù)包中都會包含相應(yīng)的發(fā)送方和接收方的標(biāo)識信息。參考圖4,示出了本發(fā)明的一種垃圾語音的過濾方法實施例4的流程 圖,可以包括以下步驟步驟401、接收方向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求,發(fā)送方依據(jù)該請 求向接收方發(fā)送語音lt據(jù)包;步驟402、從所述語音數(shù)據(jù)包中提取發(fā)送方標(biāo)識信息,判斷所述發(fā)送 方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項; 若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫存在匹配項,則過濾所述語 音數(shù)據(jù)包;若所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹配項,則 接收所述語音數(shù)據(jù)包;若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和 白名單數(shù)據(jù)庫中不存在匹配項,則執(zhí)行步驟403;步驟403、獲取所述語音數(shù)據(jù)包的聲紋特征;步驟404、將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹 配,若存在匹配項,則執(zhí)行步驟405;若不存在匹配項,則執(zhí)行步驟406; 步驟405、將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中; 步驟406、對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽; 步驟407、所述接收方接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語音 數(shù)據(jù)包。優(yōu)選的,本實施例還可包括以下步驟語音數(shù)據(jù)獲取請求的同時啟動計時程序,監(jiān)控是否超過預(yù)置時間閾值;若超過預(yù)置時間闊值,則執(zhí)行步驟405。在本發(fā)明的方法實施例中,還可以包括將所述具有灰名單標(biāo)簽的發(fā) 送方標(biāo)識信息整理至灰名單數(shù)據(jù)庫中的步驟,以便于后續(xù)應(yīng)用。需要說明的是,在本發(fā)明的實施例中,對各個實施例的描述都各有 側(cè)重,每個實施例重點說明的都是與其他實施例的不同之處,某個實施 例中沒有詳述的部分,參見其他實施例的相關(guān)描述即可。再者,對于前 述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合, 但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制, 因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本 領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例, 所涉及的動作和模塊并不 一 定是本發(fā)明所必須的。參考圖5,示出了本發(fā)明的一種垃圾語音的過濾系統(tǒng)實施例1的結(jié)構(gòu) 框圖,所述過濾系統(tǒng)可以包括用于存儲黑名單用戶標(biāo)識信息的黑名單數(shù) 據(jù)庫、用于存儲白名單用戶標(biāo)識信息的白名單數(shù)據(jù)庫和用于存儲垃圾語 音聲紋特征的垃圾語音聲紋特征庫,所述的過濾系統(tǒng)還可以包括以下單 元語音數(shù)據(jù)獲取單元501,用于獲取語音數(shù)據(jù)包; 發(fā)送方標(biāo)識提取單元502,用于提耳又所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識 信息;黑白名單匹配單元503,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單 數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項;聲紋特征提取單元504,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù) 據(jù)庫和白名單數(shù)據(jù)庫中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特 征;可以理解的是,若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名 單數(shù)據(jù)庫中存在匹配項時,還可以按照現(xiàn)有技術(shù)中的黑/白名單處理機制 進(jìn)行處理,本發(fā)明對此不作限制。聲紋特征匹配單元505,用于將所述聲紋特征在所述垃圾語音聲紋特觸發(fā)黑名單添加單元506;若未獲得 匹配項,則觸發(fā)灰名單標(biāo)識單元507;黑名單添加單元506,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單 數(shù)據(jù)庫中;灰名單標(biāo)識單元507,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。 應(yīng)用所述系統(tǒng)實施例1進(jìn)行垃圾語音過濾的過程可以對應(yīng)前述方法實施例1的描述,在此就不贅述了。作為本發(fā)明的一種垃圾語音的過濾系統(tǒng)實施例2,所述語音數(shù)據(jù)獲取單元可以包括用于接收并緩存語音數(shù)據(jù)包的緩存子單元,在這種情況下,所述系統(tǒng)還可以包括以下單元轉(zhuǎn)移單元,用于將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語音數(shù)據(jù)包,從緩存轉(zhuǎn)移至接收方。應(yīng)用所述系統(tǒng)實施例2進(jìn)行垃圾語音過濾的過程可以對應(yīng)前述方法實施例3的描述,在此就不贅述了 。作為本發(fā)明的一種垃圾語音的過濾系統(tǒng)實施例3,所述語音數(shù)據(jù)獲取單元可以包括以下子單元接收方請求子單元,用于向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求; 發(fā)送方發(fā)送子單元,用于依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 在這種情況下,所述的系統(tǒng)還可以包括接收方接收單元,用于接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語音數(shù)據(jù)包。在本實施例3中,所述語音數(shù)據(jù)獲取單元還可以包括 計時子單元,用于在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計對器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則觸發(fā)黑名單添力口單元。應(yīng)用所述系統(tǒng)實施例3進(jìn)行垃圾語音過濾的過程可以對應(yīng)前述方法 實施例4的描述,在此就不贅述了。優(yōu)選的,在本發(fā)明的系統(tǒng)實施例中,還可以包括以下單元數(shù)據(jù)庫更新單元,用于依據(jù)接收方的垃圾語音鑒別信息,將所述具 有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息添加至黑名單數(shù)據(jù)庫或白名單數(shù)據(jù)庫。和/或,聲紋特征庫添加單元,用于提取所述黑名單數(shù)據(jù)庫中發(fā)送方所發(fā)語 音數(shù)據(jù)包的聲紋特征,添加至垃圾語音聲紋特征庫。 和/或,灰名單數(shù)據(jù)庫,用于存儲所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息。 和/或,過濾單元,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫存在匹配項時,過濾所述語音數(shù)據(jù)包;保留單元,用于在所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹 配項時,接收所述語音數(shù)據(jù)包。在實際應(yīng)用中,可以所述系統(tǒng)設(shè)置于服務(wù)器端,也可以設(shè)置于客戶 端,本發(fā)明對此不作限制。對于系統(tǒng)實施例而言,由于其基本相應(yīng)于方法實施例,所以描述的 比較簡單,相關(guān)之處可以參見方法實施例的部分說明。本領(lǐng)域技術(shù)人員 易于想到的是上述實施例中相應(yīng)單元的任意組合應(yīng)用都是可行的,都 是本發(fā)明的實施方案,但是由于篇幅限制,本說明書在此就不——詳述 了。參考圖6,示出了本發(fā)明的一種語音郵件系統(tǒng)實施例的結(jié)構(gòu)框圖,可 以包括以下才莫塊接口判斷模塊601,用于接收并緩存語音郵件,并判斷所述語音郵件 的發(fā)送方是否為新用戶,若是,則觸發(fā)垃圾語音過濾組件602; 所述垃:敗語音過濾組件可以包括發(fā)送方標(biāo)識提取模塊,用于提取所述語音郵件中的發(fā)送方標(biāo)識信息; 黑白名單匹配模塊,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單用戶列表和白名單用戶列表中是否存在匹配項;聲紋特征提取模塊,用于在所述發(fā)送方標(biāo)識信息在所述黑名單用戶列表和白名單用戶列表中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;可以理解的是,若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名 單數(shù)據(jù)庫中存在匹配項時,還可以按照現(xiàn)有技術(shù)中的黑/白名單處理機制進(jìn)行處理,本發(fā)明對此不作限制。聲紋特征匹配模塊,用于將所述聲紋特征在所述垃圾語音聲紋特征庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加模塊;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識模塊;黑名單添加模塊,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單用 戶列表中;灰名單標(biāo)識模塊,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。 優(yōu)選的,所述語音郵件系統(tǒng)還可以包4舌老用戶郵件處理組件603,所述老用戶郵件處理組件可以包括以下模塊鑒別模塊,用于在所述接口判斷模塊判斷所述語音郵件的發(fā)送方為老用戶時,鑒別所述老用戶發(fā)送的語音郵件是否為垃圾郵件;如果是,則觸發(fā)所述黑名單添加模塊和聲紋特征庫添加模塊;如果否,則觸發(fā)白 名單添加模塊;聲紋特征庫添加模塊,用于提取所述老用戶所發(fā)語音數(shù)據(jù)包的聲紋 特征,添加至垃圾語音聲紋特征庫。白名單添加模塊,用于將所述老用戶的標(biāo)識信息添加至所述白名單 用戶列表中。優(yōu)選的,所述語音郵件系統(tǒng)還可以包括轉(zhuǎn)移模塊,用于將所述具有 灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語音數(shù)據(jù)包,從緩存轉(zhuǎn)移至郵件接 收方。在實際中,可以將所述垃圾語音過濾組件作為插件添加至服務(wù)器中,圾語音郵件進(jìn)行防范。再者,應(yīng)用本實施例的服務(wù)器還可以根據(jù)鑒別模 塊的處理對于語音郵件的反饋,提供垃圾語音聲紋庫與黑白名單的修改。 優(yōu)選的,所述鑒別模塊可設(shè)置在郵箱客戶端。可以看出,所述語音郵件系統(tǒng)中定義了兩種消息,第一種為新用戶 發(fā)送的語音郵件的提示信息,如果郵件系統(tǒng)接收到新用戶發(fā)送的語音郵 件,則調(diào)用垃圾語音過濾組件進(jìn)行處理;如果郵件系統(tǒng)接收到老用戶發(fā) 送的語音郵件,則調(diào)用老用戶處理組件進(jìn)行處理。參考圖7,示出了應(yīng)用 圖6所示的優(yōu)選實施例進(jìn)行郵件處理的流程圖,具體可以包括以下步驟步驟701、接口判斷模塊接收并緩存語音郵件,并判斷所述語音郵件 的發(fā)送方是否為新用戶,若是,則觸發(fā)垃圾語音過濾組件執(zhí)行步驟702—708;若否,則觸發(fā)鑒別模塊執(zhí)行步驟709—711;步驟702、發(fā)送方標(biāo)識提取模塊提取所述語音郵件中的發(fā)送方標(biāo)識信 息和接收方標(biāo)識信息;步驟703、黑白名單匹配模塊于判斷所述發(fā)送方標(biāo)識信息在所述黑名 單用戶列表和白名單用戶列表中是否存在匹配項;若所述發(fā)送方標(biāo)識信 息在所述黑名單數(shù)據(jù)庫存在匹配項,則過濾所述語音數(shù)據(jù)包;若所述發(fā) 送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹配項,則接收所述語音數(shù)據(jù)包; 若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中不存在 匹配項,則執(zhí)行步驟704;步驟704、聲紋特征提取模塊獲取所述語音數(shù)據(jù)包的聲紋特征;步驟705、聲紋特征匹配模塊將所述聲紋特征在所述垃圾語音聲紋特 征庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加模塊執(zhí)行步驟706; 若未獲得匹配項,則觸發(fā)灰名單標(biāo)識模塊執(zhí)行步驟707;步驟706、黑名單添加模塊將所述發(fā)送方標(biāo)識信息添加至所述黑名單 用戶列表中;步驟707、灰名單標(biāo)識模塊對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。步驟708、轉(zhuǎn)移模塊將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的 語音數(shù)據(jù)包,從緩存轉(zhuǎn)移至郵件接收方。鑒別模塊主要通過對發(fā)送語音郵件的老用戶進(jìn)行鑒別,從而對已有 的黑白灰名單用戶以及垃圾語音聲紋特征庫進(jìn)行修改。,步驟709、鑒別模塊鑒別所述老用戶發(fā)送的語音郵件是否為垃圾郵 件;如果是,則觸發(fā)所述黑名單添加模塊和聲紋特征庫添加模塊執(zhí)行步 驟710;如果否,則觸發(fā)白名單添加模塊執(zhí)行步驟711;步驟710、黑名單添加模塊將所述老用戶的標(biāo)識信息添加至所述黑名 單用戶列表中,聲紋特征庫添加模塊提取所述老用戶所發(fā)語音數(shù)據(jù)包的 聲紋特征,添加至垃圾語音聲紋特征庫;步驟711 、白名單添加模塊將所述老用戶的標(biāo)識信息添加至所述白名 單用戶列表中。采用本發(fā)明的語音郵件系統(tǒng),可以有效防止通過篡改、偽造發(fā)送方URI方式的垃圾語音郵件的傳播,由于在垃圾語音聲紋特征庫中添加了 所有被識別為垃圾語音的聲紋特征,因此,僅通過更改發(fā)送方URI方式 的垃圾語音郵件將無法達(dá)到垃圾語音傳播的目的。并且,所述語音郵件 系統(tǒng)實施例還可以應(yīng)用于客戶端,從而到達(dá)更細(xì)粒度級別上的垃》及語音 防范?;诼暭y信息的唯一性,本發(fā)明還可以通過將聲紋鑒別引入信令交 互流程,達(dá)到從源頭上防范垃圾語音傳播的目的。參考圖8,示出了本發(fā) 明的一種基于信令交互的垃圾語音過濾裝置實施例的結(jié)構(gòu)框圖,由于信 令交互過程中并沒有發(fā)送方的多媒體數(shù)據(jù)流,因此,在判斷發(fā)送方URI 時,需要在聲紋特征獲取過程中向發(fā)送方發(fā)起聲紋獲取請求,等待發(fā)送 方發(fā)送含有IP語音的數(shù)據(jù)包后,再進(jìn)行聲紋特征提取,具體可以包括以 下模塊接收方請求模塊801,用于向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求; 發(fā)送方發(fā)送模塊802,用于依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 發(fā)送方標(biāo)識提取模塊803,用于提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識 信息;黑白名單匹配模塊804,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單 數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項;聲紋特征提取模塊805,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù) 據(jù)庫和白名單數(shù)據(jù)庫中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;可以理解的是,若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名 單數(shù)據(jù)庫中存在匹配項時,還可以按照現(xiàn)有技術(shù)中的黑/白名單處理機制 進(jìn)行處理,本發(fā)明對此不作限制。聲紋特征匹配模塊806,用于將所述聲紋特征在所述垃圾語音聲紋特 征庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加模塊807;若未獲得 匹配項,則觸發(fā)灰名單標(biāo)識才莫塊808;黑名單添加模塊807,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單 數(shù)據(jù)庫中;灰名單標(biāo)識模塊808,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。 優(yōu)選的,在本實施例中,還可以包括計時子單元,用于在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計 時器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則觸發(fā)黑名 單添加單元。優(yōu)選的,在本實施例中,還可以包括接收方接收單元,用于接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語 音數(shù)據(jù)包。在實施例,所述裝置可以設(shè)置于服務(wù)器端。參考圖9,示出了應(yīng)用圖8所示的優(yōu)選實施例進(jìn)行垃圾語音過濾的流 程圖,具體可以包括以下步驟步驟9011、接收方請求模塊向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求,并執(zhí) 行步驟9012;步驟9012、通過計時子單元在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同 時啟動計時器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則 直接觸發(fā)黑名單添加單元執(zhí)行步驟907;步驟902、發(fā)送方發(fā)送模塊依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 步驟903、發(fā)送方標(biāo)識提取模塊提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識 4呂息;步驟904、黑白名單匹配模塊判斷所述發(fā)送方標(biāo)識信息在所述黑名單 數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項,如果不存在,則觸發(fā)聲紋特 征提取模塊執(zhí)行步驟905;可以理解的是,若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名 單數(shù)據(jù)庫中存在匹配項時,還可以按照現(xiàn)有技術(shù)中的黑/白名單處理機制 進(jìn)行處理,本發(fā)明對此不作限制。步驟905、聲紋特征提取模塊獲取所述語音數(shù)據(jù)包的聲紋特征;步驟906、聲紋特征匹配單元將所述聲紋特征在所述垃圾語音聲紋特 征庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加單元執(zhí)行步驟907; 若未獲得匹配項,則觸發(fā)灰名單標(biāo)識單元執(zhí)行步驟908;步驟907、黑名單添加單元將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中;步驟908、灰名單標(biāo)識單元對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽; 步驟909、 語音數(shù)據(jù)包。實施例重點說明的都是與其他實施例的不同之處。需要說明的是,在本文中,術(shù)語"包括"、"包含"或者其任何其他變體 意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、裝 置或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素, 或者是還包括為這種過程、方法、裝置或者系統(tǒng)所固有的要素。在沒有 更多限制的情況下,由語句"包括一個......"限定的要素,并不排除在包括所述要素的過程、方法、裝置或者系統(tǒng)中還存在另外的相同要素。以上對本發(fā)明所提供的 一 種垃圾語音過濾的方法、 一 種垃圾語音過 濾的系統(tǒng)、 一種語音郵件系統(tǒng)及一種基于信令交互的垃圾語音過濾裝置行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心 思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體 實施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng) 理解為對本發(fā)明的限制。
權(quán)利要求
1、一種垃圾語音的過濾方法,其特征在于,包括獲取語音數(shù)據(jù)包,提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信息;若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中不存在匹配項,則獲取所述語音數(shù)據(jù)包的聲紋特征;將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹配,若存在匹配項,則將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中;否則,對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。
2、 如權(quán)利要求l所述的方法,其特征在于,所述獲取語音數(shù)據(jù)包為 接收并緩存語音數(shù)據(jù)包,所述的方法還包括將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語音數(shù)據(jù)包,從緩 存轉(zhuǎn)移至接收方。
3、 如權(quán)利要求l所述的方法,其特征在于,所述獲取語音數(shù)據(jù)包的 步驟包括接收方向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求,發(fā)送方依據(jù)該請求 向接收方發(fā)送語音數(shù)據(jù)包;所述的方法還包括
4、 如權(quán)利要求3所述的方法,其特征在于,所述獲取語音數(shù)據(jù)包的 步驟還包括接收方在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計時 程序,監(jiān)控是否超過預(yù)置時間閾值;所述的方法還包括若超過預(yù)置時間閾值,則將所述發(fā)送方標(biāo)識信息添加至所述黑名單 數(shù)據(jù)庫中。
5、 如權(quán)利要求l、 2或3所述的方法,其特征在于,還包括 依據(jù)接收方的垃圾語音鑒別信息將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息添加至黑名單數(shù)據(jù)庫或白名單數(shù)據(jù)庫。
6、 如權(quán)利要求5所述的方法,其特征在于,還包括提取所述黑名單數(shù)據(jù)庫中發(fā)送方所發(fā)語音數(shù)據(jù)包的聲紋特征,添加 至垃圾語音聲紋特征庫。
7、 如權(quán)利要求l所述的方法,其特征在于,所述語音數(shù)據(jù)包的獲取為從VoIP網(wǎng)絡(luò)中實時獲取。
8、 如權(quán)利要求l所述的方法,其特征在于,還包括 所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息形成灰名單數(shù)據(jù)庫。
9、 如權(quán)利要求l所述的方法,其特征在于,還包括 若所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫存在匹配項,則過濾所述語音數(shù)據(jù)包;若所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹配項,則接收所 述語音數(shù)據(jù)包。
10、 一種垃圾語音的過濾系統(tǒng),其特征在于,所述過濾系統(tǒng)包括用 于存儲黑名單用戶標(biāo)識信息的黑名單數(shù)據(jù)庫、用于存儲白名單用戶標(biāo)識 信息的白名單數(shù)據(jù)庫、以及用于存儲垃圾語音聲紋特征的垃圾語音聲紋 特征庫,所述的過濾系統(tǒng)還包括語音數(shù)據(jù)獲取單元,用于獲取語音數(shù)據(jù)包;發(fā)送方標(biāo)識提取單元,用于提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信自.匹配單元,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項;聲紋特征提取單元,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù) 庫和白名單數(shù)據(jù)庫中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;聲紋特征匹配單元,用于將所述聲紋特征在所述垃圾語音聲紋特征 庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加單元;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識單元;黑名單添加單元,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù) 據(jù)庫中;灰名單標(biāo)識單元,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。
11、 如權(quán)利要求IO所述的系統(tǒng),其特征在于,所述語音數(shù)據(jù)獲取單 元包括用于接收并緩存語音數(shù)據(jù)包的緩存子單元,所述系統(tǒng)還包括轉(zhuǎn)移單元,用于將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語 音數(shù)據(jù)包,從緩存轉(zhuǎn)移至接收方。
12、 如權(quán)利要求IO所述的系統(tǒng),其特征在于,所述語音數(shù)據(jù)獲取單 元包括接收方請求子單元,用于向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求; 發(fā)送方發(fā)送子單元,用于依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 所述的系統(tǒng)還包括接收方接收單元,用于接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語 音數(shù)據(jù)包。
13、 如權(quán)利要求12所述的系統(tǒng),其特征在于,所述語音數(shù)據(jù)獲取單 元還包括計時子單元,用于在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計 時器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則觸發(fā)黑名 單添力口單元。
14、 如權(quán)利要求10、 11或12所述的系統(tǒng),其特征在于,還包括 數(shù)據(jù)庫更新單元,用于依據(jù)接收方的垃圾語音鑒別信息,將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息添加至黑名單數(shù)據(jù)庫或白名單數(shù)據(jù)庫。
15、 如權(quán)利要求14所述的系統(tǒng),其特征在于,還包括 聲紋特征庫添加單元,用于提取所述黑名單數(shù)據(jù)庫中發(fā)送方所發(fā)語音數(shù)據(jù)包的聲紋特征,添加至垃圾語音聲紋特征庫。
16、 如權(quán)利要求IO所述的系統(tǒng),其特征在于,還包括 灰名單數(shù)據(jù)庫,用于存儲所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息。
17、 如權(quán)利要求10所述的系統(tǒng),其特征在于,還包括 過濾單元,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫存在匹配項時,過濾所述語音數(shù)據(jù)包;保留單元,用于在所述發(fā)送方標(biāo)識信息在所述白名單數(shù)據(jù)庫存在匹 配項時,接收所述語音^t據(jù)包。
18、 如權(quán)利要求10所述的系統(tǒng),其特征在于,所述系統(tǒng)位于服務(wù)器 端或客戶端。
19、 一種語音郵件系統(tǒng),其特征在于,包括接口判斷模塊,用于接收并緩存語音郵件,并判斷所述語音郵件的 發(fā)送方是否為新用戶,若是,則觸發(fā)垃圾語音過濾組件;所述垃圾語音過濾組件包括發(fā)送方標(biāo)識提取模塊,用于提取所述語音郵件中的發(fā)送方標(biāo)識信息; 匹配模塊,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單用戶列表和白名單用戶列表中是否存在匹配項;聲紋特征提取模塊,用于在所述發(fā)送方標(biāo)識信息在所述黑名單用戶列表和白名單用戶列表中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;聲紋特征匹配模塊,用于將所述聲紋特征在所述垃圾語音聲紋特征 庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加模塊;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識模塊;黑名單添加模塊,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單用 戶列表中;灰名單標(biāo)識模塊,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。
20、 如權(quán)利要求19所述的系統(tǒng),其特征在于,還包括老用戶郵件處 理組件,所述老用戶郵件處理組件包括鑒別模塊,用于在所述接口判斷模塊判斷所述語音郵件的發(fā)送方為 老用戶時,鑒別所述老用戶發(fā)送的語音郵件是否為垃圾郵件;如果是, 則觸發(fā)所述黑名單添加模塊和聲紋特征庫添加模塊;如果否,則觸發(fā)白 名單添加模塊;聲紋特征庫添加模塊,用于提取所述老用戶所發(fā)語音數(shù)據(jù)包的聲紋 特征,添加至垃圾語音聲紋特征庫;白名單添加模塊,用于將所述老用戶的標(biāo)識信息添加至所述白名單 用戶列表中。
21、 如權(quán)利要求19所述的系統(tǒng),其特征在于,還包括 轉(zhuǎn)移模塊,用于將所述具有灰名單標(biāo)簽的發(fā)送方標(biāo)識信息發(fā)送的語音數(shù)據(jù)包,從緩存轉(zhuǎn)移至郵件接收方。
22、 一種基于信令交互的垃圾語音過濾裝置,其特征在于,包括 接收方請求模塊,用于向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求; 發(fā)送方發(fā)送模塊,用于依據(jù)該請求向接收方發(fā)送語音數(shù)據(jù)包; 發(fā)送方標(biāo)識提取模塊,用于提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信匹配模塊,用于判斷所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中是否存在匹配項;聲紋特征提取模塊,用于在所述發(fā)送方標(biāo)識信息在所述黑名單數(shù)據(jù) 庫和白名單數(shù)據(jù)庫中不存在匹配項時,獲取所述語音數(shù)據(jù)包的聲紋特征;聲紋特征匹配單元,用于將所述聲紋特征在所述垃圾語音聲紋特征 庫中進(jìn)行匹配,若獲得匹配項,則觸發(fā)黑名單添加單元;若未獲得匹配 項,則觸發(fā)灰名單標(biāo)識單元;黑名單添加單元,用于將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù) 據(jù)庫中;灰名單標(biāo)識單元,用于對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。
23、 如權(quán)利要求22所述的裝置,其特征在于,還包括 計時子單元,用于在向發(fā)送方發(fā)起語音數(shù)據(jù)獲取請求的同時啟動計時器,監(jiān)控是否超過預(yù)置時間閾值,若超過預(yù)置時間閾值,則觸發(fā)黑名 單添力口單元。
24、 如權(quán)利要求23所述的裝置,其特征在于,還包括 接收方接收單元,用于接收所述具有灰名單標(biāo)簽的發(fā)送方發(fā)送的語音數(shù)據(jù)包。
全文摘要
本發(fā)明公開了一種垃圾語音的過濾方法,包括獲取語音數(shù)據(jù)包,提取所述語音數(shù)據(jù)包中的發(fā)送方標(biāo)識信息;若所述發(fā)送方標(biāo)識信息在預(yù)置的黑名單數(shù)據(jù)庫和白名單數(shù)據(jù)庫中不存在匹配項,則獲取所述語音數(shù)據(jù)包的聲紋特征;將所述聲紋特征在預(yù)置的垃圾語音聲紋特征庫中進(jìn)行匹配,若存在匹配項,則將所述發(fā)送方標(biāo)識信息添加至所述黑名單數(shù)據(jù)庫中;否則,對所述發(fā)送方標(biāo)識信息添加灰名單標(biāo)簽。本發(fā)明可以簡單、實時、準(zhǔn)確地進(jìn)行垃圾語音過濾,有效避免非黑/白名單用戶首次呼叫的攻擊,提高應(yīng)用SIP協(xié)議的業(yè)務(wù)安全性。
文檔編號H04M7/00GK101262524SQ20081009424
公開日2008年9月10日 申請日期2008年4月23日 優(yōu)先權(quán)日2008年4月23日
發(fā)明者李大鵬, 銘 羅, 駿 胡, 聞英友, 劍 陳 申請人:沈陽東軟軟件股份有限公司