本發(fā)明涉及通信
技術領域:
的數(shù)據(jù)處理技術,尤其涉及一種通信號碼處理方法及裝置。
背景技術:
:電信詐騙是指犯罪分子通過電話、網(wǎng)絡和短信等方式,編造虛假信息,設置騙局,對受害人實施遠程、非接觸式詐騙,誘使受害人給犯罪分子打款或轉(zhuǎn)賬的犯罪行為,隨著移動互聯(lián)網(wǎng)的興起,電信詐騙犯罪日益猖獗,數(shù)據(jù)顯示,電信詐騙的涉案金額每年以指數(shù)級的速度快速增長,2015年全國公安機關共立電信詐騙案件59萬起,同比上升32.5%,共造成經(jīng)濟損失222億元;而每一個案件背后,都可能是一個個因詐騙而破碎的家庭。為了遏制電信詐騙,避免用戶被詐騙電話詐騙,現(xiàn)有技術通過手機上的應用軟件(app),收集用戶對號碼的標記信息,如果發(fā)現(xiàn)某個號碼被多個用戶同時標記為詐騙號碼,則認為該號碼為詐騙號碼,并提醒與該詐騙號碼進行通話的用戶提高警惕,以避免被詐騙。然而,一方面,現(xiàn)有技術需要收集用戶標記信息,然而,實際中用戶對號碼進行標記的概率比較低,很多用戶接到一個陌生來電往往不會去標記號碼的類型,并且,現(xiàn)有技術需要收集足夠多的用戶標記后,才能認為該號碼是詐騙號碼,因此,現(xiàn)有技術的詐騙號碼的識別速度慢、效率低;另一方面,現(xiàn)有技術中用戶對號碼進行標記是主觀行為,很多用戶在接聽到一些騷擾電話,比如廣告推銷等惡意電話時,往往會將這些騷擾號碼也標記為詐騙號碼,因此,現(xiàn)有技術的詐騙號碼的識別準確率較低。技術實現(xiàn)要素:有鑒于此,本發(fā)明實施例期望提供一種通信號碼處理方法及裝置,能夠提高號碼識別的速度和準確性。為達到上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的:第一方面,本發(fā)明實施例提供一種通信號碼處理方法,所述方法包括:從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單;解析所述話單得到所述話單中所包括的通信信息的類型,提取出所述話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單;解析所述預處理話單中各通信號碼的至少一種類型的通信信息,得到所述預處理話單中各通信號碼的相應類型通信信息所具有的特征;從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。可選的,所述解析所述話單得到所述話單中所包括的通信信息的類型,提取出所述話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單,包括:解析所述話單得到所述話單中所包括的以下類型通信信息至少之一:通信發(fā)起號碼;對應所述通信發(fā)起號碼的通信響應號碼;通信起始時間;通信時長;提取出所述話單中各通信發(fā)起號碼所關聯(lián)的至少一種類型的通信信息形成各通信發(fā)起號碼的通信記錄;將所提取的各通信發(fā)起號碼的通信記錄組合形成所述預處理話單??蛇x的,所述解析所述預處理話單中各通信號碼的至少一種類型的通信信息,得到所述預處理話單中各通信號碼的相應類型通信信息所具有的特征,包括:分別計算所述預處理話單中的各通信發(fā)起號碼與黃頁號碼的編輯距離;基于所述編輯距離得到所述預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度;從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,包括:從所述預處理話單包括的各通信發(fā)起號碼中提取出與所述黃頁號碼的相似度大于第一閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼中與所述黃頁號碼的相似度的排序,提取出相似度最高的第一比例的通信發(fā)起號碼??蛇x的,所述解析所述預處理話單中各通信號碼的至少一種類型的通信信息,得到所述預處理話單中各通信號碼的相應類型通信信息所具有的特征,包括:提取所述預處理話單中各通信號碼作為通信發(fā)起號碼的通信起始時間;計算所述預處理話單中各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù);從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,包括:從所述預處理話單包括的各通信發(fā)起號碼中提取出單位時間內(nèi)通信次數(shù)大于第二閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)的排序,提取出通信次數(shù)最高的第二比例的通信發(fā)起號碼??蛇x的,所述解析所述預處理話單中各通信號碼的至少一種類型的通信信息,得到所述預處理話單中各通信號碼的相應類型通信信息所具有的特征,包括:提取所述預處理話單中各通信號碼作為通信發(fā)起號碼的通信時長;計算所述預處理話單中各通信發(fā)起號碼的平均通信時長;從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,包括:從所述預處理話單包括的各通信發(fā)起號碼中提取出平均通信時長大于第三閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼的平均通信時長的排序, 提取出平均通信時長最高的第三比例的通信發(fā)起號碼??蛇x的,所述解析所述預處理話單中各通信號碼的至少一種類型的通信信息,得到所述預處理話單中各通信號碼的相應類型通信信息所具有的特征,包括:獲取所述預處理話單中各通信號碼作為通信發(fā)起號碼時對應的通信響應號碼的歸屬地;計算所述預處理話單中各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量;從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,包括:從所述預處理話單包括的各通信發(fā)起號碼中提取出所對應的通信響應號碼的不同歸屬地的數(shù)量大于第四閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量的排序,提取出所對應的通信響應號碼的不同歸屬地的數(shù)量最高的第四比例的通信發(fā)起號碼。可選的,從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,包括:使用機器學習模型分析所述預處理話單中各通信號碼的相應類型通信信息所具有的特征,從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼??蛇x的,所述方法還包括:接收用戶側(cè)針對目標通信號碼的反饋信息,確定所述目標通信號碼是否為安全號碼;基于所述識別出的目標通信號碼中被用戶側(cè)反饋為安全號碼的目標通信號碼的數(shù)量,確定所述機器學習模型的錯誤率;機器學習模型的錯誤率大于第五閾值時,基于所述預處理話單中所述安全號碼的通信記錄,對所述機器學習模型進行重新訓練??蛇x的,基于所述預處理話單中所述安全號碼的通信記錄,對所述機器學習模型至進行重新訓練,包括:解析所述預處理話單中所述安全號碼的通信記錄的至少一種類型的通信信息,得到所述安全號碼的至少一種類型的通信信息所具有的特征;基于所述安全號碼的至少一種類型的通信信息所具有的特征更新所述機器學習模型識別所述目標通信號碼所使用的閾值??蛇x的,所述從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼之后,所述方法還包括:確定所述目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度;根據(jù)所述目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度,確定所述目標通信號碼的危險級別;基于所述目標通信號碼的危險級別對所述目標通信號碼的通信行為進行響應處理??蛇x的,確定所述目標通信號碼的危險級別為低危時,對所述目標通信號碼的通信行為進行響應處理,包括:向與目標通信號碼存在通信記錄的通信響應號碼的用戶進行危險提醒;其中,所述危險提醒包括語音提醒和/或文字提醒;或者,確定所述目標通信號碼的危險級別為高危時,對所述目標通信號碼的通信行為進行響應處理,包括:向與目標通信號碼正在進行通信的通信響應號碼的用戶進行即時的危險提醒;或者,直接攔截與目標通信號碼正在進行的通信??蛇x的,響應處理的實時程度與危險級別正相關。第二方面,本發(fā)明實施例提供一種通信號碼處理裝置,所述裝置包括:獲取模塊,用于從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單;預處理模塊,用于解析所述話單得到所述話單中所包括的通信信息的類型,提取出所述話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話 單;解析模塊,用于解析所述預處理話單中各通信號碼的至少一種類型的通信信息,得到所述預處理話單中各通信號碼的相應類型通信信息所具有的特征;提取模塊,用于從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼??蛇x的,所述預處理模塊,具體用于:解析所述話單得到所述話單中所包括的以下類型通信信息至少之一:通信發(fā)起號碼;對應所述通信發(fā)起號碼的通信響應號碼;通信起始時間;通信時長;提取出所述話單中各通信發(fā)起號碼所關聯(lián)的至少一種類型的通信信息形成各通信發(fā)起號碼的通信記錄;將所提取的各通信發(fā)起號碼的通信記錄組合形成所述預處理話單??蛇x的,所述解析模塊,具體用于:分別計算所述預處理話單中的各通信發(fā)起號碼與黃頁號碼的編輯距離;基于所述編輯距離得到所述預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度;所述提取模塊,具體用于:從所述預處理話單包括的各通信發(fā)起號碼中提取出與所述黃頁號碼的相似度大于第一閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼中與所述黃頁號碼的相似度的排序,提取出相似度最高的第一比例的通信發(fā)起號碼??蛇x的,所述解析模塊,具體用于:提取所述預處理話單中各通信號碼作為通信發(fā)起號碼的通信起始時間;計算所述預處理話單中各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù);所述提取模塊,具體用于:從所述預處理話單包括的各通信發(fā)起號碼中提取出單位時間內(nèi)通信次數(shù)大于第二閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)的排序,提取出通信次數(shù)最高的第二比例的通信發(fā)起號碼??蛇x的,所述解析模塊,具體用于:提取所述預處理話單中各通信號碼作為通信發(fā)起號碼的通信時長;計算所述預處理話單中各通信發(fā)起號碼的平均通 信時長;所述提取模塊,具體用于:從所述預處理話單包括的各通信發(fā)起號碼中提取出平均通信時長大于第三閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼的平均通信時長的排序,提取出平均通信時長最高的第三比例的通信發(fā)起號碼。可選的,所述解析模塊,具體用于:獲取所述預處理話單中各通信號碼作為通信發(fā)起號碼時對應的通信響應號碼的歸屬地;計算所述預處理話單中各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量;所述提取模塊,具體用于:從所述預處理話單包括的各通信發(fā)起號碼中提取出所對應的通信響應號碼的不同歸屬地的數(shù)量大于第四閾值的通信發(fā)起號碼;或者,基于所述預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量的排序,提取出所對應的通信響應號碼的不同歸屬地的數(shù)量最高的第四比例的通信發(fā)起號碼??蛇x的,所述提取模塊,具體用于:使用機器學習模型分析所述預處理話單中各通信號碼的相應類型通信信息所具有的特征,從所述預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼??蛇x的,所述裝置還包括:訓練模塊,用于接收用戶側(cè)針對目標通信號碼的反饋信息,確定所述目標通信號碼是否為安全號碼;基于所述識別出的目標通信號碼中被用戶側(cè)反饋為安全號碼的目標通信號碼的數(shù)量,確定所述機器學習模型的錯誤率;機器學習模型的錯誤率大于第五閾值時,基于所述預處理話單中所述安全號碼的通信記錄,對所述機器學習模型進行重新訓練??蛇x的,所述訓練模塊,具體用于:解析所述預處理話單中所述安全號碼的通信記錄的至少一種類型的通信信息,得到所述安全號碼的至少一種類型的通信信息所具有的特征;基于所述安全號碼的至少一種類型的通信信息所具有的特征更新所述機器學習模型識別所述目標通信號碼所使用的閾值??蛇x的,所述裝置還包括:響應模塊,用于確定所述目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度;根據(jù)所述目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度,確定所述目標通信號碼的危險級別;基于所述目標通信號碼的危險級別對所述目標通信號碼的通信行為進行響應處理。相比于現(xiàn)有技術需要收集用戶的標記信息,本發(fā)明實施例通過解析第一預設時間內(nèi)預設數(shù)量的通信號碼的話單得到各通信號碼的相應類型通信信息所具有的特征,并基于各通信號碼的相應類型通信信息所具有的特征從各通信號碼中提取出與預設特征匹配的目標通信號碼,一方面,通信號碼話單是由運營商維護的客觀數(shù)據(jù),能夠真實和完整地反映用戶在一定時間間隔內(nèi)的全部通信記錄,本發(fā)明實施例以通信號碼話單為處理依據(jù),能夠提高號碼識別的準確性,另一方面,由于話單的生成及維護過程一般并不需要各用戶的直接參與,而是由運營商負責,因而通信號碼話單的獲取速度和效率較高,如此,本發(fā)明實施例能夠提高號碼識別的速度和準確性。附圖說明圖1為本發(fā)明實施例中通信號碼處理方法的一個可選的應用場景示意圖;圖2為本發(fā)明實施例一中通信號碼處理方法的一個可選的流程示意圖;圖3為本發(fā)明實施例二中通信號碼處理方法的一個可選的流程示意圖;圖4為本發(fā)明實施例三中通信號碼處理方法的一個可選的流程示意圖;圖5為本發(fā)明實施例四中通信號碼處理方法的一個可選的流程示意圖;圖6為本發(fā)明實施例五中通信號碼處理方法的一個可選的流程示意圖;圖7為本發(fā)明實施例六中通信號碼處理方法的一個可選的流程示意圖;圖8為本發(fā)明實施例七中通信號碼處理方法的一個可選的流程示意圖;圖9為本發(fā)明實施例八中通信號碼處理方法的一個可選的流程示意圖;圖10為本發(fā)明實施例九中通信號碼處理方法的一個可選的流程示意圖;圖11a為本發(fā)明實施例中運行于用戶設備上的用戶應用處于接收用戶指示狀態(tài)的一個可選的示意圖;圖11b為本發(fā)明實施例中運行于用戶設備上的用戶應用處于文字提醒狀態(tài)的一個可選的示意圖;圖12為本發(fā)明實施例中通信號碼處理裝置的一個可選的結(jié)構示意圖;圖13為本發(fā)明實施例中通信號碼處理裝置的另一個可選的結(jié)構示意圖;圖14為本發(fā)明實施例中通信號碼處理裝置的又一個可選的結(jié)構示意圖。具體實施方式以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。本發(fā)明實施例記載一種通信號碼處理方法,參見圖1示出的本發(fā)明實施例中通信號碼處理方法的一個可選的應用場景,用戶設備11、用戶設備12、用戶設備13、網(wǎng)絡設備14(如運營商網(wǎng)關或企業(yè)網(wǎng)關)、通信業(yè)務設備15、應用的后臺服務器16分別接入通信網(wǎng)絡(如無線網(wǎng)絡或有線網(wǎng)絡),通信業(yè)務設備15例如業(yè)務支撐系統(tǒng)(bss,businesssupportsystem)/運營支撐系統(tǒng)(oss,operationsupportsystem),或者電信交換機;通信業(yè)務設備15用于提供通信號碼的話單;網(wǎng)絡設備14用于對接入該通信網(wǎng)絡的各用戶設備提供業(yè)務支撐;應用的后臺服務器16用于為應用提供業(yè)務支撐;這里,與應用的后臺服務器16相對應的,安裝于用戶設備的應用的客戶端也用于為應用提供業(yè)務支撐;應用具體可以為通信類應用,例如:騰訊手機管家、微信、騰訊郵箱等等,當然,應用不限于通信類應用,本發(fā)明實施例中并不對此進行具體限定;在上述場景中,用戶設備的數(shù)量至少為一個,各用戶設備分別關聯(lián)至少一個不同的通信號碼,例如,圖1示出的用戶設備11關聯(lián)至少一個通信號碼a、用戶設備12關聯(lián)至少一個通信號碼b,用戶設備13關聯(lián)至少一個通信號碼c,通信號碼a、通信號碼b與通信號碼c兩兩互不相同;本發(fā)明實施例中通信號碼處理方法可以應用于上述場景中,實現(xiàn)從多個通信號碼中識別出滿足預設條件的通信號碼。本發(fā)明實施例還記載一種通信號碼處理裝置,可以用于執(zhí)行本發(fā)明實施例的通信號碼處理方法;通信號碼處理裝置可以采用各種方式來實施,例如在智 能手機、固定電話、平板電腦、筆記本電腦、穿戴式設備(如智能眼鏡、智能手表等)等用戶設備中實施裝置的全部組件,或者,在企業(yè)網(wǎng)關、運營商網(wǎng)關等網(wǎng)絡設備中實施裝置的全部組件,或者,在上述的用戶設備側(cè)或網(wǎng)絡側(cè)以耦合的方式實施裝置中的組件,或者,通信號碼處理裝置還可以是用戶應用的客戶端或者后臺服務器,例如,當用戶應用為騰訊手機管家時,相應的通信號碼處理裝置可以為騰訊手機管家的客戶端或者后臺服務器?;谏鲜鲇涊d的應用場景及通信號碼處理裝置,提出以下各具體實施例。實施例一本實施例提供一種通信號碼處理方法,可以應用于需要從多個通信號碼中識別出滿足預設條件的通信號碼的場景中,例如針對通信網(wǎng)絡中全網(wǎng)號碼的識別,或者,針對用戶指示的待識別通信號碼的識別,或者,針對與當前用戶進行通信的通信號碼的識別等場景中;通信的業(yè)務類型包括但不限于以下任意一種業(yè)務類型或組合:語音通話;短信;閃信;數(shù)據(jù)業(yè)務(如微信),本發(fā)明并不以此為限?;谏鲜鐾ㄐ盘柎a處理裝置,參見圖2,本實施例提供的通信號碼處理方法,包括以下步驟:步驟201、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。通信業(yè)務設備可以包括電信支撐系統(tǒng)設備,例如bss/oss,或者電信交換機;第一預設時間可以由用戶或運營商根據(jù)實際業(yè)務需求等實際情況靈活設定;通信號碼并不限于手機號碼、固定號碼等;通信號碼例如可以包括通信網(wǎng)絡中的全部通信號碼,或者,用戶指示的待識別通信號碼,或者,與當前用戶進行通話的通信號碼;其中,上述用戶指示的待識別通信號碼,例如用戶在用戶設備上運行的應用(如騰訊手機管家)中指定的待識別通信號碼,或者,用戶向運營商服務器發(fā)送攜帶待識別通信號碼的指示消息。上述從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單的實 現(xiàn)方式可以為以下方式至少之一:1)從通信業(yè)務設備獲取通信網(wǎng)絡中的全部通信號碼在第一預設時間內(nèi)的話單;2)根據(jù)當前用戶指示的待識別通信號碼,從通信業(yè)務設備獲取待識別通信號碼在第一預設時間內(nèi)的話單;3)檢測到與當前用戶進行通話的通信號碼時,從通信業(yè)務設備獲取與當前用戶進行通話的通信號碼在第一預設時間內(nèi)的話單;4)確定與當前用戶進行通話的通信號碼為陌生通信號碼時,從通信業(yè)務設備獲取陌生通信號碼在第一預設時間內(nèi)的話單。步驟202、解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。上述從通信業(yè)務設備獲取的第一預設時間內(nèi)預設數(shù)量的通信號碼的話單一般是亂序的,本實施例中預處理話單是以各通信號碼為維度進行統(tǒng)計形成,預處理話單中包括各通信號碼在以下情況至少之一對應的至少一種類型的通信信息:通信號碼作為主叫號碼(如語音業(yè)務中的主叫號碼)、通信號碼作為被叫號碼(如語音業(yè)務中的被叫號碼)、通信號碼作為信息發(fā)送號碼(如短信發(fā)送號碼,或者數(shù)據(jù)業(yè)務中的數(shù)據(jù)發(fā)送號碼)、通信號碼作為信息接收號碼(如短信接收號碼,或者數(shù)據(jù)業(yè)務中的數(shù)據(jù)接收號碼)。預處理話單中僅包括從話單中提取的各通信號碼的至少一種類型的通信信息,也即預處理話單中并不需要包括話單中的全部信息;預處理話單的數(shù)據(jù)以各通信號碼作為索引,預處理話單的數(shù)據(jù)結(jié)構,例如為:語音業(yè)務中的主叫號碼1:通信信息1、通信信息2、…;語音業(yè)務中的主叫號碼2:通信信息3通信信息4、…;短信發(fā)送號碼3:通信信息5通信信息6、…;數(shù)據(jù)業(yè)務中的數(shù)據(jù)發(fā)送號碼4:通信信息7通信信息8、…;…。以表1示出的以各通信號碼作為主叫號碼進行索引的預處理話單為例,參見表1的數(shù)據(jù)結(jié)構示例,此處的主叫號碼、被叫號碼、通信起始時間、通信時 長(秒)為該話單中所包括的通信信息的類型的部分示例。表1主叫號碼被叫號碼通信起始時間通信時長(秒)158xxxx0001186xxxx00022016-01-1515:32:42134158xxxx0001139xxxx00012016-01-1515:39:0215158xxxx0001139xxxx00022016-01-1515:48:02123170xxxx0001186xxxx00012016-01-168:30:0277170xxxx0001139xxxx00022016-01-179:26:02256步驟203、解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征。步驟204、分析預處理話單中各通信號碼的相應類型通信信息所具有的特征,判斷各通信號碼的相應類型通信信息所具有的特征是否與預設特征匹配,若是,轉(zhuǎn)到步驟205,否則流程結(jié)束。步驟205、從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。對解析得到的預處理話單中各通信號碼的相應類型通信信息所具有的特征進行分析,從預處理話單包括的通信號碼中提取出相應類型通信信息所具有的特征與預設特征匹配的目標通信號碼;預設特征例如是預先設置的先驗值。相比于需要在收集用戶標記信息的基礎上實施識別號碼的現(xiàn)有技術,本實施例對通信號碼的話單進行解析得到通信號碼的相應類型通信信息所具有的特征,并基于通信號碼的相應類型通信信息所具有的特征從各通信號碼中識別出與預設特征匹配的目標通信號碼,一方面,由于通信號碼話單的生成及維護過程一般是由運營商負責,并不需要各個用戶的參與,通信號碼話單的獲取速度和效率較高,另一方面,由于通信號碼的話單是由運營商維護的客觀數(shù)據(jù),因而能夠真實和完整地反映用戶在一定時間間隔內(nèi)的所有通信記錄,如此,本發(fā)明實施例提供的技術方案以通信號碼的話單為處理基礎,能夠提高號碼識別的 速度和準確性。實施例二本實施例基于實施例一,針對具體如何解析話單得到話單中所包括的通信信息的類型,及提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單的場景,提出解決的技術方案。參見圖3,本實施例提供的通信號碼處理方法,包括以下步驟:步驟301、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。步驟302、解析話單得到話單中所包括的以下類型通信信息至少之一:通信發(fā)起號碼;對應通信發(fā)起號碼的通信響應號碼;通信起始時間;通信時長。通信發(fā)起號碼可以包括作為主叫號碼的通信號碼(如語音業(yè)務中的主叫號碼),及作為信息發(fā)送號碼的通信號碼(如短信發(fā)送號碼,或者數(shù)據(jù)業(yè)務中的數(shù)據(jù)發(fā)送號碼);對應通信發(fā)起號碼的通信響應號碼可以包括作為被叫號碼的通信號碼(如語音業(yè)務中的被叫號碼),及作為信息接收號碼的通信號碼(如短信接收號碼,或者數(shù)據(jù)業(yè)務中的數(shù)據(jù)接收號碼);本領域技術人員可以理解的是,話單中包括的通信信息的類型并不限于上述的通信發(fā)起號碼、對應通信發(fā)起號碼的通信響應號碼、通信起始時間、通信時長等,通信信息的類型還可以包括數(shù)據(jù)流量(上行流量和/或下行流量)、通信地點、業(yè)務類型、長途類型等;本發(fā)明并不以此為限。步驟303、提取出話單中各通信發(fā)起號碼所關聯(lián)的至少一種類型的通信信息形成各通信發(fā)起號碼的通信記錄。步驟304、將所提取的各通信發(fā)起號碼的通信記錄組合形成預處理話單。這里,預處理話單只是包括了從話單中提取的各通信號碼的至少一種類型的通信信息,預處理話單并未包括話單中的全部信息,可以降低通信號碼處理工作量,提高通信號碼處理效率。上述從通信業(yè)務設備獲取的第一預設時間內(nèi)預設數(shù)量的通信號碼的話單一 般是亂序的,以表2-1示出的話單為例,此處的通信起始時間、業(yè)務類型、通信發(fā)起號碼、通信響應號碼、通信地點、長途類型、通信時長(秒)為該話單中所包括的通信信息的類型的部分示例。表2-1通信號碼處理裝置對表2-1示出的話單進行解析,得到話單中所包括的以下類型通信信息至少之一:通信發(fā)起號碼;對應通信發(fā)起號碼的通信響應號碼;通信起始時間;通信時長;通信號碼處理裝置提取出話單中各通信發(fā)起號碼所關聯(lián)的至少一種類型的通信信息形成各通信發(fā)起號碼的通信記錄;這里,每個通信發(fā)起號碼的通信記錄中包括該通信號碼在第一預設時間內(nèi)的至少一種類型的通信信息;將所提取的各通信發(fā)起號碼的通信記錄組合形成預處理話單;預處理話單 是以各通信號碼為維度進行統(tǒng)計形成,預處理話單中的數(shù)據(jù)結(jié)構(或顯示方式)以各通信號碼為索引組織,假設將各通信號碼為通信發(fā)起號碼時對應的至少一種類型的通信信息進行組合形成預處理話單,預處理話單的數(shù)據(jù)結(jié)構可以為:通信發(fā)起號碼1:通信信息1、通信信息2、…;通信發(fā)起號碼2:通信信息1通信信息2、…;…。以表2-2示出的預處理話單為例,表2-2示出的預處理話單是通信號碼處理裝置在表2-1示出的話單的基礎上,通過執(zhí)行步驟202-步驟204的方法得到的;該預處理話單以各通信發(fā)起號碼為索引進行組織。表2-2通信發(fā)起號碼通信響應號碼通信起始時間通信時長(秒)158xxxx0001186xxxx00022016-01-1515:32:42134158xxxx0001186xxxx00072016-01-1515:42:0297158xxxx0001139xxxx00062016-01-1515:48:02123158xxxx0001187xxxx00022016-01-1515:52:07256170xxxx0001186xxxx00012016-01-1515:39:0215170xxxx0001180xxxx00072016-01-1515:51:0277170xxxx0001139xxxx00022016-01-1610:26:02--步驟305、解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征。步驟306、分析預處理話單中各通信號碼的相應類型通信信息所具有的特征,判斷各通信號碼的相應類型通信信息所具有的特征是否與預設特征匹配,若是,轉(zhuǎn)到步驟307,否則流程結(jié)束。步驟307、從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。本實施例針對具體如何解析話單得到話單中所包括的通信信息的類型,及提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單的 場景,通過解析話單得到話單中所包括的至少一種類型的通信信息,提取出話單中各通信發(fā)起號碼所關聯(lián)的至少一種類型的通信信息形成各通信發(fā)起號碼的通信記錄,將所提取的各通信發(fā)起號碼的通信記錄組合形成預處理話單,所形成的預處理話單僅包括了從話單中提取的各通信號碼的至少一種類型的通信信息,預處理話單并未包括話單中的全部信息,可以降低號碼識別的工作量,提高號碼識別的速度和效率。實施例三本實施例基于實施例一,以通信發(fā)起號碼與黃頁號碼的編輯距離作為通信號碼的特征,說明具體如何從多個通信號碼中識別出滿足預設條件的通信號碼的技術方案;本實施例提供的通信號碼處理方法,包括以下步驟:1)從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。2)解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。3)分別計算預處理話單中的各通信發(fā)起號碼與黃頁號碼的編輯距離。黃頁號碼可以為一個或多個;編輯距離是指將黃頁號碼轉(zhuǎn)成與通信發(fā)起號碼所需的最少編輯操作次數(shù),也即通過對黃頁號碼進行增加、減少、修改、移動號碼等操作變成通信發(fā)起號碼的操作次數(shù);在黃頁號碼為多個的場景中,針對預處理話單中的每一個通信發(fā)起號碼,需要分別計算該通信發(fā)起號碼與每一個黃頁號碼的編輯距離。4)基于編輯距離得到預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度??梢圆捎靡韵路绞街辽僦唬瑢崿F(xiàn)基于編輯距離得到預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度:方式1、針對預處理話單中的每一個通信發(fā)起號碼,將分別計算得到的該通信發(fā)起號碼與每一個黃頁號碼的編輯距離進行歸一化處理,得到該通信發(fā)起號碼與每一個黃頁號碼的相似度;進一步,對該通信發(fā)起號碼與每一個黃頁號碼的相似度進行排序。方式2、針對預處理話單中的每一個通信發(fā)起號碼,計算該通信發(fā)起號碼與黃頁號碼的編輯距離與預設距離的比值,將計算得到的比值通信發(fā)起號碼與黃頁號碼的相似度;在黃頁號碼為多個的場景中,需要分別計算該通信發(fā)起號碼與每一個黃頁號碼的編輯距離與預設距離的比值。5)判斷預處理話單包括的各通信發(fā)起號碼與黃頁號碼的相似度是否大于第一閾值,若是,則從預處理話單包括的各通信發(fā)起號碼中提取出與黃頁號碼的相似度大于第一閾值的通信發(fā)起號碼,作為目標通信號碼;否則流程終止。第一閾值(即相似度閾值)的初始值可以由人工設定或訓練計算得到,例如:根據(jù)先驗值確定預處理話單包括的各通信發(fā)起號碼中的目標通信號碼的目標數(shù)量;將各通信發(fā)起號碼與黃頁號碼的相似度進行排序;按照相似度遞減的次序,選取目標數(shù)量的通信發(fā)起號碼;將所選取的通信發(fā)起號碼中與黃頁號碼的相似度最小的通信發(fā)起號碼所對應的相似度,確定為第一閾值的初始值。第一閾值可以根據(jù)實際需要,通過訓練計算進行繼續(xù)更新。在一個可行的實施方式中,通信號碼處理裝置基于預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度,對預處理話單包括的各通信發(fā)起號碼與黃頁號碼的相似度進行排序;基于預處理話單包括的各通信發(fā)起號碼與黃頁號碼的相似度的排序,從預處理話單包括的各通信發(fā)起號碼中提取出相似度最高的第一比例的通信發(fā)起號碼,作為目標通信號碼。在另一個可行的實施方式中,針對預處理話單包括的各通信發(fā)起號碼中的任意一個通信號碼,通信號碼處理裝置根據(jù)該通信發(fā)起號碼中與黃頁號碼的相似度及第一閾值,分別確定該通信發(fā)起號碼屬于目標通信號碼(比如詐騙號碼)類的概率、及屬于正常號碼類的概率,將概率較大值所對應的類作為該通信發(fā)起號碼所屬的類;若概率較大值所對應的類為目標通信號碼類,則確定該通信發(fā)起號碼為目標通信號碼,反之則確定該通信發(fā)起號碼為正常號碼。本實施例的實施依賴于用戶設備、服務器及通信業(yè)務設備的配合,這里,用戶設備例如可以是智能手機、固定電話、平板電腦、筆記本電腦、穿戴式設備(如智能眼鏡、智能手表等)等;服務器例如可以是運營商的業(yè)務服務器、 企業(yè)網(wǎng)關、安裝于用戶設備的應用的后臺服務器等;通信業(yè)務設備例如可以是bss/oss或者電信交換機;應用具體可以為通信類應用,例如:騰訊手機管家、微信、騰訊郵箱等等,當然,應用不限于通信類應用,本發(fā)明實施例中并不對此進行具體限定;參見圖4示出的用戶設備、服務器及通信業(yè)務設備相互配合以實施本實施例提供的通信號碼處理方法的一個可選的流程圖,方法包括:步驟401、基于用戶指示,用戶設備向服務器發(fā)送攜帶待識別通信號碼的識別指示。例如,參見圖11a,運行于用戶設備上的用戶應用處于接收用戶指示狀態(tài),用戶在安裝于用戶設備的應用的顯示窗口,按照應用的提示在指定位置輸入待識別通信號碼;這里,待識別通信號碼可以為一個或多個。步驟402、服務器接收識別指示,基于識別指示向通信業(yè)務設備發(fā)送攜帶待識別通信號碼的話單請求;話單請求中包括待識別通信號碼、及第一預設時間。步驟403、通信業(yè)務設備接收話單請求,基于話單請求獲取待識別通信號碼在第一預設時間內(nèi)的話單,并發(fā)送給服務器。步驟404、服務器接收待識別通信號碼在第一預設時間內(nèi)的話單。步驟405、解析話單得到話單中所包括的通信信息的類型,提取出話單中各待識別通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟406、分別計算預處理話單中的各待識別通信號碼與黃頁號碼的編輯距離。步驟407、基于編輯距離得到預處理話單中各待識別通信號碼與黃頁號碼的相似度。步驟408、判斷預處理話單包括的各待識別通信號碼與黃頁號碼的相似度是否大于第一閾值,若是,則轉(zhuǎn)到步驟409,否則流程終止。步驟409、從預處理話單包括的各待識別通信號碼中提取出與黃頁號碼的相似度大于第一閾值的通信發(fā)起號碼,作為目標通信號碼。步驟410、服務器基于識別到的目標通信號碼向用戶設備發(fā)送攜帶目標通 信號碼的識別響應,識別響應用于對用戶進行危險提醒,提醒用戶該識別到的目標通信號碼可能為詐騙號碼;危險提醒的實現(xiàn)方式包括但不限于通過短信、閃信、微信、騰訊手機管家等通信類應用進行提醒;服務器還可以在識別到目標通信號碼時,直接通過客服電話向用戶設備進行危險提醒。同時,服務器基于識別到的目標通信號碼,還可以向與識別出的目標通信號碼存在通信記錄、或者正在通信的通信響應號碼的用戶進行危險提醒,以避免用戶受騙。用戶設備接收到服務器發(fā)送的攜帶目標通信號碼的識別響應后,基于目標通信號碼對用戶進行危險提醒;例如,參見圖11b,運行于用戶設備上的用戶應用處于文字提醒狀態(tài),用戶設備在安裝于用戶設備的應用的顯示窗口顯示例如以下文字提醒信息“請?zhí)岣呔?!目標通信號碼是詐騙號碼”;這里的用戶應用包括但不限于:短信、閃信、微信、騰訊手機管家等通信類應用;當然,應用不限于通信類應用,本發(fā)明實施例中并不對此進行具體限定。本實施例針對具體如何得到預處理話單中各通信號碼的相應類型通信信息所具有的特征,并從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,通過在對話單進行解析的基礎上得到預處理話單,分別計算預處理話單中的各通信發(fā)起號碼與黃頁號碼的編輯距離,基于編輯距離得到預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度(即通信號碼作為通信發(fā)起號碼所具有的特征之一),從預處理話單包括的各通信發(fā)起號碼中提取出與黃頁號碼的相似度大于預設第一閾值的通信發(fā)起號碼作為目標通信號碼,或者,基于預處理話單包括的各通信發(fā)起號碼中與黃頁號碼的相似度的排序,提取出相似度最高的第一比例的通信發(fā)起號碼作為目標通信號碼;本發(fā)明實施例以預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度為特征,以第一閾值為預設特征,通過判斷預處理話單包括的各通信發(fā)起號碼與黃頁號碼的相似度與第一閾值的相對關系,從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,實現(xiàn)了快速和準確的號碼識別。實施例四本實施例基于實施例一,以通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)作為通信號碼的特征,說明具體如何從多個通信號碼中識別出滿足預設條件的通信號碼的技術方案;本實施例提供的通信號碼處理方法,包括以下步驟:1)從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。2)解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。3)提取預處理話單中各通信號碼作為通信發(fā)起號碼的通信起始時間。4)計算預處理話單中各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)。實際中,通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)可以包括以下任意一種:方式1、通信發(fā)起號碼與相同號碼在單位時間內(nèi)的通信次數(shù);方式2、通信發(fā)起號碼與所有與其進行通信的通信號碼在單位時間內(nèi)的通信次數(shù)。5)判斷預處理話單包括的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)是否大于第二閾值,若是,則從預處理話單包括的各通信發(fā)起號碼中提取出在單位時間內(nèi)的通信次數(shù)大于第二閾值的通信發(fā)起號碼,作為目標通信號碼;否則流程終止。第二閾值的初始值可以由人工設定或訓練計算得到,例如:根據(jù)先驗值確定預處理話單包括的各通信發(fā)起號碼中的目標通信號碼的目標數(shù)量;將各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)進行排序;按照在單位時間內(nèi)的通信次數(shù)遞減的次序,選取目標數(shù)量的通信發(fā)起號碼;將所選取的通信發(fā)起號碼中在單位時間內(nèi)的通信次數(shù)最小的通信發(fā)起號碼所對應的在單位時間內(nèi)的通信次數(shù),確定為第二閾值的初始值。第二閾值可以根據(jù)實際需要,通過訓練計算進行繼續(xù)更新。在一個可行的實施方式中,通信號碼處理裝置基于預處理話單中各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù),對預處理話單包括的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)進行排序;基于預處理話單包括的各通信發(fā)起號碼在單位時 間內(nèi)的通信次數(shù)的排序,從預處理話單包括的各通信發(fā)起號碼中提取出通信次數(shù)最高的第二比例的通信發(fā)起號碼,作為目標通信號碼。本實施例的實施依賴于用戶設備、服務器及通信業(yè)務設備的配合,這里,用戶設備例如可以是智能手機、固定電話、平板電腦、筆記本電腦、穿戴式設備(如智能眼鏡、智能手表等)等;服務器例如可以是運營商的業(yè)務服務器、企業(yè)網(wǎng)關、安裝于用戶設備的應用的后臺服務器等;通信業(yè)務設備例如可以是bss/oss或者電信交換機;應用具體可以為通信類應用,例如:騰訊手機管家、微信、騰訊郵箱等等,當然,應用不限于通信類應用,本發(fā)明實施例中并不對此進行具體限定;參見圖5示出的用戶設備、服務器及通信業(yè)務設備相互配合以實施本實施例提供的通信號碼處理方法的一個可選的流程圖,方法包括:步驟501、當檢測到與當前用戶進行通話的對方通信號碼時,用戶設備(或安裝于用戶設備的應用)向服務器發(fā)送攜帶對方通信號碼的識別指示。步驟502、服務器接收識別指示,基于識別指示向通信業(yè)務設備發(fā)送攜帶對方通信號碼的話單請求;話單請求中包括對方通信號碼及第一預設時間。步驟503、通信業(yè)務設備接收話單請求,基于話單請求獲取對方通信號碼在第一預設時間內(nèi)的話單,并發(fā)送給服務器。步驟504、服務器接收對方通信號碼在第一預設時間內(nèi)的話單。步驟505、解析話單得到話單中所包括的通信信息的類型,提取出話單中對方通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟506、提取預處理話單中該對方通信號碼作為通信發(fā)起號碼的通信起始時間。步驟507、計算預處理話單中該對方通信號碼在單位時間內(nèi)的通信次數(shù)。步驟508、判斷預處理話單包括的該對方通信號碼在單位時間內(nèi)的通信次數(shù)是否大于第二閾值,若是,則轉(zhuǎn)到步驟509,否則流程終止。步驟509、從預處理話單包括的該對方通信號碼中提取出在單位時間內(nèi)的通信次數(shù)大于第二閾值的通信發(fā)起號碼,作為目標通信號碼。步驟510、服務器基于識別到的目標通信號碼對用戶進行危險提醒,提醒 用戶該識別到的目標通信號碼可能為詐騙號碼;危險提醒的實現(xiàn)方式包括但不限于通過短信、閃信、微信、騰訊手機管家等通信類應用進行提醒;服務器還可以在識別到目標通信號碼時,直接通過客服電話向用戶設備進行危險提醒。同時,服務器基于識別到的目標通信號碼,還可以向與識別出的目標通信號碼存在通信記錄、或者正在通信的通信響應號碼的用戶進行危險提醒,以避免用戶受騙。用戶設備接收到服務器發(fā)送的攜帶目標通信號碼的識別響應后,基于目標通信號碼對用戶進行危險提醒;例如,參見圖11b,用戶設備在安裝于用戶設備的應用的顯示窗口顯示例如以下文字提醒信息“請?zhí)岣呔?!目標通信號碼是詐騙號碼”;這里的用戶應用包括但不限于:短信、閃信、微信、騰訊手機管家等通信類應用;當然,應用不限于通信類應用,本發(fā)明實施例中并不對此進行具體限定。本實施例針對具體如何得到預處理話單中各通信號碼的相應類型通信信息所具有的特征,并從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,通過在對話單進行解析的基礎上得到預處理話單,分別計算預處理話單中的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)(即通信號碼作為通信發(fā)起號碼所具有的特征之一),從預處理話單包括的各通信發(fā)起號碼中提取出在單位時間內(nèi)的通信次數(shù)大于預設第二閾值的通信發(fā)起號碼作為目標通信號碼,或者,基于預處理話單包括的各通信發(fā)起號碼中在單位時間內(nèi)的通信次數(shù)的排序,提取出通信次數(shù)最高的第二比例的通信發(fā)起號碼作為目標通信號碼;本發(fā)明實施例以預處理話單中各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)為特征,以第二閾值為預設特征,通過判斷預處理話單包括的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)與第二閾值的相對關系,從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,實現(xiàn)了快速和準確的號碼識別。實施例五本實施例基于實施例一,針對具體如何解析預處理話單中各通信號碼的至 少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征,并從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,提出解決的技術方案。參見圖6,本實施例提供的通信號碼處理方法,包括以下步驟:步驟601、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。步驟602、解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟603、提取預處理話單中各通信號碼作為通信發(fā)起號碼的通信時長。步驟604、計算預處理話單中各通信發(fā)起號碼的平均通信時長。實際中,通信發(fā)起號碼的平均通信時長可以包括以下任意一種:1)通信發(fā)起號碼與相同號碼的平均通信時長;2)通信發(fā)起號碼與所有與其進行通信的通信號碼的平均通信時長。步驟605、判斷預處理話單包括的各通信發(fā)起號碼的平均通信時長是否大于第三閾值,若是,則轉(zhuǎn)到步驟606,否則流程終止。第三閾值的初始值可以由人工設定或訓練計算得到,例如:根據(jù)先驗值確定預處理話單包括的各通信發(fā)起號碼中的目標通信號碼的目標數(shù)量;將各通信發(fā)起號碼的平均通信時長進行排序;按照平均通信時長遞減的次序,選取目標數(shù)量的通信發(fā)起號碼;將所選取的通信發(fā)起號碼中平均通信時長最小的通信發(fā)起號碼所對應的平均通信時長,確定為第三閾值的初始值。第三閾值可以根據(jù)實際需要,通過訓練計算進行繼續(xù)更新。步驟606、從預處理話單包括的各通信發(fā)起號碼中提取出平均通信時長大于第三閾值的通信發(fā)起號碼,作為目標通信號碼。在一個可行的實施方式中,通信號碼處理裝置基于預處理話單中各通信發(fā)起號碼的平均通信時長,對預處理話單包括的各通信發(fā)起號碼的平均通信時長 進行排序;基于預處理話單包括的各通信發(fā)起號碼的平均通信時長的排序,從預處理話單包括的各通信發(fā)起號碼中提取出平均通信時長最高的第三比例的通信發(fā)起號碼,作為目標通信號碼。本實施例針對具體如何得到預處理話單中各通信號碼的相應類型通信信息所具有的特征,并從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,通過在對話單進行解析的基礎上得到預處理話單,分別計算預處理話單中的各通信發(fā)起號碼的平均通信時長(即通信號碼作為通信發(fā)起號碼所具有的特征之一),從預處理話單包括的各通信發(fā)起號碼中提取出平均通信時長大于預設第三閾值的通信發(fā)起號碼作為目標通信號碼,或者,基于預處理話單包括的各通信發(fā)起號碼的平均通信時長的排序,提取出平均通信時長最高的第三比例的通信發(fā)起號碼作為目標通信號碼;本發(fā)明實施例以預處理話單中各通信發(fā)起號碼的平均通信時長為特征,以第三閾值為預設特征,通過判斷預處理話單包括的各通信發(fā)起號碼的平均通信時長與第三閾值的相對關系,從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,實現(xiàn)了快速和準確的號碼識別。實施例六本實施例基于實施例一,針對具體如何解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征,并從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,提出解決的技術方案。參見圖7,本實施例提供的通信號碼處理方法,包括以下步驟:步驟701、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。步驟702、解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟703、提取預處理話單中各通信號碼作為通信發(fā)起號碼時對應的通信 響應號碼的歸屬地。步驟704、計算預處理話單中各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量。步驟705、判斷預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量是否大于第四閾值,若是,則轉(zhuǎn)到步驟706,否則流程終止。第四閾值的初始值可以由人工設定或訓練計算得到,例如:根據(jù)先驗值確定預處理話單包括的各通信發(fā)起號碼中的目標通信號碼的目標數(shù)量;將各通信發(fā)起號碼的平均通信時長進行排序;按照所對應的通信響應號碼的不同歸屬地的數(shù)量遞減的次序,選取目標數(shù)量的通信發(fā)起號碼;將所選取的通信發(fā)起號碼中所對應的通信響應號碼的不同歸屬地的數(shù)量最小的通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量,確定為第四閾值的初始值。第四閾值可以根據(jù)實際需要,通過訓練計算進行繼續(xù)更新。步驟706、從預處理話單包括的各通信發(fā)起號碼中提取出所對應的通信響應號碼的不同歸屬地的數(shù)量大于第四閾值的通信發(fā)起號碼,作為目標通信號碼。在一個可行的實施方式中,通信號碼處理裝置基于預處理話單中各通信發(fā)起號碼的平均通信時長,對預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量進行排序;基于預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量的排序,從預處理話單包括的各通信發(fā)起號碼中提取出所對應的通信響應號碼的不同歸屬地的數(shù)量最高的第四比例的通信發(fā)起號碼,作為目標通信號碼。本實施例針對具體如何得到預處理話單中各通信號碼的相應類型通信信息所具有的特征,并從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,通過在對話單進行解析的基礎上得到預處理話單,分別計 算預處理話單中的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量(即通信號碼作為通信發(fā)起號碼所具有的特征之一),從預處理話單包括的各通信發(fā)起號碼中提取出所對應的通信響應號碼的不同歸屬地的數(shù)量大于預設第三閾值的通信發(fā)起號碼作為目標通信號碼,或者,基于預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量的排序,提取出所對應的通信響應號碼的不同歸屬地的數(shù)量最高的第四比例的通信發(fā)起號碼作為目標通信號碼;本發(fā)明實施例以預處理話單中各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量為特征,以第四閾值為預設特征,通過判斷預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量與第四閾值的相對關系,從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,實現(xiàn)了快速和準確的號碼識別。實施例七本實施例基于上述實施例,針對具體如何從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,提出解決的技術方案。參見圖8,本實施例提供的通信號碼處理方法,包括以下步驟:步驟801、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。步驟802、解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟803、解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征。步驟804、使用機器學習模型分析預處理話單中各通信號碼的相應類型通信信息所具有的特征。步驟805、判斷各通信號碼的相應類型通信信息所具有的特征是否與預設特征匹配,若是,轉(zhuǎn)到步驟806,否則流程結(jié)束。步驟806、從預處理話單包括的通信號碼中提取出與預設特征匹配的目標 通信號碼。這里,使用機器學習模型分析預處理話單中各通信號碼的相應類型通信信息所具有的特征的實現(xiàn)方式包括:使用上述實施例三至實施例六中任意一個實施例所記載的技術方案或者技術方案的組合識別目標通信號碼。機器學習模型可以采用以下任意一種模型或組合:貝葉斯分類器模型;支持向量機(svm,supportvectormachine)分類器模型;深度學習模型;邏輯回歸;本領域技術人員可以理解的是,機器學習模型還可以包括此處未列舉的其他模型,本發(fā)明并不以此為限。本實施例針對具體如何得到從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼的場景,通過使用機器學習模型分析預處理話單中各通信號碼的相應類型通信信息所具有的特征,從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼,實現(xiàn)了快速、高效的號碼識別。實施例八本實施例基于實施例七,針對具體如何基于用戶側(cè)針對目標通信號碼的反饋信息對機器學習模型進行訓練的場景,提出解決的技術方案。參見圖9,本實施例提供的通信號碼處理方法,包括以下步驟:步驟901、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。步驟902、解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟903、解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征。步驟904、分析預處理話單中各通信號碼的相應類型通信信息所具有的特征,判斷各通信號碼的相應類型通信信息所具有的特征是否與預設特征匹配,若是,轉(zhuǎn)到步驟905,否則流程結(jié)束。步驟905、從預處理話單包括的通信號碼中提取出與預設特征匹配的目標 通信號碼;以及,向與識別出的目標通信號碼存在通信記錄、或者正在通信的通信響應號碼的用戶進行危險提醒。步驟906、接收用戶側(cè)針對目標通信號碼的反饋信息。接收用戶側(cè)針對攜帶識別出的目標通信號碼的危險提醒的反饋信息。步驟907、根據(jù)用戶側(cè)針對目標通信號碼的反饋信息,判斷目標通信號碼是否為安全號碼,若是,則轉(zhuǎn)到步驟908,否則流程結(jié)束。步驟908、基于識別出的目標通信號碼中被用戶側(cè)反饋為安全號碼的目標通信號碼的數(shù)量,確定機器學習模型的錯誤率。步驟909、判斷機器學習模型的錯誤率是否大于第五閾值,若是,則轉(zhuǎn)到步驟910,否則流程結(jié)束。步驟910、基于預處理話單中安全號碼的通信記錄,對機器學習模型進行重新訓練。這里,基于預處理話單中安全號碼的通信記錄,對機器學習模型至進行重新訓練的一種可行的實現(xiàn)方式包括:解析預處理話單中安全號碼的通信記錄的至少一種類型的通信信息,得到安全號碼的至少一種類型的通信信息所具有的特征;基于安全號碼的至少一種類型的通信信息所具有的特征更新機器學習模型識別目標通信號碼所使用的閾值。本實施例針對基于用戶側(cè)針對目標通信號碼的反饋信息對機器學習模型進行訓練的場景,根據(jù)目標通信號碼中被用戶側(cè)反饋為安全號碼的目標通信號碼的數(shù)量確定機器學習模型的錯誤率,并在機器學習模型的錯誤率大于第五閾值時,基于預處理話單中安全號碼的通信記錄,對機器學習模型進行重新訓練;由于重新訓練時依據(jù)的是預處理話單中安全號碼的通信記錄,因而重新訓練得到的機器學習模型的準確率較高,如此,使用重新訓練得到的機器學習模型進行目標通信號碼的識別,能夠提高號碼識別的速度和準確性。實施例九本實施例基于上述任意實施例,針對識別到目標通信號碼時的響應處理場景,提出解決的技術方案。參見圖10,本實施例提供的通信號碼處理方法,包括以下步驟:步驟1001、從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單。步驟1002、解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單。步驟1003、解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征。步驟1004、分析預處理話單中各通信號碼的相應類型通信信息所具有的特征,判斷各通信號碼的相應類型通信信息所具有的特征是否與預設特征匹配,若是,轉(zhuǎn)到步驟1005,否則流程結(jié)束。步驟1005、從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。步驟1006、確定目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度。目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度也可以理解為是目標通信號碼的相應類型通信信息所具有的特征與預設特征的差異程度;以目標通信號碼的特征為目標通信號碼與黃頁號碼的相似度為例,目標通信號碼與黃頁號碼的相似度大于第一閾值,這里,匹配程度是指目標通信號碼與黃頁號碼的相似度與第一閾值的差值的大小。步驟1007、根據(jù)目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度,確定目標通信號碼的危險級別。匹配程度與危險級別是正相關的關系;不同的危險級別可以對應不同數(shù)據(jù)范圍內(nèi)的匹配程度。步驟1008、基于目標通信號碼的危險級別對目標通信號碼的通信行為進行響應處理。響應處理的實時程度與危險級別是正相關的關系;假設定義的危險級別包括:高危、低危;此處的危險級別可以用于表征該目標通信號碼是滿足特定條件的通信號碼的概率,例如危險級別可以用于表征該目標通信號碼是詐騙號碼的概率。通信號碼處理裝置在確定目標通信號碼的危險級別為低危時,對目標通信號碼的通信行為進行響應處理的方式可以包括:向與目標通信號碼存在通信記錄的通信響應號碼的用戶進行危險提醒,提醒該用戶該目標通信號碼是詐騙號碼;這里,危險提醒包括語音提醒和/或文字提醒;語音提醒例如發(fā)送語音錄音或客服電話提醒;文字提醒例如為短信或閃信。參見圖11b,通信號碼處理裝置向與目標通信號碼存在通信記錄的通信響應號碼的用戶進行事后的危險提醒,在與目標通信號碼存在通信記錄的通信響應號碼的用戶設備上,在用戶應用的顯示窗口顯示如下的文字提醒信息“請?zhí)岣呔?!目標通信號碼是詐騙號碼”;這里的用戶應用包括但不限于:短信、閃信、微信、騰訊手機管家等通信類應用;當然,應用不限于通信類應用,本發(fā)明實施例中并不對此進行具體限定。通信號碼處理裝置在確定目標通信號碼的危險級別為高危時,對目標通信號碼的通信行為進行響應處理的方式可以包括:向與目標通信號碼正在進行通信的通信響應號碼的用戶進行即時的危險提醒(包括但不限于短信或閃信等文字提醒方式,或發(fā)送語音錄音或客服電話提醒等語音提醒方式),即在該用戶正在與目標通信號碼進行通信的過程中提醒該用戶該目標通信號碼是詐騙號碼;或者,直接攔截與目標通信號碼正在進行的通信,且事后對用戶進行危險提醒。本實施例針對識別到目標通信號碼時的響應處理場景,基于目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度確定目標通信號碼的危險級別,基于目標通信號碼的危險級別對目標通信號碼的通信行為進行響應處理,提醒與目標通信號碼進行通信的用戶提高警惕,避免被詐騙。實施例十本實施例基于上述任意實施例,可以應用于需要從多個通信號碼中識別出滿足預設條件的通信號碼的場景中,例如針對通信網(wǎng)絡中全網(wǎng)號碼的識別,或者,針對用戶指示的待識別通信號碼的識別,或者,針對與當前用戶進行通信的通信號碼的識別等場景中;通信的業(yè)務類型包括但不限于以下任意一種業(yè)務類型或組合:語音通話;短信;閃信;數(shù)據(jù)業(yè)務(如微信),本發(fā)明并不以此為限。參見圖12,本實施例提供的通信號碼處理裝置(基于話單分析的詐騙號碼識別系統(tǒng)),包括:在線識別系統(tǒng)和離線訓練系統(tǒng)。在線識別系統(tǒng)是根據(jù)運營商采集的話單記錄,抽取出特征;利用機器學習模型來判斷某個電話號碼是不是詐騙電話;然后,對被騙用戶進行提醒/回訪,避免用戶上當受騙,將提醒/回訪的結(jié)果反饋到離線訓練系統(tǒng),據(jù)此對機器學習模型進行調(diào)整;離線訓練系統(tǒng)是利用歷史話單數(shù)據(jù)以及在線識別系統(tǒng)中提醒/回訪的反饋結(jié)果,抽取出相應的特征;利用這些特征,對機器學習模型重新進行訓練、調(diào)整;訓練好的機器學習模型,同步更新到在線訓練系統(tǒng)中的欺詐電話識別引擎。具體地,在線識別系統(tǒng)根據(jù)用戶通話話單記錄,就可以識別出詐騙號碼;在線識別系統(tǒng)又可以分為3個模塊:話單采集模塊,欺詐電話識別引擎和受騙用戶識別系統(tǒng);其中,話單采集模塊:主要負責用戶通話記錄的采集,并對采集后的話單進行預處理得到下表4列信息:主叫號碼被叫號碼通話時間通話時長(秒)158xxxx0001186xxxx00022016-01-1515:36:42134001xx86139xxxx00012016-01-1515:39:0215138xxxx0001139xxxx00022016-01-1515:38:02123欺詐電話識別引擎:這是在線識別系統(tǒng)的核心;對采集后的話單進行清洗,提取出特征,使用訓練好的機器學習模型對話單抽取出的特征進行識別,判斷 該號碼是否是詐騙電話;它又可分為3個部分:話單清洗、特征提取和詐騙號碼識別;其中,1)話單清洗就是去除話單中的“臟”數(shù)據(jù)。所謂的“臟”數(shù)據(jù),是一些異常的數(shù)據(jù),比如內(nèi)容缺失,值異常等。2)特征提?。簩η逑春蟮脑拞?,提取了一些特征,為下一步詐騙號碼的識別做準備,特征包括:主叫號碼的相似度,平均通話時長,相鄰話單被叫號碼的距離,通話間隔等。主叫號碼與黃頁號碼的相似度特征(即上述的通信發(fā)起號碼與黃頁號碼的相似度):詐騙號碼大都是主叫號碼,詐騙分子通過改號軟件,將主叫號碼改為和黃頁上號碼相似的號碼,比如001xx86、+0109xx88,08xxx10010(中國聯(lián)通的客服電話為10010)等,計算這些號碼的子串與黃頁上號碼的編輯距離(編輯距離:黃頁號碼通過增加、減少、修改、移動號碼等操作變成主叫號碼的操作次數(shù))。單位時間內(nèi)撥打次數(shù)(即上述的通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)):詐騙分子一般每個小時都會打很多通電話,而且這些電話大都是在工作時間,也就是周一至周五的08:00:00--18:00:00,在這個時段,撥打次數(shù)是均勻分布;非工作時段,電話的撥打次數(shù)一般很少,基本為0。平均通話時長(即上述的平均通信時長):即詐騙號碼平均每個通話的通話時長,一般用戶接到詐騙電話,都會很快的掛掉電話,所以詐騙平均通話時長很短,不超過20s。被叫號碼所在的歸屬地在時間(單位:天)上的分布(即上述的通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量):詐騙分子通常是逐個城市的進行詐騙,因此,這些話單中的被叫號碼通常都是屬于某個城市的,將一定時間內(nèi)被叫號碼的歸屬城市個數(shù)作為該特征。3)詐騙電話的識別:使用上述提取的特征,利用機器學習模型來識別詐騙。受騙用戶提醒系統(tǒng):告知詐騙通話話單中的受害用戶所接收到的某通話是詐騙電話,防止受害用戶上當受騙;同時將受害用戶反饋的結(jié)果,是否是詐騙 電話的信息提交到離線訓練系統(tǒng)。2.離線訓練系統(tǒng)當發(fā)現(xiàn)受騙用戶提醒系統(tǒng)反饋的機器學習模型的錯誤率高于域值時,離線訓練系統(tǒng)會提取出相關的歷史話單的特征,重新訓練機器學習模型,調(diào)整貝葉斯分類器(這里也可以用其他的機器學習算法,比如svm分類器、邏輯回歸、深度學習等方法);離線訓練系統(tǒng)主要可分為三部分:a)提取歷史話單:提取最近一段時間的歷史話單,特別是反饋結(jié)果是錯誤的相關話單。b)特征提?。簭臍v史話單中提取出特征,為下一步的模型再訓練提供數(shù)據(jù)。c)模型再訓練:利用b)中提取的特征,訓練貝葉斯分類器,得到新的參數(shù),并將訓練好的機器學習模型更新到在線識別系統(tǒng)。這樣在線識別系統(tǒng)與離線訓練系統(tǒng)就形成了一個完整的閉環(huán),離線訓練系統(tǒng)會根據(jù)語音回訪的結(jié)果,來決定是否重新訓練,更新在線識別系統(tǒng)中詐騙號碼識別模型。本實施例提供的通信號碼處理裝置所產(chǎn)生的有益效果在于:1)不需要用戶的標記信息,只需要話單記錄;2)加快詐騙號碼的識別速度和準確性;3)可以更加準確的識別詐騙號碼;實現(xiàn)運營商在用戶通話的過程中識別詐騙電話。實施例十一與前述實施例的記載相對應,本實施例還記載一種通信號碼處理裝置,通信號碼處理裝置可以用于執(zhí)行本發(fā)明實施例的通信號碼處理方法,通信號碼處理裝置可以采用各種方式來實施,例如在智能手機、固定電話、平板電腦、筆記本電腦、穿戴式設備(如智能眼鏡、智能手表等)等用戶設備中實施裝置的全部組件,或者,在企業(yè)網(wǎng)關、運營商網(wǎng)關等網(wǎng)絡設備中實施裝置的全部組件,或者,在上述的用戶設備側(cè)或網(wǎng)絡側(cè)以耦合的方式實施裝置中的組件,或者,通信號碼處理裝置還可以是用戶應用的客戶端或者后臺服務器,例如,當用戶應用為騰訊手機管家時,相應的通信號碼處理裝置可以為騰訊手機管家的客戶 端或者后臺服務器;參見圖13,通信號碼處理裝置包括:獲取模塊1301,用于從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單;預處理模塊1302,用于解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單;解析模塊1303,用于解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征;提取模塊1304,用于從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。相比于需要在收集用戶標記信息的基礎上實施識別號碼的現(xiàn)有技術,本實施例對通信號碼的話單進行解析得到通信號碼的相應類型通信信息所具有的特征,并基于通信號碼的相應類型通信信息所具有的特征從各通信號碼中識別出與預設特征匹配的目標通信號碼,一方面,由于通信號碼話單的生成及維護過程一般是由運營商負責,并不需要各個用戶的參與,通信號碼話單的獲取速度和效率較高,另一方面,由于通信號碼的話單是由運營商維護的客觀數(shù)據(jù),因而能夠真實和完整地反映用戶在一定時間間隔內(nèi)的所有通信記錄,如此,本發(fā)明實施例提供的技術方案以通信號碼的話單為處理基礎,能夠提高號碼識別的速度和準確性。在上述實施例的基礎上,預處理模塊1302,具體用于:解析話單得到話單中所包括的以下類型通信信息至少之一:通信發(fā)起號碼;對應通信發(fā)起號碼的通信響應號碼;通信起始時間;通信時長;提取出話單中各通信發(fā)起號碼所關聯(lián)的至少一種類型的通信信息形成各通信發(fā)起號碼的通信記錄;將所提取的各通信發(fā)起號碼的通信記錄組合形成預處理話單。在上述實施例的基礎上,解析模塊1303,具體用于:分別計算預處理話單中的各通信發(fā)起號碼與黃頁號碼的編輯距離;基于編輯距離得到預處理話單中各通信發(fā)起號碼與黃頁號碼的相似度;提取模塊1304,具體用于:從預處理話單包括的各通信發(fā)起號碼中提取出與黃頁號碼的相似度大于第一閾值的通信發(fā)起號碼;或者,基于預處理話單包括的各通信發(fā)起號碼中與黃頁號碼的相似度的排序,提取出相似度最高的第一比例的通信發(fā)起號碼。在上述實施例的基礎上,解析模塊1303,具體用于:提取預處理話單中各通信號碼作為通信發(fā)起號碼的通信起始時間;計算預處理話單中各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù);提取模塊1304,具體用于:從預處理話單包括的各通信發(fā)起號碼中提取出單位時間內(nèi)通信次數(shù)大于第二閾值的通信發(fā)起號碼;或者,基于預處理話單包括的各通信發(fā)起號碼在單位時間內(nèi)的通信次數(shù)的排序,提取出通信次數(shù)最高的第二比例的通信發(fā)起號碼。在上述實施例的基礎上,解析模塊1303,具體用于:提取預處理話單中各通信號碼作為通信發(fā)起號碼的通信時長;計算預處理話單中各通信發(fā)起號碼的平均通信時長;提取模塊1304,具體用于:從預處理話單包括的各通信發(fā)起號碼中提取出平均通信時長大于第三閾值的通信發(fā)起號碼;或者,基于預處理話單包括的各通信發(fā)起號碼的平均通信時長的排序,提取出平均通信時長最高的第三比例的通信發(fā)起號碼。在上述實施例的基礎上,解析模塊1303,具體用于:獲取預處理話單中各通信號碼作為通信發(fā)起號碼時對應的通信響應號碼的歸屬地;計算預處理話單中各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量;提取模塊1304,具體用于:從預處理話單包括的各通信發(fā)起號碼中提取出所對應的通信響應號碼的不同歸屬地的數(shù)量大于第四閾值的通信發(fā)起號碼;或者,基于預處理話單包括的各通信發(fā)起號碼所對應的通信響應號碼的不同歸屬地的數(shù)量的排序,提取出所對應的通信響應號碼的不同歸屬地的數(shù)量最高的第四比例的通信發(fā)起號碼。在上述實施例的基礎上,提取模塊1304,具體用于:使用機器學習模型分 析預處理話單中各通信號碼的相應類型通信信息所具有的特征,從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。實施例十二本實施例基于實施例十一,參見圖14,本實施例記載的通信號碼處理裝置也包括圖13中的獲取模塊1301、預處理模塊1302、解析模塊1303及提取模塊1304,并且該些功能模塊也具有實施例十一所記載的相應作用,在此基礎上,本實施例記載的通信號碼處理裝置還包括:訓練模塊1305,用于接收用戶側(cè)針對目標通信號碼的反饋信息,確定目標通信號碼是否為安全號碼;基于識別出的目標通信號碼中被用戶側(cè)反饋為安全號碼的目標通信號碼的數(shù)量,確定機器學習模型的錯誤率;機器學習模型的錯誤率大于第五閾值時,基于預處理話單中安全號碼的通信記錄,對機器學習模型進行重新訓練。進一步,訓練模塊1305,具體用于:解析預處理話單中安全號碼的通信記錄的至少一種類型的通信信息,得到安全號碼的至少一種類型的通信信息所具有的特征;基于安全號碼的至少一種類型的通信信息所具有的特征更新機器學習模型識別目標通信號碼所使用的閾值。在上述實施例的基礎上,裝置還包括:響應模塊1306,用于確定目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度;根據(jù)目標通信號碼的相應類型通信信息所具有的特征與預設特征的匹配程度,確定目標通信號碼的危險級別;基于目標通信號碼的危險級別對目標通信號碼的通信行為進行響應處理。在實際應用中,獲取模塊1301、預處理模塊1302、解析模塊1303、提取模塊1304、訓練模塊1305及響應模塊1306,均可由位于通信號碼處理裝置的中央處理器(cpu)、微處理器(mpu)、專用集成電路(asic)或現(xiàn)場可編程門陣列(fpga)等實現(xiàn)。實施例十三本實施例記載一種計算機可讀介質(zhì),可以為rom(例如,只讀存儲器、flash存儲器、轉(zhuǎn)移裝置等)、磁存儲介質(zhì)(例如,磁帶、磁盤驅(qū)動器等)、光學存儲介質(zhì)(例如,cd-rom、dvd-rom、紙卡、紙帶等)以及其他熟知類型的程序存儲器;計算機可讀介質(zhì)中存儲有計算機可執(zhí)行指令(例如騰訊視頻等投射應用的二進制可執(zhí)行指令),當執(zhí)行指令時,引起至少一個處理器執(zhí)行包括以下的操作:從通信業(yè)務設備獲取第一預設時間內(nèi)預設數(shù)量的通信號碼的話單;解析話單得到話單中所包括的通信信息的類型,提取出話單中各通信號碼的至少一種類型的通信信息并組合形成預處理話單;解析預處理話單中各通信號碼的至少一種類型的通信信息,得到預處理話單中各通信號碼的相應類型通信信息所具有的特征;從預處理話單包括的通信號碼中提取出與預設特征匹配的目標通信號碼。綜上,通信號碼處理裝置對通信號碼的話單進行解析得到通信號碼的相應類型通信信息所具有的特征,并基于通信號碼的相應類型通信信息所具有的特征從各通信號碼中識別出與預設特征匹配的目標通信號碼,一方面,由于通信號碼話單的生成及維護過程一般是由運營商負責,并不需要各個用戶的參與,通信號碼話單的獲取速度和效率較高,另一方面,由于通信號碼的話單是由運營商維護的客觀數(shù)據(jù),因而能夠真實和完整地反映用戶在一定時間間隔內(nèi)的所有通信記錄,如此,本發(fā)明實施例提供的技術方案以通信號碼的話單為處理基礎,能夠提高號碼識別的速度和準確性。本領域內(nèi)的技術人員應明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用硬件實施例、軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品 的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。當前第1頁12