號碼屬性識別方法、裝置、終端和服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域,具體而言,涉及一種號碼屬性識別方法、裝置、終端和服務(wù)器。
【背景技術(shù)】
[0002]目前,手機等終端設(shè)備的普及度越來越高,每個終端設(shè)備用戶都具有唯一的號碼,通過該號碼用戶可以與其他人之間進行通話、發(fā)送短息、郵件等多種方式的通信。
[0003]手機等終端設(shè)備為用戶來便利的同時,也帶來了不少問題:來自未知號碼的短信和電話增多,其包含了垃圾短信和騷擾電話,為用戶帶來了困擾。目前的識別未知號碼的方式為,用戶在接收到未知號碼的短信和電話后,根據(jù)電話或短信的內(nèi)容,對未知號碼進行標(biāo)記,例如,標(biāo)記為“詐騙”、“推銷”等等;收集該標(biāo)記數(shù)據(jù)并保存;則在其他用戶也收到該未知號碼的短信或電話時,根據(jù)保存的標(biāo)記數(shù)據(jù)來對其他用戶提示該未知號碼為“詐騙”或“推銷”等。
[0004]上述方案的缺陷在于:太過于依賴用戶的標(biāo)記行為,用戶的標(biāo)記行為存在著標(biāo)記次數(shù)過少或標(biāo)記不準(zhǔn)確的可能性,則根據(jù)收集的標(biāo)記數(shù)據(jù)很難準(zhǔn)確對未知號碼進行識別。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的號碼屬性識別方法、裝置、終端和服務(wù)器。
[0006]依據(jù)本發(fā)明的一個方面,提供了一種號碼屬性識別方法,其包括:獲獲取待識別的第一號碼所對應(yīng)的行為數(shù)據(jù),所述第一號碼對應(yīng)的行為數(shù)據(jù)為所述第一號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù);使用通過已知的第二號碼對應(yīng)的行為數(shù)據(jù)和屬性所訓(xùn)練的識別模型,對所述第一號碼對應(yīng)的行為數(shù)據(jù)進行計算,以得到所述第一號碼的屬性;其中所述第二號碼對應(yīng)的行為數(shù)據(jù)為所述第二號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù)。
[0007]依據(jù)本發(fā)明的另一個方面,提供了一種號碼屬性識別裝置,其包括:行為數(shù)據(jù)獲取模塊,用于獲取待識別的第一號碼所對應(yīng)的行為數(shù)據(jù),所述第一號碼對應(yīng)的行為數(shù)據(jù)為所述第一號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù);屬性識別模塊,用于使用通過已知的第二號碼對應(yīng)的行為數(shù)據(jù)和屬性所訓(xùn)練的識別模型,對所述第一號碼對應(yīng)的行為數(shù)據(jù)進行計算,以得到所述第一號碼的屬性;其中所述第二號碼對應(yīng)的行為數(shù)據(jù)為所述第二號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù)。
[0008]依據(jù)本發(fā)明的再一個方面,提供了一種終端,其包括:前述的號碼屬性識別裝置,用于根據(jù)所述號碼的行為數(shù)據(jù),識別出所述號碼的屬性。
[0009]依據(jù)本發(fā)明的還一個方面,提供了一種服務(wù)器,其包括:行為數(shù)據(jù)接收模塊,用于接收來自終端的待識別的號碼對應(yīng)的行為數(shù)據(jù);前述的號碼屬性識別裝置,用于根據(jù)所述號碼的行為數(shù)據(jù),識別出所述號碼的屬性;屬性發(fā)送模塊,將所述號碼的屬性發(fā)送給所述終端。
[0010]根據(jù)以上技術(shù)方案,可知本發(fā)明的號碼屬性識別方法、裝置、終端和服務(wù)器至少要具有以下優(yōu)點:
[0011]號碼所屬用戶基于不同的目的進行通信行為的過程中,所產(chǎn)生的數(shù)據(jù)必然是不同的,所以號碼對應(yīng)的行為數(shù)據(jù)是可以反映出用戶進行通信行為的目的;所以根據(jù)號碼對應(yīng)的行為數(shù)據(jù)所確定的號碼的屬性,能夠準(zhǔn)確體現(xiàn)出號碼所屬用戶的目的,以便于對該號碼進行相應(yīng)處理。
[0012]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【附圖說明】
[0013]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0014]圖1示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
圖1A示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的工作示意圖;
[0015]圖2示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0016]圖3示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0017]圖4示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0018]圖5示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0019]圖6示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0020]圖7示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0021]圖8示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0022]圖9示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0023]圖10示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0024]圖11示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別方法的流程圖;
[0025]圖12示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別裝置的框圖;
[0026]圖13示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別裝置的框圖;
[0027]圖14示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別裝置的框圖;
[0028]圖15示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別裝置的框圖;
[0029]圖16示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別裝置的框圖;
[0030]圖17示出了根據(jù)本發(fā)明的一個實施例的號碼屬性識別裝置的框圖;
[0031]圖18示出了根據(jù)本發(fā)明的一個實施例的終端的框圖;
[0032]圖19示出了根據(jù)本發(fā)明的一個實施例的服務(wù)器的框圖。
【具體實施方式】
[0033]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0034]如圖1所示,本發(fā)明的一個實施例中公開了一種號碼屬性識別方法,其包括:
[0035]步驟110,獲取待識別的第一號碼所對應(yīng)的行為數(shù)據(jù),第一號碼對應(yīng)的行為數(shù)據(jù)為第一號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù)。本實施例中,對通信行為的類型不進行限制,包括但不限于打電話、發(fā)短信、發(fā)郵件等;對行為數(shù)據(jù)不進行限制,包括但不限于通話時間、通話時長、被掛斷占比、呼入占比、通訊錄聯(lián)系人占比、非長途通話占比、請求通話時向?qū)Ψ降钠骄埱蟠螖?shù)。
[0036]步驟120,使用通過已知的第二號碼對應(yīng)的行為數(shù)據(jù)和屬性所訓(xùn)練的識別模型,對第一號碼對應(yīng)的行為數(shù)據(jù)進行計算,以得到第一號碼的屬性;其中第二號碼對應(yīng)的行為數(shù)據(jù)為第二號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù)。在本實施例中,對屬性不進行限制,其包括但不限于為第一號碼增加的標(biāo)簽或分類等等。在本實施例中,對識別模型對應(yīng)的算法不進行限制,例如,svm、boosting決策樹等算法均適用。根據(jù)本實施例的技術(shù)方案,號碼所屬用戶基于不同的目的進行通信行為的過程中,所產(chǎn)生的數(shù)據(jù)必然是不同的,所以號碼對應(yīng)的行為數(shù)據(jù)是可以反映出用戶進行通信行為的目的;所以根據(jù)號碼對應(yīng)的行為數(shù)據(jù)所確定的號碼的屬性,能夠準(zhǔn)確體現(xiàn)出號碼所屬用戶的目的,以便于對該號碼進行相應(yīng)處理。
[0037]例如,根據(jù)圖1,收集200個號碼(第二號碼)的通話行為(通信行為)的呼入占比(行為數(shù)據(jù)),以及每個號碼對應(yīng)的標(biāo)簽(屬性);基于boosting決策樹算法生成識別模型,獲取到號碼A(第一號碼)的通話行為(通信行為)的呼入占比(行為數(shù)據(jù))后,將其輸入識別模型,并從識別模型中輸出號碼A對應(yīng)的標(biāo)簽(屬性),例如,識別模型基于號碼A的呼入占比非常低,所以可以確定是快遞送餐電話,添加“快遞送餐”標(biāo)簽,該標(biāo)簽可以用于在手機等終端上進行顯示,例如圖1A所示,示出該來電為快遞送餐電話。
[0038]如圖2所示,本發(fā)明的一個實施例中公開了一種號碼屬性識別方法,其包括:
[0039]步驟210,獲取第一號碼所屬用戶傳輸?shù)奈谋拘畔?,并從文本信息中提取詞語作為第一號碼對應(yīng)的行為數(shù)據(jù)。本實施例中,對文本信息的類型不進行限制,其包括但不限于短信、郵件等。本實施例對提取詞語的方式不進行限制,可以只提取固定詞,也可以使用現(xiàn)有技術(shù)的分詞器分詞后再提取。
[0040]步驟220,使用通過已知的第二號碼對應(yīng)的行為數(shù)據(jù)和屬性所訓(xùn)練的識別模型,對第一號碼對應(yīng)的行為數(shù)據(jù)進行計算,以得到第一號碼的屬性;其中第二號碼對應(yīng)的行為數(shù)據(jù)為第二號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù)。根據(jù)本實施例的技術(shù)方案,文本信息中包括很多關(guān)鍵的詞語,能夠體現(xiàn)第一號碼發(fā)送文本信息的目的,所以根據(jù)文本信息中的詞語有利于確定第一號碼的屬性。
[0041]例如,根據(jù)圖2,經(jīng)統(tǒng)計號碼B的用戶發(fā)出了一條短信(文本信息);根據(jù)經(jīng)驗可知很多騷擾短信的內(nèi)容都是與“開發(fā)票”有關(guān),所以可以設(shè)置提取詞語的方式為提取“發(fā)票”這個詞,具有“發(fā)票”字眼的號碼均為黑號碼;從該短信中成功提取出“發(fā)票”(詞語)后,根據(jù)“發(fā)票”將該號碼B分類到“黑號碼”分類(屬性)下。
[0042]如圖3所示,本發(fā)明的一個實施例中公開了一種號碼屬性識別方法,其包括:
[0043]步驟310,根據(jù)預(yù)設(shè)的過濾字符庫,對文本信息中的字符進行過濾;過濾字符庫中記錄了需要過濾的字符。在本實施例中,對需要過濾掉的字符不進行限制,可以是多種類型的標(biāo)點符號。
[0044]步驟320,從文本信息中提取詞語作為第一號碼對應(yīng)的行為數(shù)據(jù)。本實施例中,對文本信息的類型不進行限制,其包括但不限于短信、郵件等。本實施例對提取詞語的方式不進行限制,可以只提取固定詞,也可以使用現(xiàn)有技術(shù)的分詞器分詞后再提取。
[0045]步驟330,使用通過已知的第二號碼對應(yīng)的行為數(shù)據(jù)和屬性所訓(xùn)練的識別模型,對第一號碼對應(yīng)的行為數(shù)據(jù)進行計算,以得到第一號碼的屬性;其中第二號碼對應(yīng)的行為數(shù)據(jù)為第二號碼所屬的用戶進行的通信行為過程中產(chǎn)生的數(shù)據(jù)。根據(jù)本實施例的技術(shù)方案,很多垃圾短信息為避免被識別出,通常在信息中加入了很多起到干擾作用的字符,因此對這些字符進行過濾后,可以更容易從文本信息中提取關(guān)鍵詞語。
[0046]例如,根據(jù)圖3,號碼C發(fā)送的短信(文本信息)中包含有以下內(nèi)容:“……開發(fā)票……”;預(yù)設(shè)的過濾字符庫中,規(guī)定需要將I符號過濾掉,則過濾后短信的內(nèi)容為“……開發(fā)票……”;對過濾后的短信進行分詞提取,可以順利提取到詞語“發(fā)票”(詞語),該短信屬于騷擾短信,從而可以將號碼C分類到“騷擾號碼”之下。
[0047]如圖4所示,本發(fā)明的一個實施例中公開了一種號碼屬性識別方法,其包括:
[0048]步驟410,根據(jù)預(yù)設(shè)的字符轉(zhuǎn)換庫在文本信息中查詢是否具有待轉(zhuǎn)換的字符,并在查找到待轉(zhuǎn)換的字符時根據(jù)字符轉(zhuǎn)換庫進行轉(zhuǎn)換;字符轉(zhuǎn)換庫中記錄待轉(zhuǎn)換的字符,以及與待轉(zhuǎn)換的字符對應(yīng)的轉(zhuǎn)換后的字符。在本實施例中,字符轉(zhuǎn)換庫可以用于將漢字數(shù)字轉(zhuǎn)換為阿拉伯?dāng)?shù)字。
[0049]步驟420,從文本信息中提取詞語作為第一號碼對應(yīng)的行為數(shù)據(jù)。本實施例中,對文本信息的類型不進行限制,其包括但不限于短信、郵件等