垃圾短信識別方法及裝置制造方法
【專利摘要】本公開是關(guān)于一種垃圾短信識別方法及裝置。所述方法包括:接收短信接收端上傳的短信;獲取所述被上傳短信的發(fā)送端標(biāo)識;根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。本公開用于提高垃圾短信的識別率。
【專利說明】垃圾短信識別方法及裝置
【技術(shù)領(lǐng)域】
[0001]本公開涉及數(shù)據(jù)分析【技術(shù)領(lǐng)域】,尤其涉及一種垃圾短信識別方法及裝置。
【背景技術(shù)】
[0002]相關(guān)技術(shù)中,可以根據(jù)短信文本信息,通過各種機器學(xué)習(xí)的算法識別垃圾短信。但是,機器學(xué)習(xí)算法對訓(xùn)練樣本的質(zhì)量有很高要求,通過機器學(xué)習(xí)的算法往往很難覆蓋所有的垃圾短信,出現(xiàn)遺漏的概率很高。
【發(fā)明內(nèi)容】
[0003]為克服相關(guān)技術(shù)中存在的問題,本公開實施例提供一種垃圾短信識別方法及裝置。
[0004]根據(jù)本公開實施例的第一方面,提供一種垃圾短信識別方法,包括:
[0005]接收短信接收端上傳的短信;
[0006]獲取所述被上傳短信的發(fā)送端標(biāo)識;
[0007]根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
[0008]本公開的實施例提供的技術(shù)方案可以包括以下有益效果:在云端服務(wù)器利用大量的社交網(wǎng)絡(luò)數(shù)據(jù)對短信進(jìn)行分析,使得對垃圾短信或詐騙短信的識別率更高且更加準(zhǔn)確,提高對垃圾短信或詐騙短信的攔截率。并且,避免在終端上存儲大量用戶分析垃圾短信的樣本數(shù)據(jù),節(jié)約了終端上的存儲空間,而且,由于不需要終端進(jìn)行垃圾短信分析,節(jié)省了終端處理資源。
[0009]可選的,所述根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,包括:
[0010]獲取發(fā)送所述短信的短信發(fā)送端發(fā)送短信的所有短信接收端;
[0011]確定所述所有短信接收端之間的平均關(guān)聯(lián)度,所述關(guān)聯(lián)度為兩個短信接收端之間通過所述已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,所述平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值;
[0012]當(dāng)所述平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,判斷所述短信為垃圾短信。
[0013]在可選方案中,通過對短信接收端之間的關(guān)聯(lián)度的分析,使得垃圾短信的判斷更為準(zhǔn)確,提高對垃圾短信或詐騙短信的攔截率。
[0014]可選的,所述根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,包括:
[0015]分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比;
[0016]當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短信不是垃圾短?目。
[0017]在可選方案中,如果短信發(fā)送端已經(jīng)存在在很多用戶的好友通信錄或其他用戶信任的通信錄中,那么這個短信發(fā)送端發(fā)送的短信是垃圾短信的概率很小,反之則越大。通過判斷短信發(fā)送端是否在一定數(shù)量的用戶通信錄中,可以進(jìn)一步提高識別垃圾短信的準(zhǔn)確率。
[0018]可選的,根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,還包括:
[0019]獲取所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量;
[0020]當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷所述短信是垃圾短信。
[0021]可選的,所述方法還包括:
[0022]獲取所有短信接收終端上傳的短信的內(nèi)容;
[0023]統(tǒng)計所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量;
[0024]當(dāng)所述短信發(fā)送 端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別所述內(nèi)容相同的短信為垃圾短信。
[0025]在可選方案中,通過分析短信發(fā)送端發(fā)送內(nèi)容相同的短信的數(shù)量,進(jìn)一步提高了識別垃圾短信的準(zhǔn)確率。
[0026]根據(jù)本公開實施例的第二方面,提供一種垃圾短信識別裝置,其特征在于,包括:
[0027]接收模塊,用于接收短信接收端上傳的短信;
[0028]獲取模塊,用于獲取所述被上傳短信的發(fā)送端標(biāo)識;
[0029]識別模塊,用于根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
[0030]所述識別模塊包括:關(guān)聯(lián)度確定單元和判斷單元;
[0031]所述獲取模塊,用于獲取發(fā)送所述短信的短信發(fā)送端發(fā)送短信的所有短信接收端;
[0032]所述關(guān)聯(lián)度確定單元,用于確定所述所有短信接收端之間的平均關(guān)聯(lián)度,所述關(guān)聯(lián)度為兩個短信接收端之間通過所述已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,所述平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值;
[0033]所述判斷單元,用于當(dāng)所述平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,判斷所述短信為垃圾短信。
[0034]所述識別模塊包括:分析單元和判斷單元;
[0035]所述分析單元,用于分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比;
[0036]所述判斷單元,用于當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短?目不是垃圾短/[目。
[0037]所述獲取模塊,用于獲取所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量;
[0038]所述判斷單元,還用于當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷所述短信是垃圾短信。
[0039]所述裝置還包括統(tǒng)計模塊,
[0040]所述獲取模塊,用于獲取所有短信接收終端上傳的短信的內(nèi)容;
[0041]所述統(tǒng)計模塊,用于統(tǒng)計所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量;
[0042]所述識別模塊,用于當(dāng)所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別所述內(nèi)容相同的短信為垃圾短信。
[0043]根據(jù)本公開實施例的第三方面,提供一種垃圾短信識別裝置,包括:
[0044]處理器;
[0045]用于存儲處理器可執(zhí)行指令的存儲器;
[0046]其中,所述處理器被配置為:
[0047]接收短信接收端上傳的短信;
[0048]獲取所述被上傳短信的發(fā)送端標(biāo)識;
[0049]根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
[0050]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
【專利附圖】
【附圖說明】
[0051]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實施例,并與說明書一起用于解釋本發(fā)明的原理。
[0052]圖1是根據(jù)一示例性實施例示出的一種垃圾短信識別方法的流程圖;
[0053]圖2是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖;
[0054]圖3是根據(jù)另一示例性實施例示出的用戶之間關(guān)聯(lián)度的示意圖;
[0055]圖4是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖;
[0056]圖5是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖;
[0057]圖6是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖;
[0058]圖7是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖;
[0059]圖8是根據(jù)一示例性實施例示出的一種垃圾短信識別裝置的框圖。
[0060]圖9是根據(jù)一示例性實施例示出的一種識別模塊的框圖;
[0061]圖10是根據(jù)另一示例性實施例示出的一種識別模塊的框圖;
[0062]圖11是根據(jù)另一示例性實施例示出的一種垃圾短信識別裝置的框圖;
[0063]圖12是根據(jù)一示例性實施例示出的一種用于垃圾短信識別的裝置1900的框圖。
【具體實施方式】
[0064]這里將詳細(xì)地對示例性實施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0065]本公開利用位于網(wǎng)絡(luò)側(cè)的云端服務(wù)器來確定用戶上傳到云端服務(wù)器的短信是否為垃圾短信。
[0066]圖1是根據(jù)一示例性實施例示出的一種垃圾短信識別方法的流程圖,如圖1所示,垃圾短信識別方法用于服務(wù)器中,包括以下步驟。
[0067]在步驟Sll中,接收短信接收端上傳的短信。
[0068]在步驟S12中,獲取被上傳短信的發(fā)送端標(biāo)識。
[0069]在步驟S13中,根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及短信的發(fā)送端標(biāo)識,識別短信。
[0070]在步驟S12中,短信的發(fā)送端標(biāo)識可以是手機號碼、移動設(shè)備國際身份碼(International Mobile Equipment Identity, I ME I)或集成在 SIM 卡中的集成電路卡識別碼(Integrate circuit card identity, ICCID)等等用于唯一標(biāo)識該短發(fā)送端的代碼。
[0071]在步驟S13中,每個用戶可能會上傳多個通信錄到云端服務(wù)器,例如,好友通信錄,黑名單通信錄,以及包含一些常用服務(wù)端標(biāo)識的黃頁,如麥當(dāng)勞的訂餐電話等。因此,通信錄中的終端標(biāo)識并不都是用戶已信任的終端標(biāo)識,云端服務(wù)器在進(jìn)行垃圾短信識別時,會利用通信錄中預(yù)先存儲的已信任終端標(biāo)識進(jìn)行判斷。
[0072]本實施例中,當(dāng)終端收到不是已信任的發(fā)送端發(fā)送的短信,終端上傳統(tǒng)的垃圾短信分析模塊不能確定該短信是否為垃圾短信的時候,終端可以立刻將這個短信上傳到位于網(wǎng)絡(luò)側(cè)的云端服務(wù)器,云端服務(wù)器會識別短信發(fā)送端標(biāo)識,并根據(jù)通過大量用戶上傳社交網(wǎng)絡(luò)數(shù)據(jù)及該短信發(fā)送端標(biāo)識對該短信進(jìn)行分析,并將分析結(jié)果實時返回給終端。這樣,在云端服務(wù)器利用大量的社交網(wǎng)絡(luò)數(shù)據(jù)對短信進(jìn)行分析,使得對垃圾短信或詐騙短信的識別率更高且更加準(zhǔn)確,提高對垃圾短信或詐騙短信的攔截率。并且,避免在終端上存儲大量用戶分析垃圾短信的樣本數(shù)據(jù),節(jié)約了終端上的存儲空間,而且,由于不需要終端進(jìn)行垃圾短信分析,節(jié)省了終端處理資源。
[0073]在步驟S13中,根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及短信的發(fā)送端標(biāo)識,識別短信,可以包括以下幾種方式。
[0074]圖2是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖,如圖2所示,可選的,步驟S13可以包括以下步驟。
[0075]步驟S21中,獲取發(fā)送短信的短信發(fā)送端發(fā)送短信的所有短信接收端。
[0076]步驟S22中,確定所有短信接收端之間的平均關(guān)聯(lián)度,關(guān)聯(lián)度為兩個短信接收端之間通過已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值。
[0077]步驟S23中,當(dāng)平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,識別短信為垃圾短信。
[0078]在云端服務(wù)器,存儲有大量使用云服務(wù)的用戶上傳的通信錄,可以根據(jù)這些通信錄中已信任發(fā)送端標(biāo)識建立社交網(wǎng)絡(luò),得到用戶之間的關(guān)聯(lián)度。例如,圖3是根據(jù)另一示例性實施例示出的用戶之間關(guān)聯(lián)度的示意圖,如圖3所示,用戶A的好友通信錄中包括用戶D,用戶B的好友通信錄中包括用戶C,用戶C的通信錄包括用戶D。則用戶A和用戶B之間通過用戶C和用戶D建立聯(lián)系,用戶A和用戶B之間的關(guān)聯(lián)度為2。
[0079]通過分析短信發(fā)送端發(fā)送的短信的所有短信接收端之間的關(guān)聯(lián)度,判斷這些接收端之間關(guān)系是否密切,即如果這些短信接收端之間的平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,則認(rèn)為這些短信接收端之間關(guān)系并不密切,短信發(fā)送端與這些短信接收端之間可能沒有什么聯(lián)系,短信發(fā)送端隨機選擇一些終端號碼發(fā)送短信,該短信有極大的可能性是廣告或詐騙等垃圾短/[目。
[0080]例如設(shè)置第一閾值為6,當(dāng)短信接收端之間的平均關(guān)聯(lián)度大于6時,判斷該短信發(fā)送端發(fā)送短信為垃圾短信。
[0081]在可選方案中,通過對短信接收端之間的關(guān)聯(lián)度的分析,使得垃圾短信的判斷更為準(zhǔn)確,提高對垃圾短信或詐騙短信的攔截率。
[0082]圖4是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖,如圖4所示,可選的,步驟S13可以包括以下步驟:
[0083]在步驟41中,分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比;
[0084]在步驟42中,當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短?目不是垃圾短/[目。
[0085]例如,可以設(shè)置第二閾值為1%。,如果云端服務(wù)器上所有終端的數(shù)量為10萬,則如果該短信發(fā)送端已存在在100個用戶的好友通信錄中,則判斷該短信發(fā)送端發(fā)送的所述短?目不是垃圾短/[目。[0086]在可選方案中,如果短信發(fā)送端已經(jīng)存在在很多用戶的好友通信錄或其他用戶信任的通信錄中,那么這個短信發(fā)送端發(fā)送的短信是垃圾短信的概率很小,反之則越大。通過判斷短信發(fā)送端是否在一定數(shù)量的用戶通信錄中,可以進(jìn)一步提高識別垃圾短信的準(zhǔn)確率。
[0087]圖5是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖,如圖5所示,可選的,步驟S13可以包括以下步驟:
[0088]在步驟51中,獲取短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量;
[0089]在步驟52中,當(dāng)將短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷短信是垃圾短信。
[0090]例如,當(dāng)短信發(fā)送端在如10分鐘內(nèi)發(fā)送短信超過3000條,且該短信發(fā)送端不存在在一定數(shù)量的用戶通信錄中,則該短信發(fā)送端發(fā)送的短信為垃圾短信的可能性極大。
[0091]可選的,還可以判斷在一段時間后,該短信發(fā)送端標(biāo)識是否被越來越多的用戶加入到已信任的好友通信錄中,例如,有50個用戶將該短信發(fā)送端加入到自身的好友通信錄中,則該短信發(fā)送端發(fā)送的短信為垃圾短信的概率較低。
[0092]可選的,還可以通過查詢該短信發(fā)送端在云端服務(wù)器的訪問日志,例如,如果該短信發(fā)送端訪問云端服務(wù)器的頻率較高,則該短信發(fā)送端有極大的可能性不是發(fā)送垃圾短信的“機器人”。
[0093]圖6是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖,如圖6所示,可選的,該方法還可以包括以下步驟。
[0094]步驟S61中,獲取所有短信接收終端上傳的短信的內(nèi)容。[0095]步驟S62中,統(tǒng)計短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量。
[0096]步驟S63中,當(dāng)短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別內(nèi)容相同的短信為垃圾短信。
[0097]在可選方案中,進(jìn)一步判斷短信發(fā)送端發(fā)送過的相同短信的數(shù)量,當(dāng)發(fā)送的相同短信的數(shù)量過多時,例如超過1000,則判斷該短信為垃圾短信。通過分析短信發(fā)送端發(fā)送內(nèi)容相同的短信的數(shù)量,進(jìn)一步提高了識別垃圾短信的準(zhǔn)確率。
[0098]下面以一個具體實例對本公開的方法進(jìn)行詳細(xì)說明。
[0099]圖7是根據(jù)另一示例性實施例示出的一種垃圾短信識別方法的流程圖,如圖7所示,該方法包括以下步驟。
[0100]在步驟S701中,接收短信接收端A上傳的短信。
[0101]在步驟S702中,獲取被上傳短信的發(fā)送端標(biāo)識,短信發(fā)送端為B。
[0102]在步驟S703中,分析將短信發(fā)送端B作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比。
[0103]在步驟S704中,判斷上述計算得到的百分比是否超過1%。,如果是,執(zhí)行步驟S705,否則,執(zhí)行步驟S710。
[0104]在步驟S705中,判斷短信發(fā)送端B在10分鐘內(nèi)發(fā)送短信的數(shù)量是否超過3000條,如果是,執(zhí)行步驟S706,否則,執(zhí)行步驟S710。
[0105]在步驟S706中,獲取短信發(fā)送端B發(fā)送短信的所有短信接收端。
[0106]在步驟S707中,確定所有短信接收端之間的平均關(guān)聯(lián)度。
[0107]在步驟S708中,判斷上述平均關(guān)聯(lián)度是否大于6,如果是,執(zhí)行步驟S709,否則,執(zhí)行步驟S710。
[0108]在步驟S709中,識別短信接收端A上傳的短信為垃圾短信。
[0109]在步驟S710中,識別短信接收端A上傳的短信不是垃圾短信。
[0110]本公開的上述實施例中,可以通過上述幾種方式對短信發(fā)送端的身份進(jìn)行識別以判斷其發(fā)送的短信是否為垃圾短信,而不是僅根據(jù)短信的內(nèi)容來識別垃圾短信,這樣,對垃圾短信的識別更加準(zhǔn)確,效率更高,提高了對垃圾短信或詐騙短信的攔截率。
[0111]上述識別垃圾短信的方式,可以根據(jù)實際情況單獨使用,或?qū)追N方式組合使用,還可以將上述方式結(jié)合現(xiàn)有的根據(jù)短信內(nèi)容識別垃圾短信的方法使用。如果在云端服務(wù)器已有關(guān)于該短信發(fā)送端相關(guān)的歷史數(shù)據(jù)積累,可以實時地將垃圾短信識別結(jié)果告知用戶,如果沒有歷史數(shù)據(jù)積累,則可以過一段時間后,再將識別結(jié)果推送給用戶。
[0112]圖8是根據(jù)一示例性實施例示出的一種垃圾短信識別裝置的框圖。參照圖8,該裝置80包括接收模塊81,獲取模塊82和識別模塊83。
[0113]接收模塊81被配置為接收短信接收端上傳的短信。
[0114]獲取模塊82被配置為獲取所述被上傳短信的發(fā)送端標(biāo)識。
[0115]識別模塊83被配置為根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
[0116]圖9是根據(jù)一示例性實施例示出的一種識別模塊的框圖。如圖9所示,可選的,識別模塊83包括:關(guān)聯(lián)度確定單元831和判斷單元832 ;
[0117]獲取模塊81被配置為獲取發(fā)送所述短信的短信發(fā)送端發(fā)送短信的所有短信接收端。關(guān)聯(lián)度確定單元831被配置為確定所述所有短信接收端之間的平均關(guān)聯(lián)度,所述關(guān)聯(lián)度為兩個短信接收端之間通過所述已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,所述平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值。判斷單元832,用于當(dāng)所述平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,判斷所述短信為垃圾短信。
[0118]圖10是根據(jù)另一示例性實施例示出的一種識別模塊的框圖。如圖10所示,可選的,識別模塊83包括:分析單元833和判斷單元832 ;
[0119]分析單元833被配置為分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比。判斷單元832被配置為當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短信不是垃圾短信。
[0120]可選的,獲取模塊81被配置為獲取所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量。判斷單元832還被配置為當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷所述短信是垃圾短信。
[0121]圖11是根據(jù)另一示例性實施例示出的一種垃圾短信識別裝置的框圖。如圖11所示,可選的,裝置80還包括統(tǒng)計模塊84,
[0122]獲取模塊81被配置為于獲取所有短信接收終端上傳的短信的內(nèi)容。統(tǒng)計模塊84被配置為統(tǒng)計所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量。識別模塊83被配置為當(dāng)所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別所述內(nèi)容相同的短信為垃圾短信。
[0123]關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
[0124]圖12是根據(jù)一示例性實施例示出的一種用于垃圾短信識別的裝置1900的框圖。例如,裝置1900可以被提供為一服務(wù)器。參照圖11,裝置1900包括處理組件1922,其進(jìn)一步包括一個或多個處理器,以及由存儲器1932所代表的存儲器資源,用于存儲可由處理部件1922的執(zhí)行的指令,例如應(yīng)用程序。存儲器1932中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外,處理組件1922被配置為執(zhí)行指令,以執(zhí)行上述方法......[0125]裝置1900還可以包括一個電源組件1926被配置為執(zhí)行裝置1900的電源管理,一個有線或無線網(wǎng)絡(luò)接口 1950被配置為將裝置1900連接到網(wǎng)絡(luò),和一個輸入輸出(I/O)接口 1958。裝置1900可以操作基于存儲在存儲器1932的操作系統(tǒng),例如Windows ServerTM,Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM 或類似。
[0126]在示例性實施例中,裝置800可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
[0127]在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
[0128] 一種非臨時性計算機可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由移動終端的處理器執(zhí)行時,使得移動終端能夠執(zhí)行一種垃圾短信識別方法,所述方法包括:
[0129]接收短信接收端上傳的短信;
[0130]獲取所述被上傳短信的發(fā)送端標(biāo)識;
[0131]根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
[0132]可選的,所述根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,包括:
[0133]獲取發(fā)送所述短信的短信發(fā)送端發(fā)送短信的所有短信接收端;
[0134]確定所述所有短信接收端之間的平均關(guān)聯(lián)度,所述關(guān)聯(lián)度為兩個短信接收端之間通過所述已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,所述平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值;
[0135]當(dāng)所述平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,判斷所述短信為垃圾短信。
[0136]可選的,所述根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,包括:
[0137]分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比;
[0138]當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短信不是垃圾短?目。
[0139]可選的,根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,還包括:
[0140]獲取所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量;
[0141]當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷所述短信是垃圾短信。
[0142]可選的,所述方法還包括:
[0143]獲取所有短信接收終端上傳的短信的內(nèi)容;
[0144]統(tǒng)計所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量;
[0145]當(dāng)所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別所述內(nèi)容相同的短信為垃圾短信。
[0146]本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實施方案。本申請旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本【技術(shù)領(lǐng)域】中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
[0147]應(yīng)當(dāng)理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。
【權(quán)利要求】
1.一種垃圾短信識別方法,其特征在于,包括: 接收短信接收端上傳的短信; 獲取所述被上傳短信的發(fā)送端標(biāo)識; 根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,包括: 獲取發(fā)送所述短信的短信發(fā)送端發(fā)送短信的所有短信接收端; 確定所述所有短信接收端之間的平均關(guān)聯(lián)度,所述關(guān)聯(lián)度為兩個短信接收端之間通過所述已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,所述平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值; 當(dāng)所述平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,判斷所述短信為垃圾短信。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,包括: 分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比; 當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短信不是垃圾短?目。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信,還包括: 獲取所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量; 當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷所述短信是垃圾短信。
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述方法還包括: 獲取所有短信接收終端上傳的短信的內(nèi)容; 統(tǒng)計所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量; 當(dāng)所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別所述內(nèi)容相同的短信為垃圾短信。
6.一種垃圾短信識別裝置,其特征在于,包括: 接收模塊,用于接收短信接收端上傳的短信; 獲取模塊,用于獲取所述被上傳短信的發(fā)送端標(biāo)識; 識別模塊,用于根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短信。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述識別模塊包括:關(guān)聯(lián)度確定單元和判斷單元; 所述獲取模塊,用于獲取發(fā)送所述短信的短信發(fā)送端發(fā)送短信的所有短信接收端; 所述關(guān)聯(lián)度確定單元,用于確定所述所有短信接收端之間的平均關(guān)聯(lián)度,所述關(guān)聯(lián)度為兩個短信接收端之間通過所述已信任發(fā)送端標(biāo)識建立聯(lián)系所通過的終端數(shù)量,所述平均關(guān)聯(lián)度為所有短信接收端之間的關(guān)聯(lián)度的平均值; 所述判斷單元,用于當(dāng)所述平均關(guān)聯(lián)度大于預(yù)設(shè)的第一閾值時,判斷所述短信為垃圾短?目。
8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述識別模塊包括:分析單元和判斷單元; 所述分析單元,用于分析將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比; 所述判斷單元,用于當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比超過預(yù)設(shè)的第二閾值時,判斷所述短?目不是垃圾短/[目。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于, 所述獲取模塊,用于獲取所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量; 所述判斷單元,還用 于當(dāng)將所述短信發(fā)送端標(biāo)識作為已信任發(fā)送端標(biāo)識的通信錄所在的短信接收終端數(shù)量占預(yù)先存儲的所有終端數(shù)量的百分比低于預(yù)設(shè)的第二閾值,且所述短信發(fā)送端在預(yù)設(shè)時間內(nèi)發(fā)送的短信的數(shù)量超過預(yù)設(shè)的第三閾值時,判斷所述短信是垃圾短?目。
10.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述裝置還包括統(tǒng)計模塊, 所述獲取模塊,用于獲取所有短信接收終端上傳的短信的內(nèi)容; 所述統(tǒng)計模塊,用于統(tǒng)計所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量; 所述識別模塊,用于當(dāng)所述短信發(fā)送端發(fā)送的相同內(nèi)容的短信數(shù)量超過預(yù)設(shè)的第四閾值時,識別所述內(nèi)容相同的短信為垃圾短信。
11.一種垃圾短信識別裝置,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為: 接收短信接收端上傳的短信; 獲取所述被上傳短信的發(fā)送端標(biāo)識; 根據(jù)通信錄中預(yù)先存儲的已信任發(fā)送端標(biāo)識以及所述短信的發(fā)送端標(biāo)識,識別所述短?目。
【文檔編號】H04W12/12GK103929723SQ201410183603
【公開日】2014年7月16日 申請日期:2014年4月30日 優(yōu)先權(quán)日:2014年4月30日
【發(fā)明者】劉道寬, 范典, 孫鵬, 劉宇翔, 李海峰, 劉新宇, 邢鑫巖, 張波, 劉率 申請人:小米科技有限責(zé)任公司