亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種垃圾短信過(guò)濾方法

文檔序號(hào):7646663閱讀:624來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種垃圾短信過(guò)濾方法
技術(shù)領(lǐng)域
本發(fā)明屬于網(wǎng)絡(luò)通信技術(shù)領(lǐng)域的短信息處理技術(shù),具體來(lái)講,涉及一種在 通信系統(tǒng)的短信服務(wù)中心對(duì)用戶短信進(jìn)行監(jiān)管和過(guò)濾的方法。
背景技術(shù)
近幾年來(lái),由于移動(dòng)通信技術(shù)的快速發(fā)展,催化了諸多增值服務(wù)的產(chǎn)生。 短信作為移動(dòng)通信的增值服務(wù)之一,在為人們提供價(jià)格低廉和便捷的通信服務(wù) 的同時(shí),滋生了大量以傳播淫穢色情、商業(yè)欺詐、惡意詆毀以及商業(yè)廣告等不 良信息為目的垃圾短信。這些垃圾短信嚴(yán)重干擾人們生活、妨害社會(huì)安全以及 造成網(wǎng)絡(luò)擁塞,垃圾短信的監(jiān)管問(wèn)題已經(jīng)受到社會(huì)各界的廣泛重視。除了從立 法層面加強(qiáng)對(duì)信息發(fā)布進(jìn)行監(jiān)管外,更重要的是要從技術(shù)層面探索垃圾短信有 效的防范技術(shù)?,F(xiàn)有技術(shù)中,垃圾短信的過(guò)濾方式可以分為兩種 一種是基于短信服務(wù)中 心的過(guò)濾方式,另外一種是基于用戶手機(jī)的過(guò)濾方式?;谟脩羰謾C(jī)的過(guò)濾方式,如2007年03月07日公開(kāi)的,公告號(hào)為CN 1929513A,名稱(chēng)為"一種短消息過(guò)濾方法"的中國(guó)發(fā)明專(zhuān)利,公布的短信過(guò)濾 方法為通過(guò)用戶在手機(jī)上設(shè)置過(guò)濾敏感詞;手機(jī)接收到來(lái)自短消息中心的短 信并保存在內(nèi)存中;手機(jī)根據(jù)敏感詞對(duì)短信內(nèi)容進(jìn)行字符串匹配,如果有敏感 詞出現(xiàn)在短信內(nèi)容中,則丟棄該短信,并向短消息中心發(fā)送成功接收消息;如 果在短信內(nèi)容中沒(méi)有發(fā)現(xiàn)敏感詞,保存該短信。但這種基于用戶手機(jī)的過(guò)濾方 式受手機(jī)處理能力、敏感詞涵蓋領(lǐng)域以及即時(shí)更新能力等方面的制約。目前,對(duì)于垃圾短信的過(guò)濾還是主要依靠基于短信服務(wù)中心的過(guò)濾方式進(jìn) 行,如2006年01月25日公開(kāi)的中國(guó)發(fā)明專(zhuān)利,公告號(hào)為CN 1725874A,名稱(chēng) 為"一種實(shí)現(xiàn)短消息業(yè)務(wù)的方法",公布了一種過(guò)濾方式,該方法中用戶在網(wǎng)絡(luò) 側(cè)設(shè)置自身對(duì)應(yīng)的短信過(guò)濾規(guī)則,在網(wǎng)絡(luò)側(cè)向接受方發(fā)送短信之前,網(wǎng)絡(luò)側(cè)根 據(jù)接收方的短信過(guò)濾規(guī)則判斷是否需要過(guò)濾該短信,如果是,則不發(fā)送該短信;
否則,向接受方發(fā)送該短信?;诙绦欧?wù)中心的過(guò)濾方式可以對(duì)短信中的敏 感詞進(jìn)行有效地更新,因而是目前的主流技術(shù),己經(jīng)有大量成熟的產(chǎn)品推出, 如北京啟明星辰信息技術(shù)有限公司推出的天清短消息監(jiān)控系統(tǒng)、北京宏基聯(lián)合 網(wǎng)絡(luò)技術(shù)開(kāi)發(fā)有限公司的短信過(guò)濾系統(tǒng)SMS、成都西朗科技發(fā)展有限公司的SLMT短信監(jiān)控系統(tǒng)、重慶瑞笛科技有限公司的Attractor VII-SMEYE短信息安 全系統(tǒng)、深圳市正普信息有限公司的ZP⑧-SM短信安全過(guò)濾系統(tǒng)等系統(tǒng),以及 中興、華為、思科、朗訊、惠普等公司推出垃圾短信產(chǎn)品等。另外,從短信的過(guò)濾技術(shù),即垃圾短信的判定方法方面,主要是依據(jù)構(gòu)成 短信的文字本身進(jìn)行判斷,目前主要采用基于關(guān)鍵詞或基于內(nèi)容的垃圾短信過(guò) 濾方法。基于關(guān)鍵詞的垃圾短信過(guò)濾是設(shè)置一些關(guān)鍵詞,只要具有這些關(guān)鍵詞的短 信,就認(rèn)定為垃圾短信,并予以濾掉,這種方法存在大量的査找運(yùn)算以及漏判 或誤判等缺陷?;趦?nèi)容的垃圾短信過(guò)濾是采用機(jī)器學(xué)習(xí)方法把短信自動(dòng)分為正常短信和 垃圾短信。目前用于短信自動(dòng)分類(lèi)的機(jī)器學(xué)習(xí)方法主要有樸素貝葉斯、SVM、 KNN、人工神經(jīng)網(wǎng)絡(luò)、Winnow算法等?;趦?nèi)容的垃圾短信過(guò)濾與基于關(guān)鍵詞 的垃圾短信過(guò)濾相比,其運(yùn)算量更大。采用這些方法過(guò)濾時(shí),短信服務(wù)中心需要對(duì)短信進(jìn)行逐條分析,才能判斷 是否是垃圾短信,因此處理的效率比較低。同時(shí)不管是基于關(guān)鍵詞還是基于內(nèi) 容的垃圾短信過(guò)濾方法,都存在大量運(yùn)算,這樣會(huì)造成短信服務(wù)中心網(wǎng)絡(luò)堵塞, 其解決方法可采用放棄部分垃圾短信的過(guò)濾或延遲短信轉(zhuǎn)發(fā)。發(fā)明內(nèi)容本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)中的不足,提供一種不需要對(duì)短信進(jìn) 行逐條分析、處理效率較高的垃圾短信過(guò)濾方法。為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明的垃圾短信過(guò)濾方法,其特征在于,包括以 下步驟第一步,給每個(gè)短信用戶設(shè)置一個(gè)用戶信任度;第二步,根據(jù)短信用戶的信任度,對(duì)經(jīng)過(guò)短信服務(wù)中心的短信進(jìn)行不同強(qiáng)
度的抽樣過(guò)濾,用戶信任度越低,抽樣強(qiáng)度越高,用戶信任度越高,抽樣強(qiáng)度 越低,未被抽樣到的短信作為正常短信予以發(fā)送,被抽樣到的短信作為可疑短 信進(jìn)入下一步;第三步,被抽樣到的可疑短信,采用依據(jù)構(gòu)成短信的文字信息確定短信是 否是垃圾短信,如是,直接過(guò)濾掉,如果不是,認(rèn)定為正常短信,予以發(fā)送;第四步,依據(jù)短信用戶短信發(fā)送情況,修改該短信用戶的用戶信任度,正 常短信的發(fā)送量越大,垃圾短信的發(fā)送量越小,用戶信任度就會(huì)提高,反之, 則降低。依據(jù)構(gòu)成短信的文字信息判定是否是垃圾短信的過(guò)濾方法,主要有前述的 基于關(guān)鍵詞或基于內(nèi)容的垃圾短信過(guò)濾方法。抽樣強(qiáng)度,即抽樣頻率,也就是指在一定時(shí)間范圍內(nèi),短信抽樣數(shù)與總的 用戶發(fā)送的短信數(shù)量之比。傳統(tǒng)的垃圾短信過(guò)濾方法,需要對(duì)短信進(jìn)行逐條分析,才能判斷是否是垃 圾短信,因此處理的效率比較低。但實(shí)際情況是大部分用戶所發(fā)送的短信都不 是垃圾短信,沒(méi)有必要逐條分析,兼顧過(guò)濾的準(zhǔn)確率和效率,本發(fā)明在假定大 多數(shù)用戶發(fā)送短信為正常短信,只有極少數(shù)用戶發(fā)送短信為垃圾短信的前提下, 在傳統(tǒng)垃圾短信過(guò)濾方法的基礎(chǔ)上,創(chuàng)新性地提出根據(jù)用戶信任度的不同,對(duì) 發(fā)送到短信服務(wù)中心的短信進(jìn)行不同強(qiáng)度的抽樣,抽樣到的短信再依據(jù)構(gòu)成短 信的文字內(nèi)容確定短信是否是垃圾短信,而不必對(duì)每一條短信進(jìn)行逐條分析的 垃圾短信抽樣過(guò)濾方法,提高了短信處理效率, 一定程度上解決了短信服務(wù)中 心網(wǎng)絡(luò)堵塞。


圖1是本發(fā)明一種具體實(shí)施方式
對(duì)垃圾短信過(guò)濾的流程圖;圖2是圖1所示用戶信任度抽樣過(guò)濾步驟的具體實(shí)施方式
的流程圖;圖3是圖1所示短信長(zhǎng)度過(guò)濾步驟的具體實(shí)施方式
的流程圖;圖4是圖1所示短信關(guān)鍵詞過(guò)濾步驟的具體實(shí)施方式
的流程圖;圖5是圖1所示短信內(nèi)容過(guò)濾步驟的具體實(shí)施方式
的流程圖;圖6是圖1所示正常短信處理流程的具體實(shí)施方式
的流程圖7是圖1所示垃圾短信處理流程的具體實(shí)施方式
的流程圖;具體實(shí)施方式
下面結(jié)合附圖,對(duì)本發(fā)明優(yōu)選具體實(shí)施方式
進(jìn)行描述。需要提醒注意的是, 在以下的描述中,當(dāng)采用的已知功能和設(shè)計(jì)的詳細(xì)描述也許會(huì)淡化本發(fā)明的主 題內(nèi)容時(shí),這些描述在這兒將被忽略。圖1是本發(fā)明一種具體實(shí)施方式
對(duì)垃圾短信過(guò)濾的流程圖。在本實(shí)施例中, 將本發(fā)明垃圾短信過(guò)濾方法融入并體現(xiàn)在用戶信任度抽樣過(guò)濾步驟、短信長(zhǎng)度 過(guò)濾步驟短信關(guān)鍵詞過(guò)濾步驟和短信內(nèi)容過(guò)濾步驟,以及短信短信處理流程和 垃圾短信處理流程中。正常短信處理流程和垃圾短信的處理流程主要是為修改 以及怎樣修改用戶信任度以及怎樣以及用戶信任度抽樣過(guò)濾提供的短信情況, 即垃圾短信和正常短信的發(fā)送情況,具體在下面的說(shuō)明書(shū)中有詳細(xì)的敘述。在本實(shí)施例中,本發(fā)明垃圾短信過(guò)濾方法的第三步將依據(jù)構(gòu)成短信的文字 信息確定短信是否是垃圾短信的過(guò)濾方法,順序地采用短信長(zhǎng)度過(guò)濾、短信關(guān) 鍵詞過(guò)濾和短信內(nèi)容過(guò)濾三種過(guò)濾方法的結(jié)合,提高過(guò)濾的準(zhǔn)確性。當(dāng)然,在 具體實(shí)施時(shí),本發(fā)明的第三步也可以選擇采用短信長(zhǎng)度過(guò)濾、短信關(guān)鍵詞過(guò)濾 方法或短信內(nèi)容過(guò)濾的其中一種。同時(shí),本實(shí)施例中,第三步創(chuàng)新性地將上述 依次進(jìn)行的短信長(zhǎng)度過(guò)濾、短信關(guān)鍵詞過(guò)濾以及短信內(nèi)容過(guò)濾三種短信過(guò)濾的 組合起來(lái),由于其在過(guò)濾時(shí)花費(fèi)的時(shí)間依次增加,同時(shí),在后的過(guò)濾方法處理 的可疑短信數(shù)量,由于前面的過(guò)濾,即部分可疑短信排除為垃圾短信并作為正 常短信予以發(fā)送后,會(huì)更少一些,這樣在兼顧垃圾短信過(guò)濾系統(tǒng)處理的準(zhǔn)確性 的同時(shí),也提高了處理效率。下面分別對(duì)四個(gè)過(guò)濾步驟進(jìn)行詳細(xì)描述。過(guò)濾步驟l:用戶信任度抽樣過(guò)濾所謂用戶信任度抽樣,是指根據(jù)用戶的信任度對(duì)用戶所發(fā)送的短信進(jìn)行相 應(yīng)頻率(強(qiáng)度)的抽樣過(guò)濾。用戶信任度是指對(duì)用戶發(fā)送正常短信的信任程度, 可以依據(jù)用戶垃圾短信的發(fā)送量、正常短信的發(fā)送量和總的短信發(fā)送量計(jì)算而 成。如果不同用戶的垃圾短信發(fā)送量、正常短信發(fā)送量和總的短信發(fā)送量不同, 那么信任度就不同。因此,對(duì)這些用戶抽樣監(jiān)測(cè)的頻率(強(qiáng)度)也就不一樣。 一般地講,用戶信任度越低,用戶發(fā)送垃圾短信的可能性越大,被抽樣的頻率 強(qiáng)度越高;用戶信任度越高,用戶發(fā)送垃圾短信的可能性越小,被抽樣的頻率 強(qiáng)度越低。被抽樣到的短信作為可疑短信,到下一步進(jìn)行基于短信長(zhǎng)度的過(guò)濾;未被抽樣到的短信作為正常短信,并予以發(fā)送。同時(shí),在本實(shí)施例中,結(jié)合傳統(tǒng)的黑名單/白名單過(guò)濾方法,即在白名單 中的短信用戶發(fā)送短信不受限制,默認(rèn)發(fā)出的均為正常短信,在黑名單的短信 用戶是被禁止發(fā)送任何短信,對(duì)已經(jīng)確認(rèn)的黑名單/白名單短信用戶進(jìn)行管理。如果用戶的信任度為o,那么表示該用戶為黑名單用戶,則該用戶所發(fā)送的短信是垃圾短信,將直接過(guò)濾掉;當(dāng)用戶的信任度為1,則表示該用戶為白名單用戶, 即特權(quán)用戶,用戶所發(fā)送的短信是正常短信,直接給予通過(guò),不再進(jìn)行依據(jù)構(gòu) 成短信的文字本身確定短信是否是垃圾短信的垃圾短信過(guò)濾。而信任度位于0 到1區(qū)間內(nèi)的用戶,則是普通用戶。普通用戶發(fā)送的短信,將按其信任度的不 同,進(jìn)行不同頻率強(qiáng)度的抽樣,對(duì)被抽取到的短信進(jìn)行依據(jù)構(gòu)成短信文字內(nèi)容 判定短信是否是垃圾短信。這樣,就將本發(fā)明的垃圾短信的過(guò)濾方法與傳統(tǒng)黑 名單/白名單過(guò)濾方法結(jié)合起來(lái)了。 過(guò)濾步驟2:短信長(zhǎng)度的過(guò)濾接收上一步來(lái)的可疑短信,計(jì)算短信內(nèi)容的長(zhǎng)度,判斷短信內(nèi)容的長(zhǎng)度是 否超過(guò)設(shè)定的閾值。當(dāng)短信長(zhǎng)度超過(guò)設(shè)定閾值時(shí),該短信為可疑短信,到下--步進(jìn)行關(guān)鍵詞過(guò)濾;短信的長(zhǎng)度小于設(shè)定閾值時(shí),該短信為正常短信,并予以 發(fā)送?;诙绦砰L(zhǎng)度的過(guò)濾方法主要根據(jù)設(shè)定的垃圾短信最小長(zhǎng)度閾值來(lái)判斷用 戶發(fā)送的短信是否為正常短信。由于短信的長(zhǎng)度有一定的限制, 一般為140個(gè) 英文字符長(zhǎng)度,也就是70個(gè)中文字符。根據(jù)統(tǒng)計(jì)發(fā)現(xiàn)垃圾和非垃圾短信在長(zhǎng)度 上有很明顯的區(qū)別,垃圾短信普遍具有更長(zhǎng)的長(zhǎng)度,也就是說(shuō)具有更多的信息。 因此可以根據(jù)短信的長(zhǎng)度對(duì)短信進(jìn)行初步的判定, 一般長(zhǎng)度比較短的短信是垃 圾短信的可能性相對(duì)比較小。在該模塊中的短信長(zhǎng)度,可以通過(guò)分析歷史垃圾 短信的長(zhǎng)度分布模式而動(dòng)態(tài)設(shè)定。過(guò)濾步驟3:短信關(guān)鍵詞過(guò)濾接收上一步來(lái)的可疑短信,根據(jù)設(shè)定的關(guān)鍵詞列表,檢測(cè)用戶發(fā)送的短信
中是否含有設(shè)定關(guān)鍵詞,當(dāng)用戶發(fā)送含有某一關(guān)鍵詞的短信量達(dá)到設(shè)定的閾值 時(shí),提示管理員進(jìn)行確認(rèn)。如果是垃圾短信,直接攔截;若為正常短信,則給 予補(bǔ)發(fā)。若含有某關(guān)鍵詞的短信數(shù)量未達(dá)到設(shè)定的閾值,則該短信作為可疑短 信到下一步進(jìn)行短信內(nèi)容過(guò)濾。關(guān)鍵詞過(guò)濾主要通過(guò)設(shè)定一些關(guān)鍵詞來(lái)判斷用戶發(fā)送垃圾短信的可能性。 系統(tǒng)初始時(shí)有一個(gè)初始值關(guān)鍵詞列表,根據(jù)系統(tǒng)的運(yùn)行情況由系統(tǒng)管理員對(duì)其 進(jìn)行靈活調(diào)整,從位于垃圾短信庫(kù)中提取新的垃圾關(guān)鍵詞擴(kuò)充到關(guān)鍵詞列表中, 并由系統(tǒng)管理員定時(shí)刪除過(guò)時(shí)的關(guān)鍵詞。過(guò)濾歩驟4:短信內(nèi)容過(guò)濾短信內(nèi)容過(guò)濾主要根據(jù)短信的內(nèi)容進(jìn)行分類(lèi)過(guò)濾。在本實(shí)施例中,該內(nèi)容 過(guò)濾主要采用貝葉斯分類(lèi)算法,其訓(xùn)練樣本來(lái)自于正常短信庫(kù)和垃圾短信庫(kù)。 接收上一步來(lái)的可疑短信,對(duì)其進(jìn)行自動(dòng)的分類(lèi)。分類(lèi)為正常短信的將直接予 以發(fā)送,并放入正常短信庫(kù)中;若判斷為垃圾短信,則攔截掉,并放入垃圾短 信庫(kù)中。同時(shí)根據(jù)新擴(kuò)充的正常短信和垃圾短信更新分類(lèi)器。在本實(shí)施例中,根據(jù)用戶的信任度確定對(duì)不同短信用戶的過(guò)濾強(qiáng)度,這樣 使得大部分用戶所發(fā)送的短信都能直接通過(guò),只有小部分用戶所發(fā)送的短信接 受相應(yīng)的檢測(cè),大大提高了過(guò)濾系統(tǒng)的處理效率;此外,在本實(shí)施例中,本發(fā) 明還整合了傳統(tǒng)的垃圾短信過(guò)濾技術(shù),構(gòu)成了一個(gè)多種方式的垃圾短信過(guò)濾方 法,對(duì)抽樣到的短信進(jìn)行有效的判別,較之采用單一過(guò)濾技術(shù)準(zhǔn)確性有了很大 提高。圖2是圖1所示用戶信任度抽樣過(guò)濾步驟一種具體實(shí)施方式
的流程圖。在 本實(shí)施例中,用戶信任度抽樣過(guò)濾的具體步驟為 a)、初始化用戶信息 統(tǒng)計(jì)用戶短信的發(fā)送量w附,,正常短信的發(fā)送量附,。則用戶的信任度為柳附'.其他 (1)
,'是用戶編號(hào),最小信任度c"化—M/7V和最大信任度cm&一M^可以根據(jù)情況 自適應(yīng)的調(diào)整以符合實(shí)際要求,同時(shí)防止普通用戶的信任度過(guò)低導(dǎo)致用戶發(fā)送 的短信直接被認(rèn)為是垃圾短信,或者信任度過(guò)高導(dǎo)致對(duì)使用用戶過(guò)于疏于監(jiān)控。 一般地,ct^^一M/7V可取0. 5, cm^—M4Z可取0.9995。黑名單用戶信任度為0,特權(quán)用戶信任度為1,直接過(guò)濾或予以發(fā)送,這類(lèi)用戶不需要進(jìn)行抽樣分析 短信的文字內(nèi)容,則可判定短信是否是垃圾短信。此時(shí),用戶發(fā)送垃圾短信的 頻率<formula>formula see original document page 10</formula>(2)
根據(jù)奈特斯特抽樣原理,則用戶發(fā)送垃圾短信抽樣強(qiáng)度,即抽樣頻率<formula>formula see original document page 10</formula> (3)當(dāng)cre^Y —M/iV取0. 5時(shí),用戶抽樣頻率為1,當(dāng)cm/" —M4X取0. 9995時(shí), 抽樣頻率0. 001.用戶抽樣間隔數(shù)<formula>formula see original document page 10</formula>
當(dāng)cre必一M4X取0.5時(shí),用戶抽樣間隔數(shù)為1,即對(duì)用戶發(fā)送的短信進(jìn)行連 續(xù)檢測(cè)。cre必一M4Z取0.9995時(shí),抽樣間隔數(shù)為1000,即對(duì)用戶發(fā)送的短信每 隔1000條進(jìn)行抽樣一次,并作為可疑短信。當(dāng)用戶為沒(méi)有歷史信息的新用戶時(shí), 則用戶信任度設(shè)為cr^^, M/7V,用戶短信的發(fā)送量wm,和正常短信的發(fā)送量m,都為0,此時(shí)需要連續(xù)確認(rèn)用戶發(fā)送的短信以獲取用戶發(fā)送短信的情況。 設(shè)置有連續(xù)抽樣標(biāo)志y/ag,, y^g,/n^表示需要連續(xù)抽樣,當(dāng)/7艱=々/^表示不 需要連續(xù)抽樣。當(dāng)用戶發(fā)送的短信需要連續(xù)抽樣時(shí),"表示連續(xù)為正常短信的最 大條數(shù), 一般取用戶信任度最大時(shí)的抽樣間隔數(shù)。此時(shí)設(shè)有一個(gè)計(jì)數(shù)器nl,,表 示連續(xù)檢測(cè)時(shí)連續(xù)為正常短信的數(shù)量,初始值為O。b)、接收用戶短信,檢索用戶信任度,判斷是否為O、 l或其他值。 如果為O,則為黑名單用戶,短信給予攔截;如果l,則為特權(quán)用戶,短信給予直接通過(guò),并予以發(fā)送;如果為其他值,則進(jìn)行下一步。c) 、用戶短信發(fā)送量w^ =^,+1,當(dāng)連續(xù)抽樣標(biāo)志y^g,-^^時(shí),轉(zhuǎn)到過(guò) 濾步驟2,即短信長(zhǎng)度過(guò)濾步驟。否則按(1)式計(jì)算用戶信任度,當(dāng) c^&^cre必—MW,設(shè)/吸,-加e轉(zhuǎn)到過(guò)濾步驟2。其他情況,則進(jìn)行下一步。d) 、計(jì)數(shù)器^ +1 , 初始值為0,計(jì)算用戶短信的抽樣間隔數(shù)。若^ &>2terv《, 轉(zhuǎn)到過(guò)濾步驟2,即對(duì)該條短信進(jìn)行抽樣,同時(shí)將,,置0;否則短信按正常短信 直接通過(guò),并予以發(fā)送。此時(shí)用戶正常短信的發(fā)送量w,-m,.+l。圖3是圖1所示短信長(zhǎng)度過(guò)濾步驟的具體實(shí)施方式
的流程圖。接收來(lái)自過(guò) 濾步驟l,即用戶信任度抽樣過(guò)濾步驟的可疑短信l,進(jìn)行短信長(zhǎng)度過(guò)濾。設(shè)垃 圾短信的長(zhǎng)度大于x,因此,當(dāng)短信的長(zhǎng)度小于x時(shí),則認(rèn)為該短信是正常短信, 給予直接通過(guò),并予以發(fā)送;對(duì)短信長(zhǎng)度大于等于x時(shí)短信需要進(jìn)行進(jìn)一步的處理,作為可疑短信。其具體的過(guò)濾歩驟為a) 、接收步驟l,即用戶信任度抽樣過(guò)濾步驟來(lái)的可疑短信l;b) 、計(jì)算每條短信的長(zhǎng)度;c) 、判斷短信的長(zhǎng)度是否大于設(shè)置的x,如果小于轉(zhuǎn)到下一步d,否則轉(zhuǎn)到e步;d) 、短信為正常短信,進(jìn)入正常短信處理流程;e) 、該短信為可疑短信,轉(zhuǎn)到過(guò)濾步驟2,即短信關(guān)鍵字過(guò)濾步驟。圖4是圖1所示短信關(guān)鍵詞過(guò)濾步驟一種具體實(shí)施方式
的流程圖。具體的 過(guò)濾步驟為a) 、接收步驟2,即短信長(zhǎng)度過(guò)濾步驟來(lái)的可疑短信2;b) 、依據(jù)關(guān)鍵字列表,判斷用戶發(fā)送短信中是否含有設(shè)定的關(guān)鍵詞,若沒(méi)有,則將該短信作為可疑短信,轉(zhuǎn)到過(guò)濾步驟3,即短信內(nèi)容過(guò)濾步驟;若有, 對(duì)應(yīng)的關(guān)鍵詞數(shù)量^y, =fe_y, +1;C)、判斷關(guān)鍵詞的數(shù)量是否小于設(shè)定的一定頻率的閾值如果小于,則轉(zhuǎn) 到過(guò)濾步驟3,即短信內(nèi)容過(guò)濾步驟;若檢索到該用戶發(fā)送包含有相同關(guān)鍵詞內(nèi)容的短信達(dá)到一定頻率閾值,提 示相關(guān)系統(tǒng)管理人員確認(rèn)核實(shí)是否屬于垃圾短信Cl)、若是垃圾短信,則進(jìn)入垃圾短信處理流程。 C2)、若是正常短信,則進(jìn)入正常短信處理流程。圖5是圖1所示短信內(nèi)容過(guò)濾步驟的具體實(shí)施方式
的流程圖。具體的過(guò)濾步驟如下a) 、接收經(jīng)步驟3的關(guān)鍵詞過(guò)濾后的可疑短信3,進(jìn)行特征提取后進(jìn)入b步;b) 、參照訓(xùn)練樣本特征庫(kù),根據(jù)可疑短信的特征信息,采用貝葉斯分類(lèi)算法對(duì)可疑短信3進(jìn)行分類(lèi);bl)、若是垃圾短信,則進(jìn)入垃圾短信處理流程;b2)、若是正常短信,則進(jìn)入正常短信處理流程。 圖6是圖1所示正常短信處理流程的一種具體實(shí)施方式
的流程圖。當(dāng)用戶 短信確定為正常短信后,正常短信的發(fā)送量附,-w, + l,并判斷當(dāng)連續(xù)抽樣標(biāo)志 如g,是否為^e:如果-flg,不為&we,將該短信予以發(fā)送,返回到過(guò)濾步驟l,即用戶信任度抽樣過(guò)濾步驟;如果,則連續(xù)正常短信數(shù)W, ,判斷Ml,是否小于(1-"e浙)x":如果"l,乂(l-o^逾,)x",則將該短信予以發(fā)送,返回到過(guò)濾步驟l,即用戶信任度抽樣過(guò)濾步驟;若A》(1 -tre淑,)x ",則^"g, = , = 0 ,并將該短信予以發(fā)送,返回到過(guò)濾步驟l,即用戶信任度抽樣過(guò)濾步驟。圖7是圖1所示垃圾短信處理流程的一種具體實(shí)施方式
的流程圖。當(dāng)用戶短信確定為垃圾短信后,判斷當(dāng)連續(xù)抽樣標(biāo)志y/"g,是否為如果y^gi,則連續(xù)正常短信數(shù)"l, = 0 ; 如果^kg, = /a&e ,則連續(xù)正常短信數(shù)"l, = 0 , yZag, = ; 將該短信予以攔截,返回到過(guò)濾步驟l,即用戶信任度抽樣過(guò)濾步驟。 盡管上面對(duì)本發(fā)明說(shuō)明性的具體實(shí)施方式
進(jìn)行了描述,。以便于本技術(shù)領(lǐng)域 的技術(shù)人員理解本發(fā)明,但應(yīng)當(dāng)清楚,本發(fā)明不限于具體實(shí)施方式
的范圍,對(duì) 本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)講,只要各種變化在所附的權(quán)利要求限定和確定 的本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見(jiàn)的, 一切利用本發(fā)明構(gòu)思的發(fā) 明創(chuàng)造均在保護(hù)之列。
權(quán)利要求
1、一種垃圾短信過(guò)濾方法,其特征在于,包括以下步驟第一步,給每個(gè)短信用戶設(shè)置一個(gè)用戶信任度;第二步,根據(jù)短信用戶的信任度,對(duì)經(jīng)過(guò)短信服務(wù)中心的短信進(jìn)行不同強(qiáng)度的抽樣過(guò)濾,用戶信任度越低,抽樣強(qiáng)度越高,用戶信任度越高,抽樣強(qiáng)度越低,未被抽樣到的短信作為正常短信予以發(fā)送,被抽樣到的短信作為可疑短信進(jìn)入下一步;第三步,被抽樣到的可疑短信,采用根據(jù)短信的文字信息來(lái)判定短信是否是垃圾短信的過(guò)濾方法,如是,直接過(guò)濾掉,如果不是,認(rèn)定為正常短信,予以發(fā)送;第四步,依據(jù)短信用戶短信發(fā)送情況,修改該短信用戶的用戶信任度,正常短信的發(fā)送量越大,垃圾短信的發(fā)送量越小,用戶信任度就會(huì)提高,反之,則降低。
2、 根據(jù)權(quán)利要求1所述的垃圾短信過(guò)濾方法,其特征在于,所述的根據(jù)短 信的文字信息判定短信是否是垃圾短信的過(guò)濾方法為順序地采用短信長(zhǎng)度過(guò) 濾、短信關(guān)鍵詞過(guò)濾和短信內(nèi)容過(guò)濾相結(jié)合的過(guò)濾方法。
3、 根據(jù)權(quán)利要求1或2所述的垃圾短信過(guò)濾方法,其特征在于,所述的用戶信任度為<formula>formula see original document page 2</formula>其中^m,為用戶短信的發(fā)送量,m,為正常短信的發(fā)送量,/是用戶編號(hào),crea^_M/7V最小信任度值,cmfe_M4X為最大信任度。
4、 根據(jù)權(quán)利要求3所述的垃圾短信過(guò)濾方法,其特征在于,所述的抽樣強(qiáng) 度為— s譜/ /《=2x j朋/r一/ =2x(l — cm/",.)。
5、 根據(jù)權(quán)利要求3所述的垃圾短信過(guò)濾方法,其特征在于,所述的抽樣過(guò)濾為計(jì)數(shù)器^^,+l,《初始值為0,計(jì)算用戶短信的抽樣間隔數(shù):<formula>formula see original document page 3</formula>若(^WmW,,對(duì)該條短信進(jìn)行抽樣,可疑短信進(jìn)入下一步,同時(shí)將《置0; 否則短信按正常短信直接通過(guò),并予以發(fā)送。
6、 權(quán)利要求3所述的垃圾短信過(guò)濾方法,其特征在于,所述的用戶信任度 是經(jīng)過(guò)一定數(shù)量的連續(xù)抽樣后,按照3上述的公式計(jì)算得到。
7、 根據(jù)權(quán)利要求6所述的垃圾短信過(guò)濾方法,其特征在于,依據(jù)構(gòu)成短信 的文字信息確定短信是否是垃圾短信,如是,則需要重新經(jīng)過(guò)一定數(shù)量的連續(xù) 抽樣。
全文摘要
本發(fā)明公開(kāi)了一種垃圾短信過(guò)濾方法,包括以下步驟給每個(gè)短信用戶設(shè)置一個(gè)用戶信任度;根據(jù)短信用戶的信任度,對(duì)短信進(jìn)行不同強(qiáng)度的抽樣過(guò)濾,未被抽樣到的短信作為正常短信予以發(fā)送,被抽樣到的短信作為可疑短信;可疑短信,采用依據(jù)構(gòu)成短信的文字信息確定短信是否是垃圾短信,如是,直接過(guò)濾掉,如果不是,認(rèn)定為正常短信,予以發(fā)送;依據(jù)短信用戶短信發(fā)送情況,修改該短信用戶的用戶信任度。本發(fā)明在傳統(tǒng)垃圾短信過(guò)濾方法的基礎(chǔ)上,創(chuàng)新性地提出根據(jù)用戶信任度的不同,對(duì)短信進(jìn)行不同強(qiáng)度的抽樣,再依據(jù)構(gòu)成短信的文字內(nèi)容確定短信是否是垃圾短信,不對(duì)每一條短信進(jìn)行逐條分析,提高了短信處理效率,一定程度上解決了短信服務(wù)中心網(wǎng)絡(luò)堵塞。
文檔編號(hào)H04W4/14GK101150756SQ200710050448
公開(kāi)日2008年3月26日 申請(qǐng)日期2007年11月8日 優(yōu)先權(quán)日2007年11月8日
發(fā)明者彥 傅, 娜 關(guān), 周俊臨, 尚明生, 鐘延輝, 陳安龍 申請(qǐng)人:電子科技大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1