一種垃圾短信過(guò)濾方法

文檔序號(hào)：7646663閱讀：624來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：一種垃圾短信過(guò)濾方法
技術(shù)領(lǐng)域：
本發(fā)明屬于網(wǎng)絡(luò)通信技術(shù)領(lǐng)域的短信息處理技術(shù)，具體來(lái)講，涉及一種在通信系統(tǒng)的短信服務(wù)中心對(duì)用戶短信進(jìn)行監(jiān)管和過(guò)濾的方法。
背景技術(shù)：
近幾年來(lái)，由于移動(dòng)通信技術(shù)的快速發(fā)展，催化了諸多增值服務(wù)的產(chǎn)生。短信作為移動(dòng)通信的增值服務(wù)之一，在為人們提供價(jià)格低廉和便捷的通信服務(wù) 的同時(shí)，滋生了大量以傳播淫穢色情、商業(yè)欺詐、惡意詆毀以及商業(yè)廣告等不良信息為目的垃圾短信。這些垃圾短信嚴(yán)重干擾人們生活、妨害社會(huì)安全以及造成網(wǎng)絡(luò)擁塞，垃圾短信的監(jiān)管問(wèn)題已經(jīng)受到社會(huì)各界的廣泛重視。除了從立法層面加強(qiáng)對(duì)信息發(fā)布進(jìn)行監(jiān)管外，更重要的是要從技術(shù)層面探索垃圾短信有效的防范技術(shù)?，F(xiàn)有技術(shù)中，垃圾短信的過(guò)濾方式可以分為兩種一種是基于短信服務(wù)中心的過(guò)濾方式，另外一種是基于用戶手機(jī)的過(guò)濾方式?；谟脩羰謾C(jī)的過(guò)濾方式，如2007年03月07日公開(kāi)的，公告號(hào)為CN 1929513A，名稱(chēng)為"一種短消息過(guò)濾方法"的中國(guó)發(fā)明專(zhuān)利，公布的短信過(guò)濾方法為通過(guò)用戶在手機(jī)上設(shè)置過(guò)濾敏感詞；手機(jī)接收到來(lái)自短消息中心的短信并保存在內(nèi)存中；手機(jī)根據(jù)敏感詞對(duì)短信內(nèi)容進(jìn)行字符串匹配，如果有敏感詞出現(xiàn)在短信內(nèi)容中，則丟棄該短信，并向短消息中心發(fā)送成功接收消息；如果在短信內(nèi)容中沒(méi)有發(fā)現(xiàn)敏感詞，保存該短信。但這種基于用戶手機(jī)的過(guò)濾方式受手機(jī)處理能力、敏感詞涵蓋領(lǐng)域以及即時(shí)更新能力等方面的制約。目前，對(duì)于垃圾短信的過(guò)濾還是主要依靠基于短信服務(wù)中心的過(guò)濾方式進(jìn) 行，如2006年01月25日公開(kāi)的中國(guó)發(fā)明專(zhuān)利，公告號(hào)為CN 1725874A,名稱(chēng) 為"一種實(shí)現(xiàn)短消息業(yè)務(wù)的方法"，公布了一種過(guò)濾方式，該方法中用戶在網(wǎng)絡(luò) 側(cè)設(shè)置自身對(duì)應(yīng)的短信過(guò)濾規(guī)則，在網(wǎng)絡(luò)側(cè)向接受方發(fā)送短信之前，網(wǎng)絡(luò)側(cè)根據(jù)接收方的短信過(guò)濾規(guī)則判斷是否需要過(guò)濾該短信，如果是，則不發(fā)送該短信;
否則，向接受方發(fā)送該短信?；诙绦欧?wù)中心的過(guò)濾方式可以對(duì)短信中的敏感詞進(jìn)行有效地更新，因而是目前的主流技術(shù)，己經(jīng)有大量成熟的產(chǎn)品推出，如北京啟明星辰信息技術(shù)有限公司推出的天清短消息監(jiān)控系統(tǒng)、北京宏基聯(lián)合網(wǎng)絡(luò)技術(shù)開(kāi)發(fā)有限公司的短信過(guò)濾系統(tǒng)SMS、成都西朗科技發(fā)展有限公司的SLMT短信監(jiān)控系統(tǒng)、重慶瑞笛科技有限公司的Attractor VII-SMEYE短信息安全系統(tǒng)、深圳市正普信息有限公司的ZP⑧-SM短信安全過(guò)濾系統(tǒng)等系統(tǒng)，以及中興、華為、思科、朗訊、惠普等公司推出垃圾短信產(chǎn)品等。另外，從短信的過(guò)濾技術(shù)，即垃圾短信的判定方法方面，主要是依據(jù)構(gòu)成短信的文字本身進(jìn)行判斷，目前主要采用基于關(guān)鍵詞或基于內(nèi)容的垃圾短信過(guò) 濾方法。基于關(guān)鍵詞的垃圾短信過(guò)濾是設(shè)置一些關(guān)鍵詞，只要具有這些關(guān)鍵詞的短信，就認(rèn)定為垃圾短信，并予以濾掉，這種方法存在大量的査找運(yùn)算以及漏判或誤判等缺陷?；趦?nèi)容的垃圾短信過(guò)濾是采用機(jī)器學(xué)習(xí)方法把短信自動(dòng)分為正常短信和垃圾短信。目前用于短信自動(dòng)分類(lèi)的機(jī)器學(xué)習(xí)方法主要有樸素貝葉斯、SVM、 KNN、人工神經(jīng)網(wǎng)絡(luò)、Winnow算法等?；趦?nèi)容的垃圾短信過(guò)濾與基于關(guān)鍵詞的垃圾短信過(guò)濾相比，其運(yùn)算量更大。采用這些方法過(guò)濾時(shí)，短信服務(wù)中心需要對(duì)短信進(jìn)行逐條分析，才能判斷是否是垃圾短信，因此處理的效率比較低。同時(shí)不管是基于關(guān)鍵詞還是基于內(nèi) 容的垃圾短信過(guò)濾方法，都存在大量運(yùn)算，這樣會(huì)造成短信服務(wù)中心網(wǎng)絡(luò)堵塞，其解決方法可采用放棄部分垃圾短信的過(guò)濾或延遲短信轉(zhuǎn)發(fā)。發(fā)明內(nèi)容本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)中的不足，提供一種不需要對(duì)短信進(jìn) 行逐條分析、處理效率較高的垃圾短信過(guò)濾方法。為實(shí)現(xiàn)上述發(fā)明目的，本發(fā)明的垃圾短信過(guò)濾方法，其特征在于，包括以下步驟第一步，給每個(gè)短信用戶設(shè)置一個(gè)用戶信任度；第二步，根據(jù)短信用戶的信任度，對(duì)經(jīng)過(guò)短信服務(wù)中心的短信進(jìn)行不同強(qiáng)
度的抽樣過(guò)濾，用戶信任度越低，抽樣強(qiáng)度越高，用戶信任度越高，抽樣強(qiáng)度越低，未被抽樣到的短信作為正常短信予以發(fā)送，被抽樣到的短信作為可疑短信進(jìn)入下一步；第三步，被抽樣到的可疑短信，采用依據(jù)構(gòu)成短信的文字信息確定短信是否是垃圾短信，如是，直接過(guò)濾掉，如果不是，認(rèn)定為正常短信，予以發(fā)送；第四步，依據(jù)短信用戶短信發(fā)送情況，修改該短信用戶的用戶信任度，正常短信的發(fā)送量越大，垃圾短信的發(fā)送量越小，用戶信任度就會(huì)提高，反之，則降低。依據(jù)構(gòu)成短信的文字信息判定是否是垃圾短信的過(guò)濾方法，主要有前述的基于關(guān)鍵詞或基于內(nèi)容的垃圾短信過(guò)濾方法。抽樣強(qiáng)度，即抽樣頻率，也就是指在一定時(shí)間范圍內(nèi)，短信抽樣數(shù)與總的用戶發(fā)送的短信數(shù)量之比。傳統(tǒng)的垃圾短信過(guò)濾方法，需要對(duì)短信進(jìn)行逐條分析，才能判斷是否是垃圾短信，因此處理的效率比較低。但實(shí)際情況是大部分用戶所發(fā)送的短信都不是垃圾短信，沒(méi)有必要逐條分析，兼顧過(guò)濾的準(zhǔn)確率和效率，本發(fā)明在假定大多數(shù)用戶發(fā)送短信為正常短信，只有極少數(shù)用戶發(fā)送短信為垃圾短信的前提下，在傳統(tǒng)垃圾短信過(guò)濾方法的基礎(chǔ)上，創(chuàng)新性地提出根據(jù)用戶信任度的不同，對(duì) 發(fā)送到短信服務(wù)中心的短信進(jìn)行不同強(qiáng)度的抽樣，抽樣到的短信再依據(jù)構(gòu)成短信的文字內(nèi)容確定短信是否是垃圾短信，而不必對(duì)每一條短信進(jìn)行逐條分析的垃圾短信抽樣過(guò)濾方法，提高了短信處理效率，一定程度上解決了短信服務(wù)中心網(wǎng)絡(luò)堵塞。

圖1是本發(fā)明一種具體實(shí)施方式
對(duì)垃圾短信過(guò)濾的流程圖；圖2是圖1所示用戶信任度抽樣過(guò)濾步驟的具體實(shí)施方式
的流程圖；圖3是圖1所示短信長(zhǎng)度過(guò)濾步驟的具體實(shí)施方式
的流程圖；圖4是圖1所示短信關(guān)鍵詞過(guò)濾步驟的具體實(shí)施方式
的流程圖；圖5是圖1所示短信內(nèi)容過(guò)濾步驟的具體實(shí)施方式
的流程圖；圖6是圖1所示正常短信處理流程的具體實(shí)施方式
的流程圖7是圖1所示垃圾短信處理流程的具體實(shí)施方式
的流程圖；具體實(shí)施方式
下面結(jié)合附圖，對(duì)本發(fā)明優(yōu)選具體實(shí)施方式
進(jìn)行描述。需要提醒注意的是，在以下的描述中，當(dāng)采用的已知功能和設(shè)計(jì)的詳細(xì)描述也許會(huì)淡化本發(fā)明的主題內(nèi)容時(shí)，這些描述在這兒將被忽略。圖1是本發(fā)明一種具體實(shí)施方式
對(duì)垃圾短信過(guò)濾的流程圖。在本實(shí)施例中，將本發(fā)明垃圾短信過(guò)濾方法融入并體現(xiàn)在用戶信任度抽樣過(guò)濾步驟、短信長(zhǎng)度過(guò)濾步驟短信關(guān)鍵詞過(guò)濾步驟和短信內(nèi)容過(guò)濾步驟，以及短信短信處理流程和垃圾短信處理流程中。正常短信處理流程和垃圾短信的處理流程主要是為修改以及怎樣修改用戶信任度以及怎樣以及用戶信任度抽樣過(guò)濾提供的短信情況，即垃圾短信和正常短信的發(fā)送情況，具體在下面的說(shuō)明書(shū)中有詳細(xì)的敘述。在本實(shí)施例中，本發(fā)明垃圾短信過(guò)濾方法的第三步將依據(jù)構(gòu)成短信的文字信息確定短信是否是垃圾短信的過(guò)濾方法，順序地采用短信長(zhǎng)度過(guò)濾、短信關(guān) 鍵詞過(guò)濾和短信內(nèi)容過(guò)濾三種過(guò)濾方法的結(jié)合，提高過(guò)濾的準(zhǔn)確性。當(dāng)然，在具體實(shí)施時(shí)，本發(fā)明的第三步也可以選擇采用短信長(zhǎng)度過(guò)濾、短信關(guān)鍵詞過(guò)濾方法或短信內(nèi)容過(guò)濾的其中一種。同時(shí)，本實(shí)施例中，第三步創(chuàng)新性地將上述依次進(jìn)行的短信長(zhǎng)度過(guò)濾、短信關(guān)鍵詞過(guò)濾以及短信內(nèi)容過(guò)濾三種短信過(guò)濾的組合起來(lái)，由于其在過(guò)濾時(shí)花費(fèi)的時(shí)間依次增加，同時(shí)，在后的過(guò)濾方法處理的可疑短信數(shù)量，由于前面的過(guò)濾，即部分可疑短信排除為垃圾短信并作為正常短信予以發(fā)送后，會(huì)更少一些，這樣在兼顧垃圾短信過(guò)濾系統(tǒng)處理的準(zhǔn)確性的同時(shí)，也提高了處理效率。下面分別對(duì)四個(gè)過(guò)濾步驟進(jìn)行詳細(xì)描述。過(guò)濾步驟l:用戶信任度抽樣過(guò)濾所謂用戶信任度抽樣，是指根據(jù)用戶的信任度對(duì)用戶所發(fā)送的短信進(jìn)行相應(yīng)頻率(強(qiáng)度)的抽樣過(guò)濾。用戶信任度是指對(duì)用戶發(fā)送正常短信的信任程度，可以依據(jù)用戶垃圾短信的發(fā)送量、正常短信的發(fā)送量和總的短信發(fā)送量計(jì)算而成。如果不同用戶的垃圾短信發(fā)送量、正常短信發(fā)送量和總的短信發(fā)送量不同，那么信任度就不同。因此，對(duì)這些用戶抽樣監(jiān)測(cè)的頻率(強(qiáng)度)也就不一樣。一般地講，用戶信任度越低，用戶發(fā)送垃圾短信的可能性越大，被抽樣的頻率強(qiáng)度越高；用戶信任度越高，用戶發(fā)送垃圾短信的可能性越小，被抽樣的頻率強(qiáng)度越低。被抽樣到的短信作為可疑短信，到下一步進(jìn)行基于短信長(zhǎng)度的過(guò)濾；未被抽樣到的短信作為正常短信，并予以發(fā)送。同時(shí)，在本實(shí)施例中，結(jié)合傳統(tǒng)的黑名單/白名單過(guò)濾方法，即在白名單中的短信用戶發(fā)送短信不受限制，默認(rèn)發(fā)出的均為正常短信，在黑名單的短信用戶是被禁止發(fā)送任何短信，對(duì)已經(jīng)確認(rèn)的黑名單/白名單短信用戶進(jìn)行管理。如果用戶的信任度為o，那么表示該用戶為黑名單用戶，則該用戶所發(fā)送的短信是垃圾短信，將直接過(guò)濾掉；當(dāng)用戶的信任度為1，則表示該用戶為白名單用戶，即特權(quán)用戶，用戶所發(fā)送的短信是正常短信，直接給予通過(guò)，不再進(jìn)行依據(jù)構(gòu) 成短信的文字本身確定短信是否是垃圾短信的垃圾短信過(guò)濾。而信任度位于0 到1區(qū)間內(nèi)的用戶，則是普通用戶。普通用戶發(fā)送的短信，將按其信任度的不同，進(jìn)行不同頻率強(qiáng)度的抽樣，對(duì)被抽取到的短信進(jìn)行依據(jù)構(gòu)成短信文字內(nèi)容判定短信是否是垃圾短信。這樣，就將本發(fā)明的垃圾短信的過(guò)濾方法與傳統(tǒng)黑名單/白名單過(guò)濾方法結(jié)合起來(lái)了。過(guò)濾步驟2:短信長(zhǎng)度的過(guò)濾接收上一步來(lái)的可疑短信，計(jì)算短信內(nèi)容的長(zhǎng)度，判斷短信內(nèi)容的長(zhǎng)度是否超過(guò)設(shè)定的閾值。當(dāng)短信長(zhǎng)度超過(guò)設(shè)定閾值時(shí)，該短信為可疑短信，到下--步進(jìn)行關(guān)鍵詞過(guò)濾；短信的長(zhǎng)度小于設(shè)定閾值時(shí)，該短信為正常短信，并予以發(fā)送?；诙绦砰L(zhǎng)度的過(guò)濾方法主要根據(jù)設(shè)定的垃圾短信最小長(zhǎng)度閾值來(lái)判斷用戶發(fā)送的短信是否為正常短信。由于短信的長(zhǎng)度有一定的限制，一般為140個(gè) 英文字符長(zhǎng)度，也就是70個(gè)中文字符。根據(jù)統(tǒng)計(jì)發(fā)現(xiàn)垃圾和非垃圾短信在長(zhǎng)度上有很明顯的區(qū)別，垃圾短信普遍具有更長(zhǎng)的長(zhǎng)度，也就是說(shuō)具有更多的信息。因此可以根據(jù)短信的長(zhǎng)度對(duì)短信進(jìn)行初步的判定，一般長(zhǎng)度比較短的短信是垃圾短信的可能性相對(duì)比較小。在該模塊中的短信長(zhǎng)度，可以通過(guò)分析歷史垃圾短信的長(zhǎng)度分布模式而動(dòng)態(tài)設(shè)定。過(guò)濾步驟3:短信關(guān)鍵詞過(guò)濾接收上一步來(lái)的可疑短信，根據(jù)設(shè)定的關(guān)鍵詞列表，檢測(cè)用戶發(fā)送的短信
中是否含有設(shè)定關(guān)鍵詞，當(dāng)用戶發(fā)送含有某一關(guān)鍵詞的短信量達(dá)到設(shè)定的閾值時(shí)，提示管理員進(jìn)行確認(rèn)。如果是垃圾短信，直接攔截；若為正常短信，則給予補(bǔ)發(fā)。若含有某關(guān)鍵詞的短信數(shù)量未達(dá)到設(shè)定的閾值，則該短信作為可疑短信到下一步進(jìn)行短信內(nèi)容過(guò)濾。關(guān)鍵詞過(guò)濾主要通過(guò)設(shè)定一些關(guān)鍵詞來(lái)判斷用戶發(fā)送垃圾短信的可能性。系統(tǒng)初始時(shí)有一個(gè)初始值關(guān)鍵詞列表，根據(jù)系統(tǒng)的運(yùn)行情況由系統(tǒng)管理員對(duì)其進(jìn)行靈活調(diào)整，從位于垃圾短信庫(kù)中提取新的垃圾關(guān)鍵詞擴(kuò)充到關(guān)鍵詞列表中，并由系統(tǒng)管理員定時(shí)刪除過(guò)時(shí)的關(guān)鍵詞。過(guò)濾歩驟4:短信內(nèi)容過(guò)濾短信內(nèi)容過(guò)濾主要根據(jù)短信的內(nèi)容進(jìn)行分類(lèi)過(guò)濾。在本實(shí)施例中，該內(nèi)容過(guò)濾主要采用貝葉斯分類(lèi)算法，其訓(xùn)練樣本來(lái)自于正常短信庫(kù)和垃圾短信庫(kù)。接收上一步來(lái)的可疑短信，對(duì)其進(jìn)行自動(dòng)的分類(lèi)。分類(lèi)為正常短信的將直接予以發(fā)送，并放入正常短信庫(kù)中；若判斷為垃圾短信，則攔截掉，并放入垃圾短信庫(kù)中。同時(shí)根據(jù)新擴(kuò)充的正常短信和垃圾短信更新分類(lèi)器。在本實(shí)施例中，根據(jù)用戶的信任度確定對(duì)不同短信用戶的過(guò)濾強(qiáng)度，這樣使得大部分用戶所發(fā)送的短信都能直接通過(guò)，只有小部分用戶所發(fā)送的短信接受相應(yīng)的檢測(cè)，大大提高了過(guò)濾系統(tǒng)的處理效率；此外，在本實(shí)施例中，本發(fā) 明還整合了傳統(tǒng)的垃圾短信過(guò)濾技術(shù)，構(gòu)成了一個(gè)多種方式的垃圾短信過(guò)濾方法，對(duì)抽樣到的短信進(jìn)行有效的判別，較之采用單一過(guò)濾技術(shù)準(zhǔn)確性有了很大提高。圖2是圖1所示用戶信任度抽樣過(guò)濾步驟一種具體實(shí)施方式
的流程圖。在本實(shí)施例中，用戶信任度抽樣過(guò)濾的具體步驟為 a)、初始化用戶信息統(tǒng)計(jì)用戶短信的發(fā)送量w附,，正常短信的發(fā)送量附,。則用戶的信任度為柳附'.其他 (1)
,'是用戶編號(hào)，最小信任度c"化—M/7V和最大信任度cm&一M^可以根據(jù)情況自適應(yīng)的調(diào)整以符合實(shí)際要求，同時(shí)防止普通用戶的信任度過(guò)低導(dǎo)致用戶發(fā)送的短信直接被認(rèn)為是垃圾短信，或者信任度過(guò)高導(dǎo)致對(duì)使用用戶過(guò)于疏于監(jiān)控。一般地，ct^^一M/7V可取0. 5， cm^—M4Z可取0.9995。黑名單用戶信任度為0，特權(quán)用戶信任度為1，直接過(guò)濾或予以發(fā)送，這類(lèi)用戶不需要進(jìn)行抽樣分析短信的文字內(nèi)容，則可判定短信是否是垃圾短信。此時(shí)，用戶發(fā)送垃圾短信的頻率<formula>formula see original document page 10</formula>(2)
根據(jù)奈特斯特抽樣原理，則用戶發(fā)送垃圾短信抽樣強(qiáng)度，即抽樣頻率<formula>formula see original document page 10</formula> (3)當(dāng)cre^Y —M/iV取0. 5時(shí)，用戶抽樣頻率為1，當(dāng)cm/" —M4X取0. 9995時(shí)，抽樣頻率0. 001.用戶抽樣間隔數(shù)<formula>formula see original document page 10</formula>
當(dāng)cre必一M4X取0.5時(shí)，用戶抽樣間隔數(shù)為1,即對(duì)用戶發(fā)送的短信進(jìn)行連續(xù)檢測(cè)。cre必一M4Z取0.9995時(shí)，抽樣間隔數(shù)為1000，即對(duì)用戶發(fā)送的短信每隔1000條進(jìn)行抽樣一次，并作為可疑短信。當(dāng)用戶為沒(méi)有歷史信息的新用戶時(shí)，則用戶信任度設(shè)為cr^^, M/7V，用戶短信的發(fā)送量wm,和正常短信的發(fā)送量m,都為0,此時(shí)需要連續(xù)確認(rèn)用戶發(fā)送的短信以獲取用戶發(fā)送短信的情況。設(shè)置有連續(xù)抽樣標(biāo)志y/ag,， y^g,/n^表示需要連續(xù)抽樣，當(dāng)/7艱=々/^表示不需要連續(xù)抽樣。當(dāng)用戶發(fā)送的短信需要連續(xù)抽樣時(shí)，"表示連續(xù)為正常短信的最大條數(shù)，一般取用戶信任度最大時(shí)的抽樣間隔數(shù)。此時(shí)設(shè)有一個(gè)計(jì)數(shù)器nl,，表示連續(xù)檢測(cè)時(shí)連續(xù)為正常短信的數(shù)量，初始值為O。b)、接收用戶短信，檢索用戶信任度，判斷是否為O、 l或其他值。如果為O，則為黑名單用戶，短信給予攔截；如果l，則為特權(quán)用戶，短信給予直接通過(guò)，并予以發(fā)送；如果為其他值，則進(jìn)行下一步。c) 、用戶短信發(fā)送量w^ =^，+1，當(dāng)連續(xù)抽樣標(biāo)志y^g,-^^時(shí)，轉(zhuǎn)到過(guò) 濾步驟2，即短信長(zhǎng)度過(guò)濾步驟。否則按(1)式計(jì)算用戶信任度，當(dāng) c^&^cre必—MW，設(shè)/吸,-加e轉(zhuǎn)到過(guò)濾步驟2。其他情況，則進(jìn)行下一步。d) 、計(jì)數(shù)器^ +1 ，初始值為0，計(jì)算用戶短信的抽樣間隔數(shù)。若^ &>2terv《，轉(zhuǎn)到過(guò)濾步驟2，即對(duì)該條短信進(jìn)行抽樣，同時(shí)將,,置0;否則短信按正常短信直接通過(guò)，并予以發(fā)送。此時(shí)用戶正常短信的發(fā)送量w,-m,.+l。圖3是圖1所示短信長(zhǎng)度過(guò)濾步驟的具體實(shí)施方式
的流程圖。接收來(lái)自過(guò) 濾步驟l，即用戶信任度抽樣過(guò)濾步驟的可疑短信l，進(jìn)行短信長(zhǎng)度過(guò)濾。設(shè)垃圾短信的長(zhǎng)度大于x，因此，當(dāng)短信的長(zhǎng)度小于x時(shí)，則認(rèn)為該短信是正常短信，給予直接通過(guò)，并予以發(fā)送；對(duì)短信長(zhǎng)度大于等于x時(shí)短信需要進(jìn)行進(jìn)一步的處理，作為可疑短信。其具體的過(guò)濾歩驟為a) 、接收步驟l，即用戶信任度抽樣過(guò)濾步驟來(lái)的可疑短信l;b) 、計(jì)算每條短信的長(zhǎng)度；c) 、判斷短信的長(zhǎng)度是否大于設(shè)置的x，如果小于轉(zhuǎn)到下一步d，否則轉(zhuǎn)到e步；d) 、短信為正常短信，進(jìn)入正常短信處理流程；e) 、該短信為可疑短信，轉(zhuǎn)到過(guò)濾步驟2，即短信關(guān)鍵字過(guò)濾步驟。圖4是圖1所示短信關(guān)鍵詞過(guò)濾步驟一種具體實(shí)施方式
的流程圖。具體的過(guò)濾步驟為a) 、接收步驟2，即短信長(zhǎng)度過(guò)濾步驟來(lái)的可疑短信2;b) 、依據(jù)關(guān)鍵字列表，判斷用戶發(fā)送短信中是否含有設(shè)定的關(guān)鍵詞，若沒(méi)有，則將該短信作為可疑短信，轉(zhuǎn)到過(guò)濾步驟3，即短信內(nèi)容過(guò)濾步驟；若有，對(duì)應(yīng)的關(guān)鍵詞數(shù)量^y, =fe_y, +1;C)、判斷關(guān)鍵詞的數(shù)量是否小于設(shè)定的一定頻率的閾值如果小于，則轉(zhuǎn) 到過(guò)濾步驟3，即短信內(nèi)容過(guò)濾步驟；若檢索到該用戶發(fā)送包含有相同關(guān)鍵詞內(nèi)容的短信達(dá)到一定頻率閾值，提示相關(guān)系統(tǒng)管理人員確認(rèn)核實(shí)是否屬于垃圾短信Cl)、若是垃圾短信，則進(jìn)入垃圾短信處理流程。 C2)、若是正常短信，則進(jìn)入正常短信處理流程。圖5是圖1所示短信內(nèi)容過(guò)濾步驟的具體實(shí)施方式
的流程圖。具體的過(guò)濾步驟如下a) 、接收經(jīng)步驟3的關(guān)鍵詞過(guò)濾后的可疑短信3，進(jìn)行特征提取后進(jìn)入b步；b) 、參照訓(xùn)練樣本特征庫(kù)，根據(jù)可疑短信的特征信息，采用貝葉斯分類(lèi)算法對(duì)可疑短信3進(jìn)行分類(lèi)；bl)、若是垃圾短信，則進(jìn)入垃圾短信處理流程；b2)、若是正常短信，則進(jìn)入正常短信處理流程。圖6是圖1所示正常短信處理流程的一種具體實(shí)施方式
的流程圖。當(dāng)用戶短信確定為正常短信后，正常短信的發(fā)送量附,-w, + l，并判斷當(dāng)連續(xù)抽樣標(biāo)志如g,是否為^e:如果-flg,不為&we，將該短信予以發(fā)送，返回到過(guò)濾步驟l，即用戶信任度抽樣過(guò)濾步驟；如果，則連續(xù)正常短信數(shù)W, ，判斷Ml,是否小于(1-"e浙)x":如果"l,乂(l-o^逾,)x"，則將該短信予以發(fā)送，返回到過(guò)濾步驟l，即用戶信任度抽樣過(guò)濾步驟；若A》(1 -tre淑,)x "，則^"g, = ， = 0 ，并將該短信予以發(fā)送，返回到過(guò)濾步驟l，即用戶信任度抽樣過(guò)濾步驟。圖7是圖1所示垃圾短信處理流程的一種具體實(shí)施方式
的流程圖。當(dāng)用戶短信確定為垃圾短信后，判斷當(dāng)連續(xù)抽樣標(biāo)志y/"g,是否為如果y^gi，則連續(xù)正常短信數(shù)"l, = 0 ; 如果^kg, = /a&e ，則連續(xù)正常短信數(shù)"l, = 0 ， yZag, = ; 將該短信予以攔截，返回到過(guò)濾步驟l，即用戶信任度抽樣過(guò)濾步驟。盡管上面對(duì)本發(fā)明說(shuō)明性的具體實(shí)施方式
進(jìn)行了描述，。以便于本技術(shù)領(lǐng)域的技術(shù)人員理解本發(fā)明，但應(yīng)當(dāng)清楚，本發(fā)明不限于具體實(shí)施方式
的范圍，對(duì) 本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)講，只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi)，這些變化是顯而易見(jiàn)的，一切利用本發(fā)明構(gòu)思的發(fā) 明創(chuàng)造均在保護(hù)之列。
權(quán)利要求
1、一種垃圾短信過(guò)濾方法，其特征在于，包括以下步驟第一步，給每個(gè)短信用戶設(shè)置一個(gè)用戶信任度；第二步，根據(jù)短信用戶的信任度，對(duì)經(jīng)過(guò)短信服務(wù)中心的短信進(jìn)行不同強(qiáng)度的抽樣過(guò)濾，用戶信任度越低，抽樣強(qiáng)度越高，用戶信任度越高，抽樣強(qiáng)度越低，未被抽樣到的短信作為正常短信予以發(fā)送，被抽樣到的短信作為可疑短信進(jìn)入下一步；第三步，被抽樣到的可疑短信，采用根據(jù)短信的文字信息來(lái)判定短信是否是垃圾短信的過(guò)濾方法，如是，直接過(guò)濾掉，如果不是，認(rèn)定為正常短信，予以發(fā)送；第四步，依據(jù)短信用戶短信發(fā)送情況，修改該短信用戶的用戶信任度，正常短信的發(fā)送量越大，垃圾短信的發(fā)送量越小，用戶信任度就會(huì)提高，反之，則降低。
2、根據(jù)權(quán)利要求1所述的垃圾短信過(guò)濾方法，其特征在于，所述的根據(jù)短信的文字信息判定短信是否是垃圾短信的過(guò)濾方法為順序地采用短信長(zhǎng)度過(guò) 濾、短信關(guān)鍵詞過(guò)濾和短信內(nèi)容過(guò)濾相結(jié)合的過(guò)濾方法。
3、根據(jù)權(quán)利要求1或2所述的垃圾短信過(guò)濾方法，其特征在于，所述的用戶信任度為<formula>formula see original document page 2</formula>其中^m,為用戶短信的發(fā)送量，m,為正常短信的發(fā)送量，/是用戶編號(hào)，crea^_M/7V最小信任度值，cmfe_M4X為最大信任度。
4、根據(jù)權(quán)利要求3所述的垃圾短信過(guò)濾方法，其特征在于，所述的抽樣強(qiáng) 度為— s譜/ /《=2x j朋/r一/ =2x(l — cm/",.)。
5、根據(jù)權(quán)利要求3所述的垃圾短信過(guò)濾方法，其特征在于，所述的抽樣過(guò)濾為計(jì)數(shù)器^^,+l，《初始值為0，計(jì)算用戶短信的抽樣間隔數(shù):<formula>formula see original document page 3</formula>若(^WmW,，對(duì)該條短信進(jìn)行抽樣，可疑短信進(jìn)入下一步，同時(shí)將《置0; 否則短信按正常短信直接通過(guò)，并予以發(fā)送。
6、權(quán)利要求3所述的垃圾短信過(guò)濾方法，其特征在于，所述的用戶信任度是經(jīng)過(guò)一定數(shù)量的連續(xù)抽樣后，按照3上述的公式計(jì)算得到。
7、根據(jù)權(quán)利要求6所述的垃圾短信過(guò)濾方法，其特征在于，依據(jù)構(gòu)成短信的文字信息確定短信是否是垃圾短信，如是，則需要重新經(jīng)過(guò)一定數(shù)量的連續(xù) 抽樣。
全文摘要
本發(fā)明公開(kāi)了一種垃圾短信過(guò)濾方法，包括以下步驟給每個(gè)短信用戶設(shè)置一個(gè)用戶信任度；根據(jù)短信用戶的信任度，對(duì)短信進(jìn)行不同強(qiáng)度的抽樣過(guò)濾，未被抽樣到的短信作為正常短信予以發(fā)送，被抽樣到的短信作為可疑短信；可疑短信，采用依據(jù)構(gòu)成短信的文字信息確定短信是否是垃圾短信，如是，直接過(guò)濾掉，如果不是，認(rèn)定為正常短信，予以發(fā)送；依據(jù)短信用戶短信發(fā)送情況，修改該短信用戶的用戶信任度。本發(fā)明在傳統(tǒng)垃圾短信過(guò)濾方法的基礎(chǔ)上，創(chuàng)新性地提出根據(jù)用戶信任度的不同，對(duì)短信進(jìn)行不同強(qiáng)度的抽樣，再依據(jù)構(gòu)成短信的文字內(nèi)容確定短信是否是垃圾短信，不對(duì)每一條短信進(jìn)行逐條分析，提高了短信處理效率，一定程度上解決了短信服務(wù)中心網(wǎng)絡(luò)堵塞。
文檔編號(hào)H04W4/14GK101150756SQ200710050448
公開(kāi)日2008年3月26日申請(qǐng)日期2007年11月8日優(yōu)先權(quán)日2007年11月8日
發(fā)明者彥傅, 娜關(guān), 周俊臨, 尚明生, 鐘延輝, 陳安龍申請(qǐng)人:電子科技大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳安龍、尚明生、傅彥、周俊臨、鐘延輝、關(guān)娜
技術(shù)所有人：電子科技大學(xué)
我是此專(zhuān)利的發(fā)明人

上一篇：統(tǒng)一漢字輸入法及其鍵盤(pán)的制作方法
上一篇：機(jī)場(chǎng)航班信息顯示系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

手機(jī)垃圾短信過(guò)濾軟件相關(guān)技術(shù)

垃圾短信過(guò)濾軟件相關(guān)技術(shù)

垃圾郵件過(guò)濾方法相關(guān)技術(shù)

過(guò)濾垃圾短信相關(guān)技術(shù)

垃圾郵件過(guò)濾相關(guān)技術(shù)

垃圾評(píng)論過(guò)濾算法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種垃圾短信過(guò)濾方法