專利名稱:反垃圾的應(yīng)用存儲(chǔ)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于長(zhǎng)期存儲(chǔ)短消息系統(tǒng)(short message system SMS )消息的方案。
背景技術(shù):
隨著因特網(wǎng)的出現(xiàn),發(fā)送方在幾乎沒(méi)有任何成本的情況下向;[艮大量 的目的地發(fā)送消息已經(jīng)變得越來(lái)越容易。這對(duì)短消息發(fā)送服務(wù)(SMS ) 而言情況也是一樣。這些消息包括未經(jīng)請(qǐng)求而主動(dòng)提供的和不想要的消 息(垃圾spam),這給消息的接收方帶來(lái)了麻煩,接收方必須清除所述 消息并且確定它是否有任何的重要性。此外,它對(duì)用于發(fā)送消息的電信 網(wǎng)絡(luò)載體而言也是一種麻煩,這不僅是因?yàn)樗鄬?duì)于被垃圾泛濫的憤怒 客戶而言提出了客戶關(guān)系問(wèn)題,而且還因?yàn)檫@些通常幾乎沒(méi)有任何收益 的消息使用了網(wǎng)絡(luò)資源。以下兩個(gè)統(tǒng)計(jì)數(shù)據(jù)例證了此問(wèn)題的嚴(yán)重性。在 中國(guó),2003年經(jīng)由中國(guó)電信網(wǎng)絡(luò)發(fā)送了兩萬(wàn)億條短消息服務(wù)(SMS)消 息;估計(jì)這些消息中有四分之三是垃圾消息。第二個(gè)統(tǒng)計(jì)數(shù)據(jù)是,在美 國(guó)估計(jì)有85 - 90°/。的電子郵件消息是垃圾。這些垃圾消息不只是一種麻煩,而且在許多實(shí)例中還是一種用于欺 詐消息接收者的手段,其通過(guò)引誘接收者提供他們的信用卡信息或者通 過(guò)催促他們?yōu)槠谕盏较喈?dāng)大量的金額而支付適度金額(用于"手續(xù)費(fèi)" 或"稅")來(lái)進(jìn)行欺詐。由計(jì)算機(jī)自動(dòng)發(fā)起的用于欺詐的消息被頻繁發(fā)送 到非常大量的目的地,希望至少有一些目的地足夠笨到去作出響應(yīng)。該 問(wèn)題在辱國(guó)是嚴(yán)重的,但實(shí)際上在中國(guó)、日本、韓國(guó)也是很嚴(yán)重的,而 在歐洲雖嚴(yán)重但稍好一些。后面的這些國(guó)家一般具有龐大數(shù)量的SMS 消息。為了識(shí)別并告發(fā)電信服務(wù)的這種欺詐使用,希望能夠記錄用于實(shí)施 這種欺詐的消息。為了用于分析目的,可能有必要把這種消息保存得比 保留期還要長(zhǎng)(數(shù)月或可能幾年)?,F(xiàn)有技術(shù)的問(wèn)題在于每個(gè)保留期所 產(chǎn)生的消息數(shù)目遠(yuǎn)大于能夠在合理成本內(nèi)存儲(chǔ)的消息數(shù)目。發(fā)明內(nèi)容依照本發(fā)明,與現(xiàn)有技術(shù)相比,極大地緩和了以上問(wèn)題并且作出了改進(jìn),其中使用過(guò)濾系統(tǒng)來(lái)控制把不同的SMS消息記錄到存儲(chǔ)系統(tǒng)的 多個(gè)子文件中;每個(gè)子文件包含不同類型的消息,諸如黑名單消息、歧 義(ambiguous)消息、白名單消息、來(lái)自高度可ll:源的消息;對(duì)于每 個(gè)子文件,系統(tǒng)管理員能夠控制要存儲(chǔ)在所述子文件中的消息的百分比 以及這些消息要被存儲(chǔ)的持續(xù)時(shí)間。有益地是,利用此方案,管理員或 電信系統(tǒng)能夠控制所存儲(chǔ)消息的數(shù)量和類別。依照申請(qǐng)人發(fā)明的一個(gè)特征,如果對(duì)于特定的源而言,消息被分析 為要大量遞送,那么僅存儲(chǔ)單個(gè)拷貝連同這種消息數(shù)目的可選計(jì)數(shù)。依照申請(qǐng)人發(fā)明的另 一特征,能夠在不同類型的存儲(chǔ)器中存儲(chǔ)不同 的子目錄,以使得必須被頻繁檢查的那些類別(諸如來(lái)自高度可疑來(lái)源 的消息)處于能夠更好地訪問(wèn)的類型的存儲(chǔ)器中。依照申請(qǐng)人發(fā)明的另 一特征,能夠依照不同的訪問(wèn)特權(quán)來(lái)訪問(wèn)不同 的子目錄??赡軙?huì)要求特殊訪問(wèn)的子文件示例是對(duì)安全敏感的子文件, 對(duì)自我訓(xùn)練的子文件的反垃圾的分析。
圖l是圖示申請(qǐng)人發(fā)明的操作的框圖;圖2是圖示申請(qǐng)人發(fā)明的操作的流程圖;圖3是典型的反垃圾的存儲(chǔ)文件及其子文件的布局;和圖4是圖示使用管理系統(tǒng)來(lái)控制申請(qǐng)人發(fā)明的操作的流程圖。
具體實(shí)施方式
圖1是圖示申請(qǐng)人發(fā)明的操作的框圖。SMS消息到達(dá)反垃圾應(yīng)用 101,所述反垃圾應(yīng)用101是在適當(dāng)計(jì)算機(jī)上運(yùn)行的軟件進(jìn)程,其目的 在于濾出垃圾消息。反垃圾應(yīng)用的示例是可從朗訊技術(shù)有限公司獲得的 MiLife SMS反垃圾應(yīng)用(MiLife SMS Anti - Spam Application)和Nexus NETVIEW信令調(diào)查系統(tǒng)(Nexus NETVIEW Signaling Survey System )。 反垃圾應(yīng)用101的輸出包括非垃圾消息121、歧義消息123和垃圾消息 125,所述歧義消息123在第一級(jí)過(guò)濾中不能夠被識(shí)別為是垃圾消息也 不能夠被識(shí)別為是非垃圾消息,但是能夠被轉(zhuǎn)發(fā)到第二級(jí)(反垃圾應(yīng)用102),以供深入分析來(lái)確定它們是良好消息還是垃圾消息。對(duì)于消息 125而言,反垃圾應(yīng)用101具有強(qiáng)烈指示來(lái)表明它是垃圾消息并且該消 息不應(yīng)當(dāng)被遞送到目的地。例如,消息125包括來(lái)自目的地不希望從其 接受消息的來(lái)源的黑名單之一的消息。非垃圾消息121的示例是其來(lái)源 處于目的地白名單上的消息,所述白名單表示可被消息目的地接受的來(lái) 源。歧義消息是其來(lái)源既不在白名單上也不在黑名單上的消息,但是對(duì) 于它們而言存在表明所述消息并非無(wú)疑就是非垃圾消息的其它指示。例 如,當(dāng)諸如反垃圾應(yīng)用101之類的反垃圾過(guò)濾器引擎進(jìn)行內(nèi)容或關(guān)鍵字 分析并且結(jié)果表明垃圾嚴(yán)重性指標(biāo)為中級(jí)時(shí),所述消息將接著被轉(zhuǎn)發(fā)到 第二級(jí)以供進(jìn)行深入分析;如果第二級(jí)分析引擎仍然無(wú)法證明它是否為 垃圾,就把這種消息131作為將被遞送到目的地的良好消息來(lái)對(duì)待,或 者把這種消息發(fā)送給操作者而手動(dòng)檢查垃圾性,并且可選擇把它存儲(chǔ)到 存儲(chǔ)系統(tǒng)中。
消息121、 125、 127、 129和131被發(fā)送到存儲(chǔ)控制系統(tǒng)103以便 存儲(chǔ)在存儲(chǔ)系統(tǒng)300的子文件(302, ..., 368 )之一中。良好消息和垃 圾消息都被存儲(chǔ),但是通常向這些不同的消息分配不同的百分比和不同 的保留時(shí)間間隔。
管理系統(tǒng)105被用來(lái)向存儲(chǔ)控制系統(tǒng)提供控制信息。所述控制信息 可以是諸如應(yīng)當(dāng)存儲(chǔ)的去往特定子文件的消息的百分比、不同類別消息 (例如,來(lái)自去往通用子文件的確定來(lái)源的消息)的子文件目的地之類 的信息,以及用于控制每個(gè)子文件中消息存儲(chǔ)的持續(xù)時(shí)間的信息。實(shí)際 上,管埋系統(tǒng)控制由存儲(chǔ)控制系統(tǒng)用來(lái)判定應(yīng)當(dāng)存儲(chǔ)哪些消息以及用來(lái) 判定哪個(gè)子文件應(yīng)當(dāng)用于存儲(chǔ)每個(gè)這種消息的規(guī)則。
圖2是圖示申請(qǐng)人發(fā)明的操作的流程圖。反垃圾應(yīng)用(anti - spam application ASA ) 101和第二級(jí)ASA 102接收進(jìn)入的SMS消息(動(dòng)作框 201)。所述ASA和第二級(jí)ASA依照垃圾類型對(duì)這些消息進(jìn)行分類(動(dòng) 作框203 )。在圖3中示出了消息的主要類別。
所述ASA和第二級(jí)ASA把這些所分類的消息傳遞到存儲(chǔ)控制系統(tǒng) (SCS)(動(dòng)作框205 )。然后,存儲(chǔ)控制系統(tǒng)依照為所述存儲(chǔ)控制系 統(tǒng)所存儲(chǔ)的規(guī)則來(lái)根據(jù)存儲(chǔ)系統(tǒng)中的子文件進(jìn)一步對(duì)消息進(jìn)行分類(動(dòng) 作框207)。例如,存儲(chǔ)控制系統(tǒng)可以具有用于來(lái)自特別可疑來(lái)源的消 息的一個(gè)類別。這種進(jìn)一步分類的優(yōu)點(diǎn)在于當(dāng)例如只以25%為限保存普通的垃圾消息時(shí),可以100%地保存來(lái)自高度可疑來(lái)源的這些消息。而
且,它們被保存在獨(dú)立的子文件中以便允許來(lái)自管理系統(tǒng)的特定訪問(wèn)來(lái) 檢查這些消息??梢詾檫@些可疑來(lái)源中的每一個(gè)設(shè)置特殊子文件。依照
由管理系統(tǒng)所提供的規(guī)則來(lái)執(zhí)行由存儲(chǔ)控制系統(tǒng)所實(shí)施的進(jìn)一步分類。
存儲(chǔ)控制系統(tǒng)判定具體消息是否應(yīng)當(dāng)^皮存儲(chǔ)(動(dòng)作框209)。由于 存儲(chǔ)所有消息可能會(huì)是不切實(shí)際的,所以只存儲(chǔ)一小部分消息。這一小 部分是要在其中存儲(chǔ)消息的特定子文件的函數(shù)。通過(guò)對(duì)于分?jǐn)?shù)N/M存 儲(chǔ)每M個(gè)消息中N個(gè)或者通過(guò)某一隨機(jī)化選擇待存儲(chǔ)消息的過(guò)程來(lái)實(shí) 施部分分配。 一種隨機(jī)化過(guò)程的示例是檢查時(shí)鐘的后幾位數(shù)字并且依照 時(shí)鐘的讀數(shù)來(lái)執(zhí)行存儲(chǔ)或不存儲(chǔ)功能。
然后,存儲(chǔ)控制系統(tǒng)把包括子文件的身份標(biāo)識(shí)的待存儲(chǔ)消息傳遞到 存儲(chǔ)系統(tǒng)(動(dòng)作框211 )。然后存儲(chǔ)系統(tǒng)存儲(chǔ)所傳遞的消息(動(dòng)作框213 )。
依照本發(fā)明的一個(gè)優(yōu)選實(shí)施例,對(duì)于每個(gè)子文件或每組子文件定制 保留時(shí)間間隔(動(dòng)作框215)。
圖3是示出典型的完整反垃圾存儲(chǔ)文件300的樣本數(shù)據(jù)布局,包括 一組良好短消息服務(wù)(SMS)子文件302、 一組垃圾SMS子文件,該組 垃圾SMS子文件包括一組移動(dòng)發(fā)起的垃圾子文件306和一組移動(dòng)終止 的垃圾SMS子文件308。在良好短消息系統(tǒng)子文件中所包括的是網(wǎng)絡(luò)內(nèi) 的良好SMS子文件320、網(wǎng)絡(luò)間的良好SMS子文件322和用于自我訓(xùn) 練目的以便幫助識(shí)別未來(lái)的良好SMS子文件的子文件324。
移動(dòng)發(fā)起的垃圾子文件包括網(wǎng)絡(luò)內(nèi)的垃圾子文件330、網(wǎng)絡(luò)間的垃 圾SMS子文件332、漫游移動(dòng)發(fā)起的垃圾子文件334、金融欺詐SMS 子文件336和色情SMS子文件338。這些子文件用來(lái)幫助識(shí)別垃圾SMS 子文件的發(fā)起者。
移動(dòng)終止的垃圾SMS子文件包括來(lái)自所識(shí)別的源網(wǎng)絡(luò)子文件350 的垃圾息、泛濫或大量分送的垃圾子文件352、欺騙的垃圾子文件354、 具有偽造源地址的垃圾子文件356、色情垃圾子文件358、金融欺詐垃 圾子文件360、用于槍支銷售的垃圾子文件362、網(wǎng)絡(luò)內(nèi)的垃圾子文件 364、潛在犯罪的垃圾子文件366和非法作廣告的垃圾子文件368。對(duì)于 每個(gè)子文件而言,維護(hù)消息數(shù)目的計(jì)數(shù)和每個(gè)條目的日期和時(shí)間。對(duì)于 每個(gè)子文件而言,已經(jīng)初始化不確定的空間分配并且維護(hù)每個(gè)子文件的 百分?jǐn)?shù)填充。對(duì)于每個(gè)子文件而言,維護(hù)要存儲(chǔ)在子文件中的適當(dāng)種類消息的百分比;對(duì)于多個(gè)子文件而言,特別是對(duì)于用于欺詐的垃圾消息 的子文件而言,要存儲(chǔ)的消息的百分比常常是100%。對(duì)于每個(gè)子文件 而言,維護(hù)保留期以使得清除較舊的消息以便為新消息騰出空間。
如從該示例所看到的, 一 些子文件只適用于移動(dòng)終止的或移動(dòng)發(fā)起 的通信業(yè)務(wù)。在可選布局中,可以為兩個(gè)方向的通信業(yè)務(wù)使用相同的子 文件??梢远ㄖ谱游募到y(tǒng)以滿足每個(gè)遠(yuǎn)程通信載體或應(yīng)用的需要。
不同的子文件可以具有不同的和/或多個(gè)閾值,以用于向管理系統(tǒng)通 知子文件充分接近滿以便要求刪除消息或增加子文件大小的某個(gè)動(dòng)作。
圖4是圖示用于控制消息存儲(chǔ)的管理系統(tǒng)的操作的流程圖。管理系 統(tǒng)(administrative system AS )訪問(wèn)存卡者系統(tǒng)中的數(shù)據(jù)(動(dòng)作框401 )。 管理系統(tǒng)可以訪問(wèn)此數(shù)據(jù)以便查明每個(gè)或任何子文件的填充和/或獲得 子文件中所存儲(chǔ)消息的具體數(shù)據(jù)。
根據(jù)所訪問(wèn)的數(shù)據(jù),管理系統(tǒng)修改存儲(chǔ)控制系統(tǒng)的規(guī)則(動(dòng)作框 403 )。例如,如果管理系統(tǒng)發(fā)現(xiàn)非垃圾子文件的填充相對(duì)較高,那么 所述管理系統(tǒng)可以修改用于存儲(chǔ)去往該子文件的消息的規(guī)則以便減少 要被存儲(chǔ)的部分。例如,在假日季節(jié)期間,可能發(fā)送很多非垃圾的問(wèn)候 消息。保留的那一小部分會(huì)被降低以便適應(yīng)通信業(yè)務(wù)的這種短時(shí)間爆發(fā) (flurry)。
然后管理系統(tǒng)向存儲(chǔ)控制系統(tǒng)發(fā)送所修改的規(guī)則(動(dòng)作框405), 所述存儲(chǔ)控制系統(tǒng)依照所修改的規(guī)則來(lái)執(zhí)行其功能。
可以向管理系統(tǒng)的工作人員給予對(duì)存儲(chǔ)系統(tǒng)的內(nèi)容進(jìn)行限制性訪 問(wèn)的權(quán)力。例如,可以要求特殊口令來(lái)訪問(wèn)金融欺詐子文件,以便防止
內(nèi)部人員對(duì)竊賊進(jìn)行警告。
以上描述是申請(qǐng)人發(fā)明的一個(gè)優(yōu)選實(shí)施例。其它實(shí)施例對(duì)本領(lǐng)域普 通技術(shù)人員而言是顯而易見(jiàn)的。本發(fā)明僅由所附權(quán)利要求來(lái)限定。
權(quán)利要求
1.一種用于短消息服務(wù)(SMS)消息的反垃圾過(guò)濾和存儲(chǔ)的系統(tǒng),包括用于確定哪些SMS消息是不想要的類型的消息(垃圾),哪些消息被認(rèn)為是非垃圾消息且能夠被遞送給目的地,以及哪些消息是歧義的-既不能被分類為是垃圾消息也不能被分類為是非垃圾消息的裝置;包括多個(gè)子文件的存儲(chǔ)系統(tǒng);和用于分配的裝置,用于依照為所述用于分配的裝置所存儲(chǔ)的規(guī)則來(lái)向所述SMS消息分配存儲(chǔ)系統(tǒng)的子文件。
2. 如權(quán)利要求1所述的設(shè)備,進(jìn)一步包括用于產(chǎn)生管理控制消息并 向所述用于分配消息的裝置發(fā)送所述管理控制消息來(lái)建立用于控制要 把哪些類型的消息存儲(chǔ)在哪些子文件中的規(guī)則的裝置。
3. 如權(quán)利要求2所述的設(shè)備,其中所述用于分配的裝置包括用于依 照所述規(guī)則來(lái)控制對(duì)被分配給特定子文件的 一 小部分消息的存儲(chǔ)的裝 置。
4. 如權(quán)利要求2所述的設(shè)備,其中所述用于分配的裝置進(jìn)一步包括 用于依照所述規(guī)則將每個(gè)子文件與所述子文件中的消息要被保留的時(shí) 間長(zhǎng)度相關(guān)聯(lián)的裝置。
5. 如權(quán)利要求2所述的設(shè)備,進(jìn)一步包括用于確定哪些電子郵件消 息是不想要類型的消息(垃圾),哪些消息被認(rèn)為是非垃圾消息并且能 夠被遞送給目的地,以及哪些消息是歧義的-既不能夠被分類為是垃圾 消息也不能夠被分類為是非垃圾消息的裝置;所述存儲(chǔ)系統(tǒng)包括用于存儲(chǔ)電子郵件消息的多個(gè)附加子文件;和 用于向所述電子郵件消息分配所述多個(gè)附加子文件中的子文件的 裝置。
6. —種用于短消息服務(wù)(SMS)消息的反垃圾過(guò)濾和存儲(chǔ)的方法, 包括步驟確定哪些SMS消息是不想要的類型的消息(垃圾),哪些消息被 認(rèn)為是非垃圾消息并且能夠被遞送給目的地,以及哪些消息是歧義的-既不能夠被分類為是垃圾消息也不能夠被分類為是非垃圾消息;并且依照為所述存儲(chǔ)系統(tǒng)所存儲(chǔ)的規(guī)則來(lái)向所述SMS消息分配存儲(chǔ)系 統(tǒng)的子文件。
7. 如權(quán)利要求6所述的方法,進(jìn)一步包括步驟產(chǎn)生管理控制消息并向所述存儲(chǔ)系統(tǒng)發(fā)送所述管理控制消息,以便 建立用來(lái)控制要把哪些類型的消息存儲(chǔ)在哪些子文件中的規(guī)則。
8. 如權(quán)利要求7所述的方法,其中用于分配的步驟包括用于依照所 述規(guī)則來(lái)控制對(duì)被分配給特定子文件的 一 小部分消息的存儲(chǔ)的步驟。
9. 如權(quán)利要求7所述的方法,其中所述用于分配的步驟進(jìn)一步包括 用于依照所述規(guī)則將每個(gè)子文件與在所述子文件中的消息要被保留的 時(shí)間長(zhǎng)度相關(guān)聯(lián)的步驟。
10. 如權(quán)利要求7所述的方法,進(jìn)一步包括步驟 確定哪些電子郵件消息是不想要的類型的消息(垃圾),哪些消息被認(rèn)為是非垃圾消息并且能夠被遞送給目的地,以及哪些消息是歧義的 -既不能夠被分類為是垃圾消息也不能夠被分類為是非垃圾消息;并且 依照為所述存儲(chǔ)系統(tǒng)所存儲(chǔ)的規(guī)則向所述電子郵件消息分配所述 存儲(chǔ)系統(tǒng)的 一 組附加子文件中的子文件。
全文摘要
本發(fā)明涉及用于存儲(chǔ)短消息服務(wù)(SMS)和電子郵件消息以便檢測(cè)垃圾消息特別是用于欺詐或色情目的的垃圾消息來(lái)源的方法和設(shè)備。由于可能要求以較長(zhǎng)時(shí)間間隔存儲(chǔ)關(guān)鍵消息,并且由于垃圾消息通信業(yè)務(wù)量很大,所以按照用于反欺詐目的所要求的最大間隔來(lái)存儲(chǔ)所有可疑的垃圾消息是不切實(shí)際的。據(jù)此,在反垃圾消息部門的控制下,把不同類型的實(shí)際垃圾、可疑垃圾和非垃圾存儲(chǔ)在不同的子文件中;每個(gè)子文件可以具有要存儲(chǔ)的可疑垃圾消息的不同保留期和百分比;還可以在反垃圾部門的控制下修改任何子文件的存儲(chǔ)量和保留期。有益地是,可以依照最優(yōu)的方式來(lái)使用有限量的反垃圾存儲(chǔ)來(lái)保持反垃圾部門所認(rèn)為的最優(yōu)消息混合。
文檔編號(hào)H04L12/58GK101317409SQ200680044573
公開(kāi)日2008年12月3日 申請(qǐng)日期2006年11月28日 優(yōu)先權(quán)日2005年11月28日
發(fā)明者D·L·麥格里爾, Y·蔡 申請(qǐng)人:盧森特技術(shù)有限公司