專利名稱:使用關(guān)系和名譽數(shù)據(jù)的電子郵件過濾的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子郵件過濾,尤其涉及使用關(guān)系和名譽數(shù)據(jù)的電子郵件過濾。
背景技術(shù):
電子郵件垃圾指由“垃圾郵件發(fā)送者”發(fā)送給大量接收者的未經(jīng)請求的電子郵件消息,很少的接收者想要接收它們。發(fā)送垃圾郵件在許多方面是不合需要的,包括,它花費了接收者時間來刪除這些消息,以及需要電子郵件服務提供者提供資源來分發(fā)和/或存儲這些通常不想要的消息。此外,有時垃圾郵件是惡意的,包含了如果激活可破壞計算機系統(tǒng)和/或盜取敏感信息的文件。針對電子郵件消息運行了許多不同類型的過濾算法,以確定消息是否是垃圾郵件,從而阻塞垃圾郵件消息或?qū)⑺鼈円频嚼募A。然而,因為需要大量CPU時間來掃描這些消息,用這些算法進行處理是昂貴的。此外,運行越多算法,將不是垃圾郵件的電子郵件消息錯誤標記為垃圾郵件的可能性越大。需要減少處理電子郵件消息尋找垃圾郵件所導致的開銷,和/或減少錯誤標記消息的數(shù)量的任何一種技術(shù)。
發(fā)明內(nèi)容
提供本發(fā)明內(nèi)容以便以簡化形式介紹將在以下的具體實施方式
中進一步描述的一些代表性概念。本發(fā)明內(nèi)容不旨在標識出所要求保護的主題的關(guān)鍵特征或必要特征,也不旨在以限制所要求保護的主題的范圍的任何方式來使用。簡言之,此處描述的主題的各個不同方面意指這樣的技術(shù),通過該技術(shù),用對應于已選過濾級別的已選過濾器(例如,算法)來掃描電子郵件,過濾級別的選擇基于發(fā)送者和接收者之間的任何先前電子郵件關(guān)系,以及相關(guān)聯(lián)的名譽數(shù)據(jù)(例如,先前電子郵件通信是否被檢測為垃圾郵件)。在一個實現(xiàn)中,當從發(fā)送者指向接收者的電子郵件消息在過濾機制處被接收時,確認發(fā)送者的IP地址和域,以確認該IP地址是否通常從消息中所標識的域發(fā)送。若否,為掃描消息選擇積極的過濾級別,例如,全部可用過濾器。如果發(fā)送者的IP地址和域被確認,過濾機制,例如,通過訪問包含關(guān)系和名譽信息的數(shù)據(jù)存儲,來確定發(fā)送者和接收者是否具有先前的好的(非垃圾郵件)電子郵件關(guān)系。 若是,可為掃描消息選擇較不積極的過濾級別,諸如僅使用檢測惡意軟件的過濾器來掃描。在一方面,如果發(fā)送者和接收者之間的直接關(guān)系不存在(例如為零或少于通信的閾值數(shù)量),過濾機制可尋找非直接關(guān)系。在一實現(xiàn)中,這對應于發(fā)送者和接收者各自具有與共同第三方的電子郵件關(guān)系。如果這樣的非直接關(guān)系存在,可基于該非直接關(guān)系及任何相關(guān)聯(lián)的名譽數(shù)據(jù)選擇過濾級別。在一方面,將來自群發(fā)者的電子郵件消息從其它電子郵件消息中區(qū)分出來。這樣的群發(fā)者消息可被分類(例如,分為零散消息、新聞簡報等等),并且可基于它們的群發(fā)者狀態(tài)和/或分類來阻塞或過濾。結(jié)合附圖閱讀以下具體實施方式
,本發(fā)明的其他優(yōu)點會變得顯而易見。
作為示例而非限制,在附圖中示出了本發(fā)明,附圖中相同的附圖標記指示相同或相似的元素,附圖中圖1是代表示例過濾系統(tǒng)的框圖,該過濾系統(tǒng)包括掃描傳入的電子郵件消息以尋找垃圾郵件的過濾機制,包括通過訪問指示發(fā)送者和接收者之間的先前電子郵件通信的關(guān)系數(shù)據(jù)來確定過濾級別。圖2是代表用于基于電子郵件消息中的信息以及與該消息的發(fā)送者和接收者相關(guān)聯(lián)的任何關(guān)系和名譽數(shù)據(jù)來確定過濾級別的示例步驟的流程圖。圖3是代表用于處理從群發(fā)者接收的電子郵件消息的示例步驟的流程圖。圖4是代表示例性非限制聯(lián)網(wǎng)環(huán)境的框圖,其中可實現(xiàn)此處描述的各種實施例。圖5是代表示例性非限制計算系統(tǒng)或運行環(huán)境的框圖,其中可實現(xiàn)此處所描述各種實施例的一個或多個方面。
具體實施例方式在此描述的技術(shù)的各個方面一般涉及增強對哪些電子郵件是垃圾郵件而哪些不是的分類,該分類是通過(在可能的時候)使用用戶的社會關(guān)系來確定垃圾郵件過濾的積極程度,以及因此在掃描電子郵件消息中要用多少CPU時間。除了總體花費更少CPU時間, 該技術(shù)還通過不向憑借關(guān)系數(shù)據(jù)被認為可能是好(即非垃圾郵件)的電子郵件應用更為積極的過濾,減少了被錯誤標記為垃圾郵件的電子郵件的數(shù)量。在一個方面,該技術(shù)利用用戶相互回復和轉(zhuǎn)發(fā)電子郵件的歷史,并使用該信息確定電子郵件消息被如何積極地掃描以尋找垃圾郵件。該技術(shù)還可在用戶之間的新連接作出時,利用兩個用戶之間的關(guān)系來推斷那些用戶之一與第三用戶之間的新關(guān)系。在一個方面, 該技術(shù)也允許(非垃圾郵件)群發(fā)者的分類,使得終端用戶可決定他們接收什么類型的群發(fā)電子郵件。應當理解的是,此處的任何示例均是非限制的。因此,本發(fā)明不限制于在此描述的任何具體的實施例、方面、概念、結(jié)構(gòu)、功能或示例。相反,在此描述的任何實施例、方面、概念、結(jié)構(gòu)、功能或示例是非限制的,并且本發(fā)明能以一般在垃圾郵件檢測和電子郵件消息處理上提供益處和優(yōu)點的各個方式使用。圖1示出了電子郵件過濾系統(tǒng)的示例組件,包括配置用于相對于垃圾郵件檢測來掃描傳入消息104的過濾機制102。該過濾系統(tǒng)可部署在要求電子郵件過濾的任何地方,諸如在托管電子郵件過濾服務上,作為基于Microsoft Exchange的郵件系統(tǒng)的部分等等。管理員之類的可按需配置該系統(tǒng),例如,設(shè)置確定消息如何被掃描或以其它方式處理的閾值、 規(guī)則等等。為過濾消息,使用多個過濾算法(指過濾器Ioe1-Ioen)來處理每一傳入消息104。 一般而言,過濾器IOe1-IO^1按照積極程度從非常積極/昂貴過濾器到較不積極、不昂貴過濾器來排列。例如,一個過濾器可快速掃描尋找壞URL,這是非??觳话嘿F的過濾器,反之, 掃描消息正文以尋找特定詞的積極的過濾器是相對慢、昂貴的過濾器??梢岳斫?,不像應用全部過濾器(或者對用戶指定為“安全發(fā)送者”的發(fā)送者一個過濾器都不應用)的現(xiàn)有過濾系統(tǒng),基于關(guān)于發(fā)送者和目標接收者已知的信息,應用的過濾器的數(shù)量和類型如此處描述的是可變。在一個方面,過濾機制102 (部分)通過以自動化方式持續(xù)跟蹤終端用戶與誰交換電子郵件來選擇過濾器的積極程度,如圖1通過關(guān)系/名譽數(shù)據(jù)存儲108所示。例如,在有好的關(guān)系和名譽的情況下,過濾機制102通??蓛H選擇那些尋找惡意/危險消息的過濾器, 這比用全部過濾器運行完全過濾掃描快得多。用于確定要如何積極地過濾消息104的另一類信息對應于發(fā)送者的域和IP地址是否能被確認,即,這個IP地址是否通常發(fā)送自消息中所標識的域。至此,如圖1中由域/IP數(shù)據(jù)存儲Iio所表示的,系統(tǒng)102跟蹤電子郵件域與用于為這些域發(fā)送電子郵件的IP地址的關(guān)聯(lián)。之后,即使沒有SPFGender Policy Framework發(fā)送者策略構(gòu)架)或 DKIM(DomainKeys Identified Mail域密鑰標識郵件)記錄(其提供了確認IP是否可從特定域發(fā)送的機制,但并不總是存在)可用,屬于特定域的且未檢測為垃圾郵件的電子郵件的一致的模式,是對于這些電子郵件所來自的IP地址可能是這些域的合法郵件中繼的好的指示。在數(shù)據(jù)存儲110中跟蹤并保存域/IP地址關(guān)聯(lián),為不具有可用SPF和/DKIM信息的域推論類似信息,并進一步可被用作對于SPF和DKIM技術(shù)的補充。如下所描述的,如果(使用SPF、DKIM和/或在數(shù)據(jù)存儲110中跟蹤的累積IP/域數(shù)據(jù))沒有為來自IP的發(fā)送確認發(fā)送域,該過濾機制1 02將積極地過濾消息104。相反, 如果被確認,過濾機制102檢測關(guān)系/名譽數(shù)據(jù)存儲108以確定發(fā)送者地址和接收者地址是否具有已記錄的關(guān)系以及名譽信息,用于確定表示消息104可能是垃圾郵件的程度的分數(shù)等等(例如,分類)。通常,基于在用戶之間通信的消息以及關(guān)于那些消息的垃圾郵件掃描結(jié)果,來隨著時間構(gòu)建關(guān)系/名譽數(shù)據(jù)存儲108。從其它源(到這樣的信息可用并可被信任的范圍)獲取一些關(guān)系數(shù)據(jù)也是可行的。例如,用戶可指定關(guān)系存在。如果有關(guān)系,且累積名譽信息指示電子郵件是垃圾郵件消息的低可能性,則僅應用不昂貴的、輕量的(較不積極)過濾器。在經(jīng)計算的分數(shù)對應于未知或壞名譽信息的情況下,則選擇并應用一組更積極的過濾器。以某種方式將被檢測為垃圾郵件的那些消息過濾掉,例如,阻塞或發(fā)送到垃圾文件夾,而那些通過垃圾郵件過濾檢測的作為被允許消息112 來傳遞。作為示例,如果發(fā)送者A已經(jīng)發(fā)送了某一閾值數(shù)量的消息到接收者B,諸如五個或更多個消息,并且無一曾包含垃圾郵件,那么下一個消息是垃圾郵件的可能性為低。可以容易理解,可能性分數(shù)等,可基于從那個發(fā)送者發(fā)送到接收者的消息和/或從那個接收者發(fā)送到發(fā)送者的消息的數(shù)量來計算;例如,消息越多分數(shù)越好(垃圾郵件可能性越低),任何被檢測到的垃圾郵件損害分數(shù)(增加垃圾郵件可能性)。注意,關(guān)系和累積名譽信息,可能隨著更老的數(shù)據(jù)過期,可基于時間被老化或加權(quán),使得最終陳舊的關(guān)系可能被認為是不再存在的,老的(例如不正確地檢測的/假肯定)“垃圾郵件”消息將不總是保留因子,等等。正如已知的,典型電子郵件交互傾向于圍繞社會或商業(yè)關(guān)系而群聚,例如,一個典型用戶接收的大百分比的電子郵件消息包含相同發(fā)送者。對于這樣的發(fā)送者和對應的重復的郵件交互,很少有或沒有垃圾郵件風險,可減少反垃圾郵件掃描的花費和積極性,而不降低反垃圾郵件檢測的總體效力。轉(zhuǎn)到另一方面,除了在發(fā)送者和接收者之間的直接關(guān)系之外,也可利用非直接關(guān)系來減少垃圾郵件過濾的積極性。例如,在過濾機制102遇到未知關(guān)系時,該機制可掃描數(shù)據(jù)存儲108來查看發(fā)送者是否具有已經(jīng)建立的與系統(tǒng)中的其它用戶的關(guān)系,并使用那個信息來推斷良好關(guān)系。例如,如果A和B具有良好關(guān)系,B和C具有良好關(guān)系,但是A和C之間不存在合格關(guān)系(包含有一些先前通信但不足以滿足閾值之時)過濾機制102能夠推斷非直接關(guān)系,并因此一定程度地較不積極地過濾郵件(可能不同于若有直接關(guān)系的程度)。 例如,不同于指示沒有合格關(guān)系存在的初始分數(shù)(例如,零),如果存在非直接關(guān)系,初始分數(shù)可以被設(shè)置為某一(例如,非零)起始值。注意,盡管具有多于一個的用于確定非直接關(guān)系的中間人是可行的,上述示例僅通過單中間人來描述關(guān)系。例如,(A,B)、(B, C)、(C,D)可代表直接關(guān)系,由此不僅可推斷單中間人的非直接關(guān)系(A-C),也可推斷雙中間人的非直接關(guān)系(A-D)等等。有可能之前好的發(fā)送者將開始發(fā)送壞電子郵件,諸如該發(fā)送者的計算機被惡意軟件感染。為檢測這樣的情形,可以更積極地過濾小百分比(采樣)的電子郵件,不考慮名譽 /關(guān)系狀態(tài)。至此,可(例如,由管理員)設(shè)置不同規(guī)則和參數(shù)114來優(yōu)先于名譽/關(guān)系處理。在之前的好用戶開始發(fā)送任何數(shù)量的垃圾郵件的情況中,任何現(xiàn)在關(guān)系將很快失效。另一種導致關(guān)系失效的情況是當終端用戶或管理員報告回系統(tǒng)他們接收到的電子郵件消息是垃圾郵件/不想要的。應當注意,一些電子郵件客戶機/系統(tǒng)提供“安全發(fā)送者”機制,用于把電子郵件發(fā)送者標記為“安全發(fā)送者”。通常根本不掃描來自安全發(fā)送者的電子郵件尋找垃圾郵件。 相反,此處描述的技術(shù)更高效靈活,因為不同于將電子郵件完全排除在反垃圾郵件掃描之外,可能執(zhí)行某些掃描(例如,至少針對惡意軟件),反垃圾郵件掃描的深度依賴于電子郵件消息是垃圾郵件的可能性。進一步注意到,此處描述的技術(shù)可使用從眾多用戶得到的廣泛社交聯(lián)網(wǎng)樣式的信息,相反傳統(tǒng)安全發(fā)送者系統(tǒng)被限制在單用戶電子郵件交互歷史和聯(lián)系。轉(zhuǎn)到另一方面,所提議的系統(tǒng)也可標識電子郵件地址/IP何時被用于發(fā)送合法群發(fā)電子郵件,諸如合法的且許多用戶需要的新聞簡報或銷售推薦。這可以通過分析發(fā)送者發(fā)出的電子郵件的量和類型來完成;例如,auto-confirmibigretalier. com發(fā)送者可能跨廣泛群體的用戶發(fā)送非常大量的電子郵件,它可被快速標識為合法“群發(fā)者”而非垃圾郵件發(fā)送者,在合適的數(shù)據(jù)存儲116中保持那個群發(fā)者的數(shù)據(jù)。一旦標識了群發(fā)者,他們發(fā)送的郵件類型的子類型可被分析者或終端用戶手動設(shè)置以將該郵件標記為,例如,"Mailing list (郵件發(fā)送列表)”或“Flyer (廣告?zhèn)鲉?”或者所需的任何合適的類型。以此方式,例如,零售商不同于新聞簡報發(fā)送者而被分類。一旦群發(fā)郵件者被分類,終端用戶可指定他們希望接收什么類型的群發(fā)電子郵件以及他們不希望接收什么類型的群發(fā)電子郵件。例如,家庭用戶可能希望接收“Music hdustry (音樂行業(yè))”電子郵件,而商務用戶不希望。這樣的信息可在規(guī)則/參數(shù)114中保持,并被訪問以確定如何處理群消息,包括基于每電子郵件系統(tǒng)(per email system)(例如,管理員阻塞了來自X公司,或Y類的全部消息)或基于每用戶(per-user basis)。圖2是概括了包含圖1的過濾機制102的過濾系統(tǒng)可能在掃描垃圾郵件消息中執(zhí)行的各步驟的某些的流程圖。在步驟202,過濾機制處理消息以提取發(fā)送者IP/電子郵件地址和接收者電子郵件。步驟204確定消息是否來自群發(fā)者,并且如果是,消息可用以下圖3描述的示例步驟來處理。步驟206代表確認帶有該IP地址的域。如上所述,這可基于在域/IP數(shù)據(jù)存儲110 中累積的信息,和/或通過SPF/DKIM累積的信息。如果沒有被確認,接著過濾級別在步驟 218被設(shè)置到最積極的級別,其中這個級別的相應過濾器(例如,全部可用的過濾器)將在步驟220被應用。如果域和IP地址被確認,步驟208和210檢查是否存在任何合格的直接關(guān)系。如果是,過濾級別基于直接關(guān)系和名譽分數(shù)在步驟216設(shè)置。這個過濾級別的對應過濾器(例如,如果好名譽,僅僅那些掃描惡意軟件的過濾器)將在步驟220被應用。注意,如果名譽是壞的,相應地提高過濾級別,并且可能,例如,對應于最積極級別。如果在步驟210評估沒有直接關(guān)系存在,步驟212尋找是否存在通過第三方的共有關(guān)系(在這個示例實現(xiàn)中僅僅檢查一個中間人)。如果在步驟214評估為是,過濾級別可基于非直接關(guān)系(以及可能基于第三方名譽的名譽分數(shù))在步驟216設(shè)置,并在步驟220 應用。如上所述,步驟220應用對應于通過前述步驟確定的過濾級別的過濾器。步驟220 也代表基于IP地址和域、往/來數(shù)據(jù),和/或掃描結(jié)果,來更新數(shù)據(jù)存儲。圖3代表當消息被確定是來自群發(fā)者時可采取的示例步驟。步驟302查找群發(fā)者的分類,例如,上述零售商。步驟304代表評估這個群發(fā)者和/或?qū)诸愂欠?,例如,被目標接收者?或管理員設(shè)置為要被阻塞。若是,消息被阻塞(或以其他方式處理,例如放到垃圾文件夾中),如步驟306所代表。若沒有被阻塞,步驟308檢查域和IP地址是否被確認。若否,有可能發(fā)送者并不是真正群發(fā)者而是垃圾郵件發(fā)送者,從而在步驟310將過濾設(shè)置到最積極級別,并在步驟314 應用。否則,過濾在步驟312被設(shè)為群發(fā)者級別(根據(jù)分類可能不同),通常被設(shè)為某較不積極級別,因為已知好的群發(fā)者不發(fā)送垃圾郵件(除非被侵入)。步驟314也代表更新適合群發(fā)消息的數(shù)據(jù)庫,例如群發(fā)者可能從新IP地址發(fā)送,在此情況中,域和新IP地址將在步驟308最終確認??梢?,通過分析消息交換歷史以確定電子郵件域與準許為這些域發(fā)送電子郵件的 IP地址的關(guān)聯(lián),并結(jié)合往來電子郵件地址的關(guān)系/名譽數(shù)據(jù)一起使用,過濾系統(tǒng)可確定如何積極地掃描一電子郵件消息尋找垃圾郵件。還可分析用戶的社交網(wǎng)絡來確定是否在兩個用戶之間存在非直接關(guān)系,那個信息用于設(shè)置初始關(guān)系值,例如,通過它,可選擇某些較不積極的過濾。此外,該系統(tǒng)可實現(xiàn)自動標識好的群郵件發(fā)送者,使得群發(fā)者可由管理員和/ 或終端用戶手動分類,相應處理和/或掃描其消息。示例性聯(lián)網(wǎng)以及分布式環(huán)境本領(lǐng)域技術(shù)人員可以理解,此處描述的各實施例和方法可結(jié)合任何計算機或其它客戶機或服務器設(shè)備來實現(xiàn),其可被部署為計算機網(wǎng)絡的部分或在分布式計算環(huán)境中,并且可以被連接到任何類型一個或多個數(shù)據(jù)存儲。在這一點上,此處描述的各實施例可在具有任何數(shù)量的存儲器或存儲單元的、并且任何數(shù)量的應用和進程跨任何數(shù)量的存儲單元發(fā)生的任何計算機系統(tǒng)或環(huán)境中實現(xiàn)。這包括但不限于具有部署在具有遠程或本地存儲的網(wǎng)絡環(huán)境或分布式計算環(huán)境中的服務器計算機和客戶計算機的環(huán)境。分布式計算通過計算設(shè)備和系統(tǒng)之間的通信交換來提供計算機資源和服務的共
8享。這些資源和服務包括信息的交換、對于諸如文件之類的對象的高速緩存存儲和盤存儲。 這些資源和服務還包括多個處理單元之間的處理能力共享以便進行負載平衡、資源擴展、 處理專門化等等。分布式計算利用網(wǎng)絡連接,從而允許客戶機利用其集體力量來使整個企業(yè)受益。就此,各種設(shè)備可具有可如參考本發(fā)明的各實施例描述地參與資源管理機制的應用、對象或資源。圖4提供了示例性的聯(lián)網(wǎng)或分布式計算環(huán)境的示意圖。該分布式計算環(huán)境包括計算對象410、412等以及計算對象或設(shè)備420、422、似4、似6、似8等,這些計算對象或設(shè)備可包括如由示例應用程序430、432、434、436、438表示的程序、方法、數(shù)據(jù)存儲、可編程邏輯等。可以理解,計算對象410、412等以及計算對象或設(shè)備420、422、424、426、似8等可包括不同的設(shè)備,諸如個人數(shù)字助理(PDA)、音頻/視頻設(shè)備、移動電話、MP3播放器、個人計算機、 膝上型計算機等。每個計算對象410、412等以及計算對象或設(shè)備420、422、似4、似6、似8等可經(jīng)由通信網(wǎng)絡440直接或間接地與一個或多個其他計算對象410、412等以及計算對象或設(shè)備420、422、似4、似6、似8等通信。盡管在圖4中被示為單個元件,但通信網(wǎng)絡440可包括向圖4的系統(tǒng)提供服務的其他計算對象和計算設(shè)備和/或可表示未示出的多個互連網(wǎng)絡。 每個計算對象410、412等或計算對象或設(shè)備420、422、似4、似6、似8等還可以包含應用,諸如可以利用API或其他對象、軟件、固件和/或硬件的、適于根據(jù)本發(fā)明的各實施例所提供的應用實現(xiàn)與其進行通信的應用430、432、434、436、438。存在支持分布式計算環(huán)境的各種系統(tǒng)、組件和網(wǎng)絡配置。例如,計算系統(tǒng)可由有線或無線系統(tǒng)、本地網(wǎng)絡或廣泛分布的網(wǎng)絡連接在一起。當前,許多網(wǎng)絡被耦合至因特網(wǎng),后者為廣泛分布的計算提供了基礎(chǔ)結(jié)構(gòu)并包含許多不同的網(wǎng)絡,但任何網(wǎng)絡基礎(chǔ)結(jié)構(gòu)都可用于便于與如各實施例中所描述的系統(tǒng)的示例性通信。由此,可使用諸如客戶機/服務器、對等、或混合體系結(jié)構(gòu)之類的網(wǎng)絡拓撲結(jié)構(gòu)和網(wǎng)絡基礎(chǔ)結(jié)構(gòu)的主機?!翱蛻魴C”是使用與其無關(guān)的另一類或組的服務的一類或組中的成員??蛻魴C可以是進程,例如,大致上是請求另一程序或進程所提供的服務的一組指令或任務??蛻魴C進程使用所請求的服務,而無需“知道”關(guān)于其他程序或服務本身的任何工作細節(jié)。在客戶機/服務器體系結(jié)構(gòu)中,尤其在聯(lián)網(wǎng)系統(tǒng)中,客戶機通常是訪問另一計算機(例如,服務器)所提供的共享網(wǎng)絡資源的計算機。在圖4的圖示中,作為非限制性示例,計算對象或設(shè)備420、422、4M、似6、4觀等可被認為是客戶機而計算對象410、412等可被認為是服務器,其中計算對象410、412等作為提供數(shù)據(jù)服務的服務器,諸如從客戶機計算對象或設(shè)備420、422、似4、似6、似8等接收數(shù)據(jù)、存儲數(shù)據(jù)、處理數(shù)據(jù)、向客戶機計算對象或設(shè)備420、422、似4、似6、4觀等發(fā)送數(shù)據(jù),但任何計算機都可取決于環(huán)境而被認為是客戶機、服務器、或兩者。服務器通常是可通過諸如因特網(wǎng)或無線網(wǎng)絡基礎(chǔ)架構(gòu)之類的遠程網(wǎng)絡或本地網(wǎng)絡訪問的遠程計算機系統(tǒng)。客戶機進程可在第一計算機系統(tǒng)中活動,而服務器進程可在第二計算機系統(tǒng)中活動,它們通過通信介質(zhì)相互通信,由此提供分布式功能并允許多個客戶機利用服務器的信息收集能力。在通信網(wǎng)絡440或總線是因特網(wǎng)的網(wǎng)絡環(huán)境中,例如,計算對象410、412等可以是其他計算對象或設(shè)備420、422、似4、似6、4觀等經(jīng)由諸如超文本傳輸協(xié)議(HTTP)之類的多種已知協(xié)議中的任一種與其通信的Web服務器。計算對象410、412等作為服務器還可用作例如計算對象或設(shè)備420、422、424、426、4觀等的客戶機,這可以是如分布式計算環(huán)境的特性。示例性計算設(shè)備如上所述,有利地,本文所描述的技術(shù)可應用于任何設(shè)備。因此,應當理解,構(gòu)想了結(jié)合各實施例使用的所有種類的手持式、便攜式和其它計算設(shè)備和計算對象。因此,以下在圖5中所述的通用遠程計算機只是計算設(shè)備的一個示例。各實施例可部分地經(jīng)由操作系統(tǒng)來實現(xiàn),以供設(shè)備或?qū)ο蟮姆臻_發(fā)者使用和/ 或被包括在用于執(zhí)行此處所述的各實施例的一個或多個功能方面的應用軟件內(nèi)。軟件可以在由諸如客戶機工作站、服務器或其它設(shè)備等一個或多個計算機執(zhí)行的諸如程序模塊等計算機可執(zhí)行指令的通用上下文中描述。本領(lǐng)域的技術(shù)人員可以理解,計算機系統(tǒng)具有可用于傳遞數(shù)據(jù)的各種配置和協(xié)議,并且由此沒有特定配置或協(xié)議應當被認為是限制性的。圖5由此示出了其中可實現(xiàn)本文所述的各實施例的一個或多個方面的合適的計算系統(tǒng)環(huán)境500的一個示例,盡管如上所述,計算系統(tǒng)環(huán)境500僅為合適的計算環(huán)境的一個示例,并非對使用范圍或功能提出任何限制。此外,也不應當將計算系統(tǒng)環(huán)境500解釋為對在示例性計算系統(tǒng)環(huán)境500中所示的組件中的任何一個或其組合有任何依賴。參考圖5,用于實現(xiàn)一個或多個實施例的示例性遠程設(shè)備包括計算機510形式的通用計算設(shè)備。計算機510的組件可包括,但不限于,處理單元520、系統(tǒng)存儲器530、以及將包括系統(tǒng)存儲器的各種系統(tǒng)組件耦合到處理單元520的系統(tǒng)總線522。計算機510通常包括各種計算機可讀介質(zhì),并且可以是可由計算機510訪問的任何可用介質(zhì)。系統(tǒng)存儲器530可包括諸如只讀存儲器(ROM)和/或隨機存取存儲器(RAM) 之類的易失性和/或非易失性存儲器形式的計算機存儲介質(zhì)。作為示例而非限制,系統(tǒng)存儲器530還可包括操作系統(tǒng)、應用程序、其他程序模塊、以及程序數(shù)據(jù)。用戶可通過輸入設(shè)備MO向計算機510輸入命令和信息。監(jiān)視器或其他類型的顯示設(shè)備也經(jīng)由諸如輸出接口 550之類的接口連接到系統(tǒng)總線522。除監(jiān)視器以外,計算機還可包括諸如揚聲器和打印機之類的其他外圍輸出設(shè)備,它們可通過輸出接口 550連接。計算機510可使用到一個或多個其他遠程計算機(諸如遠程計算機570)的邏輯連接在聯(lián)網(wǎng)或分布式環(huán)境中操作。遠程計算機570可以是個人計算機、服務器、路由器、網(wǎng)絡PC、對等設(shè)備或其他常見網(wǎng)絡節(jié)點、或者任何其他遠程媒體消費或傳輸設(shè)備,并且可包括以上關(guān)于計算機510所述的任何或全部元件。圖5所示的邏輯連接包括諸如局域網(wǎng)(LAN) 或廣域網(wǎng)(WAN)之類的網(wǎng)絡572,但也可包括其他網(wǎng)絡/總線。這些聯(lián)網(wǎng)環(huán)境在家庭、辦公室、企業(yè)范圍的計算機網(wǎng)絡、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中是常見的。如上所述,盡管結(jié)合各種計算設(shè)備和網(wǎng)絡體系結(jié)構(gòu)描述了各示例性實施例,但基本概念可被應用于其中期望改進資源使用的效率的任何網(wǎng)絡系統(tǒng)和任何計算設(shè)備或系統(tǒng)。而且,存在實現(xiàn)相同或相似功能的多種方法,例如適當?shù)腁PI、工具箱、驅(qū)動程序代碼、操作系統(tǒng)、控件、獨立或可下載軟件對象等,它們使得應用和服務能夠使用此處提供的技術(shù)。由此,此處的各實施例從API (或其他軟件對象)的觀點以及從實現(xiàn)如此處描述的一個或多個實施例的軟件或硬件對象構(gòu)想。由此,此處所述的各實施例可具有完全采用硬件、 部分采用硬件并且部分采用軟件、以及采用軟件的方面。
本文中所使用的詞語“示例性”意味著用作示例、實例、或說明。為避免疑惑,本文所公開的主題不限于這些示例。另外,本文中作為“示例性”所述的任何方面或設(shè)計不一定被解釋為比其他方面或設(shè)計更優(yōu)選或有利,它也不意味著排除本領(lǐng)域普通技術(shù)人員已知的等效示例性結(jié)構(gòu)和技術(shù)。此外,在使用術(shù)語“包括”、“具有”、“包含”和其他類似詞語的程度上,為避免疑惑,這些術(shù)語旨在以類似于術(shù)語“包括”作為開放的過渡詞的方式是包含性的而在用于權(quán)利要求時不排除任何附加或其他元素。如所述的,此處所述的各種技術(shù)可結(jié)合硬件或軟件或,在適當時,以兩者的組合來實現(xiàn)。如此處所使用的,術(shù)語“組件”、“模塊”、“系統(tǒng)”等同樣旨在指計算機相關(guān)實體,或者是硬件、硬件和軟件的組合、軟件或者是執(zhí)行中的軟件。例如,組件可以是,但不限于,在處理器上運行的進程、處理器、對象、可執(zhí)行碼、執(zhí)行的線程、程序和/或計算機。作為說明,在計算機上運行的應用和計算機都可以是組件。一個或多個組件可駐留在進程和/或執(zhí)行的線程內(nèi),并且組件可位于一個計算機上和/或分布在兩個或更多的計算機之間。如前所述的系統(tǒng)已經(jīng)參考若干組件之間的交互來描述??梢岳斫猓@些系統(tǒng)和組件可包括組件或指定的子組件、某些指定的組件或子組件和/或附加的組件,并且根據(jù)上述內(nèi)容的各種置換和組合。子組件還可作為通信地耦合到其他組件的組件來實現(xiàn),而不是被包括在父組件內(nèi)(層次性)。另外,應注意到一個或多個組件可被組合成提供聚集功能的單個組件,或被分成若干單獨的子組件,且諸如管理層等任何一個或多個中間層可被設(shè)置成通信耦合到這樣的子組件以便提供集成功能。此處所述的任何組件也可與一個或多個此處未專門描述的但本領(lǐng)域技術(shù)人員一般已知的其他組件進行交互。鑒于本文所述的示例性系統(tǒng),可根據(jù)參考各附圖的流程圖還可理解根據(jù)所述的主題來實現(xiàn)方法。盡管為了說明簡潔起見,作為一系列框示出和描述的方法,但是應當理解, 各實施例不僅僅限于框的次序,因為一些框可以與此處所描繪和描述的框不同的次序發(fā)生和/或與其他框并發(fā)地發(fā)生。盡管經(jīng)由流程圖示出了非順序或分支的流程,但可以理解,可實現(xiàn)達到相同或類似結(jié)果的各種其他分支、流程路徑和框的次序。此外,某些示出的框在實現(xiàn)下文所述的方法中是可選的。結(jié)論盡管本發(fā)明易于作出各種修改和替換構(gòu)造,但其某些說明性實施例在附圖中示出并在上面被詳細地描述。然而應當了解,這不旨在將本發(fā)明限于所公開的具體形式,而是相反地,旨在覆蓋落入本發(fā)明的精神和范圍之內(nèi)的所有修改、替換構(gòu)造和等效方案。除此處所述的各實施例以外,應當理解,可使用其他類似實施例,或者可對所述實施例作出修改和添加以便執(zhí)行對應實施例的相同或等效功能而不背離這些實施例。此外, 多個處理芯片或多個設(shè)備可共享此處所述的一個或多個功能的性能,并且類似地,存儲可跨多個設(shè)備實現(xiàn)。因此,本發(fā)明不應限于任何單個實施例,而是應當根據(jù)所附權(quán)利要求書的廣度、精神和范圍來解釋。
權(quán)利要求
1.一種在計算環(huán)境中、至少部分地在至少一個處理器上執(zhí)行的方法,包括接收(20 從發(fā)送者指向接收者的電子郵件消息(104);獲取(206)指示所述發(fā)送者的IP地址和域是否確認的信息,并且如果所述發(fā)送者的IP地址和域沒有確認,基于所述信息確定(218)過濾級別;以及如果所述發(fā)送者的IP地址和域確認,確定(210)所述發(fā)送者和接收者是否具有關(guān)于先前通信的電子郵件消息的關(guān)系,并且若是,基于所述關(guān)系和與所述關(guān)系相關(guān)聯(lián)的名譽信息確定016)過濾級別;以及基于所述過濾級別選擇(220)包含一個或多個垃圾郵件過濾器的已選過濾器組。
2.如權(quán)利要求1所述的方法,其特征在于,基于所述關(guān)系和與所述關(guān)系相關(guān)聯(lián)的名譽信息確定過濾級別包括,基于所述發(fā)送者和接收者之間的一些在前通信,或基于一個或多個先前垃圾郵件掃描的結(jié)果,或基于所述發(fā)送者和接收者之間的一些在前通信和基于一個或多個先前垃圾郵件掃描的結(jié)果兩者,來計算分數(shù)。
3.如權(quán)利要求1所述的方法,其特征在于,相關(guān)于先前通信電子郵件消息確定所述發(fā)送者和接收者不具有關(guān)系,還包括,若是,確定所述發(fā)送者和接收者是否具有非直接關(guān)系, 并且若是,基于所述非直接關(guān)系確定過濾級別。
4.如權(quán)利要求1所述的方法,其特征在于,所述發(fā)送者是群發(fā)者,并且還包括,基于與所述群發(fā)者相關(guān)聯(lián)的分類及與所述群發(fā)者相關(guān)聯(lián)的至少一個規(guī)則來確定是否阻塞所述電子郵件消息,或基于發(fā)送者是群發(fā)者、或與所述群發(fā)者相關(guān)聯(lián)的分類、或基于發(fā)送者是群發(fā)者和與所述群發(fā)者相關(guān)聯(lián)的分類兩者來確定過濾級別,或既基于與所述群發(fā)者相關(guān)聯(lián)的分類及與所述群發(fā)者相關(guān)聯(lián)的至少一個規(guī)則來確定是否阻塞所述電子郵件消息,也基于發(fā)送者是群發(fā)者、或與所述群發(fā)者相關(guān)聯(lián)的分類、或基于發(fā)送者是群發(fā)者和與所述群發(fā)者相關(guān)聯(lián)的分類兩者來確定過濾級別。
5.一種在計算環(huán)境中的系統(tǒng),包括關(guān)系和名譽數(shù)據(jù)存儲(108),保持對應于發(fā)送者和接收者之間的電子郵件通信的信息, 以及所述電子郵件通信相關(guān)于垃圾郵件的名譽;過濾機制(102),耦合到所述關(guān)系和名譽數(shù)據(jù)存儲,所述過濾機制被配置來通過多個不同過濾器(1061-106n)掃描傳入的電子郵件消息以尋找垃圾郵件,且對于每個要被掃描的消息,所述過濾機制被配置來,基于所述消息的域和IP地址是否確認,或基于關(guān)于所述消息的發(fā)送者和接收者的關(guān)系和名譽數(shù)據(jù)存儲中的信息,用已選的過濾器掃描所述消息。
6.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述過濾機制被配置來將來自群發(fā)者的消息從其它消息中區(qū)分出來,以分類從所述群發(fā)者接收的消息,并相關(guān)于一組一個或多個規(guī)則基于所述分類來阻塞或掃描消息。
7.如權(quán)利要求5所述的系統(tǒng),其特征在于,還包括保持對應于來自發(fā)送者的先前電子郵件通信的信息的域和IP地址數(shù)據(jù)存儲,所述過濾機制被配置來為消息訪問所述域和IP 地址數(shù)據(jù)存儲以確定所述消息的域和IP地址是否確認。
8.一個或多個具有計算機可執(zhí)行指令的計算機可讀介質(zhì),所述計算機可執(zhí)行指令在被執(zhí)行時執(zhí)行以下步驟,包括(a)接收(20 從發(fā)送者指向接收者的電子郵件消息;(b)確定(206)所述發(fā)送者的IP地址和域是否確認,并且,若否,前進到步驟(d);(c)確定(210)所述發(fā)送者和接收者是否具有關(guān)于先前通信的電子郵件消息的關(guān)系, 并且若是,基于所述關(guān)系和與所述關(guān)系相關(guān)聯(lián)的名譽信息將已選過濾級別設(shè)置(212)為第一過濾級別,并前進到步驟(e);(d)將已選過濾級別設(shè)置(218)為第二過濾級別,所述第二過濾級別比所述第一過濾級別更加積極;(e)基于所選過濾級別選擇(220)包含一個或多個垃圾郵件過濾器的已選過濾器組;以及(f)用已選過濾器組掃描(220)所述電子郵件消息。
9.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,在步驟(c)確定所述發(fā)送者和接收者是否具有關(guān)系包括確定直接合格關(guān)系是否存在,并且若否,確定非直接合格關(guān)系是否存在。
10.如權(quán)利要求8所述的一個或多個計算機可讀介質(zhì),其特征在于,當存在直接合格關(guān)系時,將已選過濾級別設(shè)置為第一過濾級別包括選擇低積極性過濾級別,以及當直接合格關(guān)系不存在且非直接合格關(guān)系存在時,將已選過濾級別設(shè)置為第一過濾級別包括選擇在低積極性級別和所述第二過濾級別之間的中等積極性過濾級別。
全文摘要
本發(fā)明揭示了使用關(guān)系和名譽數(shù)據(jù)的電子郵件過濾。本發(fā)明針對減少掃描電子郵件尋找垃圾郵件所需資源的量。通常,發(fā)送者和接收者之間的先前電子郵件關(guān)系,如果有,可被考慮用來確定設(shè)置用于掃描消息尋找垃圾郵件的過濾級別的積極程度,例如,在掃描中使用哪些過濾器。對于存在的關(guān)系,其中沒有先前檢測到的垃圾郵件(有與該關(guān)系相關(guān)聯(lián)的好的名譽數(shù)據(jù)),可使用較不積極的過濾級別,因此節(jié)省資源。發(fā)送者和接收者之間的關(guān)系可以是直接,或可以是間接,例如,經(jīng)由共同第三方。還描述了從其它電子郵件消息中區(qū)分來自群發(fā)者的電子郵件,用于不同處理,包括垃圾郵件過濾。
文檔編號G06Q10/10GK102567873SQ201110386209
公開日2012年7月11日 申請日期2011年11月17日 優(yōu)先權(quán)日2010年11月18日
發(fā)明者D·N·約斯特 申請人:微軟公司