云計算系統(tǒng)中攔截垃圾郵件的方法和裝置制造方法
【專利摘要】一種在云計算系統(tǒng)中的攔截垃圾郵件的方法和裝置。該方法包括,通過設置在云計算系統(tǒng)外網(wǎng)的探針裝置進行垃圾郵件特征識別;將識別為垃圾郵件的特征值存儲到云計算集群服務器的垃圾郵件黑名單列表中;云計算集群服務器基于存儲的垃圾郵件特征值進行垃圾郵件攔截。本發(fā)明不僅提高了垃圾郵件識別率,還降低了使用成本。
【專利說明】云計算系統(tǒng)中攔截垃圾郵件的方法和裝置
【技術領域】
[0001]本發(fā)明涉及網(wǎng)絡通信領域,特別涉及基于云計算的攔截垃圾郵件的方法和裝置。【背景技術】
[0002]隨著電子郵件技術的普遍應用,垃圾郵件的處理要耗費巨大的人力物力。當網(wǎng)絡上有垃圾郵件進行郵件批量發(fā)送的時候,就會出現(xiàn)垃圾郵件泛濫的問題,可能內容存在病毒和不和諧的新聞等內容,所以如何保護云計算內網(wǎng)大量的虛擬PC屏蔽掉垃圾郵件,非常重要?,F(xiàn)有的反垃圾郵件產(chǎn)品,主要采用貝葉斯算法、關鍵詞和規(guī)則等技術進行過濾。而垃圾郵件通常是基于全網(wǎng)發(fā)送的,傳統(tǒng)的反垃圾郵件系統(tǒng)無法在較大范圍內進行集中過濾和管理,因此普遍存在成本昂貴、維護困難、重復建設、服務器負擔過重等問題。
[0003]傳統(tǒng)的解決方案還包括,在虛擬集群網(wǎng)管上對進入內網(wǎng)的郵件進行病毒掃描和病毒庫中已知垃圾郵件特征掃描的方法,不過該方法對垃圾郵件的掃描效率低,遺漏的可能性大,拒收效果不好;還可以增加一個專用硬件設備,作為第三方垃圾郵件掃描工具,這種方式顯然會增加用戶的采購成本;再一種方式就是郵件的黑白名單機制,但這種方式準確度較低,如果屏蔽掉了重要郵件會使用戶收到損失。
[0004]針對相關技術中所存在的上述問題,目前尚未提出有效的解決方案。
【發(fā)明內容】
[0005]本發(fā)明的目的是提供一種攔截垃圾郵件的方法和裝置,以攔截垃圾郵件對云計算內網(wǎng)的入侵,同時提高垃圾郵件的識別率。
[0006]根據(jù)本發(fā)明的一個方面,提供了一種在云計算系統(tǒng)中的攔截垃圾郵件的方法,包括以下步驟:
[0007]步驟S101,通過設置在云計算系統(tǒng)外網(wǎng)的探針裝置進行垃圾郵件特征識別;
[0008]步驟S102,將識別為垃圾郵件的特征值存儲到云計算集群服務器的垃圾郵件黑名單列表中;
[0009]步驟S103,云計算集群服務器基于存儲的垃圾郵件特征值進行垃圾郵件攔截。
[0010]優(yōu)選地,所述探針裝置為全天候實時開機的普通物理PC或服務器,其安裝有多個虛擬郵箱。
[0011]優(yōu)選地,所述特征值為郵件的hash值,并且所述步驟SlOl進一步包括:
[0012]步驟S1010,計算郵件的hash值,
[0013]步驟S1011,基于郵件的hash值進行垃圾郵件識別,當hash值相同的郵件數(shù)量超過一預設值時,認定該郵件為垃圾郵件。
[0014]優(yōu)選地,所述郵件的hash值通過以下步驟來計算:
[0015]以接收到的來自發(fā)送者的郵件頭作為數(shù)據(jù)輸入;
[0016]提取郵件頭中字段的數(shù)量信息和關鍵字段的對應值;
[0017]定義郵件特征提取粒度,根據(jù)所獲得的郵件頭信息,通過MD5或SHAl算法生成對于該郵件的hash信息并保存。
[0018]優(yōu)選地,所述關鍵字段包括:Received,Subject, MIME-Version, Content-Type,X-Mailer,Content-Transfer—Encoding。
[0019]優(yōu)選地,所述步驟S103進一步包括:
[0020]步驟S1031,云計算集群服務器接收云計算系統(tǒng)中的虛擬PC發(fā)送的郵件;
[0021]步驟S1032,將郵件轉發(fā)給目標虛擬PC之前,通過第三方檢測模塊將接收郵件的hash值與垃圾郵件黑名單列表中hash值進行比較;[0022]步驟S1033,如果所述接收郵件的hash值與垃圾郵件黑名單列表中的其中一個垃圾郵件hash值一致,則認定該郵件為垃圾郵件,進行攔截處理并銷毀;
[0023]步驟S1034,如果所述接收郵件的hash值不存在于垃圾郵件黑名單列表中,貝!J認定為正常郵件,將其轉發(fā)給目標虛擬PC。
[0024]根據(jù)本發(fā)明的另一方面,提供了一種在云計算系統(tǒng)中攔截垃圾郵件的裝置,其特征在于,該裝置包括:探針裝置和云計算集群服務器;
[0025]所述探針裝置包括:
[0026]監(jiān)測郵箱模塊,用于全天候實時接收云計算系統(tǒng)中的各個虛擬PC發(fā)送的郵件,以及
[0027]特征值計算模塊,耦合于所述監(jiān)測郵箱模塊,用于在監(jiān)測郵箱模塊接收到郵件之后,通過對郵件進行垃圾郵件特征識別來判斷該郵件是否為垃圾郵件,并將該特征值傳送給云計算集群服務器;
[0028]所述云計算集群服務器包括:
[0029]黑名單模塊,用于接收并存儲所述特征值計算模塊發(fā)送的垃圾郵件特征值,將這些識別為垃圾郵件的特征值形成黑名單列表并存儲;
[0030]郵件接收模塊,用于接收云計算系統(tǒng)中的虛擬PC發(fā)送的郵件,并將所接收郵件的特征值發(fā)送給第三方檢測模塊進行垃圾郵件識別;
[0031]第三方檢測模塊,用于將所接收郵件的特征值與黑名單模塊中黑名單列表中的垃圾郵件的特征值進行比較,基于比較結果,對垃圾郵件進行攔截。
[0032]優(yōu)選地,所述特征值為郵件的hash值,并且所述特征值計算模塊具體用于:計算郵件的hash值,基于郵件的hash值進行垃圾郵件識別,當hash值相同的郵件數(shù)量超過一預設值時,認定該hash值對應的郵件為垃圾郵件。
[0033]優(yōu)選地,所述特征值計算模塊計算郵件的hash值進一步包括:
[0034]以接收到的來自發(fā)送者的郵件頭作為數(shù)據(jù)輸入;
[0035]提取郵件頭中字段的數(shù)量信息和關鍵字段的對應值;
[0036]定義郵件特征提取粒度,根據(jù)所獲得的郵件頭信息,通過MD5或SHAl算法生成對于該郵件的hash信息并保存。
[0037]優(yōu)選地,其中所述第三方檢測模塊執(zhí)行以下操作:
[0038]如果所述郵件的特征值與所述黑名單列表中的其中一個垃圾郵件特征值一致,則認定該郵件為垃圾郵件,進行攔截處理并銷毀,
[0039]如果所接收郵件的特征值不存在于黑名單列表中,則認定為正常郵件,并轉發(fā)給目標虛擬PC。[0040]通過本發(fā)明技術方案,采用外網(wǎng)探針和內網(wǎng)特征匹配手段,來攔截垃圾郵件對云計算內網(wǎng)的入侵。因此不僅減少了用戶采購成本,還能提高垃圾郵件的識別率,增加效率。
【專利附圖】
【附圖說明】
[0041]此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的過分限定。其中:
[0042]圖1顯示了根據(jù)本發(fā)明實施例的云計算攔截垃圾郵件方法的流程圖;
[0043]圖2顯示了根據(jù)本發(fā)明實施例的用于攔截垃圾郵件的裝置的結構圖。
【具體實施方式】
[0044]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明了,下面結合【具體實施方式】并參照附圖,對本發(fā)明進一步詳細說明。需要說明的是,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本發(fā)明。
[0045]網(wǎng)絡上的垃圾郵件一般具有以下特點,即郵件的內容、格式、發(fā)件人相同,但是郵件的收件人不同。有鑒于垃圾郵件的上述特點,本發(fā)明通過外網(wǎng)探針和內網(wǎng)特征匹配的手段,來攔截垃圾郵件對云計算內網(wǎng)的入侵。
[0046]本發(fā)明使用外網(wǎng)增加一個探針服務器,在探針服務器上設置多個虛擬郵箱,每個郵箱都可以接收到郵件,當接收到郵件以后,將郵件進行hash計算,在云計算的第三方掃描模塊同步此hash值,當有郵件進入云計算集群時,云計算集群內的第三方掃描模塊計算此郵件hash值,如果匹配則識別為垃圾郵件。
[0047]圖1顯示了根據(jù)本發(fā)明優(yōu)選實施例的云計算系統(tǒng)中攔截垃圾郵件的方法的流程圖。
[0048]如圖1所示,本發(fā)明云計算系統(tǒng)中攔截垃圾郵件的方法包括下述步驟:
[0049]步驟S101,通過設置在云計算系統(tǒng)外網(wǎng)的探針PC進行垃圾郵件特征識別。
[0050]在一個實施例中,在該探針PC上安裝有多個虛擬郵箱,例如100個。將探針PC設置為全天候實時開機,以使每個虛擬郵箱均能在任一時刻接收郵件。
[0051]在一個實施例中,該特征值的計算優(yōu)選地采用散列值即hash計算。在優(yōu)選的實施例中,計算郵件的hash由以下步驟來完成:
[0052]2.1,以接收到的來自發(fā)送者的郵件頭作為數(shù)據(jù)輸入;
[0053]2.2,提取郵件頭中字段的數(shù)量信息和具體字段名稱;
[0054]2.3,提取郵件頭中關鍵字段的對應值,所述關鍵字段包括但不限于-Received、Sub ject、MIME—Version、Content—Type、X—Mailer、Content-Transfer-Encoding ;
[0055]2.4,定義郵件特征提取粒度,根據(jù)所獲得的郵件頭信息,通過MD5或SHAl等Hash算法生成對于該封郵件的hash信息并保存。
[0056]具體來說,對垃圾郵件進行特征識別(hash值識別)可以包括以下步驟:
[0057]步驟S1010,計算郵件的hash值。
[0058]步驟SlOlI,基于郵件的hash值進行垃圾郵件識別。
[0059]具體來說,當hash值相同的郵件數(shù)量超過一預設值時,認定該郵件為垃圾郵件,并將該hash值發(fā)送到云計算集群服務器的垃圾郵件黑名單列表中存儲,此時該hash值作為該郵件的唯一身份標識。
[0060]優(yōu)選地,探針PC的多個虛擬郵箱中包括隊列結構,在接收到來自互聯(lián)網(wǎng)的大量郵件時,利用隊列結構對郵件進行緩存,并串行地處理每個郵件,包括上述特征計算過程。
[0061]步驟S102,將識別為垃圾郵件的特征值存儲到垃圾郵件黑名單列表中。
[0062]具體地,云計算集群服務器接收到探針PC發(fā)送來的垃圾郵件hash值后,將此hash值存儲于垃圾郵件黑名單列表。
[0063]步驟S103,云計算集群服務器基于存儲的垃圾郵件特征值進行垃圾郵件攔截。
[0064]具體來說,本步驟S103包括下述步驟:
[0065]步驟S1031,云計算集群服務器接收云計算系統(tǒng)中的虛擬PC發(fā)送的郵件。
[0066]步驟S1032,通過第三方檢測模塊將接收郵件的hash值與垃圾郵件黑名單列表中hash值進行比較。通常,該步驟是在將郵件轉發(fā)給目標虛擬PC之前執(zhí)行。
[0067]步驟S1033,如果所述接收郵件的hash值與垃圾郵件黑名單列表中的某個垃圾郵件hash值一致,則認定該郵件為垃圾郵件,進行攔截處理并銷毀。
[0068]步驟S1034,如果所述接收郵件的hash值不存在于垃圾郵件黑名單列表中(即與黑名單列表中的任一郵件hash值不一致),則認定為正常郵件,將其轉發(fā)給目標虛擬PC。
[0069]優(yōu)選地,云計算集群服務器中包括郵件接收模塊,在接收到來自探針PC的大量郵件時,利用隊列結構對郵件進行緩存,并串行地處理每個郵件,包括上述特征計算和匹配過程。
[0070]由于郵件經(jīng)過hash運算后,得到唯一標識郵件內容的值。因此同一 hash值指示同一封郵件,即在步驟S102中所確定的垃圾郵件。
[0071]圖2顯示了根據(jù)本發(fā)明優(yōu)選實施例的云計算系統(tǒng)中用于攔截垃圾郵件的裝置的結構圖。
[0072]如圖2所示,云計算系統(tǒng)中用于攔截垃圾郵件的裝置200包括探針PC210和云計算集群服務器220。探針PC210包括監(jiān)測郵箱模塊211和特征值計算模塊212。云計算集群服務器220包括黑名單模塊221、郵件接收模塊222、第三方檢測模塊223。
[0073]本發(fā)明的裝置200在云計算外網(wǎng)設置有物理普通PC作為探針PC210,探針PC210包括監(jiān)測郵箱模塊211和特征值計算模塊212,探針PC210用于監(jiān)測并識別垃圾郵件。
[0074]監(jiān)測郵箱模塊211包括多個郵箱,設置為全天候實時開機,用于接收云計算系統(tǒng)中的各個虛擬PC發(fā)送的郵件。
[0075]特征值計算模塊212連接到監(jiān)測郵箱模塊211,用于對監(jiān)測郵箱模塊211接收到郵件進行垃圾郵件特征識別。具體來說,對所有接收的郵件進行hash計算,當hash值相同的郵件數(shù)量超過一預設值時,認定該郵件為垃圾郵件,并將hash值傳送給云計算集群服務器220。
[0076]云計算集群服務器220用于攔截垃圾郵件并轉發(fā)非垃圾郵件。具體來說,云計算集群服務器220接收探針PC210發(fā)送的識別為垃圾郵件的hash值,基于該垃圾郵件的hash值識別并攔截垃圾郵件,然后將識別為非垃圾郵件的正常郵件轉發(fā)給目標PC。
[0077]云計算集群服務器220包括黑名單模塊221、郵件接收模塊222、第三方檢測模塊223。
[0078]黑名單模塊221用于接收并存儲特征值計算模塊212發(fā)送的垃圾郵件hash值。具體來說,特征值計算模塊212將識別為垃圾郵件的所有郵件的hash值發(fā)送給黑名單模塊221,黑名單模塊221將這些識別為垃圾郵件的hash值形成為黑名單列表并存儲。
[0079]郵件接收模塊222用于接收云計算系統(tǒng)中的各個虛擬PC發(fā)送的郵件,并將所接收郵件的hash值發(fā)送給第三方檢測模塊224進行垃圾郵件識別。
[0080]第三方檢測模塊224連接到所述黑名單模塊221和郵件接收模塊222,用于將所接收郵件的hash值與黑名單列表中的垃圾郵件hash值進行比較。如果所述郵件的hash值與黑名單模塊221中黑名單列表中的某個垃圾郵件hash值一致,則認定該郵件為垃圾郵件,進行攔截處理并銷毀,如果所接收郵件的hash值不存在于黑名單模塊221中,即與黑名單模塊221中黑名單列表中的任何一個郵件hash值均不一致,則認定為正常郵件,可以轉發(fā)給目標虛擬PC。
[0081]綜上所述,利用本發(fā)明的攔截垃圾郵件的方法和裝置,垃圾郵件的不同收件人被所設置的多個虛擬郵箱來收集和統(tǒng)計,當同一封郵件被群發(fā)預定義次數(shù)時,認定為垃圾郵件,并根據(jù)獲取的垃圾郵件特征值來攔截該郵件在云計算內網(wǎng)中的傳播,這種外網(wǎng)探針和內網(wǎng)特征匹配的手段不僅能夠減少用戶采購成本,還能夠提高垃圾郵件的識別率。
[0082]顯然,本領域的技術人員應該理解,上述的本發(fā)明的各模塊或各步驟可以用通用的計算系統(tǒng)來實現(xiàn),它們可以集中在單個的計算系統(tǒng)上,或者分布在多個計算系統(tǒng)所組成的網(wǎng)絡上,可選地,它們可以用計算系統(tǒng)可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲系統(tǒng)中由計算系統(tǒng)來執(zhí)行。這樣,本發(fā)明不限制于任何特定的硬件和軟件結合。
[0083]應當理解的是,本發(fā)明的上述【具體實施方式】僅僅用于示例性說明或解釋本發(fā)明的原理,而不構成對本發(fā)明的限制。因此,在不偏離本發(fā)明的精神和范圍的情況下所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。此外,本發(fā)明所附權利要求旨在涵蓋落入所附權利要求范圍和邊界、或者這種范圍和邊界的等同形式內的全部變化和修改例。
【權利要求】
1.一種在云計算系統(tǒng)中的攔截垃圾郵件的方法,其特征在于,包括以下步驟: 步驟S101,通過設置在云計算系統(tǒng)外網(wǎng)的探針裝置進行垃圾郵件特征識別; 步驟S102,將識別為垃圾郵件的特征值存儲到云計算集群服務器的垃圾郵件黑名單列表中; 步驟S103,云計算集群服務器基于存儲的垃圾郵件特征值進行垃圾郵件攔截。
2.根據(jù)權利要求1所述的方法,其特征在于: 所述探針裝置為全天候實時開機的普通物理PC或服務器,其安裝有多個虛擬郵箱。
3.根據(jù)權利要求1或2所述的方法,其特征在于: 所述特征值為郵件的hash值,并且所述步驟SlOl進一步包括: 步驟S1010,計算郵件的hash值, 步驟S1011,基于郵件的hash值進行垃圾郵件識別,當hash值相同的郵件數(shù)量超過一預設值時,認定該郵件為垃圾郵件。
4.根據(jù)權利要求3所述的方法,其特征在于,所述郵件的hash值通過以下步驟來計算: 以接收到的來自發(fā)送者的郵件頭作為數(shù)據(jù)輸入; 提取郵件頭中字段的數(shù)量信息和關鍵字段的對應值; 定義郵件特征提取粒度,根據(jù)所獲得的郵件頭信息,通過MD5或SHAl算法生成對于該郵件的hash信息并保存。
5.根據(jù)權利要求4所述的方法,其特征在于,所述關鍵字段包括:Received,Subject,MIME-Version, Content-Type, X-MaiIer, Content-Transfer—Encoding。
6.根據(jù)權利要求3所述的方法,其特征在于,所述步驟S103進一步包括: 步驟S1031,云計算集群服務器接收云計算系統(tǒng)中的虛擬PC發(fā)送的郵件; 步驟S1032,將郵件轉發(fā)給目標虛擬PC之前,通過第三方檢測模塊將接收郵件的hash值與垃圾郵件黑名單列表中hash值進行比較; 步驟S1033,如果所述接收郵件的hash值與垃圾郵件黑名單列表中的其中一個垃圾郵件hash值一致,則認定該郵件為垃圾郵件,進行攔截處理并銷毀; 步驟S1034,如果所述接收郵件的hash值不存在于垃圾郵件黑名單列表中,則認定為正常郵件,將其轉發(fā)給目標虛擬PC。
7.—種在云計算系統(tǒng)中攔截垃圾郵件的裝置,其特征在于,該裝置包括:探針裝置和云計算集群服務器; 所述探針裝置包括: 監(jiān)測郵箱模塊,用于全天候實時接收云計算系統(tǒng)中的各個虛擬PC發(fā)送的郵件,以及特征值計算模塊,耦合于所述監(jiān)測郵箱模塊,用于在監(jiān)測郵箱模塊接收到郵件之后,通過對郵件進行垃圾郵件特征識別來判斷該郵件是否為垃圾郵件,并將該特征值傳送給云計算集群服務器; 所述云計算集群服務器包括: 黑名單模塊,用于接收并存儲所述特征值計算模塊發(fā)送的垃圾郵件特征值,將這些識別為垃圾郵件的特征值形成黑名單列表并存儲; 郵件接收模塊,用于接收云計算系統(tǒng)中的虛擬PC發(fā)送的郵件,并將所接收郵件的特征值發(fā)送給第三方檢測模塊進行垃圾郵件識別; 第三方檢測模塊,用于將所接收郵件的特征值與黑名單模塊中黑名單列表中的垃圾郵件的特征值進行比較,基于比較結果,對垃圾郵件進行攔截。
8.根據(jù)權利要求7所述的裝置,其特征在于: 所述特征值為郵件的hash值,并且所述特征值計算模塊執(zhí)行下述操作: 計算郵件的hash值,基于郵件的hash值進行垃圾郵件識別,當hash值相同的郵件數(shù)量超過一預設值時,認定該hash值對應的郵件為垃圾郵件。
9.根據(jù)權利要求8所述的裝置,其中,所述特征值計算模塊計算郵件的hash值的步驟還包括: 以接收到的來自發(fā)送者的郵件頭作為數(shù)據(jù)輸入; 提取郵件頭中字段的數(shù)量信息和關鍵字段的對應值; 定義郵件特征提取粒度,根據(jù)所獲得的郵件頭信息,通過MD5或SHAl算法生成對于該郵件的hash信息并保存。
10.根據(jù)權利要求7所述的裝置,其中所述第三方檢測模塊執(zhí)行下述操作: 如果所述郵件的特征值與所述黑名單列表中的其中一個垃圾郵件特征值一致,則認定該郵件為垃圾郵件,進行 攔截處理并銷毀, 如果所接收郵件的特征值不存在于所述黑名單列表中,則認定為正常郵件,并將其轉發(fā)給目標虛擬PC。
【文檔編號】H04L29/08GK103841006SQ201410063603
【公開日】2014年6月4日 申請日期:2014年2月25日 優(yōu)先權日:2014年2月25日
【發(fā)明者】康暖 申請人:漢柏科技有限公司