亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

動態(tài)消息過濾的制作方法

文檔序號:7608392閱讀:252來源:國知局
專利名稱:動態(tài)消息過濾的制作方法
背景技術(shù)
1.發(fā)明領(lǐng)域本發(fā)明涉及動態(tài)消息過濾,諸如響應于其內(nèi)容而過濾傳入的消息;在一個實施例中,響應于動態(tài)過濾的結(jié)果,可投遞消息或采取其它行動。
2.相關(guān)技術(shù)在計算機通信網(wǎng)絡中,為諸如通訊、發(fā)布信息和響應請求等目的在用戶中間發(fā)送和接收消息是很常見的。實現(xiàn)此目的的一種方法是電子郵件,也稱email。本領(lǐng)域中出現(xiàn)的一個問題是一些消息是人們不想要的。此外,廣告商和其它消息發(fā)送者收集相對大量的電子郵件地址,并向在那些電子郵件地址的接收者批量地發(fā)送未經(jīng)請求的廣告也變得很常見。當此類未經(jīng)請求的批量電子郵件消息的數(shù)量相對較大時,接收者可能要花大量時間和盡力來將它們刪除。還有一種可能性是接收者可能會因為積聚在他們的電子郵件收件箱中相對大量的非重要消息而錯過了相對重要的消息。此類未經(jīng)請求的批量電子郵件消息常用通俗詞語稱為“垃圾消息”,而此類消息的發(fā)送者常被稱為“垃圾消息發(fā)送者”。
檢測垃圾消息的第一已知方法包括所謂的“白名單”和“黑名單”,其中每個消息的發(fā)送者被過濾器標識為已知為“好的”(不是垃圾消息發(fā)送者的發(fā)送者)或是“壞的”(已知是垃圾消息發(fā)送者的發(fā)送者)。盡管這些方法一般達到了過濾消息的目的,但是它們易受需要用戶來管理白名單和黑名單這一缺點、以及垃圾消息發(fā)送者常常選擇新的、獨特的發(fā)送地址來發(fā)送新的垃圾消息這一深層缺點的影響。
檢測垃圾消息的第二已知方法包括試圖從消息的內(nèi)容來評估它是否是垃圾消息。已知的評估技術(shù)包括(a)搜索消息以尋找通常指示垃圾消息的已知關(guān)鍵詞,諸如標識垃圾消息發(fā)送者普遍推銷的已知產(chǎn)品的詞語等,以及(b)通過將此類“壞”關(guān)鍵詞的個數(shù)與諸如相對不太可能在垃圾消息中使用的可能的“好”關(guān)鍵詞相比較來評估消息。后一種方法的一個例子是Paul Graham的“A Plan for Spam”(一種垃圾消息方案)提出、并由“Mozilla”電子郵件客戶機的一些實現(xiàn)執(zhí)行的貝葉斯過濾器。盡管這些方法一般達到了過濾消息的目的,但是它們易受用戶必需訓練該實現(xiàn)來識別“壞”關(guān)鍵詞和“好”關(guān)鍵詞(尤其對于用戶通常接收的類型的消息)的缺點、以及垃圾消息發(fā)送者常常選擇新的、獨特的要推銷的產(chǎn)品或是用來標識它們的詞語(常常是拼寫錯誤的)這一深層的缺點的影響。
由此,提供一種動態(tài)消息過濾的改良技術(shù)將會是有利的。
發(fā)明概述本發(fā)明提供一種能夠動態(tài)過濾傳入消息的方法和系統(tǒng),其效果是將那些消息分類為以下三個類別中的至少一個好的消息、批量期刊及垃圾消息。中間類別“批量期刊”是為顯然不是針對個體的接收者、但接收者仍然可能想要查看的消息保留的,諸如涉及更新用戶已在使用的產(chǎn)品的信息等,或是涉及用戶明確關(guān)注的產(chǎn)品或服務的信息。
在第一方面,該系統(tǒng)包括標識引擎,它基于度量所得的每個消息的意圖來將消息分類。在一個實施例中,該引擎包括正則表達式識別器和經(jīng)預先訓練來將消息分類的一組人工神經(jīng)網(wǎng)絡。正則表達式識別器適用于檢測拼寫錯誤的詞語、由本該是無害的詞語組成的貌似垃圾消息短語(諸如“MAKE MONEY FAST”(快速賺錢))、以及垃圾消息發(fā)送者規(guī)避通過已知通常指示垃圾消息的關(guān)鍵詞的檢測而進行的其它常見的嘗試。人工神經(jīng)網(wǎng)絡將消息分成“貌似好郵件”和“貌似垃圾消息”,并且使用該信息在更加詳細和更高的辨別等級進行操作以區(qū)分好的消息、批量期刊及垃圾消息。起初被視為“貌似好郵件”的消息可能最終會被標識為好的消息或是批量期刊。類似地,起初被視為“貌似垃圾消息”的消息可能最終會被標識為批量期刊或是垃圾消息。這個方面解決了確定中的模糊性,并通過將被錯誤地標識為垃圾消息的郵件中相當大量的一部分標識為用戶認為有害性較低的批量期刊來減少被錯誤地標記為垃圾消息的郵件的數(shù)量。
在第二方面,該系統(tǒng)包括動態(tài)的白名單和黑名單,當來自這些發(fā)送地址的消息數(shù)指示該發(fā)送者貌似好的發(fā)送者或是貌似垃圾消息發(fā)送者時,那些發(fā)送地址被收集到這些名單中。在一個實施例中,至少某個閾值數(shù)(較佳的是四個)的消息作為好的消息通過的任何發(fā)送者被自動添加到已知的好的發(fā)送者的白名單中,從而無需對來自那些發(fā)送者的消息進行像對來自其它發(fā)送者的消息那樣徹底的檢查。
在第三方面,該系統(tǒng)包括檢查人工神經(jīng)網(wǎng)絡的輸入的一組正則表達式,在一個實施例中,這組正則表達式是在安裝之前選擇的,其效果是這些人工神經(jīng)網(wǎng)絡能被更迅速地訓練,并更迅速和準確地響應用戶所接收的典型電子郵件的變化。在一個實施例中,使用遺傳算法從可能使用的大約70,000個最常見的英文單詞和短語中選擇2,000個最有用的正則表達式(標識單詞或短語)的子集。這還有一個效果是能夠把人工神經(jīng)網(wǎng)絡做得更小(即,帶較少的輸入節(jié)點和較少的隱藏節(jié)點),并能在相對較少的主存儲器中直接執(zhí)行這些人工神經(jīng)網(wǎng)絡,其結(jié)果是該執(zhí)行相對更快。
本發(fā)明并不限于電子郵件消息,而是還可適用于其它類型的消息或數(shù)據(jù),諸如網(wǎng)頁或網(wǎng)頁高速緩存、“彈出”廣告和網(wǎng)頁Java腳本、“即時消息”、使用HTTP隧穿的消息協(xié)議等,并且適用于其它類型的過濾,諸如將電子郵件自動路由到適當?shù)慕邮照撸瑸椴榭?或為轉(zhuǎn)發(fā)到尋呼機或無線電子郵件收件箱)目的而進行優(yōu)先級自動區(qū)分,將消息分組自動收集到消息摘要中,為次級查看或法律責任目的而標記消息,以及自動檢測傳出的消息是否有病毒內(nèi)容等。
附圖簡述

圖1示出用于動態(tài)消息過濾的一般化系統(tǒng)的框圖。
圖2示出在部署在防火墻之后的實施例中的用于動態(tài)消息過濾的系統(tǒng)的框圖。
圖3示出在部署為服務器的實施例中的用于動態(tài)消息過濾的系統(tǒng)的框圖。
圖4示出標識引擎的實施例的框圖。
圖5示出動態(tài)消息過濾的方法的流程圖。
優(yōu)選實施例詳述在本文的描述中,將描述本發(fā)明的優(yōu)選的實施例,它包括優(yōu)選的過程步驟和數(shù)據(jù)結(jié)構(gòu)。在熟讀此申請后,本領(lǐng)域技術(shù)人員將會認識到,可使用沒有具體描述的各種其它技術(shù)來實現(xiàn)本發(fā)明的實施例,而無需過多的試驗或是進一步的發(fā)明,并且這些其它技術(shù)將落入本發(fā)明的范圍和精神之內(nèi)。
詞匯以下這些術(shù)語每一個的一般意義都是旨在示例而絕不是限制。
·術(shù)語“email(電子郵件)”、“消息”及短語“電子郵件”和“電子消息”一般是描述信息從發(fā)送者被攜帶(或試圖被攜帶)到接收者的任何技術(shù),無論該技術(shù)是異步的還是同步的,是電路交換的還是分組交換的,是人類可讀的還是不可讀的,預期目標是個體接收者還是非個體接收者,或者是廣播還是組播還是單播還是非上述方式。如本文中所使用的,術(shù)語“消息”目標寬泛。如本文中所描述的,沒有特定要求要消息必須是純文本或是原文本。
·短語“人們不想要的電子郵件”、“人們不想要的消息”和術(shù)語“垃圾消息”一般是描述并非為其實際或潛在的接收者明確想要的、或?qū)λ麄兌允翘仆坏?、或是浪費他們時間的任何消息。如本文中所使用的,術(shù)語“垃圾消息”目標寬泛,盡管它可能通常被應用于未經(jīng)請求的、成批量發(fā)送的、并且常常涉及廣告的消息。
·短語“批量期刊”在被應用于消息時,一般是描述顯然不是針對個體的接收者、但接收者仍然可能想要查看的消息,諸如涉及用戶已在使用的產(chǎn)品的更新的信息等,或是涉及用戶明確關(guān)注的產(chǎn)品或服務的信息。
·短語“相對重要的消息”一般是描述被認為不是“垃圾消息”、也被認為不是諸如接收者所關(guān)注的期刊或廣告等合乎需要的批量消息的任何消息。這樣一來的效果是本發(fā)明提供一種能夠動態(tài)過濾傳入的消息的方法和系統(tǒng),其作用是將那些消息分類到以下至少三個類別中的一個好的消息、批量期刊和垃圾消息。前者是相對重要的消息,后者是人們相對不想要的消息,而中間(批量期刊)是可能符合或可能不合用戶需要的消息。
·術(shù)語“阻塞”和“過濾”在應用于消息時,一般是描述標記那些消息以便于用戶部分采取行動的任何技術(shù),諸如用該消息是否是垃圾消息的評估來標記它們,響應于該評估采取行動,或響應于該評估將那些消息排序或區(qū)分優(yōu)先級。例如,決非旨在限制,響應于該評估而“采取行動”可包括將部分或整個消息轉(zhuǎn)發(fā)給無線接收者,將消息復制到更加持久化的日志中,將消息重新分發(fā)到另一個用戶,或是向反垃圾消息強制實施機制(諸如垃圾消息發(fā)送者的ISP、垃圾消息發(fā)送者發(fā)送地址的公用黑名單、或是政府代理機構(gòu)等)報告消息的發(fā)送者。
·短語“假肯定”在應用于消息時,一般是描述被誤標識為不是相對重要的消息而實際上是相對重要的消息的任何消息。
本領(lǐng)域普通技術(shù)人員在購買此申請后將會清楚本發(fā)明其它及進一步的應用,包括這些術(shù)語和概念的擴展。這些其它和進一步的應用是本發(fā)明的范圍和精神的一部分,并且本領(lǐng)域普通技術(shù)人員無需進一步的發(fā)明或是過多的試驗即能搞清楚。
本發(fā)明的范圍和精神不局限于任何這些定義,或是其中所提及的特定例子,而是旨在包括這些及其它術(shù)語所包含的最為一般化的概念。
一般化的系統(tǒng)單元圖1示出用于動態(tài)消息過濾的一般化的系統(tǒng)的框圖。
在本發(fā)明的實施例的一般化概念中,系統(tǒng)100被耦合到外界網(wǎng)絡110,并包括裝置級120、服務器級130和客戶機級140。
外界網(wǎng)絡110可包括用于發(fā)送或接收包括諸如電子郵件等傳入的郵件話務111及其它消息在內(nèi)的消息的任何技術(shù)。在一個實施例中,外部網(wǎng)絡110包括因特網(wǎng),諸如耦合到因特網(wǎng)主干網(wǎng)的ISP等。但是,在本發(fā)明的上下文中,沒有特定要求要外界網(wǎng)絡110涉及任何特定類型的通信系統(tǒng)。在替換實施例中,外界網(wǎng)絡110可包括內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)、VPN、ATM網(wǎng)絡、諸如PSTN等專用或公用交換網(wǎng)絡、或其某種組合或聯(lián)合。
在一個實施例中,裝置級120包括公司網(wǎng)絡的入口點125,它可能涉及防火墻、路由器或網(wǎng)關(guān)路由器、或是諸如VPN(虛擬專用網(wǎng)絡)等部署在更廣泛的通信網(wǎng)絡內(nèi)的軟件構(gòu)造。裝置級120包括耦合到公司網(wǎng)絡的入口點,并還耦合到公司網(wǎng)絡的其余部分的垃圾消息過濾器121。例如,決非旨在限制,垃圾消息過濾器121可在第一端口123被耦合到防火墻,并在第二端口124被耦合到公司網(wǎng)絡(諸如包括LAN、WAN、VLAN、VPN等的網(wǎng)絡)。在一個實施例中,垃圾消息過濾器121包括至少一些存儲122(諸如數(shù)據(jù)庫或其它存儲等),在該存儲中垃圾消息過濾器121可維護被垃圾消息過濾器121阻塞、保持或扣留的任何垃圾郵件(垃圾消息)。
在一個實施例中,服務器級130包括一組服務器單元。例如,決非旨在限制,服務器級130可包括以下各項中的至少一個郵件服務器、網(wǎng)絡服務器、數(shù)據(jù)庫服務器、連接網(wǎng)絡的存儲服務器、或是打印服務器。在一個實施例中,服務器級130包括至少一個郵件服務器131,它在第一端口132處被耦合到垃圾消息服務器121,并在第二端口133處被耦合到客戶機級140。例如,決非旨在限制,郵件服務器131可被耦合到一組工作站,用戶在這組工作站接收和操縱電子郵件消息。
在一個實施例中,客戶機級140包括一組客戶機設(shè)備。例如,決非旨在限制,客戶機級140可包括一組工作站、打印機、無線通信設(shè)備、或諸如“Blackberry”或“Palm Pilot”設(shè)備或PDA(個人數(shù)字助理)或個人組織器等手持式設(shè)備。在一個實施例中,客戶機級140包括至少一個接收者郵箱141。接收者郵箱141包括至少兩個區(qū)域,“好的消息”郵箱部分142和“批量期刊”郵箱部分143。
如下文所描述的,垃圾消息過濾器121從外界網(wǎng)絡110接收至少一些傳入的郵件話務111,并將來自該傳入郵件話務111的消息分類到一組類中。在一個實施例中,這組類包括“好的消息”、“批量期刊”和“垃圾電子郵件”。垃圾消息過濾器121將在裝置級120被分類為垃圾電子郵件的那些消息保留在存儲122中,而允許被分類為好的消息或是批量期刊的那些消息(已被適當?shù)貥擞?被轉(zhuǎn)發(fā)到服務器級130。在服務器級130,郵件服務器131接收被適當?shù)貥擞浀暮玫南⒒蚴桥科诳?,將好的消息投遞到“好的消息”郵箱部分142,并將批量期刊投遞到“批量期刊”郵箱部分143。
系統(tǒng)單元(在防火墻之后)圖2示出部署在防火墻后的實施例中的用于動態(tài)消息過濾的系統(tǒng)的框圖。
系統(tǒng)200的實施例包括外界網(wǎng)絡210(類似于圖1的外界網(wǎng)絡110)、防火墻220(類似于關(guān)于圖1的裝置級120所描述的防火墻、路由器或網(wǎng)關(guān)路由器)、郵件服務器230(類似于圖1的郵件服務器131)、管理員網(wǎng)絡客戶機241、終端用戶網(wǎng)絡客戶機242、以及垃圾消息過濾器250(類似于圖1的垃圾消息過濾器121)。
類似于圖1的外界網(wǎng)絡110,外界網(wǎng)絡210可包括用于發(fā)送或接收消息的任何技術(shù)。在一個實施例中,外界網(wǎng)絡210包括因特網(wǎng),諸如被耦合到因特網(wǎng)主干網(wǎng)的ISP等。但是,在本發(fā)明的上下文中,沒有特定要求要外界網(wǎng)絡210涉及任何特定類型的通信系統(tǒng)。在替換實施例中,外界網(wǎng)絡210可包括內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)、VPN、ATM網(wǎng)絡、諸如PSTN等專用或公用交換網(wǎng)絡、或其某種組合或聯(lián)合。
類似于關(guān)于圖1的裝置級120所描述的防火墻,防火墻220能夠從外界網(wǎng)絡210接收諸如電子郵件和其它消息221等郵件話務,檢查那些消息221以確定是否應該阻塞它們(響應于防火墻220所維護的一組防火墻規(guī)則),并將那些消息221(若未被阻塞)發(fā)送到垃圾消息過濾器250。
類似于圖1的郵件服務器131,郵件服務器230能夠從垃圾消息過濾器250接收消息221,并響應于那些消息的內(nèi)容而將它們轉(zhuǎn)發(fā)給終端用戶接收者。例如,決非旨在限制,郵件服務器230可包括使用諸如IMAP、POP或SMTP等已知郵件傳送協(xié)議的已知郵件服務器。
管理員網(wǎng)絡客戶機241包括處理器、程序和數(shù)據(jù)存儲器、以及輸入和輸出設(shè)備,諸如被配置成臺式工作站、筆記本計算機、“Blackberry”或“Palm Pilot”或其它手持式計算設(shè)備、或是其它設(shè)備。管理員網(wǎng)絡客戶機241能夠與垃圾消息過濾器250通信,其作用是管理員能夠查看、編輯或刪除由垃圾消息過濾器250維護的一般使用的配置信息。
終端用戶網(wǎng)絡客戶機242包括處理器、程序和數(shù)據(jù)存儲器、以及輸入和輸出設(shè)備,諸如被配置成臺式工作站、筆記本計算機、“Blackberry”或“Palm Pilot”或其它手持式計算設(shè)備、或是其它設(shè)備。終端用戶網(wǎng)絡客戶機241能夠與垃圾消息過濾器250通信,其作用是終端用戶能夠查看、編輯或刪除由垃圾消息過濾器250維護的涉及該終端用戶的使用的配置信息。
垃圾消息過濾器類似于圖1的垃圾消息過濾器121,垃圾消息過濾器250能夠接收防火墻220允許通過的消息221,檢查那些消息221以確定是應將它們作為好的消息、批量廣告還是垃圾消息來對待,并響應于確定的結(jié)果,采取關(guān)于那些消息221的一個或多個行動。這一個或多個行動可包括(a)在將消息221轉(zhuǎn)發(fā)到郵件服務器230以進行投遞以前適當?shù)貥擞浵?21,(b)延遲、刪除、隔離或者處理消息221,(c)將消息221轉(zhuǎn)發(fā)給除消息221原來被定址到的終端用戶以外的用戶或其它實體,以及(d)更新其自身的狀態(tài),其結(jié)果是垃圾消息過濾器250能更好地辨別哪些消息221是好的消息、哪些是批量廣告、哪些是垃圾消息。
在一個實施例中,垃圾消息過濾器250包括郵件傳送代理251、數(shù)據(jù)庫252、標識引擎253、管理界面單元254、終端用戶界面單元255、網(wǎng)絡服務器256、網(wǎng)絡CGI層257、操作系統(tǒng)層258、以及硬件平臺259。
在一個實施例中,郵件傳送代理251包括諸如版本1.1.11等PostFix郵件傳送代理(可從IBM購買),它被修改為包括本文中所描述的能力和功能。郵件傳送代理251還能使用或可改為包括Sendmail。
郵件傳送代理251能夠使用一般模式在設(shè)備之間傳送消息221,其中用戶發(fā)送者(使用用戶代理)向郵件傳送代理251發(fā)送消息221,由其將消息221發(fā)送到一個或多個其它的郵件傳送代理,其中每一個將消息221投遞給一個或多個終端用戶接收者。在一個實施例中,郵件傳送代理251被修改成具有它與數(shù)據(jù)庫252和標識引擎253通信以檢查和將消息221分類的作用。
在一個實施例中,使用數(shù)據(jù)庫來存儲用戶和管理設(shè)置、以及統(tǒng)計和電子郵件日志記錄和報告。被標識為垃圾消息的消息還可被存儲在文件系統(tǒng)中,以便稍后在用戶確定這些消息實際上不是垃圾消息(即,它們是被誤標識的“假肯定”)的情況下檢索。在替換實施例中,被標識為垃圾消息的消息也可被存儲在數(shù)據(jù)庫252中以便稍后在類似情況下檢索。
在一個實施例中,標識引擎253包括Corvigo(專利所有)過濾引擎,諸如其版本2.4等。在此實施例中,過濾引擎使用各種人工智能技術(shù)的組合(例如包括自然語言處理等)來確定消息的意圖。然后可基于所確定的意圖來執(zhí)行過濾。
在一個實施例中,管理界面單元254包括一個界面。管理界面單元允許管理員配置、運行和維護垃圾消息過濾器250。管理界面單元254可使用諸如HTML(超文本標記語言)和PHP等已知工具來構(gòu)建。
在一個實施例中,終端用戶界面單元255包括一個用戶界面。用戶界面單元允許用戶執(zhí)行以下各項操作中的一個或數(shù)個修改其垃圾消息過濾偏好,查看郵件消息以及該郵件消息被如何分類和處理的報告,以及允許用戶發(fā)現(xiàn)和檢索“假肯定”(即,被錯誤地標識為批量期刊或垃圾消息的好的消息)。終端用戶界面單元255可使用諸如HTML(超文本標記語言)和PHP等已知工具來構(gòu)建。
在一個實施例中,網(wǎng)絡服務器256包括諸如Apache HTTP服務器許可證1.0等開放源碼服務器。在此實施例中,網(wǎng)絡服務器提供用來生成諸如網(wǎng)絡CGI層257等網(wǎng)絡CGI層的函數(shù)和接口。
在一個實施例中,網(wǎng)絡CGI層257包括基于PHP(超文本預處理器)的界面,它允許用戶和管理員通過諸如萬維網(wǎng)等啟用HTML的網(wǎng)絡來與垃圾消息過濾器250交互。
在第一優(yōu)選實施例中,硬件平臺259和操作系統(tǒng)層258包括在某個版本的Linux操作系統(tǒng)(或是類似的操作系統(tǒng),諸如某個版本的Unix或是包括Machmicrokernel在內(nèi)的操作系統(tǒng)等)的控制下操作的Intel體系結(jié)構(gòu)的處理器(或其功能等效裝置)。在第二優(yōu)選實施例中,硬件平臺259和操作系統(tǒng)層258包括在某個版本的Solaris操作系統(tǒng)(或類似的操作系統(tǒng),諸如某個版本的Unix等)的控制下操作的Sun SPARC站處理器(或其功能等效裝置)。
如下所述,在一個實施例中,郵件傳送代理251在垃圾消息過濾器250處可能使用例如防火墻220等來從外界網(wǎng)絡210接收至少一些消息221。消息221被路由到標識引擎253,以便基于由標識引擎253所確定的每個消息的意圖來對其進行分類。
在一個實施例中,該引擎包括正則表達式識別器、以及被預先訓練成能將消息分類的一組人工神經(jīng)網(wǎng)絡。正則表達式識別器適用于檢測誤拼的單詞、由本該是無害的單詞組成的貌似垃圾消息的短語(諸如“MAKE MONEY FAST”等)、以及垃圾消息發(fā)送者規(guī)避通過已知通常指示垃圾消息的關(guān)鍵詞的檢測而進行的其它常見的嘗試。人工神經(jīng)網(wǎng)絡將消息分成“貌似好郵件”和“貌似垃圾消息”,并且使用該信息在更加詳細和更高的辨別等級進行操作以區(qū)分好的消息、批量期刊及垃圾消息。
起初被視為“貌似好郵件”的消息可能最終會被標識為好的消息或是批量期刊。類似地,起初被視為“貌似垃圾消息”的消息可能最終會被標識為批量期刊或是垃圾消息。
在一個實施例中,被標識為垃圾消息的消息被發(fā)送到文件系統(tǒng)進行存儲以防它們被誤標識(即,它們是“假肯定”)。在替換實施例中,可選地,可將被誤標識為垃圾消息的消息發(fā)送到數(shù)據(jù)庫252以便稍后的標識或其它處理。被適當?shù)貥擞浀暮玫南⒑团科诳粡泥]件傳送代理251發(fā)送到郵件服務器230以便投遞到終端用戶接收者的郵箱部分。
處理各種類型的消息也能有不同的方式。例如,決非旨在限制,垃圾消息過濾器250可被配置成將批量消息當成是垃圾消息來處理。
系統(tǒng)單元(被配置為服務器)在閱讀此申請之后,本領(lǐng)域技術(shù)人員將會認識到,可替換地將該用于動態(tài)消息過濾的系統(tǒng)配置為便于在被部署為服務器的實施例中使用。在此類實施例中,服務器將能夠與圖1的郵件服務器131和垃圾消息過濾器121的組合一般類似。這樣一來的效果是該服務器將能夠接收消息,過濾掉垃圾消息以及可能還有批量期刊消息,并將響應于好的消息的內(nèi)容而將它們轉(zhuǎn)發(fā)給終端用戶接收者。在一些實施例中,決非旨在限制,服務器可使用諸如IMAP、POP或SMTP等已知的郵件傳送協(xié)議來工作。
標識引擎圖4示出根據(jù)本發(fā)明的一個方面的標識引擎的實施例的框圖。
適于作為標識引擎250或350來使用的標識引擎400的實施例包括詞匯分析器410、輸入矢量生成器420、規(guī)則430和神經(jīng)網(wǎng)絡分層結(jié)構(gòu)440。
在一個實施例中,詞匯分析器410根據(jù)因特網(wǎng)標準對消息進行解碼和語法分析。消息被分成報頭部分和正文部分。報頭部分被進一步分解為個體的報頭。如有必要,正文部分被解碼并剝離無關(guān)標記。在此實施例中,處理了多個MIME部分及其子組件。
在一個實施例中,輸入矢量生成器420包括正則表達式識別器,它使用主題報頭和正文文本來生成適合神經(jīng)網(wǎng)絡分層結(jié)構(gòu)440使用的輸入矢量。這是通過使用單詞和短語到輸入矢量位置的多對一映射來實現(xiàn)的。在一個實施例中,該映射包括使用遺傳算法從可能被使用的大約70,000個最常見的英文單詞中預先選出來的2,000個最有用的正則表達式(標識單詞或短語)的子集。
在一個實施例中,輸入矢量生成器420掃描每個消息的文本字符,并且檢查消息中出現(xiàn)的每個單詞或短語(最長為四個單詞)以尋找映射中的值。如果映射中出現(xiàn)對應于該單詞或短語的條目,則增加輸入矢量的適當值。必須要當心以便即使消息是以故意設(shè)計成規(guī)避該系統(tǒng)的方法來編寫的也能在消息中識別出單詞。
在一個實施例中,規(guī)則430對消息應用基本規(guī)則以便可能以高效的方式來確定其分類。以下枚舉一組可能的此類規(guī)則。在此實施例中,一旦任何規(guī)則肯定地確定了分類,則不再發(fā)生進一步的處理。
(1)如果接收者已知的發(fā)送者列表中存在消息的發(fā)送者,則該消息被分類。
(2)如果管理員已知的IP地址列表中存在發(fā)送消息的客戶機的IP地址,則該消息被分類。該列表包含客戶機IP地址和預期的分類。
(3)如果管理員已知的發(fā)送者列表中存在消息的發(fā)送者,則該消息被分類。該列表包含發(fā)送者的地址和預期的分類。
(4)如果管理員已知的域列表中存在發(fā)送者地址的域部分,則該消息被分類。該列表包含發(fā)送者的地址域和預期的分類。
(5)如果主題包含后面跟著分隔符的串“adv”(或其它選定的串),則該消息被分類為垃圾。廣告商有時使用此類串來警告終端用戶消息是商業(yè)廣告或其它批量電子郵件。
(6)如果消息使用美國英語消息不常用的字符集(或另一選定的字符集或是語言),則消息可被分類。可響應于系統(tǒng)配置而發(fā)生分類。
(7)如果消息的主題匹配包含正則表達式、搜索串以及響應于此的相關(guān)聯(lián)的分類的表中的任何搜索串,則該消息被分類。
(8)如果消息的正文匹配包含搜索串和分類的表中的任何搜索串,則該消息被分類。
(9)如果消息的任何報頭匹配包含搜索串和分類的表中的任何搜索串,則該消息被分類。
(10)如果消息包含可能引起郵件讀取器自動創(chuàng)建新的網(wǎng)絡瀏覽窗口的代碼,則該消息可被分類為垃圾。
(11)如果接收者的地址沒有出現(xiàn)在包含接收者地址列表的任何標準消息報頭(諸如“To”和“CC”報頭等)中,則該消息可被分類。可基于系統(tǒng)配置而發(fā)生分類。
(12)如果消息的報頭所聲明的接收者列表主要包含以相同字母開頭的地址,則該消息可被分類為垃圾。
(13)如果輸入矢量生成器420為消息生成了不足的輸入,則它將被分類為“好的消息”。
在其它實施例中,可使用不同的規(guī)則430,它們可包括部分、全部或不包括前述示例。
就規(guī)則所使用的各個列表而言,在一個實施例中,這些列表被分為包括好的消息的標識符的“白名單”和包括垃圾消息標識符的“黑名單”。標識符的示例包括,但不限于,發(fā)送者的名稱、地址、域名或IP地址。
在一個實施例中,可基于與那些標識符相關(guān)聯(lián)的消息的分類來動態(tài)地維護白名單和黑名單。例如,可把至少某個閾值數(shù)(較佳的是四個)的消息作為好的消息通過的任何發(fā)送者自動添加到已知的好的發(fā)送者的白名單中,從而無需對來自那些發(fā)送者的消息進行像對來自其它發(fā)送者的消息那樣徹底的檢查。類似地,可把至少某個閾值數(shù)(較佳的是四個)的消息作為垃圾消息而被拒收的任何發(fā)送者自動添加到已知的垃圾消息發(fā)送者的黑名單中,從而無需對來自那些發(fā)送者的消息進行像對來自其它發(fā)送者的消息那樣徹底的檢查。這些分類可來自垃圾消息過濾器或垃圾消息過濾服務器的全面操作,來自用戶對消息的查看,或是來自其它某個源。也可使用不同的閾值和技術(shù)來對這些列表進行動態(tài)更新。
在一個實施例中,如果規(guī)則430中沒有任何一條對消息進行肯定的分類,則由神經(jīng)網(wǎng)絡440的分層結(jié)構(gòu)處理輸入矢量生成器所創(chuàng)建的矢量,將參考圖3對此進行進一步的描述。神經(jīng)網(wǎng)絡包含人工智能引擎,它通過查看由所生成的輸入矢量指示的消息意圖來過濾消息。神經(jīng)網(wǎng)絡分層結(jié)構(gòu)的一個實施例分析消息中使用了哪些單詞,分析那些單詞是如何被獨立地和相互關(guān)聯(lián)地使用的,以及(c)基于這一分析以及對其它消息的認識來考慮該消息的分類。
分層結(jié)構(gòu)440的一個實施例包括至少兩個神經(jīng)網(wǎng)絡。第一神經(jīng)網(wǎng)絡確定消息更像是合法的還是垃圾消息,由此將消息分為“貌似好的消息”和“貌似垃圾消息”。
基于初始分類,第二神經(jīng)網(wǎng)絡處理輸入矢量以確定消息是否是批量郵件。在此實施例中,有單獨的神經(jīng)網(wǎng)絡來將批量消息與垃圾消息分類,并將批量消息與合法消息分類。起初被視為“貌似好的消息”的消息可能最終被標識為好的消息或是批量期刊。類似地,起初被視為“貌似垃圾消息”的消息可能最終被標識為批量期刊或是垃圾消息。
在替換實施例中,神經(jīng)網(wǎng)絡從已處理的消息學習,以便適應于垃圾消息發(fā)送者所使用的不斷進化的反過濾策略。
在本發(fā)明的其它實施例中可使用具有不同個數(shù)和目的的神經(jīng)網(wǎng)絡的不同的分層結(jié)構(gòu)。
神經(jīng)網(wǎng)絡圖3示出根據(jù)本發(fā)明的一個方面的一組神經(jīng)網(wǎng)絡的實施例的框圖。
神經(jīng)網(wǎng)絡310A、310B和310C的系統(tǒng)300包括至少一個第一神經(jīng)網(wǎng)絡310A,它具有一組輸入節(jié)點311、神經(jīng)網(wǎng)絡主體312、以及輸出節(jié)點313。在一個實施例中,輸入節(jié)點311中每一個都被耦合到對應的一個正則表達式識別器314。
來自消息的一組輸入單詞315被耦合到這組正則表達式識別器314。每一個正則表達式識別器314響應于這組輸入單詞315生成表示不存在或存在相關(guān)聯(lián)的模式的值(0或1),如正則表達式所表示的。在一個實施例中,正則表達式識別器314是預先選擇的。但是,在替換實施例中,可將正則表達式識別器314改為響應于關(guān)于特定的一個或多個消息是否被正確標識的用戶反饋。
在閱讀此申請之后,本領(lǐng)域技術(shù)人員將會認識到,正則表達式識別器314并非必需使用正則表達式,或必需響應于這組輸入單詞315而提供離散值0或1。舉第一個例子來說,決非旨在限制,可用其它類型的模式匹配器或及其學習技術(shù)來替換或協(xié)助正則表達式識別器314。舉第二個例子來說,決非旨在限制,正則表達式識別器314可使用模糊邏輯,或是提供0和1之間實質(zhì)上連續(xù)的值(或一組離散值中的一個)。
來自正則表達式識別器314的一組輸入被耦合到對應的一個輸入節(jié)點311。響應于對正則表達式識別器314所標識的、并與該輸入節(jié)點311相關(guān)聯(lián)的正則表達式個數(shù)的計數(shù),向每一個輸入節(jié)點311賦加權(quán)值。這樣一來的效果是,如果特定的正則表達式被標識兩次,則對該輸入節(jié)點311的輸入將響應于值2,而不是對應于標識該特定正則表達式一次的1。
在一個實施例中,將被標識的每個個體的正則表達式的個數(shù)除以被標識的正則表達式的總數(shù),這樣一來的作用是被耦合到輸入節(jié)點311的值實質(zhì)上被歸一化為總數(shù)為1。例如,決非旨在限制,如果有4個輸入節(jié)點311A、311B、311C和311D,且每個輸入節(jié)點的被標識的正則表達式的個數(shù)分別為3、3、6和3(因而總數(shù)為15),則歸一化后的值分別將是3/15、3/15、6/15和3/15(因而總數(shù)為1.0)。
在一個實施例中,每個實質(zhì)上被歸一化的值被調(diào)整到最小的非零值,這樣一來的效果是僅當預先歸一化的被標識的正則表達式的個數(shù)確實為0時,被耦合到輸入節(jié)點311的值才為0。在其它情形中,在預先歸一化的被標識的正則表達式大于0,但歸一化后的值非常小(例如,0.02)的場合,該歸一化后的值被進位到最小的量,較佳的是0.1。在替換實施例中,也可為最大值執(zhí)行相同的過程。
來自輸入節(jié)點311的一組輸出被耦合到完全連接的神經(jīng)網(wǎng)絡312,在一個實施例中,該神經(jīng)網(wǎng)絡312具有預選的閾值和權(quán)重。但是,在替換實施例中,可響應用戶反饋來調(diào)整神經(jīng)網(wǎng)絡312的這些閾值或權(quán)重,或此兩者。
來自完全連接的神經(jīng)網(wǎng)絡312的輸出被耦合到輸出節(jié)點313,這樣一來的作用是輸入節(jié)點313表示0和1之間的一個值。神經(jīng)網(wǎng)絡310A、310B或310C中的一個的結(jié)果響應于與該神經(jīng)網(wǎng)絡310A、310B或310C相關(guān)聯(lián)的閾值,諸如較佳的閾值0.9。這樣一來的作用是,對于第一神經(jīng)網(wǎng)絡310A,如果超過了閾值,則由第二神經(jīng)網(wǎng)絡310B重新評估消息,或如果沒有超過閾值,則由第三神經(jīng)網(wǎng)絡310C重新評估消息。這樣一來還有一個作用是,對于第二神經(jīng)網(wǎng)絡310B,如果超過了閾值,則確定消息是垃圾消息,或如果沒有超過閾值,則確定消息是用戶可能會關(guān)注的批量電子郵件。類似地,這樣一來還有一個作用是,對于第三神經(jīng)網(wǎng)絡310C,如果超過了閾值,則確定消息是用戶可能會關(guān)注的批量消息,或如果沒有超過閾值,則確定消息是“好的消息”。
操作方法圖5示出一種動態(tài)消息過濾的方法的流程圖。
盡管是連續(xù)描述的,但是方法500的流程點和方法步驟可由單獨的單元聯(lián)合地或并行地執(zhí)行,無論是異步還是同步地,是以管道方式還是其它方式。在本發(fā)明的上下文中,沒有特定要求要必須按照此描述列出的流程點或方法步驟的相同順序來執(zhí)行該方法,除非有明確的說明。
在步驟501,接收消息321。
在步驟502,將消息321發(fā)送到諸如圖4中的標識引擎400等標識引擎。
在步驟503,諸如圖4中的詞匯分析器410等詞匯分析器根據(jù)諸如已知的因特網(wǎng)標準等已知標準來將消息解碼和語法分析。消息被分成報頭部分和正文部分。報頭部分被進一步分解為個體的報頭。如有必要,將正文部分解碼,并剝離無關(guān)的標記。在一個實施例中,處理了多個MIME部分及其子組件。
在步驟504,諸如圖4中的輸入矢量生成器420等輸入矢量生成器識別報頭和正文部分的文本中的單詞和表達式。輸入矢量生成器使用識別出來的單詞和表達式來生成輸入矢量。該矢量是使用單詞和短語到輸入矢量位置的多對一映射來生成的。在一個實施例中,該映射包括使用遺傳算法從可能使用的大約70,000個最常見的英文單詞中選出來的2,000個最常用的正則表達式(標識單詞或短語)的子集。
在一個實施例中,輸入矢量生成器掃描每個消息的文本,并且檢查消息中出現(xiàn)的每個單詞或短語(最長四個單詞)來尋找映射中的值。如果映射中出現(xiàn)對應于該單詞或短語的條目,則增加輸入矢量的適當值。必須要當心以便即使消息是以故意設(shè)計成規(guī)避該系統(tǒng)的方法來編寫的也能在消息中識別出單詞。
在步驟505,將諸如圖4中的規(guī)則430等規(guī)則應用于消息。在一個實施例中,將基本規(guī)則應用于消息以便能夠以高效的方式來確定其分類。
如果規(guī)則成功地將消息分類,則流程從步驟506前進至步驟507。在步驟507,垃圾消息過濾器或垃圾消息過濾服務器基于分類對消息采取行動。以下參考步驟511到513來更加詳細地解釋可能的分類和行動的一個實施例。
如果規(guī)則沒有成功將消息分類,則流程從步驟506前進至步驟508到510。在那些步驟中,由諸如圖4中的分層結(jié)構(gòu)440等神經(jīng)網(wǎng)絡分層結(jié)構(gòu)來分析消息。
神經(jīng)網(wǎng)絡通過查看由步驟504中所生成的輸入矢量所指示的消息意圖來過濾消息。神經(jīng)網(wǎng)絡分層結(jié)構(gòu)的一個實施例分析消息中使用了哪些單詞,分析那些單詞是如何被獨立地和相互關(guān)聯(lián)地使用的,以及基于這一分析以及對其它消息的認識來考慮該消息的分類。
進一步地描述,在步驟508,第一級神經(jīng)網(wǎng)絡確定消息更像是合法的消息還是垃圾消息,此步驟將消息指定為可能包括好的和批量消息的“貌似好的消息”,以及可能包括批量和垃圾消息的“貌似垃圾消息”。
在步驟509,由第二級神經(jīng)網(wǎng)絡分析貌似好的消息以確定它們是好的消息還是批量消息。類似地,在步驟510,由另一個第二級神經(jīng)網(wǎng)絡分析貌似垃圾消息以確定它們是批量消息還是垃圾消息。
在一個實施例中,神經(jīng)網(wǎng)絡從經(jīng)處理的(并響應于此從終端用戶反饋的)消息“學習”(即,使用諸如后向傳播等神經(jīng)網(wǎng)絡學習的已知技術(shù)來調(diào)整神經(jīng)網(wǎng)絡),這樣一來的作用是,神經(jīng)網(wǎng)絡適應垃圾消息發(fā)送者可能使用的不斷進化的反過濾策略。
在步驟511處理好的消息。這些消息被發(fā)送到終端用戶接收者,或發(fā)送到終端用戶接收者的郵箱。
在步驟512處理批量消息。例如,在一個實施例中,通過修改批量消息的主題來標記它們,并將它們發(fā)送到終端用戶接收者,或是發(fā)送到終端用戶接收者的郵箱?;蛘?,管理員或用戶可將垃圾消息過濾器或垃圾消息過濾服務器配置成把批量消息作為好的消息或是作為垃圾消息來對待。這由圖5的虛線指示。
在步驟513處理垃圾消息。在一個實施例中,這些消息被阻塞(即,不向終端用戶發(fā)送)。這些消息可被存儲在例如數(shù)據(jù)庫中,以便在把批量或好的消息誤標識為垃圾消息的情形中可在稍后進行查看及可能進行檢索。在一個實施例中,使用任何的錯誤標識(即,“假肯定”)來進一步調(diào)整(如上所述)神經(jīng)網(wǎng)絡,以便幫助防止將來出現(xiàn)類似的誤標識。
在每個步驟511、512和513中,可基于分類的結(jié)果和消息的特征(例如,文本和所生成的輸入矢量)來動態(tài)地更新和維護神經(jīng)網(wǎng)絡的規(guī)則和分層結(jié)構(gòu)。
在本發(fā)明的不同實施例中可使用不同的類別和行動。
替換實施例盡管本文中揭示了優(yōu)選的實施例,但是許多改變都是可能的,它們?nèi)匀宦淙氡景l(fā)明的概念、范圍和精神之內(nèi)。在熟讀此申請后,本領(lǐng)域技術(shù)人員將會清楚這些改變。
·本發(fā)明的應用并不局限于檢查純文本消息、或原文本的消息的實施例。本發(fā)明包括一些實施例,其中在檢查消息時考慮包括圖片(諸如,靜態(tài)圖片或動態(tài)圖片)或聲音(諸如經(jīng)編碼的聲音)、代碼片段(諸如HTML、DHTML、Java、JavaScript等)及消息的其它元素的其它數(shù)據(jù)類型。
·本發(fā)明的應用并不局限于僅檢查消息的報頭或正文的內(nèi)容的實施例。本發(fā)明包括一些實施例,其中除本發(fā)明中所描述的方面外、或替換這些方面而檢查包括消息的發(fā)送或接收時間、消息的大小、消息發(fā)送的方法或路徑(諸如在同一公司內(nèi)還是從邏輯上遠距離的位置)、消息的傳送協(xié)議(諸如POP、IMAP或SMTP郵件,或其變體)、以及消息是否包括附件(若是,則這些附件的內(nèi)容、大小或數(shù)據(jù)類型)在內(nèi)的其它數(shù)據(jù)。
·本發(fā)明的應用并不局限于僅檢查電子郵件消息的實施例。本發(fā)明包括一些實施例,其中檢查包括網(wǎng)頁或使用其它協(xié)議(諸如HTTP、HTTPS、FTP或UDP)接收的文件或完全不同類型的消息(諸如“即時消息”、使用對等協(xié)議的消息、使用HTTP隧穿的消息、或是諸如www.neopets.com上的“NeoMail”等應用程序?qū)S玫南?等在內(nèi)的其它類型的消息。例如,決非旨在限制,本發(fā)明可被配置成阻塞網(wǎng)頁或其部分,諸如(1)嵌入在網(wǎng)頁中的廣告,(2)“彈出”(pop-up)或“隱性彈出”(pop-under)網(wǎng)頁,或是(3)包括不適合兒童的、不適合特定場所或工作場所的、對特定用戶不敬的、或僅僅是特定用戶不想要的內(nèi)容的網(wǎng)頁。
·本發(fā)明的應用并不局限于僅檢查人類可讀的消息的實施例。本發(fā)明包括一些實施例,其中檢查包括CRM或ERP系統(tǒng)消息在內(nèi)的其它類型的消息、或者多個處理器之中和之間的其它形式的通信的其它類型的消息。例如,決非旨在限制,本發(fā)明包括一些實施例,其中檢查在線拍賣或其它交易系統(tǒng)中的投標或訂購以檢查出錯、欺詐、欺騙或其它因素(諸如市場極度的反復無常等)。
·本發(fā)明的應用并不局限于僅僅阻塞或過濾消息的實施例。本發(fā)明包括一些實施例,其中采取包括轉(zhuǎn)發(fā)那些消息、將它們按優(yōu)先級分集、將它們復制到更持久化的存儲中、使用無線通信(或相關(guān)的技術(shù),諸如發(fā)送頁面或電話呼叫等)來發(fā)送它們等其它行動。例如,本發(fā)明包括確定要向無線接收者轉(zhuǎn)發(fā)整個消息還是省略任何附件的實施例。
·本發(fā)明的其它應用包括將消息自動區(qū)分優(yōu)先級以便向無線設(shè)備轉(zhuǎn)發(fā)或便于次級檢查、確定要預加載或高速緩存哪些網(wǎng)頁、檢測惡意的“彈出”廣告或網(wǎng)頁Java腳本、檢測用戶不想要的“即時消息”及其它消息類型、將消息分組自動收集到消息摘要中、以及自動檢測傳出的消息以檢查病毒內(nèi)容等用途。
在熟讀此申請之后,本領(lǐng)域技術(shù)人員將會認識到,這些替換實施例是示例性的,而決非限制性的。
權(quán)利要求
1.一種用于將消息分類的方法,包括以下步驟識別消息中包括單詞和詞組在內(nèi)的模式;響應于所識別的模式,應用多種機器學習技術(shù)以將所述消息分類。
2.如權(quán)利要求1所述的方法,其特征在于,所述機器學習技術(shù)包括神經(jīng)網(wǎng)絡。
3.如權(quán)利要求2所述的方法,其特征在于,所述神經(jīng)網(wǎng)絡被預先訓練成能夠?qū)⑺鱿⒎诸悶楹玫南?、批量消息或是垃圾消息?br> 4.如權(quán)利要求2所述的方法,其特征在于,所述神經(jīng)網(wǎng)絡還包括至少兩級神經(jīng)網(wǎng)絡。
5.如權(quán)利要求4所述的方法,其特征在于,所述兩級神經(jīng)網(wǎng)絡包括用于確定所述消息是貌似好的消息還是貌似垃圾消息的第一級,以及用于確定貌似好的消息是否是好的、及貌似垃圾消息的是否是垃圾消息的第二級。
6.如權(quán)利要求4所述的方法,其特征在于,所述兩級神經(jīng)網(wǎng)絡包括用于確定所述消息是貌似好的消息還是貌似垃圾消息的第一級,以及用于確定貌似好的消息是好的還是批量消息、及貌似垃圾消息的是垃圾消息還是批量消息的第二級。
7.如權(quán)利要求4所述的方法,其特征在于,對于至少一個所述分類,所述神經(jīng)網(wǎng)絡將所述消息分類到三個類別中的一個,其中對于所述消息,存在一條以上通過所述神經(jīng)網(wǎng)絡到達所述類別的路徑。
8.如權(quán)利要求1所述的方法,其特征在于,還包括響應于所述消息的分類來動態(tài)地維護所述神經(jīng)網(wǎng)絡的步驟。
9.如權(quán)利要求1所述的方法,其特征在于,還包括將規(guī)則應用于所述消息來幫助將所述消息分類的步驟。
10.如權(quán)利要求9所述的方法,其特征在于,如果所述消息是用所述規(guī)則來分類的,則跳過應用所述神經(jīng)網(wǎng)絡的步驟。
11.如權(quán)利要求9所述的方法,其特征在于,所述規(guī)則使用白名單、黑名單,或是所述白名單和黑名單兩者。
12.如權(quán)利要求11所述的方法,其特征在于,還包括響應于所述消息的分類而動態(tài)地維護所述白名單、所述黑名單、或是所述白名單和黑名單兩者的步驟。
13.如權(quán)利要求11所述的方法,其特征在于,所述識別表達式的步驟還包括應用遺傳算法來選擇所要識別的一組正則表達式的步驟。
全文摘要
本發(fā)明提供了一種能夠動態(tài)過濾傳入消息的方法和系統(tǒng),其效果是將那些消息分類為以下三個類別中的至少一個好的消息、批量期刊及垃圾消息。標識引擎基于度量所得的每個消息的意圖來將消息分類。該系統(tǒng)包括動態(tài)的白名單和黑名單,當來自發(fā)送地址的消息數(shù)指示該發(fā)送者貌似好的發(fā)送者或是貌似垃圾消息發(fā)送者時,那些發(fā)送地址被收集到這些名單中。用一組正則表達式來訓練神經(jīng)網(wǎng)絡,以響應用戶所接收的典型電子郵件的變化。
文檔編號H04L12/58GK101069175SQ200480028744
公開日2007年11月7日 申請日期2004年10月1日 優(yōu)先權(quán)日2003年10月3日
發(fā)明者S·勞夫米勒, M·奧爾森, J·雷迪, E·梅德吉, P·懷特, J·科利爾 申請人:考維枸有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1