專利名稱:用于信息傳送的未授權內容檢測的制作方法
技術領域:
本發(fā)明涉及傳送過程中的特定文件的識別,尤其涉及在傳送過程中未授權圖像的檢測。
背景技術:
互聯(lián)網(wǎng)服務供應商(ISP)和企業(yè)日益感到需要確保諸如色情圖片或者受版權保護的材料的未授權內容在ISP或企業(yè)的控制之下不被傳送給使用網(wǎng)絡資源的終端用戶。例如,執(zhí)法機構可以要求ISP監(jiān)控那些顯示非法內容的色情圖片的下載。再舉一例,企業(yè)可能希望對于員工把色情圖片下載到企業(yè)網(wǎng)上進行監(jiān)控。在監(jiān)視個人非法下載活動的情況時,阻止此類下載可能是所希望的,但是檢測此類下載也可能是有用的,或者甚至是優(yōu)選的。為了檢測此類下載活動,所希望的是在違規(guī)(offending)計算機文件通過交換機時檢測之。
識別通過交換機傳送的違規(guī)計算機文件的一種方法是使用試探法來檢測共有某些類型特征的文件。模糊邏輯可以使用在圖片測量上從而估算一個圖片具有違規(guī)性質的可能性。這種特征的一個示例為疊加在圖片一部分上的一個黑色矩形,用于保護標識??墒?,雖然這種試探技術可以檢測大量的違規(guī)圖片,但是它們還可以產(chǎn)生許多假陽性。
發(fā)明內容
根據(jù)本發(fā)明的一個方面,提供一種用于檢測違規(guī)計算機文件片段的方法。定義指定區(qū)域。對于許多計算機文件的每一個,對計算機文件的指定區(qū)域的字節(jié)的違規(guī)校驗和進行計算。計算在計算機文件片段的指定區(qū)域中的字節(jié)的計算校驗和。如果所述計算校驗和與至少一個違規(guī)校驗和匹配,則該計算機文件片段被確定為是違規(guī)計算機文件片段。
計算機文件片段可以是存儲在網(wǎng)絡上的計算機文件。可選地,計算機文件片段可以是分組。在后一種實施例中,本發(fā)明可以應用于在分組交換機處所接收到的分組。對于每一分組,確定該分組是否要被檢查。對于計算校驗和的計算只針對要檢查的分組。確定分組是否要被檢查可以基于如下任何一個檢查分組的百分比、檢查源地址與存儲的源地址相匹配的分組、檢查目的地址與存儲的目的地址相匹配的分組、檢查特定文件類型的第一個分組或者檢查超過尺寸限制的分組。
提供一種用于執(zhí)行本發(fā)明方法的設備。本發(fā)明的方法可以作為處理指令被存儲在計算機可讀介質上。
本發(fā)明的方法和設備允許監(jiān)控被終端用戶為了非法或者違規(guī)內容正被下載的分組而不中斷業(yè)務流。違規(guī)校驗和存儲在管理員站點而非違規(guī)計算機文件本身。雖然在分組或者計算機文件內的特定校驗和的檢查將只是檢測已知的違規(guī)材料,但是那些可能由更多試探法中產(chǎn)生的假陽性的數(shù)量極大減少。還出現(xiàn)的假陽性結果對下載活動將無影響,因為本發(fā)明檢測活動但是不阻止活動。對于執(zhí)法機構或其它機構所規(guī)定和提供的已知違規(guī)文件的監(jiān)控,可能足以證明互聯(lián)網(wǎng)服務供應商或企業(yè)在監(jiān)控和檢測非法下載活動中是仔細審查的。
本發(fā)明的特征和優(yōu)點將參考附圖從優(yōu)選實施例的隨后詳細描述中變得顯而易見,其中圖1是根據(jù)本發(fā)明一個實施例的分組交換機和其它組件的簡圖;圖2是根據(jù)本發(fā)明一個實施例由圖1的交換機執(zhí)行的方法的流程圖;圖3是根據(jù)本發(fā)明一個實施例由圖1的違規(guī)分組檢測器執(zhí)行的方法的流程圖。
應當指出附圖中相同的特征具有相同的標記。
具體實施例方式
參見圖1,根據(jù)本發(fā)明一個實施例的分組交換機和其它組件的圖表被示出。分組交換機10接收輸入分組12并將其作為輸出分組14轉發(fā)到終端用戶的目的地。分組交換機10不在終端用戶的管理控制之下,但是優(yōu)選地,在分組交換機10的管理控制和終端用戶之間存在某種關系。例如,分組交換機10可以是企業(yè)網(wǎng)的入口交換機,并且終端用戶可以是該企業(yè)的一名員工。再舉一例,分組交換機10可以是ISP的接入交換機,而終端用戶可以是該ISP的客戶。在任何情況下,終端用戶是通過分組交換機10下載計算機文件的個人,所述計算機文件諸如作為計算機文件存儲的圖片文件或音樂文件。
管理系統(tǒng)16提供至分組交換機10的管理接口。違規(guī)分組檢測器18從分組交換機10接收某些分組的拷貝(如下所述)。違規(guī)分組檢測器18最好是采用與分組交換機10相分離的處理器上的軟件的形式,例如與分組交換機10通信的個人計算機上的軟件。違規(guī)分組檢測器10可以與管理系統(tǒng)16位于同一平臺上。一般來說,違規(guī)分組檢測器18包含軟件或硬件的任意結合形式的邏輯指令。軟件形式的邏輯指令可以存儲在計算機可讀介質上。
違規(guī)分組檢測器18與數(shù)據(jù)庫20通信。數(shù)據(jù)庫20存儲至少一個違規(guī)校驗和表格。每個違規(guī)校驗和表格包括指定區(qū)域的定義、至少一個違規(guī)校驗和與機構標識。對于此說明書的剩余部分,為了描述簡潔,假定每個表格將存儲多個違規(guī)校驗和。每個指定區(qū)域是計算機文件內的一組字節(jié),將對于該字節(jié)計算校驗和。該指定區(qū)域可以用清楚定義一組字節(jié)在計算機文件內的位置的任何形式來表示。例如,第一字節(jié)的偏移和字節(jié)總數(shù)可以用來定義指定區(qū)域。
違規(guī)校驗和與相關指定區(qū)域的定義由諸如執(zhí)法機構的機構來提供。通過計算特定計算機文件的指定區(qū)域的校驗和,每個違規(guī)校驗和從該計算機文件中產(chǎn)生。例如,計算機文件的字節(jié)24到28可以用作指定區(qū)域,并且使用這些字節(jié)的值而計算出校驗和。關于在計算校驗和中使用計算機文件的哪個指定區(qū)域的選擇被留給所述機構,但是優(yōu)選的是靠近計算機文件的開始處,以便確保指定區(qū)域的偏移與第一分組內的偏移相同——如果計算機文件的部分作為多個分組有效載荷而被下載的話。用來產(chǎn)生校驗和的計算機文件可以是任意類型的計算機文件,機構希望對于其檢測下載。這些計算機文件的示例有色情圖片文件和受版權保護的音樂文件。
在實踐中,機構會選擇指定區(qū)域,并且基于該指定區(qū)域計算違規(guī)計算機文件集合中每個計算機文件的校驗和。所述機構向分組交換機10的管理員提供指定區(qū)域的定義以及違規(guī)校驗和,而不是實際的違規(guī)計算機文件。分組交換機10的管理員把指定區(qū)域的定義、違規(guī)校驗和以及所述機構標識存儲在數(shù)據(jù)庫20中。機構可以提供例如從兩個不同的違規(guī)計算機文件組中產(chǎn)生的一個以上的指定區(qū)域的定義及相關的違規(guī)校驗和。一個以上的機構每一個都可以向管理員提供一個或多個違規(guī)校驗和表格,并且數(shù)據(jù)庫20因此可以存儲一個以上的違規(guī)校驗和表格、這些表格中的一些或者全部具有機構的不同標識。
分組交換機10的管理員使用管理系統(tǒng)來在分組交換機10中設置標志用于啟用違規(guī)分組檢測。管理員還使用管理系統(tǒng)在交換機內設置參數(shù),用于定義哪些分組要被拷貝到違規(guī)分組檢測器18中。設置的最簡單參數(shù)是要拷貝的分組百分比,例如全部輸入分組12的5%要被拷貝到違規(guī)分組檢測器。這樣的百分比可以隨機或者確定地被應用,換言之,可以每二十分組5%的百分比被拷貝或者有5%的幾率拷貝任意特定分組。參數(shù)的其它例子是在某一個尺寸限制內的分組、能被識別為特定文件類型的第一分組的分組(例如圖片、音樂或者電影文件)、與存儲的源地址相匹配的分組的源地址、與存儲的目的地址相匹配的分組目的地址、或者這些參數(shù)的任意組合。
參見圖2,該圖示出根據(jù)本發(fā)明一個實施例由分組交換機10執(zhí)行的方法的流程圖。在步驟30,分組交換機10接收輸入分組。分組交換機在步驟32確定違規(guī)分組檢測是否已被啟用。如果違規(guī)分組檢測已被啟用,則在步驟34,分組交換機考慮參數(shù)來確定該輸入分組是否要被拷貝到違規(guī)分組檢測器。如果分組交換機確定該輸入分組要被拷貝,那么在步驟36,分組交換機把該分組拷貝到違規(guī)分組檢測器18中。分組交換機然后在步驟38把輸入分組傳遞給該分組中所指示的目的地,即請求此次下載的終端用戶。如果違規(guī)分組檢測未被啟用,或者如果分組交換機確定該輸入分組不被拷貝,那么分組交換機就把輸入分組傳遞給該分組中所指示的目的地。
參見圖3,該圖示出根據(jù)本發(fā)明一個實施例由違規(guī)分組檢測器18所執(zhí)行的方法的流程圖。當違規(guī)分組檢測器18被啟動時,違規(guī)分組檢測器18讀取數(shù)據(jù)庫20,并且對于數(shù)據(jù)庫20中的每個表格,違規(guī)分組檢測器載入指定區(qū)域的定義。違規(guī)分組檢測器18在存儲器中存儲記錄,每個記錄與數(shù)據(jù)庫20中的一個表格相關聯(lián)。每個記錄包括從對應表格中讀出的指定區(qū)域的定義、到表格中的至少一個違規(guī)校驗和組的鏈接、以及到表格中機構標識的鏈接。在步驟42,違規(guī)分組檢測器18等候分組從分組交換機10中到達。這樣的分組將在分組交換機拷貝分組時到達,正如在上面參考圖2的步驟36所描述的那樣。
當分組到達違規(guī)分組檢測器18時,在步驟44,違規(guī)分組檢測器認為第一指定區(qū)域的定義是包括在記錄之一中的指定區(qū)域。在步驟46,違規(guī)分組檢測器計算該分組內字節(jié)的校驗和,該字節(jié)從指定區(qū)域的定義中選出。在步驟48,違規(guī)分組檢測器使用指定區(qū)域的記錄內的鏈接接入至少一個違規(guī)校驗和組,從而確定在步驟46確定的計算校驗和是否在相應表格中的至少一個違規(guī)校驗和組內。
如果違規(guī)分組檢測器在步驟48確定計算校驗和在至少一個違規(guī)校驗和組內,那么在步驟50,違規(guī)分組檢測器產(chǎn)生報告。該報告標識該分組,包括目的地址、源地址、該分組所屬的計算機文件、違規(guī)校驗和、以及與包含該違規(guī)校驗和的表格相關的機構標識。這個報告可以被管理員以任何方式使用,例如用于內部監(jiān)控、用于傳遞給所述機構、或者僅僅用于記錄保存。在生成報告之后,違規(guī)分組檢測器在步驟42等候來自分組交換機的另一分組。
應當指出如果分組被檢測,該分組指定區(qū)域的校驗和是違規(guī)校驗和,則在圖2的步驟38該分組仍然被分組交換機10轉發(fā)給適當?shù)哪康牡?。這允許分組交換機10對輸入分組的處理的執(zhí)行采用了計算校驗和與咨詢數(shù)據(jù)庫的極少處理開銷。這也極大減少了假陽性識別的影響,因為下載導致假陽性的文件的終端用戶將不會使其業(yè)務受到影響。本發(fā)明旨在監(jiān)控并記錄違規(guī)活動,而非中斷業(yè)務。如果機構從步驟50生成的報告中確定出現(xiàn)假陽性,那么終端用戶業(yè)務保持不受影響。即使該報告指示真的違規(guī)分組,由是管理員或者所述機構負責確定下一步采取什么行動。終端用戶的業(yè)務可以保持不受影響,或者分組交換機在步驟34使用的參數(shù)可以被修改成把發(fā)往該終端用戶的所有分組拷貝到違規(guī)分組檢測器,允許暗中監(jiān)控該終端用戶的后續(xù)下載活動。
如果違規(guī)分組檢測器在步驟48確定計算校驗和不在數(shù)據(jù)庫中并因此不是違規(guī)校驗和,則在步驟52違規(guī)分組檢測器確定是否存在另一個要被考慮的指定區(qū)域的定義。例如,如果數(shù)據(jù)庫20包括一個以上違規(guī)校驗和表格,如果一個以上機構對于通過分組交換機20監(jiān)控下載活動感興趣,或者如果單個機構提供了一個以上的違規(guī)校驗和組,則這就是這種情況。如果存在指定區(qū)域的下一個定義,則違規(guī)分組檢測器在步驟46計算指定區(qū)域的校驗和,并且確定計算校驗和是否與對應于該指定區(qū)域的表格內的違規(guī)校驗和相匹配。違規(guī)分組檢測器繼續(xù)計算并檢查在步驟40載入的每個指定區(qū)域的校驗和,直到所有指定區(qū)域已被檢查。違規(guī)分組檢測器然后在步驟42等候來自分組交換機的另一分組的到來。
如果新的違規(guī)校驗和組被機構提供,那么更新數(shù)據(jù)庫20以包括新的表格,并且違規(guī)分組檢測器被重啟以使得該表格在圖3的步驟40被載入到違規(guī)分組檢測器的存儲器中,所述表格包括新指定區(qū)域的定義和到新校驗和的鏈接。
在本發(fā)明的一個實施例中,違規(guī)分組檢測器18按照與管理系統(tǒng)16相同的方式提供到分組交換機10的通信。如果違規(guī)分組檢測器18在步驟48確定分組的計算校驗和是違規(guī)校驗和,那么除了生成報告之外,違規(guī)分組檢測器改變分組交換機10的工作狀況。違規(guī)分組檢測器18調整分組交換機10在步驟34所使用的參數(shù),以便確定分組是否要被拷貝到違規(guī)分組檢測器。這些參數(shù)可以改變以屏蔽更多發(fā)往該終端用戶的分組或者從該違規(guī)分組源發(fā)出的分組。例如,如果違規(guī)分組被發(fā)現(xiàn),那么參數(shù)可以被調整以使得分組交換機向違規(guī)分組檢測器拷貝終端用戶下載的更高百分比的分組甚至全部分組。
本發(fā)明已被描述為使用與分組交換機10相分離的違規(guī)分組檢測器。分組交換機10在與分組有效載荷內容無關的分組上執(zhí)行初始屏蔽功能。由分離的違規(guī)分組檢測器考慮該分組的有效載荷并且咨詢數(shù)據(jù)庫。這將分組交換機10上的處理開銷減到最少,并且允許該方法的大部分可以用軟件實現(xiàn)。如上參考圖3所述,可選地,確定分組是否具有違規(guī)校驗和的邏輯可以在分組交換機本身實現(xiàn)。可是,為了保持處理時間最小,這可能需要對分組交換機10進行顯著的硬件變化。作為另一個可選方案,分組交換機10可以把所有業(yè)務都拷貝到另一個分離的硬件設備上,該硬件設備包含用于執(zhí)行參考圖2和圖3在上面所描述的方法的邏輯電路。
本發(fā)明已被描述為監(jiān)控通過分組交換機的分組。違規(guī)分組檢測器還可以被應用來監(jiān)控存儲在網(wǎng)絡上的計算機文件,雖然檢測器更適當?shù)貞环Q為違規(guī)文件檢測器。這允許網(wǎng)絡管理員掃描網(wǎng)絡用戶存儲的計算機文件以發(fā)現(xiàn)違規(guī)計算機文件。例如,企業(yè)網(wǎng)的管理員能使用本發(fā)明來掃描員工的文件。代替在步驟42接收分組,違規(guī)文件檢測器接收存儲的計算機文件的位置。上面參考圖3所述的邏輯無變化,違規(guī)文件檢測器計算每一個計算機文件的指定區(qū)域上的校驗和并把計算校驗和與存儲在數(shù)據(jù)庫中的違規(guī)校驗和進行比較。更一般地,本發(fā)明旨在檢測違規(guī)計算機文件片段,計算機文件片段可以是作為有效載荷而攜帶部分計算機文件的分組或者可以是在網(wǎng)絡上存儲的整個計算機文件,其中,針對所述計算機文件片段計算校驗和并將該計算校驗和與存儲的違規(guī)校驗和進行比較片段。違規(guī)分組檢測器一般來說可以被稱為違規(guī)計算機文件片段檢測器,以便包括監(jiān)控網(wǎng)絡上存儲的計算機文件的實施例。
當前的實施例只是示例性的,本領域技術人員應該理解在不偏離本發(fā)明精神的前提下,可以作出上述實施例的各種變體。本發(fā)明的范圍僅由所附權利要求來定義。
權利要求
1.一種檢測違規(guī)計算機文件片段的方法,包括定義指定區(qū)域;對于至少一個計算機文件的每一個,計算該計算機文件的所述指定區(qū)域的字節(jié)的違規(guī)校驗和;計算在計算機文件片段的所述指定區(qū)域中的字節(jié)的計算校驗和;確定所述計算校驗和是否與至少一個違規(guī)校驗和相匹配;以及如果所述計算校驗和與所述至少一個違規(guī)校驗和相匹配,則確定該計算機文件片段是違規(guī)計算機文件片段。
2.根據(jù)權利要求1的方法,其中至少一個計算機文件是圖片文件。
3.根據(jù)權利要求1的方法,其中至少一個計算機文件是音樂文件。
4.根據(jù)權利要求1的方法,其中至少一個計算機文件是電影文件。
5.根據(jù)權利要求1的方法,其中每一個計算機文件片段是分組,該方法還包括接收多個分組;和對于每個分組,確定該分組是否要被檢查,并且其中,只是對要被檢查的分組執(zhí)行下列步驟對計算校驗和進行計算,確定所述計算校驗和是否與任何違規(guī)校驗和相匹配,并確定該分組是違規(guī)分組。
6.根據(jù)權利要求5的方法,其中至少一個計算機文件是圖片文件。
7.根據(jù)權利要求5的方法,其中至少一個計算機文件是音樂文件。
8.根據(jù)權利要求5的方法,其中確定分組是否要被檢查包括確定分組的百分比要被檢查。
9.根據(jù)權利要求5的方法,其中確定分組是否要被檢查包括如果分組的源地址與存儲的源地址相匹配,則確定該分組要被檢查。
10.根據(jù)權利要求5的方法,其中確定分組是否要被檢查包括如果分組的目的地地址與存儲的目的地址相匹配,則確定該分組要被檢查。
11.根據(jù)權利要求5的方法,其中確定分組是否要被檢查包括如果分組是特定文件類型的第一分組,則確定該分組要被檢查。
12.根據(jù)權利要求5的方法,其中確定分組是否要被檢查包括如果分組超過了尺寸限制,則確定該分組要被檢查。
13.根據(jù)權利要求5的方法還包括修改參數(shù),在分組被確定是違規(guī)分組的情況下,通過修改參數(shù),確定分組是否要被檢查。
14.根據(jù)權利要求13的方法,其中修改所述參數(shù)以使得具有與違規(guī)分組的所述源地址相匹配的源地址的所有分組都被確定為要被檢查。
15.根據(jù)權利要求13的方法,其中修改所述參數(shù)以使得具有與違規(guī)分組的目的地址相匹配的目的地址的所有分組都被確定為要被檢查。
16.根據(jù)權利要求5的方法,其中接收多個分組并確定每個分組是否要被檢查由分組交換機來執(zhí)行,并且其中對計算校驗和進行計算、確定所述計算校驗和是否與至少一個違規(guī)校驗和的任何一個相匹配、以及確定該分組是不是違規(guī)分組,由與所述分組交換機相分離的處理器上運行的軟件來執(zhí)行。
17.根據(jù)權利要求1的方法,其中每個計算機文件片段是存儲在網(wǎng)絡上的計算機文件。
18.一種用于檢測違規(guī)分組的系統(tǒng),包括數(shù)據(jù)庫,用于存儲指定區(qū)域的定義和至少一個違規(guī)校驗和;分組交換機,用于接收多個分組并用于確定每個分組是否要被檢查;以及違規(guī)分組檢測器,用于計算要被檢查的每個分組的所述指定區(qū)域中的字節(jié)的計算校驗和,用于確定任何計算校驗和是否與至少一個違規(guī)校驗和中的任意一個相匹配,并且如果所述分組的計算校驗和與至少一個違規(guī)校驗和相匹配,用于確定該分組是違規(guī)分組。
19.一種存儲指令的計算機可讀介質,該指令可以被處理器處理,所述指令包括用于從數(shù)據(jù)庫中檢索指定區(qū)域的定義的指令;用于接收分組的指令;用于計算在要被檢查的所述分組的所述指定區(qū)域中的字節(jié)的計算校驗和的指令;用于確定所述計算校驗和是否與所述數(shù)據(jù)庫中的至少一個違規(guī)校驗和相匹配的指令;以及如果所述計算校驗和與至少一個違規(guī)校驗和相匹配,用于確定該分組是違規(guī)分組的指令。
全文摘要
提供一種用于檢測違規(guī)或非法下載活動的方法。諸如執(zhí)法機構之類的機構在一組計算機文件的每一個的指定區(qū)域上生成校驗和列表。該機構向分組交換機的管理員提供該校驗和列表和指定區(qū)域的標識。計算通過該交換機的分組的指定區(qū)域的校驗和。如果計算校驗和在違規(guī)校驗和列表中被發(fā)現(xiàn),那么標記該分組。為了使處理開銷可管理,可以只對一些分組計算校驗和。雖然這種方式只能檢測到已知的違規(guī)計算機文件,但是已知違規(guī)計算機文件的已知校驗和的使用極大減少了假陽性分組檢測的可能性。
文檔編號H04L29/06GK1980241SQ200610162949
公開日2007年6月13日 申請日期2006年11月29日 優(yōu)先權日2005年11月29日
發(fā)明者S·G·阿比蓋爾 申請人:阿爾卡特公司