利用用于健壯數(shù)據(jù)監(jiān)控的交叉對比的bit torrent掃描的制作方法
【專利說明】利用用于健壯數(shù)據(jù)監(jiān)控的交叉對比的BIT TORRENT掃描
[0001]對相關(guān)申請的交叉參考
本申請要求由AnjU Chopra等在2012年6月7日提交的關(guān)于BIT TORRENT SCAN WITHCROSS COMPARISON FOR ROBUST DATA MONITORING 的美國臨時專利申請序列號 61/656,675 和由 Anju Chopra 等在 2012 年 11 月 14 日提交的關(guān)于 BIT TORRENT SCAN WITH CROSSCOMPARISON FOR ROBUST DATA MONITORING 的美國臨時專利申請序列號 61/726,346 的權(quán)利,其中的每個由此通過參考被結(jié)合。
技術(shù)領(lǐng)域
[0002]本公開大體涉及計算機網(wǎng)絡并且更具體地涉及監(jiān)控BitTorrent網(wǎng)絡。
【背景技術(shù)】
[0003]BitTorrent協(xié)議與文件的可靠傳輸有關(guān)。用戶可以使用各種方法來搜索種子文件(torrent file),該種子文件然后被用來通過網(wǎng)絡從“群(swarm)”計算機下載感興趣的內(nèi)容。例如,用戶可以通過搜索索引站點/跟蹤器(tracker)站點、通過搜索對等(P2P)網(wǎng)絡、通過加入豐富站點摘要(RSS)饋送、或通過利用其它類型的BitTorrent管理頁面來尋找具體的種子文件。每個BitTorrent管理頁面能夠具有它自身的語法和格式。因此,不存在單個或一致的方式來搜尋跨過各種不同的BitTorrent管理網(wǎng)頁的上下文。進一步,不存在其中能夠可能地經(jīng)過連接跳躍到達所有參與者的集中式BitTorrent網(wǎng)絡。相反,每個種子“群”是封閉的社區(qū),每個跟蹤器站點沒有到下一個的協(xié)議層連接,并且索引站點彼此分開。
【發(fā)明內(nèi)容】
[0004]因此,仍然需要高效地監(jiān)控與種子文件相關(guān)聯(lián)的內(nèi)容和共享該內(nèi)容的群計算機。
[0005]根據(jù)一個或多個實施例,諸如索引站點或豐富站點摘要(RSS)饋送的一個或多個BitTorrent管理頁面可以針對與一個或多個搜索項相關(guān)聯(lián)的種子文件的標記來掃描。在定位種子文件之后,與種子文件相關(guān)聯(lián)的信息可以被利用來開始通過網(wǎng)絡利用BitTorrent協(xié)議從群計算機下載由種子文件所指示的內(nèi)容的一個或多個部分。隨著內(nèi)容從群計算機正被下載,可以獲得與每個群計算機相關(guān)聯(lián)的識別信息。
[0006]與種子文件相關(guān)聯(lián)的數(shù)據(jù)、與種子文件相關(guān)聯(lián)的內(nèi)容和與每個群計算機相關(guān)聯(lián)的識別信息可以被存儲在數(shù)據(jù)庫中。此后,客戶端可以搜索存儲與種子文件、內(nèi)容和識別信息相關(guān)聯(lián)的數(shù)據(jù)的數(shù)據(jù)庫或不同的貯存器結(jié)構(gòu)以定位可能正共享例如未授權(quán)的或非法的信息的一個或多個群計算機。
[0007]進一步,使用相同的搜索項目,從新穎的種子監(jiān)控系統(tǒng)獲得的結(jié)果可以與其它系統(tǒng)(例如對等網(wǎng)絡掃描)交叉對比以根據(jù)“威脅”等級來歸類或分類組合的結(jié)果。
[0008]有利地,種子文件、它們的內(nèi)容和共享與種子文件相關(guān)聯(lián)的內(nèi)容的群計算機可以被高效地監(jiān)控。
【附圖說明】
[0009]下面的描述參考附圖,其中:
圖1圖示示例計算機網(wǎng)絡;
圖2圖示可以在圖1的計算機網(wǎng)絡中利用的示例種子監(jiān)控系統(tǒng);
圖3圖示用于監(jiān)控BitTorrent的示例簡化程序;
圖4圖示用于搜索與當前應用的種子監(jiān)控系統(tǒng)相關(guān)聯(lián)的信息的示例簡化程序;
圖5圖示用于將使用相同的搜索項從種子監(jiān)控系統(tǒng)所獲得的信息與從使用其它系統(tǒng)所獲得的信息交叉對比的示例系統(tǒng);以及
圖6圖示用于將使用相同的搜索項從新穎的種子監(jiān)控系統(tǒng)所獲得的信息與從其它系統(tǒng)所獲得的信息交叉對比的示例簡化程序。
【具體實施方式】
[0010]圖1圖示示例計算機網(wǎng)絡100,該計算機網(wǎng)絡100說明性地包括通過通信鏈路120互連的客戶計算機105、種子監(jiān)控系統(tǒng)200、數(shù)據(jù)庫110、一個或多個群計算機115、以及BitTorrent管理頁面118。本領(lǐng)域技術(shù)人員將理解的是,任何數(shù)目的客戶計算機、種子監(jiān)控系統(tǒng)、數(shù)據(jù)庫、群計算機和/或鏈路可以被用在計算機網(wǎng)絡中,并且這里示出的視圖是為了簡單起見。
[0011]客戶計算機105和群計算機115可以是任何通用的數(shù)據(jù)處理器,諸如個人計算機或工作站。數(shù)據(jù)庫110是組織數(shù)據(jù)集合的常規(guī)的結(jié)構(gòu),如由本領(lǐng)域技術(shù)人員所知。
[0012]圖2圖不不例種子監(jiān)控系統(tǒng)200,該種子監(jiān)控系統(tǒng)200可以與在本文中描述的一個或多個實施例一起被使用。種子監(jiān)控系統(tǒng)200可以包括通過系統(tǒng)總線250互連的多個網(wǎng)絡接口 210、一個或多個數(shù)據(jù)處理器220和存儲器240。網(wǎng)絡接口 210含有用于在耦合到網(wǎng)絡100的物理鏈路上傳送數(shù)據(jù)的機械、電氣和信號電路系統(tǒng)。網(wǎng)絡接口可以被配置成使用各種不同的通信協(xié)議來發(fā)送和/或接收數(shù)據(jù),該通信協(xié)議尤其包含TCP/IP、UDP、ATM、同步光網(wǎng)絡(SONET)、無線協(xié)議、幀中繼、以太網(wǎng)、光纖分布式數(shù)據(jù)接口(FDDI)等。特別地,物理網(wǎng)絡接口 210也可以被用來實施對于本領(lǐng)域技術(shù)人員已知的一個或多個虛擬網(wǎng)絡接口,諸如用于虛擬個人網(wǎng)絡(VPN)訪問。
[0013]存儲器240包括通過(一個或多個)處理器220和網(wǎng)絡接口 210可尋址的多個位置用于存儲與在本文中描述的實施例相關(guān)聯(lián)的軟件程序和數(shù)據(jù)結(jié)構(gòu)。處理器220可以包括適于運行軟件程序和操縱數(shù)據(jù)結(jié)構(gòu)的必要的元件或邏輯。其部分典型地駐留在存儲器240中并且由(一個或多個)處理器來運行的操作系統(tǒng)242尤其通過調(diào)用支持在節(jié)點上運行的軟件過程和/或服務的網(wǎng)絡操作而在功能上組織節(jié)點。這些軟件過程和/或服務可以包括調(diào)度器238、掃描器244、種子下載器246、DSP匹配器250、和內(nèi)容下載器252。
[0014]調(diào)度器238是負責使掃描器244的運行再發(fā)生的過程,其下面被描述。因為索引站點是集中式存儲庫并且持續(xù)反復的探查能夠?qū)е抡{(diào)度器238被禁止訪問索引站點,所以用于于從BitTorrent管理頁面進行種子文件發(fā)現(xiàn)的批處理是有利的。照此,調(diào)度器238可以通過分批訪問BitTorrent管理頁面來最小化BitTorrent管理頁面上的足跡,從而跨過BitTorrent管理頁面交錯訪問以最大化每個站點訪問與每個站點節(jié)流(throttling)之間的時間。由調(diào)度器238限定的每個進度表可以具有配置項目,諸如遞歸值(例如,每X小時、開始/停止日期)、掃描的類型(RSS、搜索、走動、輸入等)和掃描類型輸入源值(例如,對于RSS =RSS饋送的列表;對于搜索:索引站點的列表;對于走動:索引站點的列表;以及對于輸入:輸入?yún)f(xié)議源)。調(diào)度器238可以由終端用戶(例如使用客戶端105的管理員)來管理。
[0015](一個或多個)掃描器244是負責從各種BitTorrent“管理頁面”類型發(fā)現(xiàn)種子文件的過程。這些管理頁面提供關(guān)于如何尋找種子文件的標記,并且可以包含索引網(wǎng)站、跟蹤器站點、RSS饋送等。每個掃描器244被配置成根據(jù)BitTorrent管理頁面的語法和/或格式來掃描BitTorrent管理頁面。例如,索引站點可以具有與RSS饋送不同的語法和/或格式,或甚至可以具有不同于另一個索引站點的格式。照此,掃描器244被配置成與具有不同的語法和/或格式的各種不同的BitTorrent管理頁面相互作用。
[0016]每個掃描器244可以例如利用客戶端105從用戶接收一組感興趣的搜索項(這里稱為數(shù)字簽名簡檔(DSP)搜索項)。DSP搜索項然后被用來以下面更詳細地描述的方式針對相關(guān)聯(lián)的種子掃描相關(guān)聯(lián)的類型的BitTorrent管理頁面。
[0017]掃描器244可以包含“索引掃描器”(IS),IS被設(shè)計成掃描具有索引站點類型的BitTorrent管理頁面。特別地,IS 244可以使用特定的DSP搜索項在索引站點上搜索種子。IS 244的搜索能力受由索引站點實施和面臨(expose)的索引算法約束。例如,更復雜的索引站點允許由普及性、由時間性、由風格等準予(qualify)的搜索,而不太復雜的索引站點僅可以通過上載時間和種子文件名稱的查找索引來將結(jié)果分類。其它可用的索引準則可以包含種子文件名稱、內(nèi)容文件名稱、描述和元數(shù)據(jù)。IS 244能夠形成含有配置的DSP項目的站點特定的URL。每個項目例如可以要求每個索引站點的一個搜索請求。
[0018]掃描器244也可以包含“RSS掃描器”(RSSS),RSSS特別企圖發(fā)現(xiàn)由RSS饋送公布的可用種子。RSSS接觸(一個或