專利名稱:在下載文件時(shí)處理數(shù)據(jù)的方法、客戶端、服務(wù)器和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別涉及一種在下載文件時(shí)處理數(shù)據(jù)的方法、客戶端、月艮務(wù)器和系統(tǒng)。
背景技術(shù):
目前的許多下載軟件都使用P2SP (Peer to Server&Peer,點(diǎn)對(duì)服務(wù)器和點(diǎn))技術(shù)進(jìn)行數(shù)據(jù)下載,P2SP技術(shù)不再像傳統(tǒng)方式那樣只能依賴服務(wù)器傳輸數(shù)據(jù),數(shù)據(jù)的傳遞可以在網(wǎng)絡(luò)上的各個(gè)終端機(jī)器中進(jìn)行,有效地把原本孤立的服務(wù)器和其鏡像資源以及P2P (Peerto Peer,點(diǎn)對(duì)點(diǎn))資源整合到了一起。在P2SP技術(shù)當(dāng)中下載一個(gè)文件時(shí),該文件的數(shù)據(jù)來(lái)源可包括原始鏈接、P2P網(wǎng)絡(luò)、第三方鏡像的輔助源,客戶端下載該文件的數(shù)據(jù)后通過(guò)完整文件的唯一標(biāo)識(shí)把文件統(tǒng)一串聯(lián)起來(lái),獲得下載文件,并在下載完成以后將相關(guān)的統(tǒng)計(jì)信息上報(bào)給服務(wù)器端,使服務(wù)器端收錄客戶端的下載鏈接,以便其它客戶端在該鏈接上下載。在對(duì)現(xiàn)有技術(shù)進(jìn)行分析后,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少具有如下缺點(diǎn)客戶端下載完成后,下載鏈接會(huì)被服務(wù)器端自動(dòng)收錄,但有些下載網(wǎng)站對(duì)下載鏈接收錄行為較為反感,所以通常會(huì)采取一些措施來(lái)污染系統(tǒng)中的數(shù)據(jù),這樣系統(tǒng)收錄的下載鏈接就是被污染的數(shù)據(jù),其它客戶端通過(guò)該鏈接進(jìn)行下載時(shí),被污染的數(shù)據(jù)就會(huì)被傳播擴(kuò)散,導(dǎo)致客戶端的下載失敗,并浪費(fèi)客戶端的帶寬資源。當(dāng)然現(xiàn)有技術(shù)中還存在許多種可能導(dǎo)致源節(jié)點(diǎn)數(shù)據(jù)被污染的方法,一旦這些被污染的數(shù)據(jù)在網(wǎng)絡(luò)上傳播,就會(huì)導(dǎo)致客戶端下載失敗,并浪費(fèi)客戶端的帶寬資源
發(fā)明內(nèi)容
為了防止污染數(shù)據(jù)被傳播,本發(fā)明實(shí)施例提供了一種在下載文件時(shí)處理數(shù)據(jù)的方法、客戶端、服務(wù)器和系統(tǒng)。所述技術(shù)方案如下一方面,提供了一種在下載文件時(shí)處理數(shù)據(jù)的方法,所述方法包括客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息;根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染;如果是,則將所述污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。所述根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染,包括判斷所述完整數(shù)據(jù)分片的校驗(yàn)信息是否與所述獲取的服務(wù)器端預(yù)先存儲(chǔ)的校驗(yàn)信息一致;如果不一致,則所述完整數(shù)據(jù)分片已被污染。所述使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽,包括所述服務(wù)器端根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新所述上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄,并根據(jù)所述黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。
所述服務(wù)器端根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新所述上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄,之前還包括對(duì)所述客戶端的上報(bào)數(shù)據(jù)的相關(guān)信息進(jìn)行二次驗(yàn)證,驗(yàn)證所述上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù),如果所述驗(yàn)證結(jié)果為是,則繼續(xù)執(zhí)行步驟。所述對(duì)所述客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證所述上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù),包括下載需要驗(yàn)證的所述上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取所述原始文件的關(guān)鍵信息;如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和所述上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則所述上報(bào)數(shù)據(jù)為被污染數(shù) 據(jù)。所述方法還包括如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息不一致,用所述獲取的原始文件的關(guān)鍵信息更新所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息。所述客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息,之前還包括判斷服務(wù)器端是否有下載文件的校驗(yàn)信息;如果是,則繼續(xù)執(zhí)行步驟,否則判斷所述下載文件為新文件,抽取所述下載文件的校驗(yàn)信息和所述下載文件的唯一標(biāo)識(shí)上報(bào)給所述服務(wù)器端,使所述服務(wù)器端存儲(chǔ)所述下載文件的校驗(yàn)信息。所述方法還包括下載完所述下載文件后,對(duì)所述下載文件進(jìn)行安全性掃描,并將所述下載文件的安全屬性信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端對(duì)所述下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)所述源節(jié)點(diǎn)的信譽(yù)度更新黑白名單的記錄。另一方面,還提供了一種客戶端,所述客戶端包括獲取模塊,用于獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息;判斷模塊,用于根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染;第一上報(bào)模塊,用于如果所述判斷模塊的結(jié)果為是,則將所述污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。所述判斷模塊,具體用于判斷所述完整數(shù)據(jù)分片的校驗(yàn)信息是否與所述獲取的服務(wù)器端預(yù)先存儲(chǔ)的校驗(yàn)信息一致;如果不一致,則所述完整數(shù)據(jù)分片已被污染。所述客戶端還包括第二上報(bào)模塊,用于所述獲取模塊獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息之前,判斷服務(wù)器端是否有下載文件的校驗(yàn)信息;如果是,則繼續(xù)執(zhí)行步驟,否則判斷所述下載文件為新文件,抽取所述下載文件的校驗(yàn)信息和所述下載文件的唯一標(biāo)識(shí)上報(bào)給所述服務(wù)器端,使所述服務(wù)器端存儲(chǔ)所述下載文件的校驗(yàn)信息。
所述客戶端還包括第三上報(bào)模塊,用于下載完所述下載文件后,對(duì)所述下載文件進(jìn)行安全性掃描,并將所述下載文件的安全屬性信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端對(duì)所述下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)所述源節(jié)點(diǎn)的信譽(yù)度更新黑白名單的記錄。另一方面,還提供了一種服務(wù)器,所述服務(wù)器包括驗(yàn)證模塊,用于對(duì)客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證所述上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù);屏蔽模塊,用于根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新所述上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄;并根據(jù)所述黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。
所述驗(yàn)證模塊,包括 獲取單元,用于下載需要驗(yàn)證的所述上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取所述原始文件的關(guān)鍵信息;判斷單元,用于如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和所述上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則所述上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)。所述驗(yàn)證模塊還包括更新單元,用于如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息不一致,用所述獲取的原始文件的關(guān)鍵信息更新所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息。另一方面,還提供了一種在下載文件時(shí)處理數(shù)據(jù)的系統(tǒng),所述系統(tǒng)包括如上所述的客戶端和服務(wù)器。本發(fā)明實(shí)施例提供的技術(shù)方案,在服務(wù)器端預(yù)先存儲(chǔ)下載文件的校驗(yàn)信息,當(dāng)客戶端下載到完整數(shù)據(jù)分片后,根據(jù)校驗(yàn)信息判斷完整數(shù)據(jù)分片是否已被污染,從而能夠快速檢測(cè)出污染數(shù)據(jù),并將污染數(shù)據(jù)及時(shí)屏蔽,有效控制污染數(shù)據(jù)的擴(kuò)散,降低用戶下載到錯(cuò)誤數(shù)據(jù)概率,節(jié)省用戶寶貴的帶寬資源。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I是現(xiàn)有技術(shù)中的P2SP的系統(tǒng)示意圖;圖2是本發(fā)明實(shí)施例I提供的一種在下載文件時(shí)處理數(shù)據(jù)的方法的流程圖;圖3是本發(fā)明實(shí)施例2提供的一種在下載文件時(shí)處理數(shù)據(jù)的方法的流程圖;圖4是本發(fā)明實(shí)施例2提供的一種P2SP的系統(tǒng)示意圖;圖5是本發(fā)明實(shí)施例3提供的一種客戶端的示意圖;圖6是本發(fā)明實(shí)施例3提供的另一種客戶端的示意圖;圖7是本發(fā)明實(shí)施例3提供的一種服務(wù)器的示意圖8是本發(fā)明實(shí)施例3提供的另一種服務(wù)器的示意圖;圖9是本發(fā)明實(shí)施例3提供的一種在下載文件時(shí)處理數(shù)據(jù)的系統(tǒng)的示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。在介紹本發(fā)明提供的在下載文件時(shí)處理數(shù)據(jù)的方法之前,首先對(duì)本發(fā)明的基礎(chǔ)知識(shí)進(jìn)行簡(jiǎn)要的介紹參見(jiàn)圖1,現(xiàn)有的P2SP系統(tǒng)架構(gòu),包括資源索引服務(wù)器組、P2PTracker服務(wù)器組、統(tǒng)計(jì)服務(wù)器、下載客戶端。其中,在現(xiàn)有的系統(tǒng)架構(gòu)的基礎(chǔ)上,客戶端的下載流程包括(I)下載客戶端需要下載文件的時(shí)候從互聯(lián)網(wǎng)或者資源網(wǎng)站獲取Url鏈接; (2)下載客戶端以 Url (Uniform/Universal Resource Locator,統(tǒng)一資源定位符)鏈接為入口,從資源索引服務(wù)器查詢多資源及文件Hash,然后從查詢到的Url下載數(shù)據(jù);(3)下載客戶端下載完成后注冊(cè)文件信息到Tracker服務(wù)器,其他客戶端可以通過(guò)Tracker服務(wù)查詢到已經(jīng)下載完成的Peer和正在下載的Peer ;(4)其它下載客戶端開(kāi)始多源P2P下載,在Peer之間相互交換數(shù)據(jù);(5)下載完成以后將相關(guān)的統(tǒng)計(jì)信息上報(bào)給統(tǒng)計(jì)服務(wù)器。實(shí)施例I參見(jiàn)圖2,本發(fā)明實(shí)施例提供了一種在下載文件時(shí)處理數(shù)據(jù)的方法,包括步驟101 :客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息;步驟102 :根據(jù)校驗(yàn)信息判斷下載的下載文件的完整數(shù)據(jù)分片是否已被污染;如果是,則將污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給服務(wù)器端,使服務(wù)器端將污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。其中,根據(jù)校驗(yàn)信息判斷下載的下載文件的完整數(shù)據(jù)分片是否已被污染,包括判斷完整數(shù)據(jù)分片的校驗(yàn)信息是否與獲取的服務(wù)器端預(yù)先存儲(chǔ)的校驗(yàn)信息一致;如果不一致,則完整數(shù)據(jù)分片已被污染。本實(shí)施例中,使服務(wù)器端將污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽,包括服務(wù)器端根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄,并根據(jù)黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。本實(shí)施例中,可選地,服務(wù)器端根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄,之前還包括對(duì)客戶端的上報(bào)數(shù)據(jù)的相關(guān)信息進(jìn)行二次驗(yàn)證,驗(yàn)證上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù),如果驗(yàn)證結(jié)果為是,則繼續(xù)執(zhí)行步驟。其中,對(duì)所述客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù),包括下載需要驗(yàn)證的上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取原始文件的關(guān)鍵信息;如果原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)??蛇x地,本實(shí)施例中的方法還包括
如果原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息不一致,用獲取的原始文件的關(guān)鍵信息更新數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息??蛇x地,客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息,之前還包括判斷服務(wù)器端是否有下載文件的校驗(yàn)信息;如果是,則繼續(xù)執(zhí)行步驟,否則判斷下載文件為新文件,抽取下載文件的校驗(yàn)信息和下載文件的唯一標(biāo)識(shí)上報(bào)給服務(wù)器端,使服務(wù)器端存儲(chǔ)下載文件的校驗(yàn)信息??蛇x地,本實(shí)施例中的方法還包括下載完下載文件后,對(duì)下載文件進(jìn)行安全性掃描,并將下載文件的安全屬性信息上報(bào)給服務(wù)器端,使服務(wù)器端對(duì)下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)源節(jié)點(diǎn)的信 譽(yù)度更新黑白名單的記錄。本發(fā)明實(shí)施例提供的技術(shù)方案,在服務(wù)器端預(yù)先存儲(chǔ)下載文件的校驗(yàn)信息,當(dāng)客戶端下載到完整數(shù)據(jù)分片后,根據(jù)校驗(yàn)信息判斷完整數(shù)據(jù)分片是否已被污染,從而能夠快速檢測(cè)出污染數(shù)據(jù),并將污染數(shù)據(jù)及時(shí)屏蔽,有效控制污染數(shù)據(jù)的擴(kuò)散,降低用戶下載到錯(cuò)誤數(shù)據(jù)概率,節(jié)省用戶寶貴的帶寬資源。實(shí)施例2參見(jiàn)圖3,本發(fā)明實(shí)施例提供了一種在下載文件時(shí)處理數(shù)據(jù)的方法,方法包括步驟201 :客戶端在查詢下載資源時(shí),判斷下載校驗(yàn)裝置中是否有需要下載文件的校驗(yàn)信息,如果是則從下載校驗(yàn)裝置中獲取下載文件的校驗(yàn)信息,并執(zhí)行步驟202,否則判定該下載文件為新文件,并執(zhí)行步驟204。本實(shí)施例中,在現(xiàn)有下載文件系統(tǒng)的基礎(chǔ)上加入下載校驗(yàn)裝置,其中,下載校驗(yàn)裝置中存儲(chǔ)有下載文件的校驗(yàn)信息,以便客戶端在下載數(shù)據(jù)分片時(shí),對(duì)數(shù)據(jù)分片的正確性進(jìn)行驗(yàn)證。本實(shí)施例中,在服務(wù)器端可以單獨(dú)設(shè)置一臺(tái)資源入庫(kù)服務(wù)器來(lái)實(shí)現(xiàn)下載校驗(yàn)裝置的功能,也可以在服務(wù)器端設(shè)置一臺(tái)資源入庫(kù)服務(wù)器和一臺(tái)下載校驗(yàn)服務(wù)器,下載校驗(yàn)服務(wù)器和資源入庫(kù)服務(wù)器共同完成下載校驗(yàn)裝置的功能,這兩種方式都是在服務(wù)器端主動(dòng)依據(jù)客戶端的反饋信息結(jié)合服務(wù)器的調(diào)度,來(lái)調(diào)度和控制數(shù)據(jù)污染的擴(kuò)散和保證數(shù)據(jù)的一致性。本實(shí)施例中,優(yōu)選地,客戶端在查詢下載資源準(zhǔn)備下載文件時(shí),如果下載校驗(yàn)裝置中存有該下載文件的校驗(yàn)信息,則客戶端從中獲取校驗(yàn)信息,如果下載校驗(yàn)裝置中沒(méi)有該下載文件的校驗(yàn)信息,則表明該下載文件是第一次在網(wǎng)上傳播,還沒(méi)有關(guān)于其下載校驗(yàn)信息的記錄,判定該下載文件對(duì)于下載校驗(yàn)裝置來(lái)說(shuō)為新的文件。步驟202 :根據(jù)校驗(yàn)信息判斷下載文件的完整數(shù)據(jù)分片是否已被污染,如果是,則執(zhí)行步驟203 ;否則,繼續(xù)下載其它數(shù)據(jù)分片。其中,P2P共享網(wǎng)絡(luò)都支持基于文件數(shù)據(jù)片的文件下載。一個(gè)大文件以預(yù)先確定的大小分成了若干小塊。由于文件的數(shù)據(jù)片不用順序地下載,所以用戶可以從多個(gè)物理節(jié)點(diǎn)同時(shí)下載不同的數(shù)據(jù)片。這除了能增加下載過(guò)程的吞吐量和提高文件傳送率外,還能實(shí)現(xiàn)基于數(shù)據(jù)片的完整性檢測(cè)。當(dāng)用戶獲取目標(biāo)文件的索引信息時(shí),也同時(shí)得到了文件片的摘要。本實(shí)施例中,為了保障下載數(shù)據(jù)的完整性,對(duì)文件進(jìn)行分片,每一片數(shù)據(jù)保留一份Hash校驗(yàn)數(shù)據(jù),每當(dāng)客戶端下載完成一片數(shù)據(jù)以后,通過(guò)拉取到的校驗(yàn)信息驗(yàn)證下載的正確性,校驗(yàn)信息保存在服務(wù)器端,客戶端在查詢多資源Url的時(shí)候,同時(shí)從下載校驗(yàn)裝置獲取校驗(yàn)信息。本實(shí)施例中,下載客戶端在下載過(guò)程中對(duì)已下載的數(shù)據(jù)片進(jìn)行完整性驗(yàn)證,篩選出有錯(cuò)誤的數(shù)據(jù)片,主動(dòng)并將錯(cuò)誤的源反饋給后臺(tái)系統(tǒng)。具體的,根據(jù)校驗(yàn)信息判斷下載文件的完整數(shù)據(jù)分片是否為污染數(shù)據(jù),包括當(dāng)下載到下載文件的完整數(shù)據(jù)分片后,判斷完整數(shù)據(jù)分片的校驗(yàn)信息是否與從下載校驗(yàn)裝置中獲取的校驗(yàn)信息一致;如果不一致,則完整數(shù)據(jù)分片已被污染。步驟203 :將污染數(shù)據(jù)上報(bào)給下載校驗(yàn)裝置。本實(shí)施例中,客戶端一旦發(fā)現(xiàn)被污染的數(shù)據(jù),則將該數(shù)據(jù)和來(lái)源鏈接或者Peer上報(bào)給下載校驗(yàn)裝置,下載校驗(yàn)裝置在接收到該上報(bào)數(shù)據(jù)后,對(duì)其進(jìn)行二次驗(yàn)證,如果判斷其為污染數(shù)據(jù),則將該污染數(shù)據(jù)的源節(jié)點(diǎn)根據(jù)預(yù)設(shè)規(guī)則加入到黑名單中,并實(shí)時(shí)同步Tracker 服務(wù)器和資源索引服務(wù)器的記錄,使Tracker服務(wù)器和資源索引服務(wù)器根據(jù)黑名單的記錄將被污染的節(jié)點(diǎn)屏蔽,以避免其它客戶端再次訪問(wèn)該污染節(jié)點(diǎn),從而使污染數(shù)據(jù)不會(huì)繼續(xù)在網(wǎng)絡(luò)中傳播。步驟204 :抽取下載文件的校驗(yàn)信息和下載文件的唯一標(biāo)識(shí)上報(bào)給下載校驗(yàn)裝置。本實(shí)施例中,當(dāng)下載文件為新文件時(shí),在下載完該文件后,抽取其校驗(yàn)信息和該文件的唯一標(biāo)識(shí)上報(bào)給下載校驗(yàn)裝置,當(dāng)其它客戶端再下載該文件時(shí),能夠從下載校驗(yàn)裝置中獲取其校驗(yàn)信息,并進(jìn)行數(shù)據(jù)的驗(yàn)證。步驟205 :下載校驗(yàn)裝置接收客戶端的上報(bào)數(shù)據(jù)。本實(shí)施例中,在客戶端下載文件的同時(shí),在步驟203或步驟204中,會(huì)將篩選出的被污染數(shù)據(jù)或新文件的相關(guān)信息上報(bào)給下載校驗(yàn)裝置,所以下載校驗(yàn)裝置接收到的上報(bào)數(shù)據(jù)包括污染數(shù)據(jù)和下載文件的校驗(yàn)信息和唯一標(biāo)識(shí)。步驟206 :下載校驗(yàn)裝置對(duì)客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù)。其中,下載校驗(yàn)裝置在接收到上報(bào)數(shù)據(jù)后,會(huì)對(duì)上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證。具體的,下載校驗(yàn)裝置下載上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取原始文件的關(guān)鍵信息,如果原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)。其中關(guān)鍵信息包括數(shù)據(jù)來(lái)源的Peer,Url,文件Hash、文件大小和Hash標(biāo)識(shí)等。具體的,判斷數(shù)據(jù)庫(kù)中是否有與上報(bào)數(shù)據(jù)匹配的記錄,如果是,則表明該上報(bào)數(shù)據(jù)可能為污染數(shù)據(jù),根據(jù)上報(bào)數(shù)據(jù)的相關(guān)字段,進(jìn)一步對(duì)其進(jìn)行判定,如果上報(bào)數(shù)據(jù)為污染數(shù)據(jù),則屏蔽上報(bào)數(shù)據(jù)的相關(guān)信息;如果沒(méi)有匹配的記錄,則表明該上報(bào)數(shù)據(jù)為新文件,直接將該上報(bào)數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中。其中相關(guān)字段包括文件大小和Hash標(biāo)識(shí)。進(jìn)一步地,下載校驗(yàn)裝置根據(jù)上報(bào)數(shù)據(jù)的相關(guān)字段,判斷上報(bào)數(shù)據(jù)是否為被污染的數(shù)據(jù),包括I)判斷上報(bào)數(shù)據(jù)的相關(guān)字段是否與數(shù)據(jù)庫(kù)中匹配的數(shù)據(jù)的相關(guān)字段一致;2)如果上報(bào)數(shù)據(jù)的相關(guān)字段與數(shù)據(jù)庫(kù)中匹配的數(shù)據(jù)的相關(guān)字段不一致,則繼續(xù)驗(yàn)證不一致的相關(guān)字段;3)如果原始文件的相關(guān)字段與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的相關(guān)字段一致,或原始文件的相關(guān)字段與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的相關(guān)字段和上報(bào)數(shù)據(jù)的相關(guān)字段均不一致,則上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)。其中,判斷上報(bào)數(shù)據(jù)的相關(guān)字段是否與數(shù)據(jù)庫(kù)中匹配的數(shù)據(jù)的相關(guān)字段一致,如果一致則表明客戶端的判斷結(jié)果錯(cuò)誤,客戶端上報(bào)的數(shù)據(jù)不是被污染的數(shù)據(jù),則不對(duì)該數(shù)據(jù)進(jìn)行處理,由于數(shù)據(jù)庫(kù)中已存有該下載文件的相關(guān)信息,所以相當(dāng)于此次入庫(kù)操作已完成;但如果相關(guān)字段不一致,則表明該數(shù)據(jù)可能為被污染的數(shù)據(jù),從下載文件內(nèi)容當(dāng)中抽取文件各種Hash特征值和文件的分片Hash校驗(yàn)信息;將獲取的原始文件的相關(guān)信息與數(shù)據(jù)庫(kù)中已存儲(chǔ)的相關(guān)信息進(jìn)行比較,如果比較結(jié)果一致,則表明客戶端上報(bào)的數(shù)據(jù)為被污染的數(shù)據(jù),如果比較的結(jié)果不一致,且與上報(bào)數(shù)據(jù)的相關(guān)信息一致,則表明該數(shù)據(jù)庫(kù)中存儲(chǔ)的下載文件的相關(guān)信息不正確,則用獲取到的原始文件的相關(guān)信息更新該數(shù)據(jù)庫(kù)中的記錄。例如,對(duì)于一個(gè)URL在數(shù)據(jù)庫(kù)只可能有一條記錄,則直接更新該記錄;對(duì)于H2U,如果URL對(duì) 應(yīng)的Hash改了,則應(yīng)先將H2U (Hash到Url的映射記錄表)表中以前Hash對(duì)應(yīng)的該URL記錄刪除掉,再插入新的記錄;對(duì)于分片校驗(yàn)信息,一個(gè)Hash只對(duì)應(yīng)一個(gè)記錄,直接更新該記錄;如果原始文件的相關(guān)信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的和客戶端上報(bào)的相關(guān)信息都不一致,則用下載驗(yàn)證返回的信息更新數(shù)據(jù)庫(kù)。進(jìn)一步地,本實(shí)施例中,下載校驗(yàn)裝置判斷出接收的上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)后,在確定更新數(shù)據(jù)庫(kù)中分片校驗(yàn)信息記錄的時(shí)候,不是客戶端有上報(bào)驗(yàn)證返回就馬上更新,采樣基于信任度和概率的策略,客戶端P2P節(jié)點(diǎn)信譽(yù)系統(tǒng)根據(jù)其他對(duì)等節(jié)點(diǎn)的反饋信息來(lái)建立和更新節(jié)點(diǎn)間的信譽(yù)評(píng)價(jià)。任何一個(gè)節(jié)點(diǎn)的信譽(yù)值都由兩部分組成用戶自己從它下載的經(jīng)驗(yàn)和別的節(jié)點(diǎn)從它下載的經(jīng)驗(yàn)。因此節(jié)點(diǎn)信譽(yù)能反映一個(gè)節(jié)點(diǎn)的一貫的行為,從而有效地識(shí)別和排除節(jié)點(diǎn)的惡意行為,這些信息會(huì)反饋給服務(wù)端;對(duì)于客戶端下載的Url源設(shè)定一個(gè)閥值,如果同樣Url有多個(gè)人報(bào)告錯(cuò)誤,實(shí)施更新該Url在黑白名單中的記錄,依據(jù)客戶端上報(bào)的次數(shù),設(shè)置一個(gè)分級(jí)的黑名單機(jī)制。進(jìn)一步地,本實(shí)施例中,如果上報(bào)數(shù)據(jù)為污染數(shù)據(jù),則屏蔽上報(bào)數(shù)據(jù)的相關(guān)信息,包括根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄;根據(jù)黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。具體的實(shí)時(shí)同步資源索引服務(wù)器和Tracker服務(wù)器的記錄,使資源索引服務(wù)器和Tracker服務(wù)器根據(jù)黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。進(jìn)一步地,本實(shí)施例中,每個(gè)下載的Url源都有一個(gè)安全屬性標(biāo)記,下載客戶端每下載完成一個(gè)文件,可以通過(guò)本地的安全軟件掃描對(duì)下載文件進(jìn)行安全性掃描,并將下載文件的安全屬性信息上報(bào)給下載校驗(yàn)裝置,使下載校驗(yàn)裝置對(duì)下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)源節(jié)點(diǎn)的信譽(yù)度更新黑白名單的記錄。參見(jiàn)圖4,本實(shí)施例提供了一種P2SP系統(tǒng)圖,在現(xiàn)有P2SP的基礎(chǔ)上增加資源入庫(kù)服務(wù)器和下載校驗(yàn)服務(wù)器,客戶端通過(guò)統(tǒng)計(jì)服務(wù)器與資源入庫(kù)服務(wù)器進(jìn)行信息交互。其中,下載校驗(yàn)服務(wù)器的作用是(I)依據(jù)資源入庫(kù)服務(wù)器的調(diào)度,從網(wǎng)絡(luò)上下載需要驗(yàn)證的原始文件內(nèi)容;(2)下載過(guò)程中,依據(jù)調(diào)度的需要,從下載文件內(nèi)容當(dāng)中抽取文件各種Hash特征值和文件的分片Hash校驗(yàn)信息。資源入庫(kù)服務(wù)器的作用是(I)接收客戶端入庫(kù)上報(bào)請(qǐng)求資源入庫(kù)服務(wù)器收到入庫(kù)請(qǐng)求后,首先向數(shù)據(jù)庫(kù)查詢?cè)撡Y源的信息,如果沒(méi)有匹配的記錄,直接將該資源入庫(kù),請(qǐng)求驗(yàn)證資源,要求客戶端上報(bào)文件分片校驗(yàn)信息;如果有匹配的記錄,則檢查相關(guān)字段(文件大小,Hash標(biāo)識(shí))內(nèi)容是否一致。如果一致,則此次入庫(kù)操作完成;如果有字段不一致,則請(qǐng)求驗(yàn)證不一致的字段;(2)調(diào)動(dòng)下載驗(yàn)證服務(wù)器驗(yàn)證入庫(kù)數(shù)據(jù)的合法性、有效性;將資源索引信息保存在數(shù)據(jù)庫(kù)當(dāng)中下載驗(yàn)證返回后,如果驗(yàn)證結(jié)果與舊信息一致,則此次入庫(kù)操作完;(3)依據(jù)客戶端上報(bào)的下載錯(cuò)誤數(shù)據(jù)的Url和Peer信息,主動(dòng)同步到Tracker服務(wù)器和多資源服務(wù)器;(4)依據(jù)運(yùn)營(yíng)的需要,對(duì)需要控制傳播的Url內(nèi)容通過(guò)資源資源入庫(kù)管理控制資源索引服務(wù)器和Tracker提供所有服務(wù)。本發(fā)明實(shí)施例提供的技術(shù)方案的有益效果是在服務(wù)器端預(yù)先存儲(chǔ)下載文件的校驗(yàn)信息,當(dāng)客戶端下載到完整數(shù)據(jù)分片后,根據(jù)校驗(yàn)信息判斷完整數(shù)據(jù)分片是否已被污染,從而能夠快速檢測(cè)出污染數(shù)據(jù),并通過(guò)下載 校驗(yàn)裝置對(duì)污染數(shù)據(jù)進(jìn)行二次驗(yàn)證,增加判斷結(jié)果的準(zhǔn)確性,有效控制污染數(shù)據(jù)的擴(kuò)散,降低用戶下載到錯(cuò)誤數(shù)據(jù)概率,節(jié)省用戶寶貴的帶寬資源。實(shí)施例3參見(jiàn)圖5,本發(fā)明實(shí)施例提供了一種客戶端,包括獲取模塊301、判斷模塊302、第一上報(bào)模塊303。獲取模塊301,用于獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息;判斷模塊302,用于根據(jù)校驗(yàn)信息判斷下載的下載文件的完整數(shù)據(jù)分片是否已被污染;第一上報(bào)模塊303,用于如果判斷模塊的結(jié)果為是,則將污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給服務(wù)器端,使服務(wù)器端將污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。其中,判斷模塊302,具體用于判斷完整數(shù)據(jù)分片的校驗(yàn)信息是否與獲取的服務(wù)器端預(yù)先存儲(chǔ)的校驗(yàn)信息一致;如果不一致,則完整數(shù)據(jù)分片已被污染。參見(jiàn)圖6,本發(fā)明實(shí)施例中,客戶端還包括第二上報(bào)模塊304,用于獲取模塊301獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息之前,判斷服務(wù)器端是否有下載文件的校驗(yàn)信息;如果是,則繼續(xù)執(zhí)行步驟,否則判斷下載文件為新文件,抽取下載文件的校驗(yàn)信息和下載文件的唯一標(biāo)識(shí)上報(bào)給服務(wù)器端,使服務(wù)器端存儲(chǔ)下載文件的校驗(yàn)信息??蛇x地,參見(jiàn)圖6,本實(shí)施例中客戶端還包括第三上報(bào)模塊305,用于下載完下載文件后,對(duì)下載文件進(jìn)行安全性掃描,并將下載文件的安全屬性信息上報(bào)給服務(wù)器端,使服務(wù)器端對(duì)下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)源節(jié)點(diǎn)的信譽(yù)度更新黑白名單的記錄。參見(jiàn)圖7,本發(fā)明實(shí)施例還提供了一種服務(wù)器,包括驗(yàn)證模塊401、屏蔽模塊402。驗(yàn)證模塊401,用于對(duì)客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù);屏蔽模塊402,用于根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄;并根據(jù)黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。其中,參見(jiàn)圖8,驗(yàn)證模塊401,包括獲取單元401a,用于下載需要驗(yàn)證的上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取原始文件的關(guān)鍵息;判斷單元401b,用于如果原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)。參見(jiàn)圖8,驗(yàn)證模塊401還包括更新單元401c,用于如果原始文件的關(guān)鍵信息與數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息不一致,用獲取的原始文件的關(guān)鍵信息更新數(shù)據(jù)庫(kù)中存儲(chǔ)的與上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息。參見(jiàn)圖9,本發(fā)明實(shí)施例還提供了一種在下載文件時(shí)處理數(shù)據(jù)的系統(tǒng),包括本實(shí)施例提供的客戶端501和服務(wù)器502。本發(fā)明實(shí)施例提供的技術(shù)方案,在服務(wù)器端預(yù)先存儲(chǔ)下載文件的校驗(yàn)信息,當(dāng)客 戶端下載到完整數(shù)據(jù)分片后,根據(jù)校驗(yàn)信息判斷完整數(shù)據(jù)分片是否已被污染,從而能夠快速檢測(cè)出污染數(shù)據(jù),并將污染數(shù)據(jù)及時(shí)屏蔽,有效控制污染數(shù)據(jù)的擴(kuò)散,降低用戶下載到錯(cuò)誤數(shù)據(jù)概率,節(jié)省用戶寶貴的帶寬資源。本實(shí)施例提供的客戶端、服務(wù)器和系統(tǒng),具體可以,與方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過(guò)程詳見(jiàn)方法實(shí)施例,這里不再贅述。本發(fā)明實(shí)施例提供的上述技術(shù)方案的全部或部分可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,所述程序可以存儲(chǔ)在可讀取的存儲(chǔ)介質(zhì)中,該存儲(chǔ)介質(zhì)包括R0M、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種在下載文件時(shí)處理數(shù)據(jù)的方法,其特征在于,所述方法包括 客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息; 根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染; 如果是,則將所述污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染,包括 判斷所述完整數(shù)據(jù)分片的校驗(yàn)信息是否與所述獲取的服務(wù)器端預(yù)先存儲(chǔ)的校驗(yàn)信息一致;如果不一致,則所述完整數(shù)據(jù)分片已被污染。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽,包括 所述服務(wù)器端根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新所述上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄,并根據(jù)所述黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述服務(wù)器端根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新所述上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄,之前還包括 對(duì)所述客戶端的上報(bào)數(shù)據(jù)的相關(guān)信息進(jìn)行二次驗(yàn)證,驗(yàn)證所述上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù),如果所述驗(yàn)證結(jié)果為是,則繼續(xù)執(zhí)行步驟。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對(duì)所述客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證所述上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù),包括 下載需要驗(yàn)證的所述上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取所述原始文件的關(guān)鍵信息; 如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和所述上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則所述上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括 如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息不一致,用所述獲取的原始文件的關(guān)鍵信息更新所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息,之前還包括 判斷服務(wù)器端是否有下載文件的校驗(yàn)信息; 如果是,則繼續(xù)執(zhí)行步驟,否則判斷所述下載文件為新文件,抽取所述下載文件的校驗(yàn)信息和所述下載文件的唯一標(biāo)識(shí)上報(bào)給所述服務(wù)器端,使所述服務(wù)器端存儲(chǔ)所述下載文件的校驗(yàn)信息。
8.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述方法還包括 下載完所述下載文件后,對(duì)所述下載文件進(jìn)行安全性掃描,并將所述下載文件的安全屬性信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端對(duì)所述下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)所述源節(jié)點(diǎn)的信譽(yù)度更新黑白名單的記錄。
9.一種客戶端,其特征在于,所述客戶端包括 獲取模塊,用于獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息;判斷模塊,用于根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染; 第一上報(bào)模塊,用于如果所述判斷模塊的結(jié)果為是,則將所述污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。
10.根據(jù)權(quán)利要求9所述的客戶端,其特征在于,所述判斷模塊,具體用于 判斷所述完整數(shù)據(jù)分片的校驗(yàn)信息是否與所述獲取的服務(wù)器端預(yù)先存儲(chǔ)的校驗(yàn)信息一致;如果不一致,則所述完整數(shù)據(jù)分片已被污染。
11.根據(jù)權(quán)利要求9所述的客戶端,其特征在于,所述客戶端還包括 第二上報(bào)模塊,用于所述獲取模塊獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息之前,判斷服務(wù)器端是否有下載文件的校驗(yàn)信息;如果是,則繼續(xù)執(zhí)行步驟,否則判斷所述下載文件為新文件,抽取所述下載文件的校驗(yàn)信息和所述下載文件的唯一標(biāo)識(shí)上報(bào)給所述服務(wù)器端,使所述服務(wù)器端存儲(chǔ)所述下載文件的校驗(yàn)信息。
12.根據(jù)權(quán)利要求9所述的客戶端,其特征在于,所述客戶端還包括 第三上報(bào)模塊,用于下載完所述下載文件后,對(duì)所述下載文件進(jìn)行安全性掃描,并將所述下載文件的安全屬性信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端對(duì)所述下載文件的源節(jié)點(diǎn)的信譽(yù)度進(jìn)行加權(quán),并根據(jù)所述源節(jié)點(diǎn)的信譽(yù)度更新黑白名單的記錄。
13.一種服務(wù)器,其特征在于,所述服務(wù)器包括 驗(yàn)證模塊,用于對(duì)客戶端的上報(bào)數(shù)據(jù)進(jìn)行二次驗(yàn)證,驗(yàn)證所述上報(bào)數(shù)據(jù)是否為污染數(shù)據(jù); 屏蔽模塊,用于根據(jù)預(yù)設(shè)規(guī)則在黑白名單中更新所述上報(bào)數(shù)據(jù)的源節(jié)點(diǎn)的記錄;并根據(jù)所述黑白名單中的記錄將被污染的源節(jié)點(diǎn)屏蔽。
14.根據(jù)權(quán)利要求13所述的服務(wù)器,其特征在于,所述驗(yàn)證模塊,包括 獲取單元,用于下載需要驗(yàn)證的所述上報(bào)數(shù)據(jù)對(duì)應(yīng)的原始文件,并獲取所述原始文件的關(guān)鍵信息; 判斷單元,用于如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息一致,或所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息和所述上報(bào)數(shù)據(jù)的關(guān)鍵信息均不一致,則所述上報(bào)數(shù)據(jù)為被污染數(shù)據(jù)。
15.根據(jù)權(quán)利要求14所述的服務(wù)器,其特征在于,所述驗(yàn)證模塊還包括 更新單元,用于如果所述原始文件的關(guān)鍵信息與所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息不一致,用所述獲取的原始文件的關(guān)鍵信息更新所述數(shù)據(jù)庫(kù)中存儲(chǔ)的與所述上報(bào)數(shù)據(jù)匹配的數(shù)據(jù)的關(guān)鍵信息。
16.一種在下載文件時(shí)處理數(shù)據(jù)的系統(tǒng),其特征在于,所述系統(tǒng)包括如權(quán)利要求9-12所述的客戶端和如權(quán)利要求13-15所述的服務(wù)器。
全文摘要
本發(fā)明公開(kāi)了一種在下載文件時(shí)處理數(shù)據(jù)的方法、客戶端、服務(wù)器和系統(tǒng),屬于互聯(lián)網(wǎng)領(lǐng)域。所述方法包括客戶端獲取服務(wù)器端預(yù)先存儲(chǔ)的下載文件的校驗(yàn)信息;根據(jù)所述校驗(yàn)信息判斷下載的所述下載文件的完整數(shù)據(jù)分片是否已被污染;如果是,則將所述污染數(shù)據(jù)的關(guān)鍵信息上報(bào)給所述服務(wù)器端,使所述服務(wù)器端將所述污染數(shù)據(jù)的源節(jié)點(diǎn)屏蔽。本發(fā)明在服務(wù)器端引入獨(dú)立的下載校驗(yàn)裝置,結(jié)合客戶端上報(bào)的信息,能夠有效控制污染數(shù)據(jù)的擴(kuò)散。
文檔編號(hào)H04L29/08GK102752326SQ201110097908
公開(kāi)日2012年10月24日 申請(qǐng)日期2011年4月19日 優(yōu)先權(quán)日2011年4月19日
發(fā)明者劉剛, 王福臣 申請(qǐng)人:騰訊科技(深圳)有限公司