專利名稱:一種樣本收集方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)安全技術(shù)領(lǐng)域,特別是涉及一種樣本收集方法及系統(tǒng)。
背景技術(shù):
在互聯(lián)網(wǎng)時代,信息爆炸性增長,木馬、病毒也隨之爆發(fā)性的泛濫,如何快速反應(yīng), 及時發(fā)現(xiàn)新的木馬和病毒,及早控制木馬、病毒的傳播是安全行業(yè)面臨的新的挑戰(zhàn)。海量樣本實(shí)時鑒定技術(shù),是基于服務(wù)器端強(qiáng)大的處理能力對海量的樣本進(jìn)行收集并實(shí)時給出精準(zhǔn)的鑒定結(jié)果的一種云鑒定技術(shù)。海量樣本實(shí)時鑒定系統(tǒng)主要包含四大部分樣本收集,樣本鑒定,樣本存儲,鑒定結(jié)果發(fā)布。樣本收集指的是利用各種探測工具收集互聯(lián)網(wǎng)上最新出現(xiàn)的未被鑒定系統(tǒng)識別過的可執(zhí)行文件;樣本存儲指的是妥善的存儲海量的樣本,并能做到數(shù)據(jù)的高可靠性、高可用性;樣本鑒定指的是靈活的組織調(diào)度各種各樣的鑒定服務(wù)快速的給出樣本的各種鑒定結(jié)果,并綜合這些鑒定結(jié)果最終確定該樣本的安全等級;鑒定結(jié)果發(fā)布指的是樣本鑒定結(jié)果快速發(fā)布到云引擎服務(wù)器,為客戶端提供鑒定結(jié)果查詢。這一實(shí)現(xiàn)方式,大大縮短了互聯(lián)網(wǎng)中新增樣本的識別時間,遠(yuǎn)優(yōu)于傳統(tǒng)殺軟利用病毒庫升級來識別新樣本的傳統(tǒng)模式,其目標(biāo)是做到實(shí)時鑒定,實(shí)時查殺。但是在現(xiàn)有的海量樣本實(shí)時鑒定系統(tǒng)中還存在許多待改善提高的地方,例如,在樣本收集方面,現(xiàn)有技術(shù)中通常采用由客戶端發(fā)現(xiàn)可疑樣本,然后上傳到服務(wù)器進(jìn)行鑒定, 但是,經(jīng)常出現(xiàn)大樣本無法上傳導(dǎo)致上傳失敗,以及上傳效率比較低等問題。
發(fā)明內(nèi)容
本發(fā)明提供了一種樣本收集方法及系統(tǒng),能夠提高樣本收集的效率及成功率。本發(fā)明提供了如下方案—種樣本收集方法,包括當(dāng)客戶端發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中,如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。其中,所述以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳包括按照分片號的順序,向所述管理服務(wù)器發(fā)送樣本上傳請求,所述管理服務(wù)器根據(jù)其他客戶端針對該樣本的各分片的已上傳情況,確定當(dāng)前客戶端是否需要上傳當(dāng)前分片;如果接收到需要上傳的響應(yīng)消息,則將當(dāng)前分片上傳到數(shù)據(jù)服務(wù)器。其中,還包括如果接收到不需要上傳的響應(yīng)消息,則放棄上傳當(dāng)前分片,并向所述管理服務(wù)器發(fā)送上傳其他分片的請求。其中,還包括所述管理服務(wù)器根據(jù)該客戶端的IP地址確定該客戶端需要上傳的數(shù)據(jù)服務(wù)器,并返回給所述客戶端;所述以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳包括以分片為單位向所述需要上傳的數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳。其中,還包括所述管理服務(wù)器將不同客戶端上傳的同一樣本的各個分片路由到同一個組包服務(wù)器,由所述組包服務(wù)器對各個分片進(jìn)行組包。一種樣本收集系統(tǒng),包括樣本發(fā)現(xiàn)單元,用于當(dāng)客戶端發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;樣本分片單元,用于客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;分片上傳單元,用于客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中,如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。其中,所述分片上傳單元包括請求子單元,用于按照分片號的順序,向所述管理服務(wù)器發(fā)送樣本上傳請求,所述管理服務(wù)器根據(jù)其他客戶端針對該樣本的各分片的已上傳情況,確定當(dāng)前客戶端是否需要上傳當(dāng)前分片;上傳子單元,用于如果接收到需要上傳的響應(yīng)消息,則將當(dāng)前分片上傳到數(shù)據(jù)服務(wù)器。其中,還包括放棄上傳單元,用于如果接收到不需要上傳的響應(yīng)消息,則放棄上傳當(dāng)前分片,并向所述管理服務(wù)器發(fā)送上傳其他分片的請求。其中,還包括數(shù)據(jù)服務(wù)器獲知單元,用于所述管理服務(wù)器根據(jù)該客戶端的IP地址確定該客戶端需要上傳的數(shù)據(jù)服務(wù)器,并返回給所述客戶端;所述分片上傳單元具體用于以分片為單位向所述需要上傳的數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳。其中,還包括組包單元,用于所述管理服務(wù)器將不同客戶端上傳的同一樣本的各個分片路由到同一個組包服務(wù)器,由所述組包服務(wù)器對各個分片進(jìn)行組包。根據(jù)本發(fā)明提供的具體實(shí)施例,本發(fā)明公開了以下技術(shù)效果通過本發(fā)明,由于采用了分片及多客戶端并行上傳的機(jī)制,這樣,一方面,由于對樣本進(jìn)行了分片,因此,可以避免由于樣本過大導(dǎo)致的上傳失敗現(xiàn)象,提高上傳的成功率; 另一方面,如果多個客戶端都發(fā)現(xiàn)了同一可疑樣本,則由于多客戶端可以并行上傳該可疑樣本的不同分片,因此,也可以在降低單個客戶端的上傳負(fù)擔(dān)的同時,避免受到一個客戶端上傳帶寬的限制,提高上傳的效率。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例提供的方法的流程圖;圖2是本發(fā)明實(shí)施例提供的裝置的示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),現(xiàn)有技術(shù)中之所以會存在樣本上傳成功率及效率低的問題,是因?yàn)椋砂l(fā)現(xiàn)可疑樣本的客戶端直接將整個樣本上傳到服務(wù)器,這樣, 如果一個樣本太大,而客戶端可以使用的上傳帶寬比較小的話,就可能導(dǎo)致上傳失敗,另外,僅使用一個客戶端進(jìn)行同一個樣本的上傳,也會使得該客戶端的上傳負(fù)擔(dān)比較重,也將導(dǎo)致上傳的速度很慢。因此,在本發(fā)明實(shí)施例中,采用分片及多客戶端并行上傳的機(jī)制,這樣,一方面,由于對樣本進(jìn)行了分片,因此,可以避免由于樣本過大導(dǎo)致的上傳失敗現(xiàn)象,提高上傳的成功率;另一方面,如果多個客戶端都發(fā)現(xiàn)了同一可疑樣本,則由于多客戶端可以并行上傳該可疑樣本的不同分片,因此,也可以在降低單個客戶端的上傳負(fù)擔(dān)的同時,避免受到一個客戶端上傳帶寬的限制,提高上傳的效率。具體實(shí)現(xiàn)時,參見圖1,本發(fā)明實(shí)施例提供的樣本收集方法包括以下步驟SlOl 當(dāng)發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;在本發(fā)明實(shí)施例中,仍然采取由客戶端發(fā)現(xiàn)可疑樣本,然后上傳到服務(wù)器的方式進(jìn)行樣本收集,但是為了實(shí)現(xiàn)前述分片及多客戶端并行上傳,并不是由客戶端直接將上傳請求發(fā)送到數(shù)據(jù)服務(wù)器,而是首先由一個管理服務(wù)器(可以稱為Token管理服務(wù)器)接收客戶端的上傳請求。其中,客戶端的上傳請求中可以包括待上傳樣本的大小、文件名等信息,管理服務(wù)器的作用就是根據(jù)待上傳文件的大小等參數(shù),確定該樣本的分片策略,也即分為多少個分片,每個分片的大小,等等。當(dāng)然,在實(shí)際應(yīng)用中,由于數(shù)據(jù)服務(wù)器會在多個,分布在不同的物理區(qū)域,相應(yīng)的,客戶端也是分布在不同的物理區(qū)域,一般而言,如果客戶端能夠?qū)⒆约旱臄?shù)據(jù)就近發(fā)送到自己所在區(qū)域部署的服務(wù)器,則可以獲得更大的上傳速率。因此,在本發(fā)明實(shí)施例中,客戶端的上傳請求中還可以包括客戶端的IP地址,這樣,管理服務(wù)器就可以根據(jù)客戶端的IP地址,為該客戶端分配距離最近的數(shù)據(jù)服務(wù)器,客戶端在上傳具體的數(shù)據(jù)時,就可以向該分配的數(shù)據(jù)服務(wù)器上傳。具體實(shí)現(xiàn)時,可以根據(jù)客戶端上傳的IP地址,來比對IP庫從而確定客戶端所在的地域,然后再根據(jù)該地域的數(shù)據(jù)服務(wù)器部署情況,為用戶選擇合適的服務(wù)器。當(dāng)然,在實(shí)際應(yīng)用中,除了依據(jù)客戶端的IP地址之外,還額可以根據(jù)根據(jù)客戶端的帶寬狀況等等綜合考慮,為客戶端選擇最好的數(shù)據(jù)服務(wù)器。
需要說明的是,客戶端發(fā)現(xiàn)可疑樣本的方法可以參照現(xiàn)有技術(shù)中的實(shí)現(xiàn)方式,例如,當(dāng)客戶端的各個產(chǎn)品無論是掃描還是主動觸發(fā)的時候,都發(fā)現(xiàn)某個樣本在服務(wù)端的樣本庫中沒有收集,則會將該其作為一個可疑樣本,并發(fā)起上傳請求。S102 客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;客戶端在接收到管理服務(wù)器的分片策略之后,就可以對待上傳的樣本進(jìn)行分片, 同時,還可以為各個分片分配分片號(具體如何編號也可以包含在分片策略中)。分片之后,每一片仍采用原來的數(shù)據(jù)格式,且可以保留原樣本的標(biāo)識符,但只包含原樣本的部分?jǐn)?shù)據(jù)。并且,一旦完成分片后,每個分片就都可以作為獨(dú)立的數(shù)據(jù)傳輸單元進(jìn)行傳送。其中, 具體的分片方法可以采用已有技術(shù)中的方法來實(shí)現(xiàn),這里不再詳述。S103 客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中,如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。客戶端在完成分片之后,就可以以分片為單位進(jìn)行樣本的上傳,并且,由于可能有多個客戶端都發(fā)現(xiàn)了同一樣本,因此,就可以由這些客戶端分別上傳一部分分片,這樣就可以避免一個客戶端的上傳任務(wù)過重,并且由于可以多個客戶端可以并行上傳,因此,上傳的效率就可以得到大幅的提高。其中,客戶端在上傳各個分片時,可以按照分片號的順序,向管理服務(wù)器發(fā)送樣本上傳請求,管理服務(wù)器根據(jù)其他客戶端針對該樣本的各分片的已上傳情況,確定當(dāng)前客戶端是否需要上傳當(dāng)前分片;如果需要,則向客戶端發(fā)出需要上傳的指示,客戶端接收到需要上傳的響應(yīng)消息,則將當(dāng)前分片上傳到數(shù)據(jù)服務(wù)器,否則,就可以不必上傳該分片。例如,假設(shè)某樣本被分為3個分片,當(dāng)某客戶端A請求上傳其中的分片1時,如果已經(jīng)有其他客戶端上傳了該分片,或者有其他客戶端正在上傳在分片,那么管理服務(wù)器就可以指示該客戶端A不需要上傳該分片;客戶端A在接收到該指令之后,就可以放棄對分片 1的上傳請求,繼而向管理服務(wù)器發(fā)出上傳分片2的請求。否則,如果在接收到客戶端A上傳分片1的請求時,分片1尚未上傳到數(shù)據(jù)服務(wù)器,也沒有其他客戶端正在上傳該分片1,那么管理服務(wù)器就會向客戶端A發(fā)出上傳該分片的指令,客戶端A接收到該指令之后,就可以上傳該分片1 ;待完成分片1的上傳之后,再向管理服務(wù)器發(fā)出上傳分片2的請求,以此類推。需要說明的是,針對同一待上傳樣本,管理服務(wù)器分配的分片策略是相同的。也就是說,假設(shè)有三個客戶端都發(fā)現(xiàn)了上述例子中的樣本,則向這三個客戶端發(fā)送的分片策略都應(yīng)該是分成三個分片,并且每個分片的大小及編號等在各個客戶端之間都是一致的。當(dāng)然,另外需要說明的是,在實(shí)際應(yīng)用中,各個客戶端并不一定是同一時刻發(fā)現(xiàn)同一樣本,而是存在時間上的先后性,但是使用前述方式進(jìn)行每個分片的上傳時,并不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。例如,客戶端A最先發(fā)現(xiàn)了某樣本,在根據(jù)管理服務(wù)器的策略對樣本進(jìn)行分片之后,首先將分片1上傳到數(shù)據(jù)服務(wù)器;就在客戶端A上傳分片1的過程中,客戶端B也發(fā)現(xiàn)了該樣本,管理服務(wù)器同樣指示該客戶端B按照同樣的策略對樣本進(jìn)行分片,并且客戶端B 在發(fā)起上傳分片1的請求時,管理服務(wù)器就可以指示該客戶端B不必上傳該分片1,于是客戶端B再向管理服務(wù)器發(fā)起上傳分片2的請求,如果在此之前還沒有其他客戶端上傳該分片2,就可以指示該客戶端B可以上傳該分片2,于是客戶端B就可以開始上傳該分片2,以此類推。需要說明的是,由于在上傳的過程中已經(jīng)對樣本進(jìn)行了分片,因此,在服務(wù)器側(cè)還需要再對各個分片進(jìn)行組包,以得到完整的樣本。而在本發(fā)明實(shí)施例中,由于同一樣本的不同分片可能是由不同的客戶端上傳的,而根據(jù)各個客戶端所處的地理位置的不同,管理服務(wù)器針對不同的客戶端選擇的數(shù)據(jù)服務(wù)器可能是不同的,這樣,同一樣本的不同分片可能被上傳的不同的數(shù)據(jù)服務(wù)器上去。針對這種情況,還可以首先將不同客戶端上傳的同一樣本的各個分片路由到同一個組包服務(wù)器,然后由組包服務(wù)器對各個分片進(jìn)行組包。具體實(shí)現(xiàn)時,數(shù)據(jù)服務(wù)器(相當(dāng)于是上傳接收機(jī))可以是個集群,每個數(shù)據(jù)服務(wù)器都可以接收分片上傳,分片上傳到數(shù)據(jù)服務(wù)器之后,可以由分片分發(fā)進(jìn)程把各個分片路由到組包集群上。具體的,這個進(jìn)程可以先去請求一下調(diào)度中心,得到該分片應(yīng)該去哪個組包服務(wù)器,調(diào)度中心根據(jù)樣本的md5 (Message Digest Algorithm,消息摘要算法第五版,是計(jì)算機(jī)安全領(lǐng)域廣泛使用的一種散列函數(shù),用以提供消息的完整性保護(hù))給分發(fā)進(jìn)程分配一個合適的組包服務(wù)器,每個組包服務(wù)器都會起動一個組包worker等待組包,這樣同一樣本的所有分片就會落在同一臺組包服務(wù)器中。需要說明的是,本發(fā)明實(shí)施例所述的數(shù)據(jù)服務(wù)器、組包服務(wù)器可以是物理上相互獨(dú)立的機(jī)器,也可以使用同一機(jī)器中提供不同的服務(wù),本發(fā)明實(shí)施例在描述時重點(diǎn)突出功能性,但并不能看作是對本發(fā)明的限制。其中,上述的調(diào)度中心可以用來監(jiān)控組包機(jī)器的狀態(tài),該調(diào)度中心是冗余的,可以熱切;當(dāng)一個分片請求調(diào)度中心時候,可以根據(jù)樣本的md5,通過hash算法找到相應(yīng)的組包服務(wù)器,當(dāng)某臺組包服務(wù)器失效時候,調(diào)度中心會檢測到該組包服務(wù)器失效,并把狀態(tài)置為無效,同時選擇一臺備份機(jī)器頂替掉失效的機(jī)器。通過這種機(jī)制,可以提高系統(tǒng)的容錯能力,保證組包服務(wù)的可靠運(yùn)行??傊?,在本發(fā)明實(shí)施例中,由于采用了分片及多客戶端并行上傳的機(jī)制,這樣,一方面,由于對樣本進(jìn)行了分片,因此,可以避免由于樣本過大導(dǎo)致的上傳失敗現(xiàn)象,提高上傳的成功率;另一方面,如果多個客戶端都發(fā)現(xiàn)了同一可疑樣本,則由于多客戶端可以并行上傳該可疑樣本的不同分片,因此,也可以在降低單個客戶端的上傳負(fù)擔(dān)的同時,避免受到一個客戶端上傳帶寬的限制,提高上傳的效率。與本發(fā)明實(shí)施例提供的樣本收集方法相對應(yīng),本發(fā)明實(shí)施例還提供了一種樣本收集系統(tǒng),參見圖2,該系統(tǒng)包括樣本發(fā)現(xiàn)單元201,用于當(dāng)客戶端發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;樣本分片單元202,用于客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;分片上傳單元203,用于客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中, 如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。具體實(shí)現(xiàn)時,分片上傳單元203可以包括請求子單元,用于按照分片號的順序,向所述管理服務(wù)器發(fā)送樣本上傳請求,所述管理服務(wù)器根據(jù)其他客戶端針對該樣本的各分片的已上傳情況,確定當(dāng)前客戶端是否需要上傳當(dāng)前分片;上傳子單元,用于如果接收到需要上傳的響應(yīng)消息,則將當(dāng)前分片上傳到數(shù)據(jù)服務(wù)器。此外,該系統(tǒng)還可以包括放棄上傳單元,用于如果接收到不需要上傳的響應(yīng)消息,則放棄上傳當(dāng)前分片,并向所述管理服務(wù)器發(fā)送上傳其他分片的請求。該系統(tǒng)還可以包括數(shù)據(jù)服務(wù)器獲知單元,用于所述管理服務(wù)器根據(jù)該客戶端的IP地址確定該客戶端需要上傳的數(shù)據(jù)服務(wù)器,并返回給所述客戶端;所述分片上傳單元具體用于以分片為單位向所述需要上傳的數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳。為了在上傳之后得到完成的樣本,該系統(tǒng)還可以包括組包單元,用于所述管理服務(wù)器將不同客戶端上傳的同一樣本的各個分片路由到同一個組包服務(wù)器,由所述組包服務(wù)器對各個分片進(jìn)行組包??傊谏鲜鱿到y(tǒng)中,由于采用了分片及多客戶端并行上傳的機(jī)制,這樣,一方面, 由于對樣本進(jìn)行了分片,因此,可以避免由于樣本過大導(dǎo)致的上傳失敗現(xiàn)象,提高上傳的成功率;另一方面,如果多個客戶端都發(fā)現(xiàn)了同一可疑樣本,則由于多客戶端可以并行上傳該可疑樣本的不同分片,因此,也可以在降低單個客戶端的上傳負(fù)擔(dān)的同時,避免受到一個客戶端上傳帶寬的限制,提高上傳的效率。通過以上的實(shí)施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實(shí)現(xiàn)。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備 (可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例或者實(shí)施例的某些部分所述的方法。本說明書中的各個實(shí)施例均采用遞進(jìn)的方式描述,各個實(shí)施例之間相同相似的部分互相參見即可,每個實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于裝置或系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置及系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實(shí)施。以上對本發(fā)明所提供的一種樣本收集方法及系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種樣本收集方法,其特征在于,包括當(dāng)客戶端發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中,如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳包括按照分片號的順序,向所述管理服務(wù)器發(fā)送樣本上傳請求,所述管理服務(wù)器根據(jù)其他客戶端針對該樣本的各分片的已上傳情況,確定當(dāng)前客戶端是否需要上傳當(dāng)前分片;如果接收到需要上傳的響應(yīng)消息,則將當(dāng)前分片上傳到數(shù)據(jù)服務(wù)器。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括如果接收到不需要上傳的響應(yīng)消息,則放棄上傳當(dāng)前分片,并向所述管理服務(wù)器發(fā)送上傳其他分片的請求。
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,還包括所述管理服務(wù)器根據(jù)該客戶端的IP地址確定該客戶端需要上傳的數(shù)據(jù)服務(wù)器,并返回給所述客戶端;所述以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳包括以分片為單位向所述需要上傳的數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括所述管理服務(wù)器將不同客戶端上傳的同一樣本的各個分片路由到同一個組包服務(wù)器, 由所述組包服務(wù)器對各個分片進(jìn)行組包。
6.一種樣本收集系統(tǒng),其特征在于,包括樣本發(fā)現(xiàn)單元,用于當(dāng)客戶端發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;樣本分片單元,用于客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;分片上傳單元,用于客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中,如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述分片上傳單元包括請求子單元,用于按照分片號的順序,向所述管理服務(wù)器發(fā)送樣本上傳請求,所述管理服務(wù)器根據(jù)其他客戶端針對該樣本的各分片的已上傳情況,確定當(dāng)前客戶端是否需要上傳當(dāng)前分片;上傳子單元,用于如果接收到需要上傳的響應(yīng)消息,則將當(dāng)前分片上傳到數(shù)據(jù)服務(wù)器。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,還包括放棄上傳單元,用于如果接收到不需要上傳的響應(yīng)消息,則放棄上傳當(dāng)前分片,并向所述管理服務(wù)器發(fā)送上傳其他分片的請求。
9.根據(jù)權(quán)利要求6至8任一項(xiàng)所述的系統(tǒng),其特征在于,還包括數(shù)據(jù)服務(wù)器獲知單元,用于所述管理服務(wù)器根據(jù)該客戶端的IP地址確定該客戶端需要上傳的數(shù)據(jù)服務(wù)器,并返回給所述客戶端;所述分片上傳單元具體用于以分片為單位向所述需要上傳的數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,還包括組包單元,用于所述管理服務(wù)器將不同客戶端上傳的同一樣本的各個分片路由到同一個組包服務(wù)器,由所述組包服務(wù)器對各個分片進(jìn)行組包。
全文摘要
本發(fā)明公開了一種樣本收集方法及系統(tǒng),其中,所述方法包括通過本發(fā)明,當(dāng)客戶端發(fā)現(xiàn)待上傳樣本時,向管理服務(wù)器發(fā)送上傳樣本的請求;客戶端根據(jù)管理服務(wù)器返回的分片策略,對所述待上傳樣本進(jìn)行分片;客戶端以分片為單位向數(shù)據(jù)服務(wù)器進(jìn)行樣本上傳;其中,如果不同的客戶端發(fā)現(xiàn)同一待上傳樣本,則由各個客戶端并行上傳該同一待上傳樣本的不同分片。能夠提高樣本收集的效率及成功率。
文檔編號H04L29/12GK102571788SQ20111045699
公開日2012年7月11日 申請日期2011年12月30日 優(yōu)先權(quán)日2011年12月30日
發(fā)明者馮鑫, 李振博, 謝冉 申請人:北京奇虎科技有限公司