專利名稱:智能的備份數(shù)據(jù)分層的制作方法
智能的備份數(shù)據(jù)分層
背景技術(shù):
隨著計(jì)算設(shè)備變得更加普及及其在一般人群中廣泛地使用,此類設(shè)備生成和使用的數(shù)據(jù)量快速地增長。例如,計(jì)算和數(shù)據(jù)存儲技術(shù)的最新進(jìn)步使得甚至形狀系數(shù)最為有限的設(shè)備能夠針對多種大數(shù)據(jù)量的應(yīng)用存儲和處理大量信息,所述應(yīng)用例如是文檔編輯、媒體處理等等。進(jìn)一步,通信技術(shù)方面的近期進(jìn)步可以允許計(jì)算設(shè)備以高速率傳遞數(shù)據(jù)。除了其他的技術(shù)之外,這些進(jìn)步導(dǎo)致可以例如使用位于網(wǎng)絡(luò)上的多個(gè)位置的計(jì)算設(shè)備進(jìn)行的分布式計(jì)算服務(wù)的實(shí)現(xiàn)。此外,這些進(jìn)步允許實(shí)現(xiàn)諸如基于網(wǎng)絡(luò)的備份之類的服務(wù),此類服務(wù)允許計(jì)算設(shè)備用戶在網(wǎng)絡(luò)上的遠(yuǎn)程位置保持與計(jì)算設(shè)備相關(guān)聯(lián)的數(shù)據(jù)的一個(gè)或多個(gè)備份拷貝。現(xiàn)有系統(tǒng)和/或數(shù)據(jù)備份解決方案允許用戶將備份信息保存在與其初始來源分離的位置和/或介質(zhì)中。因此,舉例來說,來自計(jì)算設(shè)備的數(shù)據(jù)可從硬盤驅(qū)動器備份到外部介質(zhì),例如磁帶驅(qū)動器、外部硬盤驅(qū)動器等等。但是,在實(shí)施基于網(wǎng)絡(luò)的備份和/或可用于提供物理上的遠(yuǎn)程位置來存儲備份數(shù)據(jù)的其他解決方案的過程中,與用戶數(shù)據(jù)在用戶機(jī)與遠(yuǎn)程存儲位置之間的傳輸和恢復(fù)相關(guān)聯(lián)的成本及復(fù)雜度有可能在很大程度上限制備份系統(tǒng)的有用性。例如,在其中將備份數(shù)據(jù)保存在遠(yuǎn)程網(wǎng)絡(luò)位置的情況下,與文件和/或系統(tǒng)映像的初始拷貝的各個(gè)版本相關(guān)聯(lián)的數(shù)據(jù)可被傳送至遠(yuǎn)程存儲器,其中稍后可以重獲相應(yīng)版本來進(jìn)行恢復(fù)。但在此類示例中,在網(wǎng)絡(luò)上通常傳送大量數(shù)據(jù),由此消耗昂貴的帶寬。有鑒于上述問題,希望的是實(shí)施效率提升的基于網(wǎng)絡(luò)的備份技術(shù)。
發(fā)明內(nèi)容
以下給出了本創(chuàng)新的簡要概述,以便提供關(guān)于這里描述的一些方面的基本理解。 本概述并不是所要求保護(hù)的主題的詳盡的綜述。其目的既不是識別所要求保護(hù)的主題的關(guān)鍵或決定性要素,也不是描繪主題創(chuàng)新的范圍。它唯一目的在于以簡化的形式給出所要求保護(hù)的主題的一些概念,以此作為稍后給出的更詳細(xì)描述的前序。本主題創(chuàng)新涉及有助于將備份信息智能地分布在基于網(wǎng)絡(luò)的備份架構(gòu)中的存儲位置的系統(tǒng)和/或方法??梢詫?shí)現(xiàn)在備份架構(gòu)中的存儲位置上對備份信息執(zhí)行虛擬分層。 統(tǒng)計(jì)模型用于動態(tài)地在存儲位置和/或?qū)又兄匦路峙鋫浞菪畔ⅲ员愦_保數(shù)據(jù)可用性、恢復(fù)時(shí)的最小延遲以及恢復(fù)時(shí)的最小帶寬使用。可以監(jiān)視備份信息以發(fā)現(xiàn)隨時(shí)間的訪問趨勢。此外,可以監(jiān)視存儲位置以識別健康度、存儲容量、帶寬等等。通過監(jiān)視收集的信息可以應(yīng)用于與訪問模式和/或機(jī)器學(xué)習(xí)機(jī)制相關(guān)的啟發(fā)法,從而將數(shù)據(jù)壽命分解成分發(fā)決定。 在另一個(gè)示例中,可以應(yīng)用機(jī)器學(xué)習(xí)技術(shù)以主動檢測存儲位置中的故障或其他變化,由此可以在故障或其他事故之前相應(yīng)地重新分配備份信息。根據(jù)一個(gè)方面,可以使用一種混合備份架構(gòu),其中備份數(shù)據(jù)可以保持在網(wǎng)絡(luò)或互聯(lián)網(wǎng)(例如“云”)內(nèi)部的全局位置以及一個(gè)或多個(gè)對等點(diǎn)上。相應(yīng)地,一些或所有備份數(shù)據(jù)可以從云或附近的對等點(diǎn)獲取,由此減小與恢復(fù)操作相關(guān)聯(lián)的延遲和帶寬消耗。在一個(gè)示例中,對于用以存儲和/或重獲備份信息的位置的選擇可以基于這樣的因素以一種智能且自動的方式來選擇,所述因素例如但不限于位置的可用性、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、位置資源等等。以下描述和附圖詳細(xì)闡述了所要求保護(hù)的主題的某些說明性方面。但是,這些方面僅僅指示了其中可以使用本創(chuàng)新原理的少量不同方式,并且所要求保護(hù)的主題旨在包含所有這些方面及其等價(jià)物。從以下結(jié)合附圖考慮時(shí)對于本創(chuàng)新的詳細(xì)描述中可以清楚了解要求保護(hù)的主題的其他優(yōu)點(diǎn)和新穎特征。
圖1示出了根據(jù)不同的方面的促進(jìn)使用數(shù)據(jù)在存儲位置上的智能再分發(fā)處理的例示系統(tǒng)的框圖。圖2示出了根據(jù)不同方面的促進(jìn)產(chǎn)生備份信息的例示系統(tǒng)的框圖。圖3示出了根據(jù)一個(gè)或多個(gè)方面的促進(jìn)觀察和分析備份信息及存儲位置的例示系統(tǒng)的框圖。圖4示出了根據(jù)不同方面的促進(jìn)將備份信息智能分發(fā)到存儲位置的例示系統(tǒng)的框圖。圖5示出了可以與這里描述的不同方面結(jié)合使用的例示網(wǎng)絡(luò)架構(gòu)的框圖。圖6示出了根據(jù)不同方面的促進(jìn)在混合的基于云及點(diǎn)對點(diǎn)的備份架構(gòu)中實(shí)施恢復(fù)處理的例示系統(tǒng)的框圖。圖7示出了根據(jù)不同方面的用于在一個(gè)或多個(gè)存儲節(jié)點(diǎn)上實(shí)施的數(shù)據(jù)層中重新分配數(shù)據(jù)的例示方法。圖8示出了根據(jù)不同方面的用于基于數(shù)據(jù)的使用信息來重新分配備份數(shù)據(jù)的例示方法。圖9示出了其中可以使用所要求保護(hù)的主題的新穎方面的例示聯(lián)網(wǎng)環(huán)境。圖10示出了根據(jù)所要求保護(hù)的主題而可以使用的例示操作環(huán)境。
具體實(shí)施例方式所要求保護(hù)的主題參考附圖來描述,其中相同的參考數(shù)字始終用于標(biāo)引相同的要素。在后續(xù)描述中,出于說明目的而對眾多的具體細(xì)節(jié)進(jìn)行了闡述,以便提供關(guān)于主題創(chuàng)新的全面理解。然而可能明顯的是,所要求保護(hù)的主題可以在沒有這些具體細(xì)節(jié)的情況下實(shí)施。在其他實(shí)例中,眾所周知的結(jié)構(gòu)和設(shè)備以框圖形式示出,以便幫助描述該主題創(chuàng)新。這里使用的術(shù)語“組件”、“系統(tǒng)”、“數(shù)據(jù)存儲器”、“云”、“對等點(diǎn)”、“超級對等點(diǎn)”、 “客戶端”等等旨在引用計(jì)算機(jī)相關(guān)的實(shí)體,該實(shí)體為硬件、硬件上執(zhí)行的軟件和/或固件。 例如,組件可以是在處理器上運(yùn)行的進(jìn)程、對象、可執(zhí)行文件、程序、函數(shù)、庫、子例程和/或計(jì)算機(jī)或是軟硬件組合。作為例證,在服務(wù)器上運(yùn)行的應(yīng)用和服務(wù)器都可以是組件。一個(gè)或多個(gè)組件可以駐留在進(jìn)程內(nèi)部,并且組件可被局部化在一個(gè)計(jì)算機(jī)上和/或分布在兩個(gè)或更多計(jì)算機(jī)之間。不同的方面將會依照系統(tǒng)來描述,所述系統(tǒng)可以包括多個(gè)組件、模塊等等。應(yīng)該理解和意識到的是,不同的系統(tǒng)可以包括附加組件、模塊等等,和/或可以不包括結(jié)合附圖討論的所有組件、模塊等等。也可以使用這些方法的組合。這里公開的不同方面可以在包含使用了觸摸屏顯示技術(shù)和/或鼠標(biāo)鍵盤類型的接口的設(shè)備的電氣設(shè)備上執(zhí)行。此類設(shè)備的示例包括計(jì)算機(jī)(臺式和移動式)、智能電話、個(gè)人數(shù)字助理(PDA)以及其他的有線和無線電子設(shè)備。此外,所要求保護(hù)的主題可以作為使用了標(biāo)準(zhǔn)的編程和/或工程技術(shù)的方法、設(shè)備或是制品來實(shí)施,以便產(chǎn)生軟件、固件、硬件或是其任何組合,從而控制計(jì)算機(jī)來實(shí)施所公開的主題。這里使用的術(shù)語“制品”旨在包含可以從任何計(jì)算機(jī)可讀的設(shè)備、載體或介質(zhì)訪問的計(jì)算機(jī)程序。例如,所述計(jì)算機(jī)可讀介質(zhì)可以包括但不局限于磁性存儲設(shè)備(例如硬盤、軟盤、磁條……)、光盤(例如緊湊型碟片(⑶)、數(shù)字多用途碟片(DVD)……)、智能卡以及閃存設(shè)備(例如卡、記憶棒、鍵驅(qū)動器……)。另外還應(yīng)該理解,載波可以用于承載計(jì)算機(jī)可讀的電子數(shù)據(jù),例如在傳送和接收電子郵件的過程中或是在訪問諸如因特網(wǎng)或局域網(wǎng) (LAN)之類的網(wǎng)絡(luò)的過程中使用的電子數(shù)據(jù)。當(dāng)然,本領(lǐng)域技術(shù)人員將會認(rèn)識到,在不脫離所要求保護(hù)的主題的范圍或精神的情況下,可以對該配置做出眾多修改。此外,這里使用的單詞“例示”意味著充當(dāng)示例、實(shí)例或例證。在這里被描述成“例示”的任何方面或設(shè)計(jì)沒有必要被理解成是相對于其他的方面或設(shè)計(jì)是優(yōu)選的或有利的。 相反,使用單詞“例示”旨在以一種具體的形式公開概念。本申請中使用的術(shù)語“或”旨在表示包容性的“或”而不是排他性的“或”。換言之,除非以別的方式加以規(guī)定或者從上下文中可以清楚了解,否則“X使用A或B”旨在表示任何自然的包容性置換。也就是說,如果X使用了 A ;X使用了 B ;或者X使用了 A和B 二者,那么在前述任一實(shí)例中均滿足“X使用A或 B”。此外,,除非以別的方式加以規(guī)定或者從上下文中可以清楚理解其指示的單數(shù)形式,否則本申請和附加權(quán)利要求中使用的冠詞“一”通常應(yīng)被解釋成是指“一個(gè)或多個(gè)”。現(xiàn)在轉(zhuǎn)到附圖,圖1示出了根據(jù)不同方面的促進(jìn)使用數(shù)據(jù)在存儲位置上的智能再分發(fā)處理的系統(tǒng)100。在一個(gè)示例中,系統(tǒng)100可以用于在實(shí)施系統(tǒng)100或是以別的方式與系統(tǒng)100相關(guān)聯(lián)的客戶機(jī)上備份文件、系統(tǒng)映像和/或其他數(shù)據(jù)。在一個(gè)方面中,客戶機(jī)可以是個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、服務(wù)器、便攜式數(shù)字助理(PDA)、移動設(shè)備、智能電話、手機(jī)、便攜式游戲設(shè)備、媒體播放器或是其他任何可以存儲、操縱和/或傳送數(shù)據(jù)的適當(dāng)計(jì)算設(shè)備。根據(jù)一個(gè)方面,系統(tǒng)100可以與基于網(wǎng)絡(luò)或在線的備份解決方案(例如在下文中進(jìn)一步詳述的云備份系統(tǒng))結(jié)合使用,所述解決方案將來自客戶機(jī)的備份信息保存在與客戶機(jī)相關(guān)聯(lián)的網(wǎng)絡(luò)或互聯(lián)網(wǎng)絡(luò)上的一個(gè)或多個(gè)遠(yuǎn)程存儲位置。常規(guī)的在線備份解決方案通過在不同時(shí)間點(diǎn)將獲取自備份客戶端的一組文件保持在遠(yuǎn)程存儲位置而工作。隨后,恢復(fù)處理可以通過根據(jù)請求而從存儲位置重獲一個(gè)或多個(gè)文件來實(shí)施。隨著數(shù)據(jù)和系統(tǒng)大小的增長,在傳輸備份數(shù)據(jù)的過程中節(jié)約空間以及節(jié)約帶寬的必要性類似地增長。雖然取消重復(fù)記錄數(shù)據(jù)塊和/或單個(gè)實(shí)例文件允許實(shí)現(xiàn)更有效的存儲使用率,但是可以實(shí)施附加的優(yōu)化。例如,可以實(shí)施如下優(yōu)化降低存儲成本、降低與在位置網(wǎng)絡(luò)周圍傳輸數(shù)據(jù)相關(guān)聯(lián)的帶寬成本,以及減小與數(shù)據(jù)恢復(fù)相關(guān)聯(lián)的延遲??梢圆捎米赃m應(yīng)和/或主動機(jī)制,其幫助構(gòu)造和維持?jǐn)?shù)據(jù)的虛擬層或?qū)蛹?。這些數(shù)據(jù)層級可以是智能分布的,以及持續(xù)調(diào)整以確保最優(yōu)的放置。例如,可以監(jiān)視數(shù)據(jù)和/或存儲位置以允許動態(tài)地重新分配數(shù)據(jù),以便在減小存儲成本、恢復(fù)時(shí)的延遲以及恢復(fù)的帶寬的同時(shí)確保數(shù)據(jù)可用性。相應(yīng)地,為了提供增長的可用性以及減少資源使用和恢復(fù)成本,在一種分布式備份解決方案中,系統(tǒng)100可以智能地將數(shù)據(jù)分層。更具體地說,當(dāng)客戶機(jī)上的用戶選擇部分?jǐn)?shù)據(jù)(例如文件、系統(tǒng)映像等等)進(jìn)行備份時(shí),監(jiān)視組件102可以開始評估這部分?jǐn)?shù)據(jù)。此外, 監(jiān)視組件102持續(xù)評估并且跟蹤存儲位置106上存儲的其他備份數(shù)據(jù)的屬性。在一個(gè)示例中,監(jiān)視組件102觀察備份數(shù)據(jù)的訪問頻率和/或從生成備份數(shù)據(jù)時(shí)起經(jīng)過的時(shí)間。在另一個(gè)示例中,監(jiān)視組件102可以跟蹤備份數(shù)據(jù)的可用性。例如,監(jiān)視組件102可以觀察分散在存儲位置106的部分備份數(shù)據(jù)的副本數(shù)量。根據(jù)另一個(gè)方面,監(jiān)視組件102可以監(jiān)視存儲位置106以跟蹤屬性。例如,屬性可以包括各個(gè)存儲位置的健康度、存儲位置的存儲容量(例如總的和/或可用的容量)、存儲位置的可用性(例如停機(jī)時(shí)間、正常運(yùn)行時(shí)間等等)、存儲位置的帶寬使用情況或是用于各個(gè)存儲位置之間的數(shù)據(jù)傳輸?shù)念A(yù)測延遲時(shí)間。這些關(guān)于存儲位置的信息可以促進(jìn)主動的備份數(shù)據(jù)再分配處理和/或基于存儲位置變化的自適應(yīng)分發(fā)處理。根據(jù)另一個(gè)方面,分層組件104可以用于實(shí)施備份數(shù)據(jù)在存儲位置106上的虛擬分層。在一個(gè)示例中,分層組件104可以使用啟發(fā)式方法、機(jī)器學(xué)習(xí)和/或其他適當(dāng)?shù)娜斯ぶ悄芗夹g(shù)來對備份數(shù)據(jù)進(jìn)行分層。在另一個(gè)示例中,虛擬層可以相對于原始位置(例如恢復(fù)客戶機(jī))構(gòu)造,由此備份數(shù)據(jù)的局部性(locality)將被列入優(yōu)先地位。例如,被頻繁訪問并且較新的(例如由監(jiān)視組件102確定的)備份數(shù)據(jù)可以被保存在更接近網(wǎng)絡(luò)上的恢復(fù)客戶機(jī)的存儲位置,以便減小與恢復(fù)相關(guān)聯(lián)的延遲。較早和/或不頻繁訪問的備份數(shù)據(jù)則可以被保存在更遠(yuǎn)但卻提供更為廉價(jià)或更豐富的存儲容量的存儲位置(例如云)。在另一個(gè)方面中,應(yīng)該理解的是,分層組件104可以強(qiáng)調(diào)最有可能被訪問或恢復(fù)的數(shù)據(jù)(例如最近生成或是被頻繁訪問的備份數(shù)據(jù))的可用性。例如,除了減小延遲時(shí)間和帶寬之外,分層組件104 可以在具有大量存儲器的遠(yuǎn)程位置存儲有可能被恢復(fù)的數(shù)據(jù)的拷貝。由此,即便具有最佳局部性的存儲位置變得不可用,備份數(shù)據(jù)也可以保持可用。應(yīng)該理解的是,分層組件104可以控制保存在次最優(yōu)位置的拷貝的數(shù)量,以便平衡存儲成本與可用性。在另一個(gè)方面中,分層組件104可以主動重新分配備份數(shù)據(jù)。例如,監(jiān)視組件102 監(jiān)視存儲位置來檢測出客戶機(jī)正在遭遇到嚴(yán)重故障或是迫近的重大故障的威脅。作為響應(yīng),分層組件104可以將恢復(fù)客戶機(jī)所需要的數(shù)據(jù)重新分配到虛擬層內(nèi)部的存儲位置,以便提供最佳局部性以及減小客戶機(jī)恢復(fù)時(shí)的恢復(fù)延遲。在另一個(gè)示例中,分層組件104可以使用監(jiān)視組件102收集的信息。分層組件104 可以將備份數(shù)據(jù)指定成熱數(shù)據(jù)或冷數(shù)據(jù)。熱數(shù)據(jù)指的是被頻繁訪問和/或最近產(chǎn)生的備份數(shù)據(jù)(例如最近備份的數(shù)據(jù))。分層組件104可以斷定熱數(shù)據(jù)更有可能恢復(fù),并且相應(yīng)地將此類數(shù)據(jù)分配到與最近地點(diǎn)、最小恢復(fù)延遲和/或最高可用性相對應(yīng)的層。相比之下,冷數(shù)據(jù)可以是指很少訪問和/或較老的備份信息。分層組件104可以斷定冷數(shù)據(jù)不太可能恢復(fù), 并且將此類數(shù)據(jù)分發(fā)到局部性方面次優(yōu)但卻提供廉價(jià)存儲器的位置。應(yīng)該理解的是,系統(tǒng)100可以包括任何提供了不同適配器、連接器、信道、通信路徑等等的適當(dāng)和/或必要的接口組件(未顯示),以便將監(jiān)視組件102和分層組件104集成在幾乎任何應(yīng)用、一個(gè)或多個(gè)操作和/或數(shù)據(jù)庫系統(tǒng)中和/或彼此集成。此外,接口組件可以提供各種適配器、連接器、信道、通信路徑等等,其提供與監(jiān)視組件102、分層組件104、存儲位置106和/或與系統(tǒng)100相關(guān)聯(lián)的其他任何組件的交互以及它們之間的交互?,F(xiàn)在轉(zhuǎn)到圖2,該圖示出了根據(jù)不同方面的用于生成備份信息的系統(tǒng)200。如圖2 所示,系統(tǒng)200可以包括備份組件202,該組件可以生成和幫助存儲文件、系統(tǒng)快照和/或與備份客戶機(jī)相關(guān)聯(lián)的其他信息的備份拷貝。在一個(gè)示例中,備份組件202可以駐留在所要備份的客戶端信息所在的機(jī)器上和/或在該機(jī)器上工作。作為補(bǔ)充或替換,備份組件202可以駐留在不同的計(jì)算設(shè)備上(例如作為遠(yuǎn)程執(zhí)行的組件)。在一個(gè)示例中,備份組件202可以用于以規(guī)則的時(shí)間間隔、在觸發(fā)一個(gè)或多個(gè)事件(例如文件修改)的時(shí)候和/或根據(jù)其他任何適當(dāng)?shù)募せ钜?guī)則來備份一組文件和/或其他信息。根據(jù)一個(gè)方面,備份組件202可以以一種遞增的方式來實(shí)施文件備份,以便減小實(shí)施系統(tǒng)200所需要的帶寬和/或存儲空間量。舉例來說,這種處理可以通過先使用分段組件204將所要備份的文件劃分成各個(gè)文件分段(例如塊、組塊等等)來實(shí)施。在一個(gè)示例中,文件的分段或分塊可以由分段組件212以一種促進(jìn)取消重復(fù)記錄各個(gè)文件分段的方式來執(zhí)行。舉個(gè)例子,在一個(gè)非限制性的具體示例中,分段組件204可以將文件的第一個(gè)版本劃分成一組均勻和/或非均勻的塊。在另一個(gè)示例中,文件版本可以類似地分段,以便識別版本之間的特別的塊。例如,一旦檢測到對文件進(jìn)行了修改,則分段組件204可以以與第一版本分段一致的方式來對文件進(jìn)行重新分段,以使文件中的從第一版本到第二版本的狀態(tài)發(fā)生了變化的任何塊易于被識別。一旦在更新后的文件版本中檢測到特別的塊,則分段組件204可以促進(jìn)遞增存儲與文件以及涉及各個(gè)文件版本之間變化的其他信息相對應(yīng)的新的和/或改變的塊。一旦生成了與文件相對應(yīng)的塊或分段,則可以向分段分發(fā)組件206提供與各個(gè)文件和/或文件更新相對應(yīng)的不同塊。分段分發(fā)組件206轉(zhuǎn)而可以在一個(gè)或多個(gè)存儲位置 106中分發(fā)塊。舉例來說,存儲位置106可以對應(yīng)或關(guān)聯(lián)于本地網(wǎng)絡(luò)中的對等機(jī)器,云存儲服務(wù)和/或基于因特網(wǎng)的另一適當(dāng)存儲位置和/或其他任何存儲點(diǎn)。以下將會進(jìn)一步詳細(xì)地描述用于在網(wǎng)絡(luò)存儲位置中分發(fā)信息的技術(shù)。作為具體的非限制性示例,塊可以被預(yù)先配置成統(tǒng)一的大小(例如4千字節(jié)ab))。但是應(yīng)該理解,任何適當(dāng)?shù)膲K大小都是可以使用的。圖3示出了根據(jù)一個(gè)或多個(gè)方面的促進(jìn)觀察和分析備份信息和存儲位置的系統(tǒng) 300。如圖3所示,系統(tǒng)300可以包括監(jiān)視組件302,該組件可以觀察備份信息和/或存儲位置,以便獲取涉及與存儲位置相關(guān)聯(lián)的屬性、特性或趨勢的數(shù)據(jù)。所獲取的數(shù)據(jù)可以用于促進(jìn)備份數(shù)據(jù)在存儲位置中的智能分發(fā)。此外,響應(yīng)于備份數(shù)據(jù)或存儲位置的變化,所述數(shù)據(jù)可以促進(jìn)數(shù)據(jù)的自適應(yīng)重新分配以及主動移動。根據(jù)一個(gè)方面,監(jiān)視組件102可以包括對存儲位置106保持的備份數(shù)據(jù)進(jìn)行分析的數(shù)據(jù)評估組件302。在一個(gè)示例中,數(shù)據(jù)評估組件302可以監(jiān)視備份數(shù)據(jù)(例如數(shù)據(jù)塊), 以便跟蹤對于各塊的訪問。通過訪問跟蹤,數(shù)據(jù)評估組件302可以確定各個(gè)數(shù)據(jù)塊的訪問頻率。應(yīng)該理解的是,訪問頻率可能跨越各種各樣的時(shí)間段。例如,訪問頻率可以跨越一個(gè)小時(shí)、一天、一周、一個(gè)月等等而表征。此外,訪問頻率可以作為從生成數(shù)據(jù)塊時(shí)開始的總的頻率來提供。在另一個(gè)示例中,數(shù)據(jù)評估組件302可以保持?jǐn)?shù)據(jù)塊的創(chuàng)建時(shí)間。在另一個(gè)方面中,數(shù)據(jù)評估組件302可以監(jiān)視備份數(shù)據(jù)塊的可用性。例如,數(shù)據(jù)評估組件302可以對分布在存儲位置106中的各個(gè)備份數(shù)據(jù)塊的復(fù)制拷貝數(shù)量進(jìn)行計(jì)數(shù)。根據(jù)另一個(gè)方面,監(jiān)視組件102可以包括對存儲位置106進(jìn)行分析的機(jī)器評估組件304。在一個(gè)示例中,機(jī)器評估組件304可以確定存儲位置106的屬性。此外,可以跟蹤存儲位置106的屬性以監(jiān)視隨時(shí)間發(fā)生的變化。這些屬性可以包括各個(gè)存儲位置的健康度、存儲位置的存儲容量(例如總的和/或可用的容量)、存儲位置的可用性(例如停機(jī)時(shí)間、 正常運(yùn)行時(shí)間等等)、存儲位置的帶寬使用情況或是在各個(gè)存儲位置之間傳輸數(shù)據(jù)的預(yù)測延遲時(shí)間。通過監(jiān)視存儲位置106收集的信息可以幫助預(yù)測故障以及主動將備份數(shù)據(jù)移動到相對于發(fā)生故障的機(jī)器具有最佳局部性的地點(diǎn),以便以低延遲實(shí)施有效的恢復(fù)處理。此外,所述信息可以促進(jìn)備份數(shù)據(jù)的最優(yōu)放置,其在減小延遲、存儲成本和帶寬成本的同時(shí)將可用性最大化?,F(xiàn)在轉(zhuǎn)到圖4,該圖示出了根據(jù)不同方面的促進(jìn)將備份信息智能分發(fā)到存儲位置的系統(tǒng)400。根據(jù)一個(gè)方面,系統(tǒng)400可以使用混合的點(diǎn)對點(diǎn)(P2P)和基于云的架構(gòu)。例如, 分層組件104可以在存儲位置106散布或者重新分配備份信息。存儲位置106可以包括一個(gè)或多個(gè)可信對等點(diǎn),例如一個(gè)或多個(gè)對等點(diǎn)402和/或一個(gè)或多個(gè)超級對等點(diǎn)404,以及一個(gè)或多個(gè)云存儲位置406。如系統(tǒng)400中進(jìn)一步示出的那樣,一個(gè)或多個(gè)對等點(diǎn)402、一個(gè)或多個(gè)超級對等點(diǎn)404和/或云存儲器406還可以用來在彼此之間傳遞備份數(shù)據(jù)塊和/ 或其他備份信息。此外,可以理解,分層組件104、系統(tǒng)400的其他任何組件和/或參考先前附圖描述的監(jiān)視組件102還可以與一個(gè)或多個(gè)對等點(diǎn)402、超級對等點(diǎn)404或是關(guān)聯(lián)于云存儲器406的實(shí)體相關(guān)聯(lián)。下文中提供了關(guān)于使用一個(gè)或多個(gè)對等點(diǎn)402、一個(gè)或多個(gè)超級對等點(diǎn)404以及云存儲器406的技術(shù)的進(jìn)一步的細(xì)節(jié),以及關(guān)于此類實(shí)體在混合架構(gòu)內(nèi)部的功能的進(jìn)一步的細(xì)節(jié)。在一個(gè)方面中,分層組件104創(chuàng)建跨越存儲位置106的備份數(shù)據(jù)的虛擬層或?qū)蛹墶?備份數(shù)據(jù)則被分發(fā)到這些層中,以便在減小存儲成本、帶寬成本和恢復(fù)時(shí)的延遲時(shí)間的同時(shí)保持可用性和最佳局部性。分層組件104可以通過將塊(例如備份數(shù)據(jù))分發(fā)到對等點(diǎn) 402、超級對等點(diǎn)404或是云存儲器406中的一個(gè)或多個(gè)來生成虛擬層。分層組件104可以使用來自上文描述的監(jiān)視組件102的監(jiān)視結(jié)果來幫助創(chuàng)建和保持虛擬層。根據(jù)另一個(gè)方面,分層組件404可以包括根據(jù)監(jiān)視結(jié)果而將部分備份數(shù)據(jù)(例如塊、組塊等等)分配到存儲位置106的分發(fā)組件408。在一個(gè)示例中,分發(fā)組件408可以使用訪問頻率和備份數(shù)據(jù)塊的壽命來將所述塊指定成熱數(shù)據(jù)或冷數(shù)據(jù)。熱數(shù)據(jù)指的是被頻繁訪問和/或最近創(chuàng)建的(例如最近備份的)備份數(shù)據(jù)塊,而冷數(shù)據(jù)則是指很少訪問和/或很久以前創(chuàng)建的數(shù)據(jù)。分發(fā)組件408可以將熱數(shù)據(jù)分配給向可能的恢復(fù)機(jī)器(例如對等點(diǎn)402 和/或超級對等點(diǎn)404)提供最佳局部性的存儲位置。冷數(shù)據(jù)則可以置于具有次最佳局部性但卻具有更廉價(jià)的充足存儲器的存儲位置,例如超級對等點(diǎn)404和云存儲器406。在另一個(gè)示例中,分發(fā)組件408可以基于監(jiān)視結(jié)果中提供的備份數(shù)據(jù)可用性來做出分發(fā)決定。例如,熱數(shù)據(jù)可以散布在對等點(diǎn)402中,并且唯一取消重復(fù)記錄的備份數(shù)據(jù)塊 (例如具有很少復(fù)制品的塊)可以在具有高可靠性的位置(例如超級對等點(diǎn)404或云406)生成和存儲的附加復(fù)制品,以便提高可用性。冷數(shù)據(jù)可以在非峰值時(shí)間或間隔時(shí)間逐漸移動到可靠存儲位置,例如云存儲器406。相應(yīng)地,在對等點(diǎn)402或超級對等點(diǎn)404之間可以降低冷數(shù)據(jù)的可用性,以便降低存儲成本。此外,還有可能對冷數(shù)據(jù)施以壓縮技術(shù),以便進(jìn)一步減小存儲足跡。分發(fā)組件408可以根據(jù)從監(jiān)視存儲位置106收集的信息來重新分配數(shù)據(jù)。例如, 可以預(yù)測存儲位置的故障,并且可以相應(yīng)地重新分配備份數(shù)據(jù)。舉例來說,恢復(fù)故障機(jī)器所需要的備份數(shù)據(jù)可被重新分配到對于故障機(jī)器而言具有最佳局部性的位置,以便將恢復(fù)延遲最小化。在另一個(gè)示例中,分發(fā)組件408可以重新分配或重新分發(fā)來自顯示出嚴(yán)重故障指示的存儲位置的備份數(shù)據(jù)。根據(jù)另一個(gè)方面,分層組件104可以包括和/或以其他方式關(guān)聯(lián)于索引組件412, 該索引組件可以保持列出了備份數(shù)據(jù)塊與這些塊分發(fā)至的存儲位置之間的關(guān)系的索引。在一個(gè)示例中,當(dāng)分層組件104實(shí)施涉及備份數(shù)據(jù)塊的分發(fā)和/或復(fù)制決定時(shí),索引組件410 可以添加、刪除和/或修改索引中的每一個(gè)條目。在另一個(gè)示例中,該索引可以與這里表示的備份數(shù)據(jù)一起被分發(fā)給再一個(gè)對等點(diǎn)402、超級對等點(diǎn)404或云存儲器406。應(yīng)該指出的是,在不進(jìn)行限制或喪失一般性的情況下,整個(gè)索引都可以被復(fù)制和保存在一個(gè)或多個(gè)位置,或者可以在多個(gè)位置之間成塊地拆分和分發(fā)該索引。如系統(tǒng)400進(jìn)一步示出的那樣,機(jī)器學(xué)習(xí)和推理(MLR)組件412可用于促進(jìn)智能、 自動地選擇各個(gè)信息的存儲位置。在一個(gè)示例中,MLR組件412可以使用任何適當(dāng)?shù)娜斯ぶ悄?Al)、機(jī)器學(xué)習(xí)和/或本領(lǐng)域公知的一個(gè)或多個(gè)其他算法。本說明書中使用的術(shù)語“智能”指的是基于有關(guān)系統(tǒng)的現(xiàn)有信息來推理或歸納(例如推斷出)系統(tǒng)的當(dāng)前或未來狀態(tài)的能力。人工智能可以用于識別特定的上下文或動作,或者在沒有人為干預(yù)的情況下產(chǎn)生系統(tǒng)特定狀態(tài)的概率分布。人工智能依賴于將高級數(shù)學(xué)算法(例如決策樹、神經(jīng)網(wǎng)絡(luò)、回歸分析、聚類分析、遺傳算法以及加強(qiáng)學(xué)習(xí))應(yīng)用于系統(tǒng)的一組可用數(shù)據(jù)(信息)。例如,可以使用眾多方法中的一種或多種方法來從數(shù)據(jù)中學(xué)習(xí)以及從以這樣構(gòu)造的模型中進(jìn)行推斷,所述模型例如隱式馬爾科夫模型(HMM)以及相關(guān)的原型依賴模型,更為一般的概率圖模型,例如由使用貝葉斯模型分?jǐn)?shù)或近似的結(jié)構(gòu)搜索創(chuàng)建的貝葉斯網(wǎng)絡(luò),線性分類器,例如支持矢量機(jī)(SVM),非線性分類器,例如被稱為“神經(jīng)網(wǎng)絡(luò)”方法論的方法、模糊邏輯方法以及其他那些實(shí)施這里描述的不同自動化方面的方法(執(zhí)行數(shù)據(jù)融合等等)。接下來參考圖5,提供了示出可以結(jié)合這里描述的不同方面使用的例示網(wǎng)絡(luò)實(shí)施方式的圖示500。如圖示500所示,一種網(wǎng)絡(luò)實(shí)施方式可以使用混合的點(diǎn)到點(diǎn)和基于云的結(jié)構(gòu),其中云服務(wù)供應(yīng)商510與一個(gè)或多個(gè)超級對等點(diǎn)520以及一個(gè)或多個(gè)對等點(diǎn)530-540 進(jìn)行交互。根據(jù)一個(gè)方面,云服務(wù)供應(yīng)商510可用于從與一個(gè)或多個(gè)超級對等點(diǎn)520和/或一個(gè)或多個(gè)對等點(diǎn)530-540相關(guān)聯(lián)的網(wǎng)絡(luò)/互聯(lián)網(wǎng)絡(luò)(例如因特網(wǎng))上的給定位置遠(yuǎn)程實(shí)施一個(gè)或多個(gè)計(jì)算服務(wù)。云服務(wù)供應(yīng)商510可以源自一個(gè)位置,或者作為替換,云服務(wù)供應(yīng)商 510可以作為基于因特網(wǎng)的分布式服務(wù)供應(yīng)商來實(shí)施。在一個(gè)示例中,云服務(wù)供應(yīng)商510可用于向關(guān)聯(lián)于云服務(wù)供應(yīng)商510的一個(gè)或多個(gè)對等點(diǎn)520-540提供備份功能。相應(yīng)地,云服務(wù)供應(yīng)商510可以實(shí)施備份服務(wù)512和/或提供相關(guān)聯(lián)的數(shù)據(jù)存儲514。在一個(gè)示例中,數(shù)據(jù)存儲器514可以與超級對等點(diǎn)520處的備份客戶端522和/ 或各個(gè)對等點(diǎn)530或540處的備份客戶端532或542進(jìn)行交互,以便為駐留于各個(gè)對等點(diǎn)實(shí)體520440的數(shù)據(jù)充當(dāng)中心存儲位置。這樣一來,云服務(wù)供應(yīng)商510可以通過數(shù)據(jù)存儲器514來有效地充當(dāng)位于對等點(diǎn)520-540的數(shù)據(jù)的在線“保險(xiǎn)箱”??梢岳斫獾氖牵梢詾槿魏芜m當(dāng)類型的信息實(shí)施備份,所述信息例如文件(例如文檔、照片、音頻、視頻等等)、系統(tǒng)信息等等。作為補(bǔ)充或替換,可以實(shí)施分布式網(wǎng)絡(luò)存儲,由此超級對等點(diǎn)520和/或?qū)Φ赛c(diǎn) 530-540也被配置成包含用于與相關(guān)聯(lián)的本地網(wǎng)絡(luò)上的一個(gè)或多個(gè)機(jī)器相關(guān)聯(lián)的備份數(shù)據(jù)的各個(gè)數(shù)據(jù)存儲器5M、534和/或M4。在另一個(gè)示例中,諸如取消重復(fù)、增量存儲之類的技術(shù)和/或其他適當(dāng)?shù)募夹g(shù)可用于減少處于圖示500所表示的網(wǎng)絡(luò)中的一個(gè)或多個(gè)相應(yīng)實(shí)體處的數(shù)據(jù)存儲器514、5M、534和/或544實(shí)施基于云的備份服務(wù)所需要的存儲空間量。根據(jù)另一個(gè)方面,云服務(wù)提供商510可以與一個(gè)或多個(gè)對等點(diǎn)機(jī)器520、530和/ 或540交互。如圖示500所示,一個(gè)或多個(gè)對等點(diǎn)520可以被指定為超級對等點(diǎn),并且可以用作相關(guān)聯(lián)的本地網(wǎng)絡(luò)中的云服務(wù)提供商510和一個(gè)或多個(gè)其他對等點(diǎn)530-540之間的聯(lián)絡(luò)器。盡管未在圖5中示出,但應(yīng)當(dāng)理解,在認(rèn)為合適的情況下,任何適當(dāng)?shù)膶Φ赛c(diǎn)530和 /或MO以及指定的一個(gè)或多個(gè)超級對等點(diǎn)520都可以與云服務(wù)提供商510直接交互。由此,可以理解的是,云服務(wù)提供商510、超級對等點(diǎn)520和/或?qū)Φ赛c(diǎn)530或540可以在任何適當(dāng)?shù)臅r(shí)間相互通信,以在示圖500中所示的各個(gè)實(shí)體之間同步文件或其他信息。在一個(gè)示例中,超級對等點(diǎn)520可以是內(nèi)容分發(fā)網(wǎng)絡(luò)(⑶N)之類的與對等點(diǎn) 520-540關(guān)聯(lián)的網(wǎng)絡(luò)上的中心實(shí)體、企業(yè)服務(wù)器、家庭服務(wù)器和/或被確定成具有以這里描述的方式充當(dāng)超級對等點(diǎn)的能力的一個(gè)或多個(gè)其他任何適當(dāng)?shù)挠?jì)算設(shè)備。除了標(biāo)準(zhǔn)的對等點(diǎn)功能之外,一個(gè)或多個(gè)超級對等點(diǎn)520還可以負(fù)責(zé)在本地網(wǎng)絡(luò)中的對等點(diǎn)520-540之間收集、分發(fā)和/或標(biāo)引數(shù)據(jù)。例如,超級對等點(diǎn)520可以保持存儲索引526,該索引可以包括與對等點(diǎn)520-540相對應(yīng)的各個(gè)文件和/或文件分段的標(biāo)識,以及指向可以發(fā)現(xiàn)文件或是其分段的網(wǎng)絡(luò)和/或云數(shù)據(jù)存儲器514中的一個(gè)或多個(gè)相應(yīng)位置的一個(gè)或多個(gè)指針。作為替換或補(bǔ)充,舉例來說,通過在指定的非峰值時(shí)段經(jīng)由云上傳組件5 將各個(gè)數(shù)據(jù)上傳至云服務(wù)供應(yīng)商510,超級對等點(diǎn)520可以充當(dāng)其他對等點(diǎn)530-540與云服務(wù)供應(yīng)商510之間的網(wǎng)關(guān)。應(yīng)該理解的是,舉例來說,系統(tǒng)500中示出的數(shù)據(jù)存儲器(例如數(shù)據(jù)存儲器514, 524,534與M4)既可以是易失性存儲器或非易失性存儲器,也可以包括易失性和非易失性存儲器二者。作為例證而不是限制,非易失性存儲器可以包括只讀存儲器(ROM)、可編程 ROM (I3ROM)、電可編程ROM (EPROM)、電可擦除可編程ROM (EEPROM)或閃速存儲器。易失存儲器可以包括充當(dāng)外部緩存的隨機(jī)存取存儲器(RAM)。作為例證而不是限制,RAM以多種形式可用,例如靜態(tài)RAM (SRAM)、動態(tài)RAM (DRAM)、同步DRAM (SDRAM)、雙倍數(shù)據(jù)速率 SDRAM (DDR SDRAM)、增強(qiáng)型 SDRAM (ESDRAM)、同步鏈接 DRAM (SLDRAM)、內(nèi)存總線直接 RAM (RDRAM)、直接內(nèi)存總線動態(tài)RAM (DRDRAM)以及內(nèi)存總線動態(tài)RAM (RDRAM)。本主題系統(tǒng)和方法中的數(shù)據(jù)存儲器旨在不受限制地包含這些以及其他任何適當(dāng)類型的存儲器。此外, 還應(yīng)該理解的是,數(shù)據(jù)存儲器可以是服務(wù)器、數(shù)據(jù)庫、硬盤驅(qū)動器、筆驅(qū)動器、外部硬盤驅(qū)動器、便攜式硬盤驅(qū)動器等等?,F(xiàn)在參考圖6,示出了根據(jù)不同方面的促進(jìn)在混合的基于云及點(diǎn)對點(diǎn)的備份架構(gòu)中實(shí)施恢復(fù)處理的系統(tǒng)600。如系統(tǒng)600所示,可以使用混合的P2P/云備份架構(gòu),其中與一個(gè)或多個(gè)計(jì)算設(shè)備相對應(yīng)的備份信息分布在一個(gè)或多個(gè)對等機(jī)610或620和/或一個(gè)或多個(gè)超級對等機(jī)630以及一個(gè)或多個(gè)云存儲位置640之間。 在一個(gè)示例中,對等機(jī)620可以包括各自的數(shù)據(jù)存儲器622,這些數(shù)據(jù)存儲器可以用于接收和保持與一個(gè)或多個(gè)文件或是各個(gè)文件的增量更新相對應(yīng)的備份信息。例如,保存在數(shù)據(jù)存儲器622中的文件和/或更新(例如備份版本)可以與恢復(fù)對等點(diǎn)610 (例如由版本控制組件102創(chuàng)建以及由分發(fā)組件104分發(fā))相關(guān)聯(lián)。此外,作為補(bǔ)充或替換,恢復(fù)對等點(diǎn)610可以包含用于本地存儲與駐留在恢復(fù)對等點(diǎn)610本地的文件和/或文件版本相對應(yīng)的備份信息的數(shù)據(jù)存儲器616。在另一個(gè)示例中,系統(tǒng)600中的一個(gè)或多個(gè)超級對等點(diǎn)630還可以包括數(shù)據(jù)存儲器632以及目錄634,所述目錄可以提供保存在系統(tǒng)600內(nèi)部的文件版本及其各自位置(例如由編目組件312創(chuàng)建)的總清單。雖然目錄634被示為位于系統(tǒng)600中的超級對等點(diǎn)630, 但是應(yīng)該理解的是,作為補(bǔ)充或替換,一些或所有目錄634可以位于一個(gè)或多個(gè)對等點(diǎn)610 和/或640以及云存儲器640。根據(jù)一個(gè)方面,恢復(fù)對等點(diǎn)610可以包括能夠發(fā)布恢復(fù)請求的恢復(fù)組件614。該恢復(fù)請求可以是用分布在系統(tǒng)600中的先前版本來回退恢復(fù)對等點(diǎn)610所保持的文件版本的請求。在另一個(gè)示例中,該恢復(fù)請求可以是恢復(fù)版本(例如最新的版本、初始版本和/或其間的任何版本)的命令。目錄查找組件612可以從目錄634和/或指向所要恢復(fù)的文件版本的各自位置的其他任何適當(dāng)來源獲取元數(shù)據(jù)?;谀夸洸檎医M件612獲取的位置,恢復(fù)組件614可以從一個(gè)或多個(gè)數(shù)據(jù)存儲器 622、632、642內(nèi)部的文件版本的相應(yīng)位置和/或系統(tǒng)600內(nèi)部的其他任何適當(dāng)?shù)拇鎯ξ恢猛弦肺募姹尽N募姹究梢允俏募w和/或反映出某個(gè)版本與前一個(gè)版本之間的變化的增量組塊。相應(yīng)地,在一個(gè)示例中,恢復(fù)處理可以通過拖曳重新創(chuàng)建預(yù)期版本所必需的增量組塊來實(shí)施。在另一個(gè)示例中,預(yù)期版本的完整再現(xiàn)可被定位和獲取。根據(jù)另一個(gè)示例,系統(tǒng)600的混合P2P/云備份架構(gòu)可用于將在恢復(fù)對等點(diǎn)610 上恢復(fù)一個(gè)或多個(gè)文件版本所需要的延遲和/或帶寬最小化。例如,恢復(fù)組件614可以對系統(tǒng)600進(jìn)行分析,以便促進(jìn)通過系統(tǒng)600而從最小阻力的路徑中拖曳各個(gè)文件版本。由此,舉例來說,如果給定文件版本駐留于對等點(diǎn)620或超級對等點(diǎn)630上的數(shù)據(jù)存儲器622 或632,以及云存儲器640,那么可以優(yōu)選首先從最近的網(wǎng)絡(luò)節(jié)點(diǎn)拖曳所述塊。結(jié)果,對等點(diǎn) 620和/或超級對等點(diǎn)630的優(yōu)先級可以高于云存儲器640,從而將關(guān)聯(lián)于與云存儲器640 通信的延遲和帶寬使用率最小化。此外,恢復(fù)組件614可以分析系統(tǒng)600中的各個(gè)節(jié)點(diǎn)的可用性、相對網(wǎng)絡(luò)負(fù)載和/或其他因素,以便促進(jìn)對用以獲取文件版本的節(jié)點(diǎn)所進(jìn)行的智能選擇。相應(yīng)地,恢復(fù)對等點(diǎn)610可以被配置成首先嘗試從對等機(jī)620或超級對等點(diǎn)630 獲取文件版本,只在具有所需要的文件版本的對等點(diǎn)620和/或630可用的情況下才回退至云存儲器640。在一個(gè)替換示例中,超級對等點(diǎn)630和/或可供恢復(fù)對等點(diǎn)610訪問目錄634的另一個(gè)實(shí)體可以使用類似的網(wǎng)絡(luò)分析,以便從保持目錄634所指示的文件版本的多個(gè)位置中選擇一個(gè)最優(yōu)位置。一旦選擇了所述位置,則隨后可以將一個(gè)或多個(gè)這樣的位置提供給恢復(fù)對等點(diǎn)610。圖7-8示出的是根據(jù)所要求保護(hù)的主題的方法和/或流程圖。為了說明簡單起見, 所述方法作為一系列的動作來描繪和描述。應(yīng)該理解和意識到的是,本主題創(chuàng)新不受所示動作和/或動作順序的限制。例如,這些動作可以按照不同的順序和/或同時(shí)發(fā)生,并且可以與這里并未給出和描述的其他動作一起發(fā)生。此外,并非所示出的所有動作都可能需要用來實(shí)施根據(jù)所要求保護(hù)的主題的方法。另外,本領(lǐng)域技術(shù)人員將會理解并意識到,這些方法可替換地可以借助狀態(tài)圖或事件而被表示成是一系列相互關(guān)聯(lián)的狀態(tài)。此外,還應(yīng)該理解,在下文中以及整個(gè)說明書中公開的方法能夠保存在制品中,以便促進(jìn)將此類方法傳輸和轉(zhuǎn)移到計(jì)算機(jī)。這里使用的術(shù)語制品旨在包含可以從任何計(jì)算機(jī)可讀設(shè)備、載體或介質(zhì)訪問的計(jì)算機(jī)程序。
參考圖7,示出了用于在一個(gè)或多個(gè)存儲節(jié)點(diǎn)實(shí)施的數(shù)據(jù)層中重新分配數(shù)據(jù)的方法700。在參考數(shù)字702,可以跨越存儲節(jié)點(diǎn)創(chuàng)建虛擬備份數(shù)據(jù)層。所述備份數(shù)據(jù)可以是文件、系統(tǒng)映像或是備份系統(tǒng)管理的其他信息。在一個(gè)示例中,該備份系統(tǒng)可以是混合的點(diǎn)到點(diǎn)/云備份系統(tǒng)。在另一個(gè)示例中,虛擬層可以相對于初始位置(例如恢復(fù)客戶機(jī))構(gòu)造, 由此備份數(shù)據(jù)的局部性被列為優(yōu)先地位。在參考數(shù)字704,分析存儲位置。在一個(gè)示例中, 可以監(jiān)視這些存儲位置以發(fā)現(xiàn)屬性。屬性可以包括各個(gè)存儲位置的健康度、存儲位置的存儲容量(例如總的和/或可用的容量)、存儲位置的可用性(例如停機(jī)時(shí)間、運(yùn)行時(shí)間等等)、 存儲位置的帶寬使用情況或是在各個(gè)存儲位置之間傳輸數(shù)據(jù)的預(yù)計(jì)延遲時(shí)間。在參考數(shù)字 706,評估備份數(shù)據(jù)的屬性。這些屬性可以包括訪問頻率、使用期限或可用性(例如副本數(shù)量)。在參考數(shù)字708,可以在存儲位置之間重新分配備份數(shù)據(jù)。在一個(gè)示例中,所述重新分配可以至少部分基于存儲位置和/或備份數(shù)據(jù)的屬性。例如,備份數(shù)據(jù)可以響應(yīng)于某個(gè)存儲位置或其他客戶機(jī)的嚴(yán)重故障的檢測而被轉(zhuǎn)移到具有最佳局部性的地點(diǎn),其中這樣轉(zhuǎn)移的數(shù)據(jù)可以用于恢復(fù)發(fā)生故障的機(jī)器?,F(xiàn)在轉(zhuǎn)到圖8,示出了一種用于基于備份數(shù)據(jù)的使用信息來重新分配備份數(shù)據(jù)的方法800。在參考數(shù)字802,備份數(shù)據(jù)被指定成熱數(shù)據(jù)或冷數(shù)據(jù)。熱數(shù)據(jù)指的是被頻繁訪問和/或最近產(chǎn)生的備份數(shù)據(jù)(例如最近備份的數(shù)據(jù))??梢酝茢喑?,熱數(shù)據(jù)更可能會被恢復(fù)。 冷數(shù)據(jù)指的是很少訪問和/或較老的備份信息??梢酝茢喑?,冷數(shù)據(jù)不太可能會被恢復(fù)。在參考數(shù)字804,熱數(shù)據(jù)的可用性增加。此外,熱數(shù)據(jù)被分發(fā),以便向最有可能恢復(fù)熱數(shù)據(jù)的對等點(diǎn)提供最佳局部性。在一個(gè)示例中,熱數(shù)據(jù)可以保持在混合的點(diǎn)對點(diǎn)/云備份系統(tǒng)的對等點(diǎn)中。此外,可以選擇靠近的網(wǎng)絡(luò)中鄰近于可能恢復(fù)點(diǎn)的對等點(diǎn)來存儲熱數(shù)據(jù)。此外,熱數(shù)據(jù)的復(fù)制拷貝可以保存在諸如超級對等點(diǎn)或云存儲位置之類的可靠存儲位置,以便提高可用性。在參考數(shù)字806,冷數(shù)據(jù)的存儲成本可以降低。根據(jù)一個(gè)示例,冷數(shù)據(jù)可以從對等點(diǎn)轉(zhuǎn)移到超級對等點(diǎn)。此外,保存在超級對等點(diǎn)的冷數(shù)據(jù)可以在非峰值時(shí)間或是可以最小化帶寬使用情況的其他時(shí)段轉(zhuǎn)移到云存儲器。在參考數(shù)字808,壓縮技術(shù)可應(yīng)用于冷數(shù)據(jù), 以便進(jìn)一步減小存儲足跡。為了提供用于實(shí)施所要求保護(hù)的主題的不同方面的附加上下文,圖9-10以及后續(xù)論述旨在將對可以實(shí)施本主題創(chuàng)新的不同方面的適當(dāng)計(jì)算環(huán)境提供簡要的一般描述。例如,在這種適當(dāng)?shù)挠?jì)算環(huán)境中可以實(shí)施諸如對等點(diǎn)和超級對等點(diǎn)之類的客戶機(jī)以及云存儲位置。雖然在上文中已經(jīng)在運(yùn)行于本地計(jì)算機(jī)和/或遠(yuǎn)程計(jì)算機(jī)的計(jì)算機(jī)程序的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述了所要求保護(hù)的主題,但是本領(lǐng)域技術(shù)人員將會認(rèn)識到,本主題創(chuàng)新也可以結(jié)合其他程序模塊來實(shí)施。通常,程序模塊包括執(zhí)行特定任務(wù)和/或?qū)嵤┨囟ǔ橄髷?shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)等等。通常,程序模塊包括執(zhí)行特定任務(wù)或是實(shí)施特定抽象數(shù)據(jù)類型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)等等。此外,本領(lǐng)域技術(shù)人員將會認(rèn)識到,所要求保護(hù)的主題可以使用其他的計(jì)算機(jī)系統(tǒng)配置來實(shí)現(xiàn),包括單處理器或多處理器計(jì)算機(jī)系統(tǒng)、微型計(jì)算機(jī)、大型計(jì)算機(jī)以及個(gè)人計(jì)算機(jī)、手持計(jì)算設(shè)備、基于微處理器的或可編程的消費(fèi)類電子設(shè)備等等,其中每一個(gè)都可操作地耦合到一個(gè)或多個(gè)相關(guān)聯(lián)的設(shè)備。所示出的方面還可以在分布式計(jì)算環(huán)境中實(shí)施,其中某些任務(wù)由通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行。在分布式計(jì)算環(huán)境中,程序模塊可以位于本地和遠(yuǎn)程記憶存儲設(shè)
計(jì)算機(jī)通常包括多種計(jì)算機(jī)可讀介質(zhì)。計(jì)算機(jī)可讀介質(zhì)可以是任何能被計(jì)算機(jī)訪問的可用介質(zhì),并且包括易失性和非易失性介質(zhì)、可拆卸和不可拆卸介質(zhì)。作為示例而不是限制,計(jì)算機(jī)可讀介質(zhì)可以包括計(jì)算機(jī)存儲介質(zhì)和通信介質(zhì)。計(jì)算機(jī)存儲介質(zhì)可以包括在任何方法和技術(shù)中實(shí)施的用于存儲信息的易失性和非易失性、可拆卸和不可拆卸介質(zhì),所述信息可以是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)。計(jì)算機(jī)存儲介質(zhì)包括但不局限于RAM、R0M、EEPR0M、閃速存儲器或其他存儲技術(shù)、CD-ROM、數(shù)字多用途碟片(DVD)或其他光盤存儲器、磁帶盒、磁帶、磁盤存儲器或其他磁存儲設(shè)備或是可以用于存儲預(yù)期信息并能被計(jì)算機(jī)訪問的其他任何介質(zhì)。通信介質(zhì)通常將計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)包含在諸如載波或其他傳輸機(jī)制之類的調(diào)制數(shù)據(jù)信號中,并且包括任何信息遞送介質(zhì)。術(shù)語“調(diào)制數(shù)據(jù)信號”指的是這樣的信號,該信號具有一個(gè)或多個(gè)以將信息編碼在信號中的方式設(shè)置或改變特性。作為例證而不是限制,通信介質(zhì)包括有線介質(zhì),例如有線網(wǎng)絡(luò)或直接有線連接,以及無線介質(zhì),例如聲學(xué)、RF、紅外及其他無線介質(zhì)。此外,在計(jì)算機(jī)可讀介質(zhì)的范圍中還應(yīng)該包含上述任何項(xiàng)的組合?,F(xiàn)在參考圖9,示出了可操作來執(zhí)行所公開的架構(gòu)的例示計(jì)算機(jī)編譯系統(tǒng)的示意性框圖。該系統(tǒng)900包括一個(gè)或多個(gè)客戶端902。所述一個(gè)或多個(gè)客戶端902可以是硬件和/或軟件(例如線程、進(jìn)程、計(jì)算設(shè)備)。在一個(gè)示例中,所述一個(gè)或多個(gè)客戶端902可以使用這里描述的一個(gè)或多個(gè)特征來容納一個(gè)或多個(gè)cookie和/或相關(guān)聯(lián)的上下文信息。系統(tǒng)900還包括一個(gè)或多個(gè)服務(wù)器904。所述一個(gè)或多個(gè)服務(wù)器904也可以是硬件和/或軟件(例如線程、進(jìn)程、計(jì)算設(shè)備)。在一個(gè)示例中,服務(wù)器904可以使用這里描述的一個(gè)或多個(gè)特征來容納執(zhí)行變換的線程。客戶端902與服務(wù)器904之間的一個(gè)可能的通信可以處于適于在兩個(gè)或更多計(jì)算機(jī)進(jìn)程之間傳送的數(shù)據(jù)分組的形式。舉例來說,該數(shù)據(jù)分組可以包括cookie和/或相關(guān)聯(lián)的上下文信息。系統(tǒng)900包括可用于促進(jìn)一個(gè)或多個(gè)客戶端902與一個(gè)或多個(gè)服務(wù)器904之間的通信的通信框架906 (例如諸如因特網(wǎng)之類的全球通信網(wǎng)絡(luò))。通信可以借助有線(包括光纖)和/或無線技術(shù)來促進(jìn)。一個(gè)或多個(gè)客戶端902可操作地連接到一個(gè)或多個(gè)客戶端數(shù)據(jù)存儲器908,這些數(shù)據(jù)存儲器可以用于保存所述一個(gè)或多個(gè)客戶端902本地的信息(例如一個(gè)或多個(gè)cookie和/或相關(guān)聯(lián)的上下文信息)。類似地,一個(gè)或多個(gè)服務(wù)器904可操作地連接到一個(gè)或多個(gè)服務(wù)器數(shù)據(jù)存儲器910,這些數(shù)據(jù)存儲器可以用于存儲服務(wù)器904本地的信息。參考圖10,用于實(shí)施這里描述的不同方面的例示環(huán)境1000包括計(jì)算機(jī)1002,所述計(jì)算機(jī)1002包括處理單元1004、系統(tǒng)存儲器1006以及系統(tǒng)總線1008。系統(tǒng)總線1008與系統(tǒng)組件耦合,這些系統(tǒng)組件包括但不局限于將系統(tǒng)存儲器1006或處理單元1004。處理單元1004可以是商業(yè)上可獲得的不同處理器中的任何一種。雙微處理器和其他多處理器架構(gòu)同樣可以用作處理單元1004。系統(tǒng)總線1008可以是若干類型的總線結(jié)構(gòu)中的任何一種,其還可以互連到存儲總線(有或者沒有存儲控制器)、外圍總線以及使用了商業(yè)上可獲得的總線架構(gòu)中任何一種的本地總線。系統(tǒng)存儲器1006包括只讀存儲器(ROM) 1010和隨機(jī)存取存儲器(RAM) 1012。在諸如ROM、EPROM、EEPROM之類的非易失性存儲器1010中保存了基本輸入/輸出系統(tǒng) (BIOS),所述BIOS包含例如啟動過程中在計(jì)算機(jī)1002內(nèi)部的部件之間幫助傳遞信息的基本例程。RAM 1012還可以包括高速RAM,例如用于緩存數(shù)據(jù)的靜態(tài)RAM。計(jì)算機(jī)1002還包括內(nèi)部硬盤驅(qū)動器(HDD) 1014 (例如EIDE、SATA)、磁性軟盤驅(qū)動器(FDD) 1016 (例如讀寫可拆卸磁盤1018)以及光盤驅(qū)動器1020 (例如讀取⑶-ROM碟片1022或者讀寫DVD之類的其他大容量光學(xué)介質(zhì)),所述內(nèi)部硬盤驅(qū)動器1014還可以被配置成在適當(dāng)機(jī)架(未顯示)中外用。硬盤驅(qū)動器1014、磁盤驅(qū)動器1016以及光盤驅(qū)動器 1020分別可以通過硬盤驅(qū)動器接口 1024、磁盤驅(qū)動器接口 10 以及光盤驅(qū)動器接口 10 與系統(tǒng)總線1008連接。用于外部驅(qū)動器實(shí)施方式的接口 IOM包括通用串行總線(USB)和 IEEE-1394接口技術(shù)中的至少一種或是這二者。其他外部驅(qū)動器連接技術(shù)處于本主題公開的設(shè)想以內(nèi)。驅(qū)動器以及與之關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)對數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、計(jì)算機(jī)可執(zhí)行指令等等提供了非易失性存儲。對計(jì)算機(jī)1002來說,驅(qū)動器和介質(zhì)容納適當(dāng)數(shù)字格式的任何數(shù)據(jù)的存儲。雖然以上關(guān)于計(jì)算機(jī)可讀介質(zhì)的描述涉及HDD、可拆卸磁盤以及CD或DVD之類的可拆卸光學(xué)介質(zhì),但是本領(lǐng)域技術(shù)人員應(yīng)該理解,在例示操作環(huán)境中也可以使用能被計(jì)算機(jī)讀取的其他類型的介質(zhì),例如zip驅(qū)動器、磁帶盒、閃存卡、盒式磁帶等等,并且進(jìn)一步, 任何此類介質(zhì)都可以包括用于執(zhí)行這里描述的方法的計(jì)算機(jī)可執(zhí)行指令。在驅(qū)動器和RAM 1012中可以存儲多個(gè)程序模塊,包括操作系統(tǒng)1030、一個(gè)或多個(gè)應(yīng)用程序1032、其他程序模塊1034以及程序數(shù)據(jù)1036。此外,在RAM 1012中還可以緩存所有或部分的操作系統(tǒng)、應(yīng)用、模塊和/或數(shù)據(jù)。應(yīng)該理解的是,所要求保護(hù)的的主題可以用商業(yè)上可獲得的不同操作系統(tǒng)或操作系統(tǒng)組合來實(shí)現(xiàn)。用戶可以通過一個(gè)或多個(gè)有線/無線輸入設(shè)備來將命令和信息輸入計(jì)算機(jī)1002, 所述輸入設(shè)備例如鍵盤1038以及鼠標(biāo)1040之類的指示設(shè)備。其他輸入設(shè)備(未顯示)可以包括麥克風(fēng)UR遙控器、操縱桿、游戲墊、指示筆、觸摸屏等等。這些以及其他輸入設(shè)備通常經(jīng)由與系統(tǒng)總線1008耦合的輸入設(shè)備接口 1042連接到處理單元1004,但是也可以通過其他接口來連接,其他接口例如并口、串口、IEEE-1394端口、游戲端口、USB端口 JR接口等寸。監(jiān)視器1044或其他類型的顯示設(shè)備同樣經(jīng)由諸如視頻適配器1046之類的接口連接到系統(tǒng)總線1008。除了監(jiān)視器1044之外,計(jì)算機(jī)通常還包括其他外圍輸出設(shè)備(未顯示),例如揚(yáng)聲器、打印機(jī)等等。計(jì)算機(jī)1002可以使用借助有線和/或無線通信連至一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī)(例如一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī)1048)的邏輯連接而在聯(lián)網(wǎng)環(huán)境中工作。所述一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī)1048可以是工作站、服務(wù)器計(jì)算機(jī)、路由器、個(gè)人計(jì)算機(jī)、便攜式計(jì)算機(jī)、基于微處理器的娛樂器具、對等設(shè)備或其他公共網(wǎng)絡(luò)節(jié)點(diǎn),并且通常包含結(jié)合計(jì)算機(jī)1002描述的很多或所有元件,但是為了簡潔起見,只示出了一個(gè)記憶/存儲設(shè)備1050。所描繪的邏輯連接包括與局域網(wǎng)(LAN) 1052和/或廣域網(wǎng)(WAN) 1054之類的更大網(wǎng)絡(luò)相連的有線/無線連接。 這種LAN和WAN聯(lián)網(wǎng)環(huán)境在辦公室和公司中是很常見的,并且促進(jìn)了企業(yè)級計(jì)算機(jī)網(wǎng)絡(luò),例如內(nèi)聯(lián)網(wǎng),所有這些網(wǎng)絡(luò)都可以連接到因特網(wǎng)之類的全球通信網(wǎng)絡(luò)。當(dāng)在LAN聯(lián)網(wǎng)環(huán)境中使用時(shí),計(jì)算機(jī)1002通過有線和/或無線通信網(wǎng)絡(luò)接口或適配器1056連接到本地網(wǎng)絡(luò)1052。該適配器1056可以促進(jìn)與LAN 1052的有線或無線通信, 所述LAN還可以包括部署在其上的無線接入點(diǎn),以便與無線適配器1056進(jìn)行通信。當(dāng)用于WAN聯(lián)網(wǎng)環(huán)境時(shí),計(jì)算機(jī)1002可以包括調(diào)制解調(diào)器1058,或者連接到WAN 1054上的通信服務(wù)器,抑或是具有經(jīng)由WAN 1054來建立通信的其他手段,例如借助因特網(wǎng)。調(diào)制解調(diào)器1058可以是內(nèi)部或外部以及有線或無線設(shè)備,其經(jīng)由串口接口 1042與系統(tǒng)總線1008連接。在聯(lián)網(wǎng)環(huán)境中,結(jié)合計(jì)算機(jī)1002繪出的程序模塊或是其某些部分可以保存在遠(yuǎn)程記憶/存儲設(shè)備1050中。應(yīng)該理解的是,所顯示的網(wǎng)絡(luò)連接是例示性的,并且可以使用在計(jì)算機(jī)之間建立通信鏈路的其他手段。計(jì)算機(jī)1002可操作來與可操作地部署在無線通信中的任何無線設(shè)備或?qū)嶓w進(jìn)行通信,所述設(shè)備或?qū)嶓w例如打印機(jī)、掃描儀、臺式和/或便攜式計(jì)算機(jī)、便攜式數(shù)據(jù)助理、通信衛(wèi)星、與可以無線檢測的標(biāo)簽相關(guān)聯(lián)的任何設(shè)備或位置(例如信息亭、報(bào)攤、休息室)以及電話。這至少包括Wi-Fi和Bluetooth 無線技術(shù)。因此,所述通信可以是與傳統(tǒng)網(wǎng)絡(luò)一樣的預(yù)先定義的結(jié)構(gòu),或者僅僅是至少兩個(gè)設(shè)備之間的特設(shè)通信。Wi-Fi或無線高保真是一種與蜂窩電話中使用的技術(shù)相似的無線技術(shù),該技術(shù)能使設(shè)備在基站范圍以內(nèi)的任何位置發(fā)送和接收數(shù)據(jù)。Wi-Fi網(wǎng)絡(luò)使用了 IEEE-802.il (a、 b、g等等)無線電技術(shù)來提供安全、可靠且快速的無線連接。Wi-Fi網(wǎng)絡(luò)可用于將計(jì)算機(jī)相互連接,將計(jì)算機(jī)連接到因特網(wǎng),以及將其連接到有線網(wǎng)絡(luò)(其使用IEEE-802. 3或以太網(wǎng))。 例如,Wi-Fi網(wǎng)絡(luò)以13Mbps (802. Ila)或54Mbps (802. lib)的數(shù)據(jù)速率工作在未授權(quán)的 2. 4GHz和5GHz的無線電波段中,或者可以與同時(shí)包含這兩個(gè)波段(雙波段)的產(chǎn)品一起工作。因此,使用Wi-Fi無線技術(shù)的網(wǎng)絡(luò)可以提供與IOBaseT有線以太網(wǎng)相似的現(xiàn)實(shí)性能。以上描述包含了所要求保護(hù)的主題的示例。當(dāng)然,不可能為了描述所要求保護(hù)的主題而對組件或方法的每一種能夠想到的組合進(jìn)行描述,但是本領(lǐng)域技術(shù)人員可以認(rèn)識到,眾多進(jìn)一步的組合和置換都是可能的。相應(yīng)地,該詳細(xì)描述旨在包含所有落入附加權(quán)利要求的精神和范圍以內(nèi)的變動、修改和變更。特別地,就上述組件、設(shè)備、電路、系統(tǒng)等等執(zhí)行的不同功能而言,除非另有陳述, 否則,用于描述此類組件的術(shù)語(包括關(guān)于“裝置”的參考)旨在對應(yīng)于任何執(zhí)行了所描述的組件的規(guī)定功能的組件(例如功能等價(jià)物),其中所述組件執(zhí)行在這里示出的例示性方面的功能,即使所述組件在結(jié)構(gòu)上與所公開的結(jié)構(gòu)并不等價(jià)。就此而論,還應(yīng)該認(rèn)識到的是,所描述的方面包含了系統(tǒng)以及具有用于執(zhí)行不同方法的動作和/或事件的計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì)。此外,雖然對照若干實(shí)施方式中的僅僅一個(gè)實(shí)施方式公開了特定的特征,但是此類特征也可以與其他實(shí)施方式的一個(gè)或多個(gè)其他特征結(jié)合,其對任何指定或特定應(yīng)用而言有可能是理想和有利的。此外,就詳細(xì)描述或權(quán)利要求中使用的術(shù)語“包括”和“含有”及其變體而言,這些術(shù)語以與術(shù)語“包含”類似的方式旨在是包含性的。
權(quán)利要求
1.一種促進(jìn)在備份環(huán)境中的一組存儲位置(106)之間智能分配備份數(shù)據(jù)的系統(tǒng) (100),包括與保留計(jì)算機(jī)可執(zhí)行指令的存儲器相耦合的處理器,該處理器執(zhí)行監(jiān)視組件(102),其識別一個(gè)或多個(gè)存儲位置(106)存儲的備份數(shù)據(jù)的至少一個(gè)屬性或所述一個(gè)或多個(gè)存儲位置(106)的屬性;以及分層組件(104),其根據(jù)備份數(shù)據(jù)的屬性或是存儲位置(106)的屬性來實(shí)施跨越所述一個(gè)或多個(gè)存儲位置(106)的虛擬備份數(shù)據(jù)層,所述分層組件(104)在所述一個(gè)或多個(gè)存儲位置(106)之間分發(fā)備份數(shù)據(jù),以便在減少存儲使用和恢復(fù)時(shí)的延遲的同時(shí)確??捎眯?。
2.權(quán)利要求1的系統(tǒng),其中監(jiān)視組件(102)包括數(shù)據(jù)評估組件(302),該數(shù)據(jù)評估組件對備份數(shù)據(jù)進(jìn)行分析,以便確定備份數(shù)據(jù)的屬性。
3.權(quán)利要求1的系統(tǒng),其中監(jiān)視組件(102)包括機(jī)器評估組件(304),該機(jī)器評估組件觀察所述一個(gè)或多個(gè)存儲位置(106),以便確定所述一個(gè)或多個(gè)存儲位置(106)的屬性。
4.權(quán)利要求1的系統(tǒng),其中分層組件(104)包括分發(fā)組件(408),該分發(fā)組件至少部分基于備份數(shù)據(jù)或存儲位置(106)的屬性而將備份數(shù)據(jù)塊復(fù)制到所述一個(gè)或多個(gè)存儲位置 (106)。
5.權(quán)利要求1的系統(tǒng),其中分層組件(104)包括保持索引的索引組件(410),其中該索引包括備份版本與分發(fā)了所述備份版本的存儲位置之間的關(guān)系的列表,并且其中當(dāng)分層組件(104)實(shí)施分發(fā)決定時(shí),所述索引組件(410)執(zhí)行添加、刪除或修改索引中的條目的處理中的至少一個(gè)。
6.權(quán)利要求5的系統(tǒng),其中該索引包括備份版本與分發(fā)了備份版本的存儲位置之間的關(guān)系的列表。
7.權(quán)利要求1的系統(tǒng),其中備份數(shù)據(jù)的屬性包括下列各項(xiàng)中的至少一項(xiàng)備份數(shù)據(jù)的訪問頻率,備份數(shù)據(jù)的可用性,創(chuàng)建備份數(shù)據(jù)時(shí)起經(jīng)過的時(shí)間,其中頻繁訪問的備份數(shù)據(jù)被斷定為最有可能恢復(fù),并且其中很少訪問的備份數(shù)據(jù)被斷定為最不可能被恢復(fù)。
8.權(quán)利要求7的系統(tǒng),其中分層組件(104)將頻繁訪問的數(shù)據(jù)分發(fā)到靠近的網(wǎng)絡(luò)中緊鄰恢復(fù)客戶端的存儲位置。
9.權(quán)利要求7的系統(tǒng),其中分層組件(104)將頻繁訪問數(shù)據(jù)的拷貝復(fù)制到可靠的存儲位置。
10.權(quán)利要求7的系統(tǒng),其中分層組件(104)將不頻繁訪問的備份數(shù)據(jù)分配到提供可靠存儲的遠(yuǎn)程存儲節(jié)點(diǎn)。
11.權(quán)利要求1的系統(tǒng),其中存儲位置(106)的屬性包括各個(gè)存儲位置的健康度,存儲位置的存儲容量,存儲位置的可用性,存儲位置的帶寬使用情況,或者在各個(gè)存儲位置之間傳輸數(shù)據(jù)的預(yù)計(jì)延遲時(shí)間。
12.權(quán)利要求1的系統(tǒng),其中分層組件(104)基于所述一個(gè)或多個(gè)存儲位置的屬性來檢測至少一個(gè)存儲位置或客戶機(jī)的重大故障,并且其中分層組件(104)響應(yīng)于檢測到的重大故障來主動分配備份數(shù)據(jù)。
13.權(quán)利要求1的系統(tǒng),其中所述一個(gè)或多個(gè)存儲位置(106)包括一個(gè)或多個(gè)對等點(diǎn)或云存儲位置,并且其中分層組件(104)通過在與對等點(diǎn)相對應(yīng)的存儲位置應(yīng)用比與云位置相對應(yīng)的存儲位置更高的偏好水平來創(chuàng)建虛擬備份數(shù)據(jù)層。
14.一種用于在分布式備份環(huán)境中對備份信息進(jìn)行智能分層的方法(700),包括 使用執(zhí)行計(jì)算機(jī)可讀存儲介質(zhì)上存儲的計(jì)算機(jī)可執(zhí)行指令的處理器來實(shí)施以下動作創(chuàng)建(702)跨越一組存儲位置的虛擬備份信息層;監(jiān)視(704)備份信息,以便確定備份信息(706)的屬性,這些屬性包括備份信息的訪問頻率、可用性以及存在時(shí)間中的至少一項(xiàng);以及基于備份信息的屬性,在虛擬層中動態(tài)地重新分配(708)備份信息,以便在最小化存儲成本以及恢復(fù)備份信息時(shí)的延遲的同時(shí)確保備份信息的可用性。
15.權(quán)利要求14的方法,還包括基于備份信息的屬性來將備份信息指定(802)成熱數(shù)據(jù)或冷數(shù)據(jù)中的至少一個(gè); 將熱數(shù)據(jù)分配(804)給向恢復(fù)客戶端提供最佳局部性的存儲位置;以及將冷數(shù)據(jù)分配(806 )給以最低成本提供存儲的遠(yuǎn)程存儲位置。
全文摘要
所要求保護(hù)的主題涉及在基于網(wǎng)絡(luò)的備份架構(gòu)中促進(jìn)跨存儲位置的備份信息的智能分布的系統(tǒng)和/或方法。在該備份架構(gòu)中可以實(shí)施跨存儲位置的備份信息的虛擬分層。使用了統(tǒng)計(jì)模型而在存儲位置和/或?qū)又袆討B(tài)地重新分配備份信息,以便確保數(shù)據(jù)可用性、恢復(fù)時(shí)的最小延遲以及恢復(fù)時(shí)的最小帶寬使用率。此外,還可以應(yīng)用探試法或機(jī)器學(xué)習(xí)技術(shù)來主動檢測存儲位置中的故障或其他變化,以便在發(fā)生故障之前相應(yīng)地重新分配備份信息。
文檔編號G06F3/06GK102414673SQ201080018067
公開日2012年4月11日 申請日期2010年4月21日 優(yōu)先權(quán)日2009年4月24日
發(fā)明者E. S. 墨菲 E., D. 梅爾 J. 申請人:微軟公司