亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的制作方法

文檔序號:6496355閱讀:176來源:國知局
向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的制作方法
【專利摘要】一種方法,包括:根據(jù)虛擬卷上的已去重的數(shù)據(jù)形成初始位圖;根據(jù)出現(xiàn)頻率將離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖;根據(jù)修改后的位圖創(chuàng)建物理卷映射;根據(jù)物理卷映射審查在對應(yīng)的原始物理卷上包括的虛擬卷的初始虛擬卷,以確定將初始虛擬卷從其對應(yīng)的原始物理卷移動到不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù);將初始虛擬卷從其對應(yīng)的原始物理卷刪除,并將初始虛擬卷添加到不同原始物理卷,以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射;以及使用修改后的物理卷映射向目標物理介質(zhì)集合寫入修改后的物理卷。
【專利說明】向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明總地涉及去重(de-duplicated)數(shù)據(jù),以及一種向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的方法。
【背景技術(shù)】
[0002]數(shù)據(jù)去重是用于消除或減少冗余數(shù)據(jù)的數(shù)據(jù)存儲方法。具體地,數(shù)據(jù)去重通過用指向單個實例的指針代替相同數(shù)據(jù)的多個實例而允許在存儲介質(zhì)上保留數(shù)據(jù)的一個唯一實例而非相同數(shù)據(jù)的多個實例。在該方面,分析存儲到數(shù)據(jù)去重系統(tǒng)中的數(shù)據(jù)并將其分成“塊”。識別重復(fù)的塊,給予每個唯一塊一數(shù)字簽名以表示具有相同簽名的兩個塊是相同數(shù)據(jù),并且消除重復(fù)的塊。通常,因為數(shù)據(jù)去重系統(tǒng)將包括較大對象的數(shù)據(jù)分為多個單獨塊,因此該系統(tǒng)跟蹤這些單獨塊使得當需要時可以檢索對應(yīng)的較大對象。例如,提供索引或數(shù)據(jù)庫來跟蹤這些塊。
[0003]數(shù)據(jù)去重系統(tǒng)可以在跨越多個存儲卷和存儲池的存儲管理系統(tǒng)中實現(xiàn)。例如,可以通過存儲管理客戶端或數(shù)據(jù)保護代理向存儲管理服務(wù)器發(fā)送數(shù)據(jù)用于存儲。在該方面,存儲管理系統(tǒng)通常在單獨的介質(zhì)上存儲對象的副本,使得可以存儲太大以至于不適合在單個卷上存儲的數(shù)據(jù)集合。可替換地,可以在相同存儲池內(nèi)或在存儲池之間或在不同介質(zhì)之間,諸如在存儲不同數(shù)據(jù)量的盤和磁帶之間,從一個存儲位置向另一存儲位置移動數(shù)據(jù)。

【發(fā)明內(nèi)容】

[0004]許多虛擬卷被存儲在大的、同類存儲池中。通常,存儲器是基于盤的,并且不針對虛擬卷單獨去重而是將虛擬卷作為存儲池的條目的部分而去重。當存在將這些虛擬卷寫出到物理介質(zhì)的需要時,在各項物理介質(zhì)是原始存儲池的大小的一小部分的情況下,可能出現(xiàn)困難。因此,希望具有用于向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的方法和系統(tǒng)。
[0005]在一種改進方法中,步驟包括:根據(jù)虛擬卷上的已去重的數(shù)據(jù)形成初始位圖,虛擬卷上的已去重的數(shù)據(jù)包括全部離散塊;根據(jù)出現(xiàn)頻率將離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖;根據(jù)修改后的位圖創(chuàng)建物理卷映射,物理卷映射將虛擬卷上的已去重的數(shù)據(jù)的每個離散塊與原始物理卷相關(guān)聯(lián),并且所述物理卷映射包括全部原始虛擬卷集合和全部數(shù)據(jù)塊;根據(jù)物理卷映射審查在對應(yīng)的原始物理卷上包括的虛擬卷的初始虛擬卷,以確定將初始虛擬卷從其對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù);將初始虛擬卷從其對應(yīng)的原始物理卷刪除,并將初始虛擬卷添加到不同原始物理卷,以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射;以及使用修改后的物理卷映射向目標物理介質(zhì)集合寫入修改后的物理卷。
[0006]在另一實施例中,僅通過示例的方式,一種物理計算機存儲介質(zhì)包括用于向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的計算機程序產(chǎn)品方法。物理計算機存儲介質(zhì)包括:用于根據(jù)虛擬卷上的已去重的數(shù)據(jù)形成初始位圖的計算機代碼,虛擬卷上的已去重的數(shù)據(jù)包括全部離散塊;用于根據(jù)出現(xiàn)頻率將離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖的計算機代碼;用于根據(jù)修改后的位圖創(chuàng)建物理卷映射的計算機代碼,物理卷映射將虛擬卷上的已去重的數(shù)據(jù)的每個離散塊與原始物理卷相關(guān)聯(lián),并且所述物理卷映射包括全部原始虛擬卷集合和全部數(shù)據(jù)塊;用于根據(jù)物理卷映射審查在對應(yīng)的原始物理卷上包括的虛擬卷的第一虛擬卷,以確定將第一虛擬卷從其對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù)的計算機代碼;用于將第一虛擬卷從其對應(yīng)的原始物理卷刪除,并將第一虛擬卷添加到不同原始物理卷,以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射的計算機代碼;以及用于使用修改后的物理卷映射向目標物理介質(zhì)集合寫入修改后的物理卷的計算機代碼。
【專利附圖】

【附圖說明】
[0007]為了容易地理解本發(fā)明的優(yōu)點,將通過參考在附圖中所示的具體實施例給予上面簡要描述的本發(fā)明的更具體描述。應(yīng)理解這些附圖僅描繪本發(fā)明的典型實施例并且因此不被認為限制本發(fā)明的范圍,通過使用附圖將以額外的特征和細節(jié)描述和解釋本發(fā)明,其中:
[0008]圖1是根據(jù)實施例的數(shù)據(jù)存儲系統(tǒng)的框圖;以及
[0009]圖2A是根據(jù)實施例的與數(shù)據(jù)存儲介質(zhì)通信的存儲控制器的示意圖
[0010]圖2B是根據(jù)實施例的/[目息存儲和檢索系統(tǒng)的不意圖;以及
[0011]圖3是根據(jù)實施例的向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的方法的流程圖。
【具體實施方式】
[0012]下面所示的實施例提供用于向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的改進方法。所述方法包括:根據(jù)在虛擬卷上的已去重的數(shù)據(jù)形成初始位圖,虛擬卷上的已去重的數(shù)據(jù)包括離散塊的總數(shù);根據(jù)出現(xiàn)頻率將離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖;根據(jù)修改后的位圖創(chuàng)建物理卷映射,物理卷映射將虛擬卷上的已去重的數(shù)據(jù)的每個離散塊與原始物理卷相關(guān)聯(lián),并且所述物理卷映射包括全部原始虛擬卷集合和全部數(shù)據(jù)塊;根據(jù)物理卷映射審查在對應(yīng)的原始物理卷上包括的虛擬卷的初始虛擬卷,以確定是否將初始虛擬卷從其對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷,以在不超過不同物理卷上的允許塊的總數(shù)的情況下,減少物理卷映射中的數(shù)據(jù)塊總數(shù);將初始虛擬卷從其對應(yīng)的原始物理卷刪除,并將初始虛擬卷添加到不同原始物理卷,以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射;以及使用修改后的物理卷映射向目標物理介質(zhì)集合寫入修改后的物理卷。
[0013]圖1是根據(jù)實施例的數(shù)據(jù)存儲系統(tǒng)的框圖。數(shù)據(jù)處理系統(tǒng)100包括存儲控制器120和數(shù)據(jù)存儲介質(zhì)130、140、150和160。在所示的圖1的實施例中,存儲控制器120分別經(jīng)由I/O協(xié)議132、142、152和162與數(shù)據(jù)存儲介質(zhì)130、140、150和160通信。I/O協(xié)議132、142,152和162可以包括任何種類的I/O協(xié)議,包括但不限于光纖通道環(huán)路、SCSI (小型計算機系統(tǒng)接口)、iSCSI (因特網(wǎng)SCSI)、SAS (串列SCSI)、光纖通道、經(jīng)由光纖通道的SCS1、以太網(wǎng)、經(jīng)由以太網(wǎng)的光纖通道、無限帶寬和SATA (串行ΑΤΑ)。
[0014]如在此使用的,術(shù)語“數(shù)據(jù)存儲介質(zhì)”被定義為與需要向該信息存儲介質(zhì)寫入信息和從該信息存儲介質(zhì)讀取信息的硬件、固件和/或軟件相結(jié)合的信息存儲介質(zhì)。在某些實施例中,信息存儲介質(zhì)包括磁信息存儲介質(zhì),諸如但不限于磁盤和磁帶等。在其他實施例中,信息存儲介質(zhì)包括光學(xué)信息存儲介質(zhì),諸如但不限于⑶、DVD (數(shù)字通用盤)、HD-DVD (高清晰度DVD)和BD (藍光盤)等。在另外的實施例中,信息存儲介質(zhì)包括電子信息存儲介質(zhì),諸如但不限于PR0M、EPR0M、EEPR0M、閃存PR0M、壓縮閃存和智能介質(zhì)等。在再另外的實施例中,信息存儲介質(zhì)包括全息信息存儲介質(zhì)。
[0015]存儲控制器120與主機計算機102、104和106通信。通常,諸如大型機、個人計算機、工作站及其組合的主機計算機102、104和106每個包括計算系統(tǒng),所述計算系統(tǒng)包括操作系統(tǒng),諸如 Windows?、ATX?、Unix?、Z/OS?、LINUX?等(Windows?.是微軟公司的注冊商標;AIX?是IBM公司的注冊商標;Z/OS?是IBM公司的商標;Unix?.是美國和開放群組專門許可的其他國家中的注冊商標;以及LINUX?是Linus Torvald的注冊商標)。主機計算機102、104和/或106中的一個或多個還包括存儲管理程序。根據(jù)實施例,存儲管理程序可以包括管理向和從數(shù)據(jù)存儲和檢索系統(tǒng)傳遞數(shù)據(jù)的本領(lǐng)域中已知的存儲管理類型程序的功能,諸如但不限于在IBMZ/OS?操作系統(tǒng)中實現(xiàn)的IBM DFSMS0
[0016]存儲控制器120包括處理器128和計算機可讀介質(zhì)121、寫入計算機可讀介質(zhì)121的微碼(microcode) 122、寫入計算機可讀介質(zhì)121的指令124、寫入計算機可讀介質(zhì)121的第一級哈希算法123和寫入計算機可讀介質(zhì)121的第二級哈希算法125。處理器128使用微碼122操作存儲控制器120。在所示的圖1的實施例中,存儲控制器120還包括去重隊列126。處理器128執(zhí)行與從一個或多個主機計算機接收的數(shù)據(jù)有關(guān)的某些操作,諸如但不限于數(shù)據(jù)去重。
[0017]在實施例中,主機計算機102、104和106分別使用1/0協(xié)議103、105和107連接到交換結(jié)構(gòu)(fabric) 110。1/0協(xié)議103、105和107可以是任何類型的1/0協(xié)議;例如,TCP/IP、NFS、CIFS、FTP、HTTP協(xié)議、光纖通道(“FC”)環(huán)路或經(jīng)由以太網(wǎng)的光纖通道、到交換結(jié)構(gòu)110的直接連接或者由主機計算機102、104和106使用以向和從交換結(jié)構(gòu)110傳遞信息的
一個或多個信號線。
[0018]在某些實施例中,交換結(jié)構(gòu)110包括例如一個或多個FC交換機115。在實施例中,這些一個或多個交換機115包括一個或多個傳統(tǒng)路由器交換機。在所示的圖1的實施例中,一個或多個交換機115經(jīng)由1/0協(xié)議117將主機計算機102、104個106與存儲控制器120互連。1/0協(xié)議117可以包括任何類型的1/0接口,例如光纖通道、無限帶寬、千兆以太網(wǎng)、以太網(wǎng)、經(jīng)由以太網(wǎng)的光纖通道、TCP/IP、iSCS1、SCSI 1/0接口或者由FC交換機115使用以向和從存儲控制器120以及隨后的數(shù)據(jù)存儲介質(zhì)130、140、150和160傳遞信息的一個或多個信號線。在其他實施例中,一個或多個計算機,諸如但不限于主機計算機102、104和106,分別使用1/0協(xié)議103、105和107與存儲控制器120直接通信。
[0019]圖2A是根據(jù)實施例的與數(shù)據(jù)存儲介質(zhì)130、140、150和160通信的存儲控制器120的示意圖。在實施例中,通信使用交換機的光纖通道仲裁(“FC-AL”)環(huán)而發(fā)生,其中控制器120和介質(zhì)130、140、150和160布置在信息存儲和檢索系統(tǒng)200中。如本領(lǐng)域技術(shù)人員將理解的,信息存儲和檢索系統(tǒng)200還包括額外的元件,諸如但不限于一個或多個主機適配器、一個或多個設(shè)備適配器、數(shù)據(jù)高速緩存器和非易失性存儲器等。所示的圖2的實施例不應(yīng)被解釋為將本發(fā)明限制于使用光纖通道網(wǎng)絡(luò)或設(shè)備。在其他實施例中,使用其他網(wǎng)絡(luò)技術(shù)和設(shè)備,包括但不限于SAS設(shè)備和/或SATA設(shè)備。
[0020]圖2B是根據(jù)實施例的信息存儲和檢索系統(tǒng)202的示意圖。系統(tǒng)202包括交換機的雙FC-AL環(huán),其中存儲控制器120A和存儲控制器120B與兩個FC-AL環(huán)互連。每個FC-AL環(huán)包括一個或多個本地控制器,諸如本地控制器210、220、230、240、250和260。如本領(lǐng)域技術(shù)人員將理解的,信息存儲和檢索系統(tǒng)還包括額外的元件,諸如但不限于一個或多個主機適配器、一個或多個設(shè)備適配器、數(shù)據(jù)高速緩沖器和非易失性存儲器等。每個存儲控制器與第一多個數(shù)據(jù)存儲介質(zhì)270、第二多個數(shù)據(jù)存儲介質(zhì)280和第三多個數(shù)據(jù)存儲介質(zhì)290通信。所示的圖2B的實施例不應(yīng)被解釋為將本發(fā)明限制為使用光纖通道網(wǎng)絡(luò)或設(shè)備。在所示的圖2B的實施例中,兩個FC-AL環(huán)路的列舉(recitation)包括 申請人:(applicant)的裝置的一個實施例。在其他實施例中,使用其他網(wǎng)絡(luò)拓撲和設(shè)備,包括但不限于SAS設(shè)備和/或SATA設(shè)備。
[0021]多個數(shù)據(jù)存儲介質(zhì)270、280、290的每個表示在其上存儲數(shù)據(jù)的物理卷(Pn)。物理卷(Pn)上的數(shù)據(jù)被視為塊。許多次,雖然數(shù)據(jù)塊位于特定物理卷上,但是所述塊邏輯上一起分組為虛擬卷(Vn),并且因此可以跨越多個盤。然而,在作為物理卷的磁帶上,希望虛擬卷不跨越磁帶,因為檢索一個虛擬卷會需要多次磁帶裝載。
[0022]因為塊中的一些可能是冗余的,所以可以去重以消除冗余數(shù)據(jù),僅保留存儲的數(shù)據(jù)的一個副本。因此,為了使存儲器最優(yōu)化,全部離散塊(Bn)理想地存儲在盡可能少的物理卷(Pn)上。因此,物理卷的絕對理想數(shù)目等于離散塊Bn的數(shù)目除以可以在每個Pn上存儲的塊的數(shù)目,使得每個物理卷(例如,數(shù)據(jù)存儲介質(zhì)270、280、290)完全充滿離散塊。
[0023]圖3是根據(jù)實施例的向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的方法300的流程圖??梢圆捎梅椒?00以實現(xiàn)上面描述的理想存儲器。在實施例中,在開始302之后,在方框304,根據(jù)出現(xiàn)頻率將離散塊(UBn)列表排序為位圖。在實施例中,根據(jù)在虛擬卷中組織的已去重的數(shù)據(jù)形成初始位圖,其中在虛擬卷中組織的已去重的數(shù)據(jù)包括
全部離散塊。根據(jù)實施例,虛擬卷集合可以具有總共N個離散塊,(Bnl......BnN)。第一虛擬
卷可以具有離散塊中的一些并且可以包括Bnl、Bn2、Bn3、Bn7個Bn8。得到的第一虛擬卷的位圖可以是11100011。第二虛擬卷可以具有離散塊中的一些并且可以包括Bnl、Bn2、Bn3、Bn5、Bn6、Bn7和Bn8。在這種情況下,所得到的第二虛擬卷的位圖可以是11101111。在對虛擬卷集合的全部虛擬卷創(chuàng)建位圖之后,比較位圖以確定離散塊出現(xiàn)在每個虛擬卷中的頻率。例如,可以比較第一和第二虛擬卷:
[0024]11100011 (第一虛擬卷)
[0025]11101111 (第二虛擬卷)
[0026]在實施例中,根據(jù)出現(xiàn)頻率將位圖的離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖。如上所示,Bnl、Bn2、Bn3是第一和第二虛擬卷中的最常用離散塊,并且因此可以從考慮中消除以提高進程速度和/或形成修改后的位圖。在另一實施例中,初始位圖可以由多個進程中的任何一個創(chuàng)建。[0027]然后,在方框306,根據(jù)位圖創(chuàng)建稻草人(strawman)存儲器映射并將其排序。例如,稻草人存儲器映射(在此也被稱為“物理卷映射”)根據(jù)修改后的位圖創(chuàng)建。物理卷映射將虛擬卷上的已去重的數(shù)據(jù)的每個離散塊與原始物理卷相關(guān)聯(lián),并且包括全部原始虛擬卷集合和全部數(shù)據(jù)塊。在實施例中,物理卷映射是存儲器內(nèi)映射。在其他實施例中,物理卷映射存儲到可以存儲映射的另一區(qū)域或從所述另一區(qū)域引用。為了改進方框306處的處理,通過對應(yīng)的塊位圖將與物理卷映射相關(guān)聯(lián)的每個原始物理卷排序為降序。作為結(jié)果,映射中具有最常用塊的物理卷在列表頂端分組在一起并更可能考慮到,并且因此首先被消除。在實施例中,可以識別多個數(shù)據(jù)塊中的數(shù)據(jù)塊子集,其中數(shù)據(jù)塊子集具有共同的位模式,使得可以在隨后的步驟中比較子集中的不包括共同的位模式的每個數(shù)據(jù)塊的部分。
[0028]在任何情況下,在創(chuàng)建稻草人存儲器映射之后,在方框308,做出關(guān)于是否已滿足停止條件的確定。在實施例中,在已執(zhí)行多次迭代(例如,最大次數(shù)的允許循環(huán))之后,滿足停止條件。在另一實施例中,在沒有發(fā)生已審查的物理卷的刪除的情況下執(zhí)行預(yù)定次數(shù)的迭代之后,滿足停止條件。在另一實施例中,當已完成理想的全部物理卷或預(yù)定百分比的全部原始物理卷時,滿足停止條件。在再一實施例中,在預(yù)定持續(xù)時間之后,滿足停止條件。如果已滿足停止條件,則在方框310,根據(jù)列出的存儲器映射將每個物理卷寫出到物理介質(zhì)(例如,數(shù)據(jù)存儲介質(zhì)270、280、290)。具體地,使用修改后的物理卷映射將修改后的物理卷寫到目標物理介質(zhì)集合,其將在下面更詳細地描述。方法300隨后在方框312停止。
[0029]如果做出尚未滿足停止條件的確定,則在方框314,做出關(guān)于是否已檢查全部物理卷的另一確定。如果是,則在方框316,將物理卷指針設(shè)置到第一物理卷,并且方法300從方框308迭代。
[0030]如果尚未檢查全部物理卷,則在方框318,做出關(guān)于是否已檢查當前物理卷上的全部虛擬卷的確定。如果是,則在方框320,將物理卷指針設(shè)置到下一物理卷,并且方法300在方框314處迭代。
[0031]如果否,則在方框322,在虛擬卷的塊位圖與全部物理卷的塊位圖而非當前物理卷的塊位圖之間進行比較。例如,將初始虛擬卷的位圖(例如,尚未檢查的虛擬卷的位圖)與全部原始物理卷集合中的每個原始物理卷的每個位圖相比較。
[0032]然后,在方框324,做出關(guān)于將虛擬卷移動到不同物理卷是否可以改進映射的確定。具體地,確定基于將初始虛擬卷從與其相關(guān)聯(lián)的原始物理卷移動到新的物理卷是否將改進映射。改進映射可以通過減少物理卷數(shù)量或減少需要存儲在原始物理卷上的塊總數(shù)加上需要存儲在不同物理卷上的塊總數(shù)而實現(xiàn),并且在移動之后,原始物理卷和不同物理卷都不包括比可以存儲在物理卷上的最大數(shù)量的塊更多的塊。在實施例中,根據(jù)物理卷映射對在對應(yīng)的原始物理卷上包括的虛擬卷的初始虛擬卷進行審查,以確定將初始虛擬卷從其對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù)。在檢查初始虛擬卷之后,隨后根據(jù)修改后的物理卷映射審查對應(yīng)的原始物理卷上包括的虛擬卷的隨后的虛擬卷,以確定將隨后的虛擬卷從其對應(yīng)的原始物理卷移動到不同原始物理卷或修改后的物理卷是否減少修改后的物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同原始物理卷或修改后的物理卷上的允許塊的總數(shù),依次類推。在再一實施例中,審查包括識別虛擬卷中的合并目標(consolidationtarget),其中合并目標包括共同的數(shù)據(jù)塊,并且確定將共同的數(shù)據(jù)塊從對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù)。
[0033]如果在方框324沒有改進映射,則在方框326,系統(tǒng)將虛擬卷指針遞增到下一虛擬卷,并且方法300在方框318迭代。
[0034]如果改進映射,則在方框328,將虛擬卷從當前物理卷列表移除并添加到新的物理卷列表,并且如果離散塊不是已經(jīng)在新的物理卷上,則將來自僅由虛擬卷使用的當前物理卷的離散塊移除并添加到新的物理卷。在實施例中,初始虛擬卷從其對應(yīng)的原始物理卷刪除并將其添加到不同原始物理卷以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射。在檢查初始虛擬卷之后(例如,在檢查隨后的虛擬卷之后)的隨后的迭代中,隨后的虛擬卷從其對應(yīng)的原始物理卷刪除并添加到不同原始物理卷或修改后的物理卷以創(chuàng)建包括隨后的修改后的物理卷的隨后的修改后的物理卷映射。
[0035]在任何情況下,在方框330,做出關(guān)于當前物理卷是否為空的確定。如果否,則在方框326,系統(tǒng)將虛擬卷指針遞增到下一虛擬卷,并且方法300在方框318迭代。如果當前物理卷為空,則在方框322,從當前物理卷列表移除當前物理卷,并且方法300在方框320迭代。
[0036]現(xiàn)在提供了一種可以用作用于將已去重的數(shù)據(jù)寫入物理卷的開放標準的改進的方法。所述方法將在虛擬卷中組織的已去重的數(shù)據(jù)高效地傳遞到目標物理介質(zhì)集合,使得物理介質(zhì)僅包括全部虛擬卷的數(shù)據(jù)的離散塊。此外,所述方法的一些實施例保留哈希索引值以當從物理介質(zhì)的單個卷讀取時重新組成完整的虛擬卷。
[0037]如本領(lǐng)域普通技術(shù)人員將理解的,本發(fā)明的多個方面可以實施為系統(tǒng)、方法或計算機程序產(chǎn)品。因此,本發(fā)明的多個方面可以采用整個硬件實施例、整個軟件實施例(包括固件、常駐軟件、微碼等)或者結(jié)合在此可以全部總地稱為“電路”、“模塊”或“系統(tǒng)”的軟件和硬件方面的實施例的形式。此外,本發(fā)明的多個方面可以采用在具有在其上實施的計算機可讀程序代碼的一個或多個計算機可讀介質(zhì)中實施的計算機程序代碼的形式。
[0038]可以使用一個或多個計算機可讀介質(zhì)的任何組合。計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或物理計算機可讀存儲介質(zhì)。物理計算機可讀存儲介質(zhì)可以是例如但不限于電子、磁、光學(xué)、晶體、聚合物、電磁、紅外線或半導(dǎo)體系統(tǒng)、裝置或設(shè)備、或者上述事物的任何適當組合。物理計算機可讀存儲介質(zhì)的示例包括但不限于具有一條或多條線的電氣連接、便攜式計算機磁盤、硬盤、RAM、ROM、EPR0M、閃存、光纖、CD-ROM、光學(xué)存儲設(shè)備、磁存儲設(shè)備或上面事物的任何適當組合。在本文件的上下文中,計算機可讀存儲介質(zhì)可以是可以包括或存儲由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用的或與所述指令執(zhí)行系統(tǒng)、裝置或設(shè)備有關(guān)的程序或數(shù)據(jù)的任何有形介質(zhì)。
[0039]在計算機可讀存儲介質(zhì)上實施的計算機代碼可以使用任何適當介質(zhì)傳送,包括但不限于無線、有線、光纖電纜、射頻(RF)等,或上面事物的任何適當組合。用于進行本發(fā)明的多個方面的操作的計算機代碼可以以任何靜態(tài)語言寫成,諸如“C”編程語言或其他類似編程語言。計算機代碼可以作為獨立軟件包在用戶計算機上完全執(zhí)行,在用戶計算機上部分執(zhí)行,在用戶計算機上部分執(zhí)行并在遠程計算機上部分執(zhí)行或者在遠程計算機或服務(wù)器上完全執(zhí)行。在后一情況下,遠程計算機可以通過任何類型的網(wǎng)絡(luò)或通信系統(tǒng)連接到用戶計算機,包括但不限于,局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)、融合網(wǎng)絡(luò)、或者可以到外部計算機的連接(例如,使用因特網(wǎng)服務(wù)提供商通過因特網(wǎng))。
[0040]上面參考根據(jù)本發(fā)明的實施例的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖和/或框圖描述了本發(fā)明的多個方面。將理解可以由計算機程序指令實現(xiàn)流程圖和/或框圖的每個方框,以及流程圖和/或框圖中的方框的組合。這些計算機程序指令可以向通用計算機、專用計算機、或其他可編程數(shù)據(jù)處理裝置的處理器提供以產(chǎn)生機器,使得經(jīng)由計算機或其他可編程數(shù)據(jù)處理裝置的處理器執(zhí)行的指令創(chuàng)建用于實現(xiàn)在流程圖和/或框圖的一個或多個方框中指定的功能/行為。
[0041]這些計算機程序指令還可以存儲在可以指示計算機、其他可編程數(shù)據(jù)處理裝置、或其他設(shè)備以特定方式運行的計算機可讀介質(zhì)中,使得存儲在計算機可讀介質(zhì)中的指令產(chǎn)生包括實現(xiàn)在流程圖和/或框圖的一個或多個方框中指定的功能/行為的指令的制造物。計算機程序指令還可以加載到計算機、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備上,以使得在計算機、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備上執(zhí)行的一系列操作步驟產(chǎn)生計算機實現(xiàn)的進程,使得在計算機或其他可編程裝置上執(zhí)行的指令提供用于在流程圖和/或框圖的一個或多個方框中指定的功能/行為的進程。
[0042]上面的圖中的流程圖和框圖示出根據(jù)本發(fā)明的各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)方式的架構(gòu)、功能和操作。在該方面中,流程圖或框圖中的每個方框可以表示包括用于實現(xiàn)指定的一個或多個邏輯功能的一個或多個可執(zhí)行指令的代碼的模塊、分段或部分。還應(yīng)注意,在一些替換實現(xiàn)方式中,方框中標注的功能可以不按圖中標注的順序發(fā)生。例如,事實上,根據(jù)涉及的功能,連續(xù)示出的兩個方框可以基本上同時執(zhí)行,或者方框有時可以按相反的順序執(zhí)行。還將注意,框圖和/或流程圖的每個方框,以及框圖和/或流程圖中的方框的組合可以由執(zhí)行指定功能或行為的基于專業(yè)硬件的系統(tǒng)或者專用硬件和計算機指令的組合實現(xiàn)。
【權(quán)利要求】
1.一種向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的方法,包括: 根據(jù)虛擬卷上的已去重的數(shù)據(jù)形成初始位圖,虛擬卷上的已去重的數(shù)據(jù)包括全部離散塊;根據(jù)出現(xiàn)頻率將離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖;根據(jù)修改后的位圖創(chuàng)建物理卷映射,物理卷映射將虛擬卷上的已去重的數(shù)據(jù)的每個離散塊與原始物理卷相關(guān)聯(lián),并且所述物理卷映射包括全部原始虛擬卷集合和全部數(shù)據(jù)塊;根據(jù)物理卷映射審查在對應(yīng)的原始物理卷上包括的虛擬卷的初始虛擬卷,以確定將初始虛擬卷從其對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù); 將初始虛擬卷從其對應(yīng)的原始物理卷刪除,并將初始虛擬卷添加到不同原始物理卷,以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射;以及 使用修改后的物理卷映射向目標物理介質(zhì)集合寫入修改后的物理卷。
2.如權(quán)利要求1所述的方法,其中, 所述方法還包括通過對應(yīng)的塊位圖將與物理卷映射相關(guān)聯(lián)的每個原始物理卷排序為首先包括多個最常用數(shù)據(jù)塊到最不常用數(shù)據(jù)塊的降序以形成物理卷映射的步驟。
3.如權(quán)利要求2所述的方法, 其中, 審查的步驟還包括識別多個數(shù)據(jù)塊中的數(shù)據(jù)塊子集,所述數(shù)據(jù)塊子集具有共同的位模式,并且比較子集中的不包括共同的位模式的每個數(shù)據(jù)塊的部分。
4.如權(quán)利要求1所述的方法,其中, 審查的步驟還包括比較初始虛擬卷的位圖與全部原始物理卷集合中的每個原始物理卷的每個位圖。
5.如權(quán)利要求1所述的方法,其中, 審查的步驟還包括根據(jù)修改后的物理卷映射,審查對應(yīng)的原始物理卷上包括的虛擬卷的隨后的虛擬卷,以確定將隨后的虛擬卷從其對應(yīng)的原始物理卷移動到不同原始物理卷或修改后的物理卷是否減少修改后的物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同原始物理卷或修改后的物理卷上的允許塊的總數(shù);以及 將隨后的虛擬卷從其對應(yīng)的原始物理卷刪除,并將隨后的虛擬卷添加到不同原始物理卷或修改后的物理卷,以創(chuàng)建包括隨后的修改后的物理卷的隨后的修改后的物理卷映射。
6.如權(quán)利要求1所述的方法,還包括, 審查的步驟還包括識別虛擬卷中的合并目標,其中合并目標包括共同的數(shù)據(jù)塊,并且確定將共同的數(shù)據(jù)塊從對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù)。
7.如權(quán)利要求1所述的方法,還包括, 重復(fù)審查和刪除步驟,直到在沒有發(fā)生已審查的物理卷的刪除的情況下,執(zhí)行預(yù)定次數(shù)的迭代。
8.如權(quán)利要求7所述的方法,還包括, 在重復(fù)步驟之后,刪除空物理卷。
9.如權(quán)利要求1所述的方法,還包括, 重復(fù)審查和刪除步驟達預(yù)定持續(xù)時間。
10.如權(quán)利要求1所述的方法,還包括, 重復(fù)形成初始位圖,將離散塊排序,根據(jù)修改后的位圖創(chuàng)建物理卷映射,審查以及刪除的步驟,直到完成原始物理卷總數(shù)的預(yù)定百分比。
11.如權(quán)利要求1所述的方法,還包括, 重復(fù)形成初始位圖,將離散塊排序,根據(jù)修改后的位圖創(chuàng)建物理卷映射,審查以及刪除的步驟,直到完成理想數(shù)目的物理卷以上的預(yù)定百分比,其中理想數(shù)目被定義為僅向一個完全滿的物理卷寫出的每個離散塊。
12.一種包括用于向目標物理介質(zhì)集合傳遞在虛擬卷中組織的已去重的數(shù)據(jù)的計算機程序產(chǎn)品方法的物理計算機存儲介質(zhì),所述物理計算機存儲介質(zhì)包括: 用于根據(jù)虛擬卷上的已去重的數(shù)據(jù)形成初始位圖的計算機代碼,虛擬卷上的已去重的數(shù)據(jù)包括全部離散塊; 用于根據(jù)出現(xiàn)頻率將離散塊排序以形成首先包括多個最常用離散塊的修改后的位圖的計算機代碼; 用于根據(jù)修改后的位圖創(chuàng)建物理卷映射的計算機代碼,物理卷映射將虛擬卷上的已去重的數(shù)據(jù)的每個離散塊與原始物理卷相關(guān)聯(lián),并且所述物理卷映射包括全部原始虛擬卷集合和全部數(shù)據(jù)塊; 用于根據(jù)物理卷映射審查在對應(yīng)的原始物理卷上包括的虛擬卷的第一虛擬卷,以確定將第一虛擬卷從其對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù)的計算機代碼; 用于將第一虛擬卷從其對應(yīng)的原始物理卷刪除,并將第一虛擬卷添加到不同原始物理卷,以創(chuàng)建包括修改后的物理卷的修改后的物理卷映射的計算機代碼;以及 用于使用修改后的物理卷映射向目標物理介質(zhì)集合寫入修改后的物理卷的計算機代碼。
13.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于通過對應(yīng)的塊位圖將與物理卷映射相關(guān)聯(lián)的每個原始物理卷排序為首先包括多個最常用數(shù)據(jù)塊到最不常用數(shù)據(jù)塊的降序以形成物理卷映射的步驟的計算機代碼。
14.如權(quán)利要求13所述的物理計算機存儲介質(zhì),還包括, 用于識別多個數(shù)據(jù)塊中的數(shù)據(jù)塊子集的計算機代碼,所述數(shù)據(jù)塊子集具有共同的位模式,并且比較子集中的不包括共同的位模式的每個數(shù)據(jù)塊的部分。
15.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于比較初始虛擬卷的位圖與全部原始物理卷集合中的每個原始物理卷的每個位圖的計算機代碼。
16.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于根據(jù)修改后的物理卷映射,審查對應(yīng)的原始物理卷上包括的虛擬卷的隨后的虛擬卷,以確定將隨后的虛擬卷從其對應(yīng)的原始物理卷移動到不同原始物理卷或修改后的物理卷是否減少修改后的物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同原始物理卷或修改后的物理卷上的允許塊的總數(shù)的計算機代碼;以及 用于將隨后的虛擬卷從其對應(yīng)的原始物理卷刪除,并將隨后的虛擬卷添加到不同原始物理卷或修改后的物理卷,以創(chuàng)建包括隨后的修改后的物理卷的隨后的修改后的物理卷映射的計算機代碼。
17.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于識別虛擬卷中的合并目標,其中合并目標包括共同的數(shù)據(jù)塊,并且確定將共同的數(shù)據(jù)塊從對應(yīng)的原始物理卷移動到全部原始物理卷集合中的不同物理卷是否減少物理卷映射中的數(shù)據(jù)塊總數(shù),而不超過不同物理卷上的允許塊的總數(shù)的計算機代碼。
18.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于重復(fù)審查和刪除步驟,直到在沒有發(fā)生已審查的物理卷的刪除的情況下,執(zhí)行預(yù)定次數(shù)的迭代的計算機代碼。
19.如權(quán)利要求18所述的物理計算機存儲介質(zhì),還包括, 用于在重復(fù)步驟之后,刪除空物理卷的計算機代碼。
20.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于重復(fù)審查和刪除步驟達預(yù)定持續(xù)時間的計算機代碼。
21.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于重復(fù)形成初始位圖,將離散塊排序,根據(jù)修改后的位圖創(chuàng)建物理卷映射,審查以及刪除的步驟,直到完成原始物理卷總數(shù)`的預(yù)定百分比的計算機代碼。
22.如權(quán)利要求12所述的物理計算機存儲介質(zhì),還包括, 用于重復(fù)形成初始位圖,將離散塊排序,根據(jù)修改后的位圖創(chuàng)建物理卷映射,審查以及刪除的步驟,直到完成理想數(shù)目的物理卷以上的預(yù)定百分比的計算機代碼,其中理想數(shù)目被定義為僅向一個完全滿的物理卷寫出的每個離散塊。
【文檔編號】G06F7/00GK103765375SQ201280042458
【公開日】2014年4月30日 申請日期:2012年8月23日 優(yōu)先權(quán)日:2011年8月30日
【發(fā)明者】J.J.奧文夏因, A.G.豪爾賽爾特, J.T.奧爾森, E.巴托洛米, H.D.帕克特三世 申請人:國際商業(yè)機器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1