亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種考慮訪問隨機(jī)性的文件分級存儲方法和系統(tǒng)的制作方法

文檔序號:6635448閱讀:286來源:國知局
一種考慮訪問隨機(jī)性的文件分級存儲方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種考慮訪問隨機(jī)性的文件分級存儲方法和系統(tǒng)。將存儲系統(tǒng)中的各種計(jì)算資源、存儲資源和通信資源進(jìn)行量化,同時統(tǒng)計(jì)所有文件的訪問特征并量化各文件的資源消耗,結(jié)合具體的文件遷移策略計(jì)算文件遷移的存儲系統(tǒng)總體收益,得到的結(jié)果是文件的一個集合,在執(zhí)行文件遷移操作時將位于上述計(jì)算結(jié)果的一個子集中的文件進(jìn)行遷移。采用本發(fā)明提出的考慮訪問隨機(jī)性的文件分級存儲方法,通過將訪問隨機(jī)性較大的文件納入文件分級和文件遷移的范疇,能夠減少因文件隨機(jī)訪問帶來的系統(tǒng)性能開銷,有效提升文件分級存儲系統(tǒng)的整體性能,充分發(fā)揮SSD設(shè)備的性能,提高了系統(tǒng)資源利用率。
【專利說明】一種考慮訪問隨機(jī)性的文件分級存儲方法和系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及文件分級存儲【技術(shù)領(lǐng)域】,具體涉及一種考慮訪問隨機(jī)性的文件分級存 儲方法和系統(tǒng)。

【背景技術(shù)】
[0002] 隨機(jī)互聯(lián)網(wǎng)數(shù)據(jù)量的急劇增長,人們對存儲系統(tǒng)的容量和性能提出了越來越高 的要求,現(xiàn)代的存儲系統(tǒng)不僅需要大容量,還要滿足高吞吐率、高IOPS和IO訪問低延遲。 然而目前存儲系統(tǒng)的性能仍然受限于傳統(tǒng)機(jī)械式硬盤,機(jī)械式的磁盤驅(qū)動器(Hard Disk Driver,簡稱HDD)仍然是目前存儲系統(tǒng)使用最多的存儲介質(zhì)。而傳統(tǒng)機(jī)械式硬盤由于其 固有物理特性,其隨機(jī)訪問的性能相比順序訪問性能較差。近年出現(xiàn)的固態(tài)存儲器(Solid Storage Driver,簡稱SSD),如Flash存儲器、固態(tài)盤和PCM等,正好彌補(bǔ)了傳統(tǒng)HDD的缺 點(diǎn),基于閃存技術(shù)的SSD讀寫延遲較小,對數(shù)據(jù)隨機(jī)訪問提供了很好的支持。而由于SSD 速度越來越快,容量越來越大,存儲系統(tǒng)中開始使用SSD與HDD構(gòu)成混合存儲系統(tǒng),將存儲 系統(tǒng)中訪問頻繁的數(shù)據(jù)和文件存放到SSD中,以充分發(fā)揮SSD的優(yōu)勢,這就形成了分級存儲 系統(tǒng)。由于SSD的先擦除后刷寫,以及具有有限擦除次數(shù)的特點(diǎn),分級存儲系統(tǒng)中多將讀頻 繁的數(shù)據(jù)存儲于SSD設(shè)備。
[0003] 現(xiàn)有分級存儲系統(tǒng)主要有數(shù)據(jù)塊分級和文件分級兩種,以數(shù)據(jù)塊為粒度的分級技 術(shù)實(shí)現(xiàn)偏系統(tǒng)底層,數(shù)據(jù)遷移粒度較小,對存儲系統(tǒng)提升比文件分級大,目前主要是根據(jù)數(shù) 據(jù)塊訪問熱度進(jìn)行數(shù)據(jù)塊遷移。而以文件為粒度的分級技術(shù)目前也是根據(jù)上層應(yīng)用系統(tǒng) 對文件的訪問熱度對文件在HDD層和SSD層之間進(jìn)行遷移,但文件級的分級存儲技術(shù)相比 數(shù)據(jù)塊級的分級技術(shù),還需要考慮文件數(shù)據(jù)的訪問隨機(jī)性問題,某些訪問熱度一般的文件 按照現(xiàn)有分級策略不會遷移到SSD層中,但是上層應(yīng)用系統(tǒng)對該文件數(shù)據(jù)的訪問隨機(jī)性較 大,導(dǎo)致該文件的訪問對HDD層的性能造成較大的實(shí)際開銷。


【發(fā)明內(nèi)容】

[0004] 為了解決上述技術(shù)問題,本發(fā)明提出了一種考慮訪問隨機(jī)性的文件分級存儲方 法,可以提高文件級分級存儲系統(tǒng)的整體性能和存儲資源利用率,同時提出了基于該方法 的文件級分級存儲系統(tǒng)架構(gòu)。
[0005] -種考慮訪問隨機(jī)性的文件分級存儲方法,包括: 51 :量化存儲系統(tǒng)的資源,對分級存儲系統(tǒng)的HDD層和SSD層的資源(包括帶寬、I0PS、 平均IO時間)進(jìn)行量化; 52 :量化文件對系統(tǒng)中資源的消耗,即文件存儲在某一層時,該層帶寬、IOPS和平均IO 時間等資源的開銷; 53 :對存儲系統(tǒng)中所有文件的訪問特性進(jìn)行統(tǒng)計(jì),計(jì)算并量化文件的訪問隨機(jī)性和訪 問熱度; 54 :根據(jù)文件的訪問隨機(jī)性和熱度,采用具體的文件遷移策略對文件進(jìn)行HDD層和SSD 層的遷移。
[0006] 特別地,所述步驟SI中的存儲系統(tǒng)的資源,具體包括計(jì)算資源、存儲資源和通信 資源。
[0007] 特別地,所述步驟S2中文件對系統(tǒng)中資源的消耗,指存儲系統(tǒng)存儲該文件所需消 耗的存儲資源,以及支持上層應(yīng)用系統(tǒng)對文件的訪問所消耗的算計(jì)資源和通信資源。
[0008] 特別地,所述步驟S3中對文件的訪問特性進(jìn)行統(tǒng)計(jì),具體包括對文件的訪問IO在 文件中的分布統(tǒng)計(jì),和對文件的讀訪問頻率統(tǒng)計(jì),用于計(jì)算文件的訪問隨機(jī)性和熱度。之所 以統(tǒng)計(jì)文件的讀訪問頻率,是由于【背景技術(shù)】中說明的SSD的固有特性,其先擦除后刷寫和 具有有限刷寫次數(shù)的特點(diǎn)決定了 SSD設(shè)備不適合作為寫頻繁數(shù)據(jù)的存儲介質(zhì)。
[0009] 特別地,所述步驟S4中具體的文件遷移策略,指根據(jù)步驟S1~S3中的量化數(shù)據(jù),計(jì) 算文件遷移的存儲系統(tǒng)整體性能收益,選取使得系統(tǒng)整體性能收益最大的文件進(jìn)行遷移。
[0010] 應(yīng)用本發(fā)明提出的考慮訪問隨機(jī)性的文件分級存儲方法的存儲系統(tǒng),主要包括 系統(tǒng)的控制器、操作系統(tǒng)、網(wǎng)絡(luò)、存儲設(shè)備以及電源管理等,其中主要功能模塊位于操作系 統(tǒng)中的文件系統(tǒng)層之上。具體系統(tǒng)架構(gòu)在【具體實(shí)施方式】中進(jìn)行詳細(xì)說明。該系統(tǒng)包括6個 主要功能模塊:數(shù)據(jù)統(tǒng)計(jì)模塊、數(shù)據(jù)分析模塊、遷移策略模塊、遷移管理模塊、元數(shù)據(jù)模塊和 設(shè)備管理模塊;此六個模塊實(shí)現(xiàn)于存儲系統(tǒng)中文件系統(tǒng)的上層和VFS的下層;同時包括存 儲控制器、磁盤驅(qū)動器和固態(tài)存儲器等存儲設(shè)備以及網(wǎng)絡(luò)鏈接。
[0011] 本發(fā)明的有益效果是:采用本發(fā)明提出的考慮訪問隨機(jī)性的文件分級存儲方法, 能夠有效提升文件分級存儲系統(tǒng)的整體性能,充分發(fā)揮SSD設(shè)備的性能,提高了系統(tǒng)資源 利用率。

【專利附圖】

【附圖說明】
[0012] 圖1是本發(fā)明提出方法的實(shí)施流程示意圖。
[0013] 圖2是應(yīng)用本發(fā)明方法的存儲系統(tǒng)的架構(gòu)示意圖。

【具體實(shí)施方式】
[0014] 下面參照附圖1,對本發(fā)明提出的方法以具體實(shí)施例進(jìn)行描述說明。
[0015] 存儲系統(tǒng)的資源主要包括計(jì)算資源、存儲資源和通信資源,其中計(jì)算資源包括存 儲系統(tǒng)控制器及各種處理器的占用時間,存儲資源包括存儲系統(tǒng)中的HDD和SSD的存儲空 間,以及各級緩存的存儲空間,通信資源包括存儲系統(tǒng)中的數(shù)據(jù)傳輸和控制信息傳輸能力, 如各存儲節(jié)點(diǎn)之間的網(wǎng)絡(luò)帶寬、存儲節(jié)點(diǎn)內(nèi)部的總線等。通常以節(jié)點(diǎn)或?qū)蛹壍拇鎯θ萘?、?寬和節(jié)點(diǎn)單位時間能夠處理的IO數(shù)量即IOPS為存儲系統(tǒng)資源的主要考慮因素。
[0016] 文件級分層存儲系統(tǒng)主要分為兩層:HDD層和SSD層,分別以HDD和SSD作為存儲 介質(zhì)。每層所需考慮的資源有:存儲空間容量(Capacity,記為C)、帶寬(Bandwidth,記為 B)和單位時間IO請求頻率(I0PS,記為I)。HDD層的容量記為CH,帶寬記為BH, IO請求頻 率記為IH,SSD層的容量記為CS,帶寬記為BS,IO請求頻率記為IS。存儲系統(tǒng)中每種資源 都具有上限,如存儲容量上限為系統(tǒng)中所有存儲設(shè)備實(shí)際存儲空間的總和,在代表每種資 源的符號后面加下標(biāo)m表示該種資源的上限,即HDD層的容量上限、帶寬上限和IO請求頻 率上限分別記為Cli、BH m和IHm,SSD層的容量上限、帶寬上限和IO請求頻率上限分別記為 CS^BSjPIS^。
[0017] 存儲系統(tǒng)中每種資源的當(dāng)前值和上限確定有多種方式,如容量上限為各設(shè)備存儲 空間之和,在系統(tǒng)建立之初即可由系統(tǒng)配置文件或操作系統(tǒng)獲得,又如容量的當(dāng)前值、帶寬 和IO請求頻率的上限可由系統(tǒng)運(yùn)行過程中統(tǒng)計(jì)的系統(tǒng)運(yùn)行數(shù)據(jù)獲得。在一些實(shí)施例中應(yīng) 用本發(fā)明的人員也可使用其它方式獲得系統(tǒng)當(dāng)前資源和資源上限。
[0018] 文件存儲在存儲系統(tǒng)中會消耗資源,如文件的存儲資源開銷為存儲文件及其副本 的數(shù)據(jù)空間,以及系統(tǒng)為管理該文件所需增加的元數(shù)據(jù)??紤]上述量化的存儲系統(tǒng)資源,在 代表每種資源將文件fi消耗的各種資源的符號后面加下標(biāo)fi或i表示文件fi對該種資源 的消耗,即文件A消耗HDD層的容量、帶寬和IO請求頻率分別記為CHpBH i和IHi,消耗SSD 層的容量、帶寬和IO請求頻率分別記為CSiJS i和ISit5
[0019] 文件對各種資源的消耗的確定方式有多種,如根據(jù)文件大小、存儲系統(tǒng)副本組織 方式和元數(shù)據(jù)組織方式計(jì)算文件的容量開銷,根據(jù)文件的讀訪問頻率和每次讀取文件的大 小計(jì)算帶寬和IO請求頻率開銷。在一些實(shí)施例中,應(yīng)用本發(fā)明的人員也可使用其它方式計(jì) 算文件對各種資源的消耗。
[0020] 統(tǒng)計(jì)文件的訪問特性,包括對文件讀訪問頻率的統(tǒng)計(jì),以及IO訪問請求的數(shù)據(jù)在 文件內(nèi)的分布情況進(jìn)行記錄,進(jìn)一步計(jì)算文件的訪問熱度和訪問隨機(jī)性。文件A的訪問熱 度記為H i,訪問隨機(jī)性記為Ri。
[0021] 對文件讀訪問頻率進(jìn)行統(tǒng)計(jì),能夠識別出存儲系統(tǒng)中的熱點(diǎn)數(shù)據(jù),從而將熱點(diǎn)數(shù) 據(jù)遷移到性能較高的SSD層,提升系統(tǒng)性能。而對文件訪問請求數(shù)據(jù)在文件內(nèi)的分布情況 進(jìn)行統(tǒng)計(jì),同樣出于提高系統(tǒng)性能的目的,這是因?yàn)閷δ承岫纫话愕奈募?,按照文件遷移 策略可能不會被遷移到SSD層,然而實(shí)際應(yīng)用中對這些文件的訪問請求呈現(xiàn)較大的隨機(jī) 性。對文件的訪問請求的隨機(jī)性有多種表現(xiàn)形式,如上層應(yīng)用系統(tǒng)下發(fā)到存儲系統(tǒng)的多種 連續(xù)IO請求都是針對同一文件,但請求訪問的是文件中的不同部分,彼此之間無法合并, 此時在磁盤中這些訪問請求表現(xiàn)為對文件的隨機(jī)訪問。又如上層應(yīng)用系統(tǒng)下發(fā)到存儲系統(tǒng) 中的對同一文件的IO請求是順序的,請求訪問的是文件中連續(xù)的部分,但在這些IO請求之 間存在多個其它文件的訪問請求,且由于磁盤驅(qū)動程序的IO隊(duì)列深度,無法對這些分散在 其它IO請求中的同一文件訪問請求進(jìn)行合并,此種情況下也會造成磁盤中對文件的隨機(jī) 訪問。在某些實(shí)施例中還存在其它形式的文件隨機(jī)訪問方式,在此不做贅述。雖然文件的 訪問熱度一般,但是對文件的訪問請求隨機(jī)性較大,導(dǎo)致對文件的訪問造成較大的存儲資 源開銷,影響系統(tǒng)的整體性能,因此也應(yīng)將此類型文件也遷移到SSD層以發(fā)揮SSD設(shè)備隨機(jī) 訪問性能優(yōu)越的特點(diǎn)。
[0022] 在建議實(shí)施例中,將文件的訪問熱度H定義為存儲系統(tǒng)最近一段時間內(nèi)單位時間 文件的讀訪問次數(shù),將文件的訪問隨機(jī)性R定義為最近一段時間內(nèi)連續(xù)兩個對文件訪問的 IO請求的數(shù)據(jù)起始位置之差與平均IO請求數(shù)據(jù)大小的比值。在其它實(shí)施例中,應(yīng)用本發(fā)明 的人員也可采用其它方式定義和計(jì)算文件的訪問熱度H和訪問隨機(jī)性R。
[0023] 文件的遷移策略規(guī)定了文件遷移的方式,在某些實(shí)施例中,以固定時間為周期進(jìn) 行文件遷移操作,在其它實(shí)施例中也可不定期的將遷移增益達(dá)到某一閾值的文件進(jìn)行遷移 操作,也可在存儲系統(tǒng)負(fù)載較低時進(jìn)行文件遷移,應(yīng)用本發(fā)明的人員也可采用其它條件觸 發(fā)文件遷移操作。文件的遷移策略也規(guī)定了每次文件遷移的數(shù)量或數(shù)據(jù)量大小,由于文件 的遷移會對存儲系統(tǒng)造成額外的性能開銷,因此要限制每次遷移操作的規(guī)模。文件的遷移 策略同時規(guī)定了文件訪問特性計(jì)算的時間長度,因?yàn)槲募臒岫鹊仍L問特性是隨時間變化 而不斷變化的,若對其訪問特性的計(jì)算周期過短,會造成文件的遷移抖動,使得文件頻繁地 在HDD層和SSD層之間遷移;反之若對文件訪問特性的計(jì)算周期過長,則無法發(fā)揮文件遷移 帶來的存儲系統(tǒng)性能提升。在其它實(shí)施例中,應(yīng)用本發(fā)明的人員也可根據(jù)實(shí)際情況增加其 它文件的遷移策略。
[0024] 文件的遷移策略可由存儲系統(tǒng)的管理員手動設(shè)置,也可由計(jì)算機(jī)算法自動根據(jù)存 儲系統(tǒng)運(yùn)行時的統(tǒng)計(jì)信息進(jìn)行計(jì)算得出。在其它實(shí)施例中,應(yīng)用本發(fā)明的人員也可根據(jù)實(shí) 際情況增加其它文件的遷移策略的設(shè)置方式。
[0025] 文件存儲在不同層的資源開銷是不同的,通常情況下文件存儲在SSD層的資源消 耗要小于其存儲在HDD中的資源消耗,而兩者的差值即為文件從HDD層遷移到SSD層的收 Mo
[0026] 記文件A存儲在HDD層的資源消耗為COSTHi COSTHi = CHi + BHi + IHi 記文件A存儲在SSD層的資源消耗為COSTSi COSTSi = CSi + BSi + ISi 記文件遷移到SSD層的收益為Pi Pi = COSTHi - COSTSi 注意,Pi可能為負(fù)值,此時表明文件A遷移到SSD層會增加系統(tǒng)資源開銷。
[0027] 根據(jù)上述公式,定義存儲系統(tǒng)的文件遷移總收益W為:

【權(quán)利要求】
1. 一種考慮訪問隨機(jī)性的文件分級存儲方法,其特征在于包括: 51 :量化存儲系統(tǒng)的資源,對分級存儲系統(tǒng)的HDD層和SSD層的資源進(jìn)行量化; 52 :量化文件對系統(tǒng)中資源的消耗,即文件存儲在某一層時,該層帶寬、IOPS和平均 10時間等資源的開銷; 53 :對存儲系統(tǒng)中所有文件的訪問特性進(jìn)行統(tǒng)計(jì),計(jì)算并量化文件的訪問隨機(jī)性和訪 問熱度; S4 :根據(jù)文件的訪問隨機(jī)性和熱度,采用具體的文件遷移策略對文件進(jìn)行HDD層和SSD 層的遷移。
2. 如權(quán)利要求1所述的方法,其特征在于: 所述步驟S1中的存儲系統(tǒng)的資源,具體包括計(jì)算資源、存儲資源和通信資源。
3. 如權(quán)利要求1所述的方法,其特征在于: 所述步驟S2中文件對系統(tǒng)中資源的消耗,指存儲系統(tǒng)存儲該文件所需消耗的存儲資 源,以及支持上層應(yīng)用系統(tǒng)對文件的訪問所消耗的算計(jì)資源和通信資源。
4. 如權(quán)利要求1所述的方法,其特征在于: 所述步驟S3中對文件的訪問特性進(jìn)行統(tǒng)計(jì),具體包括對文件的訪問10在文件中的分 布統(tǒng)計(jì),和對文件的讀訪問頻率統(tǒng)計(jì),用于計(jì)算文件的訪問隨機(jī)性和熱度。
5. 如權(quán)利要求1所述的方法,其特征在于: 所述步驟S4中具體的文件遷移策略,指根據(jù)步驟S1~S3中的量化數(shù)據(jù),計(jì)算文件遷移 的存儲系統(tǒng)整體性能收益,選取使得系統(tǒng)整體性能收益最大的文件進(jìn)行遷移。
6. 應(yīng)用一種考慮訪問隨機(jī)性的文件分級存儲方法的存儲系統(tǒng),其特征在于包括6個主 要功能模塊:數(shù)據(jù)統(tǒng)計(jì)模塊、數(shù)據(jù)分析模塊、遷移策略模塊、遷移管理模塊、元數(shù)據(jù)模塊和設(shè) 備管理模塊;此六個模塊實(shí)現(xiàn)于存儲系統(tǒng)中文件系統(tǒng)的上層和VFS的下層;同時包括存儲 控制器、磁盤驅(qū)動器和固態(tài)存儲器以及網(wǎng)絡(luò)鏈接。
【文檔編號】G06F17/30GK104376094SQ201410678157
【公開日】2015年2月25日 申請日期:2014年11月24日 優(yōu)先權(quán)日:2014年11月24日
【發(fā)明者】馬春 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1