本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)生命周期監(jiān)控方法及裝置。
背景技術(shù):
電信業(yè)的數(shù)據(jù)量長年保持高速增長,給數(shù)據(jù)的管理和維護(hù)帶來諸多問題,如存儲空間、數(shù)據(jù)保存策略等。隨著數(shù)據(jù)存儲量的增加,如何保存數(shù)量龐大的數(shù)據(jù),以及如何有效率地從龐大的數(shù)據(jù)中快速取得數(shù)據(jù),是目前數(shù)據(jù)存儲和數(shù)據(jù)維護(hù)所面對的一項極大的挑戰(zhàn)。
數(shù)據(jù)的形式眾多,例如有文字、語音、影像、圖案、及其混合型式,用于存儲數(shù)據(jù)的存儲介質(zhì)眾多,例如,磁盤、光盤、硬盤等。各種存儲介質(zhì)的容量、采購成本也不同。如何根據(jù)數(shù)據(jù)的特點合理選擇存儲介質(zhì),是數(shù)據(jù)維護(hù)必須要考慮的問題。
目前,用戶進(jìn)行數(shù)據(jù)維護(hù)通常是根據(jù)數(shù)據(jù)的重要程度、數(shù)據(jù)調(diào)用情況、企業(yè)的實際情況等因素,結(jié)合采購成本,由用戶自行確定數(shù)據(jù)存儲策略,這種數(shù)據(jù)維護(hù)方式?jīng)]有考慮到數(shù)據(jù)生命周期的特點,完全依賴于各用戶的經(jīng)驗,隨意性較大,科學(xué)性、合理性較差。
而數(shù)據(jù)的生命周期分為不同階段,各生命周期階段數(shù)據(jù)的性能、可用性、保存等要求也不一樣,目前對于數(shù)據(jù)維護(hù)方面,僅根據(jù)企業(yè)規(guī)范制定數(shù)據(jù)存儲策略,相關(guān)監(jiān)測系統(tǒng)和工具匱乏,沒有對數(shù)據(jù)的各生命周期階段進(jìn)行監(jiān)控,也無法對數(shù)據(jù)生命周期的階段進(jìn)行有效劃分,相應(yīng)的,無法準(zhǔn)確監(jiān)控數(shù)據(jù)在各個生命周期階段的存儲狀態(tài),也就無法指導(dǎo)制定合理的數(shù)據(jù)存儲策略。
因此,亟需一種數(shù)據(jù)生命周期監(jiān)控方案以解決上述技術(shù)問題。
技術(shù)實現(xiàn)要素:
本發(fā)明針對現(xiàn)有技術(shù)中存在的上述不足,提供一種數(shù)據(jù)生命周期監(jiān)控方法及裝置,用以至少部分解決現(xiàn)有的數(shù)據(jù)存儲策略不合理的問題。
本發(fā)明為解決上述技術(shù)問題,采用如下技術(shù)方案:
本發(fā)明提供一種數(shù)據(jù)生命周期監(jiān)控方法,包括:
獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率;
根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段。
進(jìn)一步的,所述獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率之前,所述方法還包括:
對待維護(hù)數(shù)據(jù)進(jìn)行分類;
所述獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率,根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段,具體包括:
獲取各類型數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率,根據(jù)各類型數(shù)據(jù)的存儲時間和調(diào)用頻率,分別為各類型數(shù)據(jù)劃分生命周期階段。
優(yōu)選的,所述根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段,具體包括:
建立多維度判別模型,對所述模型求導(dǎo),得到所述數(shù)據(jù)的各生命周期階段的臨界點;
根據(jù)所述數(shù)據(jù)的各生命周期階段的臨界點劃分所述數(shù)據(jù)的生命周期;
其中,所述模型為:
t為存儲時間,f為調(diào)用頻率,b1、c1、b2、c2為常數(shù)。
進(jìn)一步的,所述根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段之后,所述方法還包括:
顯示所述數(shù)據(jù)的各生命周期階段的臨界點。
進(jìn)一步的,所述根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段之后,所述方法還包括:
根據(jù)所述存儲時間和調(diào)用頻率,圖形化所述數(shù)據(jù)的生命周期階段,得到所述數(shù)據(jù)的生命周期曲線,并顯示所述數(shù)據(jù)的生命周期曲線。
本發(fā)明還提供一種數(shù)據(jù)生命周期監(jiān)控服務(wù)器,包括獲取模塊和處理模塊,
所述獲取模塊用于,獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率;
所述處理模塊用于,根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段。
進(jìn)一步的,所述數(shù)據(jù)生命周期監(jiān)控服務(wù)器,還包括分類模塊,所述分類模塊用于,在所述獲取模塊獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率之前,對待維護(hù)數(shù)據(jù)進(jìn)行分類;
所述獲取模塊具體用于,獲取各類型數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率;
所述處理模塊具體用于,根據(jù)各類型數(shù)據(jù)的存儲時間和調(diào)用頻率,分別為各類型數(shù)據(jù)劃分生命周期階段。
優(yōu)選的,所述處理模塊具體用于,建立多維度判別模型,對所述模型求導(dǎo),得到所述數(shù)據(jù)的各生命周期階段的臨界點,并根據(jù)所述數(shù)據(jù)的各生命周期階段的臨界點劃分所述數(shù)據(jù)的生命周期;其中,所述模型為:t為存儲時間,f為調(diào)用頻率,b1、c1、b2、c2為常數(shù)。
進(jìn)一步的,所述數(shù)據(jù)生命周期監(jiān)控服務(wù)器還包括可視化模塊,
所述可視化模塊用于,在所述處理模塊根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段之后,顯示所述數(shù)據(jù)的各生命周期階段的臨界點。
進(jìn)一步的,所述可視化模塊還用于,根據(jù)所述存儲時間和調(diào)用頻率,圖形化所述數(shù)據(jù)的生命周期階段,得到所述數(shù)據(jù)的生命周期曲線,并顯示所述數(shù)據(jù)的生命周期曲線。
不同階段的數(shù)據(jù)其性能、可用性、保存等要求不同,本發(fā)明通過獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻,根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段,以便針對所述數(shù)據(jù)的各生命周期階段選擇相應(yīng)的數(shù)據(jù)存儲策略。本發(fā)明的數(shù)據(jù)生命周期監(jiān)控方案,能夠?qū)?shù)據(jù)狀態(tài)進(jìn)行監(jiān)測,實時、準(zhǔn)確感知數(shù)據(jù)狀態(tài),從而采取相應(yīng)的存儲策略,指導(dǎo)數(shù)據(jù)遷移,根據(jù)數(shù)據(jù)的不同生命周期階段特點確定出的數(shù)據(jù)存儲策略更為合理。
附圖說明
圖1為本發(fā)明實施例提供的數(shù)據(jù)生命周期監(jiān)控流程圖;
圖2為本發(fā)明實施例提供的數(shù)據(jù)生命周期分布示意圖;
圖3為本發(fā)明實施例提供的數(shù)據(jù)生命周期監(jiān)控服務(wù)器的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明中的附圖,對本發(fā)明中的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實施例是本發(fā)明的一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
以下結(jié)合圖1、2,對本發(fā)明的數(shù)據(jù)生命周期監(jiān)控流程進(jìn)行詳細(xì)說明。
如圖1所示,所述數(shù)據(jù)生命周期監(jiān)控流程包括以下步驟:
步驟101,獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率。
具體的,所述數(shù)據(jù)為預(yù)設(shè)時長內(nèi)的歷史數(shù)據(jù),可以從數(shù)據(jù)倉庫中獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率。調(diào)用頻率是指數(shù)據(jù)的讀寫頻率。預(yù)設(shè)時長可以為24個月,在本發(fā)明實施例中,存儲時間的單位為月,如圖2所示,監(jiān)控17個月內(nèi)的歷史數(shù)據(jù),即預(yù)設(shè)時長為17個月。
步驟102,根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段。
由于數(shù)據(jù)存儲容量與數(shù)據(jù)調(diào)用頻率和數(shù)據(jù)存儲時間相關(guān),因此,可以通過存儲時間、使用頻率兩個指標(biāo)反映數(shù)據(jù)存儲容量的情況。處于不同數(shù)據(jù)生命周期階段的數(shù)據(jù)在性能、可用性、保存時間等方面要求不同,本發(fā)明實施例根據(jù)數(shù)據(jù)的存儲時間和調(diào)用頻率,將數(shù)據(jù)的生命周期劃分為多個階段,用于針對不同的數(shù)據(jù)生命周期階段采用不同的存儲策略。
結(jié)合圖2所示,數(shù)據(jù)的生命周期階段包括:近線階段、在線階段和歸檔階段。
通常情況下,在數(shù)據(jù)生命周期的初期(即近線階段),數(shù)據(jù)調(diào)用頻率較低。在數(shù)據(jù)生命周期的中期(即在線階段),隨著時間的推移,數(shù)據(jù)增長速度提升,數(shù)據(jù)調(diào)用頻率變化較大。在數(shù)據(jù)生命周期的后期(即歸檔階段),隨著時間的推移,數(shù)據(jù)調(diào)用頻率變化并不明顯,說明數(shù)據(jù)所承載的業(yè)務(wù)進(jìn)入去飽和期。
具體的,可以通過建立多維度判別MDMP(Multi-perspective and multi-dimensional)模型,對所述MDMP模型求導(dǎo),得到數(shù)據(jù)的各生命周期階段的臨界點,并根據(jù)所述數(shù)據(jù)的各生命周期階段的臨界點劃分所述數(shù)據(jù)的生命周期。如圖2所示,橫坐標(biāo)為數(shù)據(jù)的存儲時間,縱坐標(biāo)為數(shù)據(jù)的調(diào)用頻率,曲線為數(shù)據(jù)生命周期曲線。從圖2可以看出,近線階段與在線階段的臨界點為A,在線階段與歸檔階段的臨界點為B,A點對應(yīng)的存儲時間為3月,B點對應(yīng)的存儲時間為10月,因此,0-2月為近線階段,3-9月為在線階段,10-16月為歸檔階段。
所述MPMD模型為:
其中,t為存儲時間,f為調(diào)用頻率,b1、c1、b2、c2為常數(shù)。
上述四個常數(shù)的計算策略為:
選取同類數(shù)據(jù)的預(yù)設(shè)時長內(nèi)(例如24個月)的存儲數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),并用回歸函數(shù)Logistic(x)分別對存儲時間t,及調(diào)用頻率f進(jìn)行分析,求出b1、c1、b2、c2的常數(shù)值。即:
函數(shù)曲線呈S型分布,對兩個拐點數(shù)據(jù)求導(dǎo)數(shù),得到b1、c1的二元一次方程組,即常數(shù)b1、c1。同理,計算常數(shù)b2、c2。
對MPMD模型求導(dǎo),得到函數(shù)v的拐點A和B,所述拐點即為相鄰生命周期階段的臨界點。
MPMD模型可以從多個角度和多個維度對事物進(jìn)行評價,從而對事物準(zhǔn)確定位。
需要說明的是,在步驟102之后,可以針對所述數(shù)據(jù)的各生命周期階段選擇相應(yīng)的數(shù)據(jù)存儲策略。
具體的,在數(shù)據(jù)生命周期的近線階段,通常是業(yè)務(wù)剛剛開始,數(shù)據(jù)調(diào)用不太頻繁,可以選用采購成本相對較低、數(shù)據(jù)讀取靈敏度較低的存儲介質(zhì)存儲數(shù)據(jù)(即近線存儲策略)。在數(shù)據(jù)生命周期的在線階段,數(shù)據(jù)的使用頻率較高、增幅較大,需要使用數(shù)據(jù)讀取靈敏度較高、數(shù)據(jù)讀取速度較快,質(zhì)量較好的存儲介質(zhì)存儲數(shù)據(jù),以確保數(shù)據(jù)的高可用性(即在線存儲策略)。在數(shù)據(jù)生命周期的歸檔階段,通常是業(yè)務(wù)的去飽和階段,數(shù)據(jù)重要性會逐漸降低,調(diào)用頻率會隨之下降,此時,可以選用數(shù)據(jù)讀取靈敏度較低的存儲介質(zhì)存儲數(shù)據(jù),以降低數(shù)據(jù)維護(hù)成本的資源開銷(即歸檔存儲策略)。
通過上述步驟可以看出,本發(fā)明通過獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻,根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段,以便針對所述數(shù)據(jù)的各生命周期階段選擇相應(yīng)的數(shù)據(jù)存儲策略。本發(fā)明的數(shù)據(jù)生命周期監(jiān)控方案,能夠?qū)?shù)據(jù)狀態(tài)進(jìn)行監(jiān)測,實時、準(zhǔn)確感知數(shù)據(jù)狀態(tài),從而采取相應(yīng)的存儲策略,指導(dǎo)數(shù)據(jù)遷移,根據(jù)數(shù)據(jù)的不同生命周期階段特點確定出的數(shù)據(jù)存儲策略更為合理。
進(jìn)一步的,在步驟101之前還可以包括以下步驟100:
步驟100,對待維護(hù)數(shù)據(jù)進(jìn)行分類。
具體的,待維護(hù)數(shù)據(jù)可以按照以下分類標(biāo)準(zhǔn)件分類:客戶域、公共域、服務(wù)域、產(chǎn)品域、資源域、市場營銷域、合作伙伴域、企業(yè)管理域;服務(wù)支撐型數(shù)據(jù)的明細(xì)數(shù)據(jù)、應(yīng)用數(shù)據(jù)、原型數(shù)據(jù)、匯總數(shù)據(jù);系統(tǒng)運營數(shù)據(jù)的程序軟件、日志數(shù)據(jù)、過程數(shù)據(jù)、臨時數(shù)據(jù)。
相應(yīng)的,在后續(xù)的步驟101-102中,針對各類型數(shù)據(jù)分別進(jìn)行監(jiān)控,即獲取各類型數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率,根據(jù)各類型數(shù)據(jù)的存儲時間和調(diào)用頻率,分別為各類型數(shù)據(jù)劃分生命周期階段。
進(jìn)一步的,在步驟102之后,所述數(shù)據(jù)生命周期監(jiān)控流程還可以包括以下步驟:
步驟103,顯示所述數(shù)據(jù)的各生命周期階段的臨界點。
具體的,將存儲時間和調(diào)用頻率這兩個參數(shù)以一個二維數(shù)組的形式,表示數(shù)據(jù)的生命周期階段的臨界點A和B,并通過可視化模塊呈現(xiàn)出來。
步驟104,根據(jù)所述存儲時間和調(diào)用頻率,圖形化所述數(shù)據(jù)的生命周期階段,得到所述數(shù)據(jù)的生命周期曲線,并顯示所述數(shù)據(jù)的生命周期曲線。
具體的,可視化模塊將各類型的數(shù)據(jù)的存儲時間和調(diào)用頻率圖形化處理后,得到該類型數(shù)據(jù)的生命周期曲線(如圖2所示),并呈現(xiàn)出來。圖形化數(shù)據(jù)的生命周期曲線的具體實現(xiàn)方式屬于現(xiàn)有技術(shù),在此不再贅述。
需要說明的是,可以單獨執(zhí)行步驟103或單獨執(zhí)行步驟104,也可以既執(zhí)行步驟103又執(zhí)行步驟104,步驟103和步驟104的執(zhí)行順序不限,也可以同步執(zhí)行。
本發(fā)明的數(shù)據(jù)生命周期監(jiān)控方案,選取存儲時間和調(diào)用頻率兩個指標(biāo)對海量數(shù)據(jù)進(jìn)行監(jiān)控,結(jié)合MPMD模型,使用MPMD算法分析處理,可視化數(shù)據(jù)的生命周期階段的趨勢及狀態(tài)轉(zhuǎn)變拐點。相對于目前按照企業(yè)規(guī)范維護(hù)數(shù)據(jù)的方案,本發(fā)明采用信息化手段,結(jié)合運維系統(tǒng)實際情況,更加靈活,提高數(shù)據(jù)維護(hù)的處理效率。
本發(fā)明的數(shù)據(jù)生命周期監(jiān)測方案,監(jiān)測運維系統(tǒng)中核心數(shù)據(jù)的成長趨勢,通過獲取存儲時間、調(diào)用頻率兩個關(guān)鍵指標(biāo),得出數(shù)據(jù)在不同時期的分布情況,實現(xiàn)數(shù)據(jù)生命周期自動化管理。
基于相同的技術(shù)構(gòu)思,本發(fā)明實施例還提供一種數(shù)據(jù)生命周期監(jiān)控服務(wù)器,如圖3所示,該數(shù)據(jù)生命周期監(jiān)控服務(wù)器3可以包括獲取模塊31和處理模塊32。
獲取模塊31用于,獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率。
處理模塊32用于,根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段。
進(jìn)一步的,所述數(shù)據(jù)生命周期監(jiān)控服務(wù)器還包括分類模塊33,分類模塊33用于,在獲取模塊31獲取數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率之前,對待維護(hù)數(shù)據(jù)進(jìn)行分類。
獲取模塊31具體用于,獲取各類型數(shù)據(jù)在預(yù)設(shè)時長內(nèi)的存儲時間和調(diào)用頻率。
處理模塊32具體用于,根據(jù)各類型數(shù)據(jù)的存儲時間和調(diào)用頻率,分別為各類型數(shù)據(jù)劃分生命周期階段。
優(yōu)選的,處理模塊32具體用于,建立多維度判別模型,對所述模型求導(dǎo),得到所述數(shù)據(jù)的各生命周期階段的臨界點,并根據(jù)所述數(shù)據(jù)的各生命周期階段的臨界點劃分所述數(shù)據(jù)的生命周期;其中,所述模型為:t為存儲時間,f為調(diào)用頻率,b1、c1、b2、c2為常數(shù)。
進(jìn)一步的,所述數(shù)據(jù)生命周期監(jiān)控服務(wù)器還包括可視化模塊34,可視化模塊34用于,在處理模塊32根據(jù)所述存儲時間和調(diào)用頻率,劃分所述數(shù)據(jù)的生命周期階段之后,顯示所述數(shù)據(jù)的各生命周期階段的臨界點。
進(jìn)一步的,可視化模塊34還用于,根據(jù)所述存儲時間和調(diào)用頻率,圖形化所述數(shù)據(jù)的生命周期階段,得到所述數(shù)據(jù)的生命周期曲線,并顯示所述數(shù)據(jù)的生命周期曲線。
可以理解的是,以上實施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實施方式,然而本發(fā)明并不局限于此。對于本領(lǐng)域內(nèi)的普通技術(shù)人員而言,在不脫離本發(fā)明的精神和實質(zhì)的情況下,可以做出各種變型和改進(jìn),這些變型和改進(jìn)也視為本發(fā)明的保護(hù)范圍。