本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,特別地涉及一種評估模型重要性的方法和裝置。
背景技術(shù):
在各類數(shù)據(jù)應(yīng)用系統(tǒng)或數(shù)據(jù)倉庫中往往存在成千上萬個模型(又稱為數(shù)據(jù)表),其中不同模型的重要程度通常有所不同。對于重要程度不一的模型我們通常加以區(qū)分對待,對重要性較高的模型加以特殊關(guān)注(例如增加數(shù)據(jù)監(jiān)控等等),對重要性較低的模型則不太多關(guān)注。
如何來評估模型的重要性是管理模型工作的一個關(guān)鍵環(huán)節(jié)。
目前通常是技術(shù)人員在模型剛建立時依照個人經(jīng)驗來評估模型是否重要,然后給模型加上“重要模型”、“一般模型”、“非重要模型”等等標(biāo)簽?,F(xiàn)有方案過于主觀,并且沒有考慮到之后的模型的實際使用情況,評估結(jié)果通常不夠準(zhǔn)確。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明提供一種評估模型重要性的方法和裝置,可以客觀地準(zhǔn)確地判斷模型的重要性。
為實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種評估模型重要性的方法。
本發(fā)明的評估模型重要性的方法包括:確定模型的使用頻率;確定所述模型的依賴性指數(shù);根據(jù)所述使用頻率和所述依賴性指數(shù)計算 所述模型的重要性指數(shù),其中所述重要性指數(shù)與所述使用頻率呈正相關(guān),并且所述重要性指數(shù)與所述依賴性指數(shù)呈正相關(guān)。
可選地,所述重要性指數(shù)的計算公式為:Ii=Ri+Vi×W,其中Ii表示第i個模型的重要性指數(shù),Ri表示第i個模型的使用頻率,Vi表示第i個模型的依賴性指數(shù),W表示權(quán)重系數(shù),其中W為正數(shù)。
可選地,所述權(quán)重系數(shù)的計算公式為:其中n表示模型的總數(shù)量。
可選地,所述確定所述模型的依賴性指數(shù)的步驟包括:獲取所述模型對應(yīng)的依賴樹狀結(jié)構(gòu);遍歷所述依賴樹狀結(jié)構(gòu)以得到所述模型的各級子級模型數(shù)量;計算所述模型的所有子級模型數(shù)量總和,作為所述模型的依賴性指數(shù)。
可選地,還包括:根據(jù)所述模型的重要性指數(shù)對所述模型分級。
根據(jù)本發(fā)明的另一方面,提供了一種評估模型重要性的裝置。
本發(fā)明的評估模型重要性的裝置包括:第一確定模塊,用于確定模型的使用頻率;第二確定模塊,用于確定所述模型的依賴性指數(shù);計算模塊,用于根據(jù)所述使用頻率和所述依賴性指數(shù)計算所述模型的重要性指數(shù),其中所述重要性指數(shù)與所述使用頻率呈正相關(guān),并且所述重要性指數(shù)與所述依賴性指數(shù)呈正相關(guān)。
可選地,所述計算模塊還用于按如下公式計算所述重要性指數(shù):Ii=Ri+Vi×W,其中Ii表示第i個模型的重要性指數(shù),Ri表示第i個模型的使用頻率,Vi表示第i個模型的依賴性指數(shù),W表示權(quán)重系數(shù),其中W為正數(shù)。
可選地,所述計算模塊還用于按如下公式計算所述權(quán)重系數(shù):其中n表示模型的總數(shù)量。
可選地,所述第二確定模塊還用于:獲取所述模型對應(yīng)的依賴樹狀結(jié)構(gòu);遍歷所述依賴樹狀結(jié)構(gòu)以得到所述模型的各級子級模型數(shù)量;計算所述模型的所有子級模型數(shù)量總和,作為所述模型的依賴性指數(shù)。
可選地,還包括:分級模塊,用于根據(jù)所述模型的重要性指數(shù)對所述模型分級。
根據(jù)本發(fā)明的技術(shù)方案,綜合考慮了模型的使用頻率高低和依賴性強弱兩方面因素,能夠客觀地、準(zhǔn)確地判斷模型的重要程度的高低。
附圖說明
附圖用于更好地理解本發(fā)明,不構(gòu)成對本發(fā)明的不當(dāng)限定。其中:
圖1是根據(jù)本發(fā)明實施方式的評估模型重要性的方法的基本步驟的示意圖;
圖2是數(shù)據(jù)庫中模型A對應(yīng)的依賴樹狀結(jié)構(gòu)的示意圖;
圖3是根據(jù)本發(fā)明實施方式的評估模型重要性的裝置的主要模塊的示意圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的示范性實施例做出說明,其中包括本發(fā)明實施例的各種細(xì)節(jié)以助于理解,應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識到,可以對這里描述的實施例做出各種改變和修改,而不會背離本發(fā)明的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對公知功能和結(jié)構(gòu)的描述。
圖1是根據(jù)本發(fā)明實施方式的評估模型重要性的方法的基本步驟的示意圖。如圖1所示,本發(fā)明實施方式的評估模型重要性的方法主要包括如下步驟A至步驟C。
步驟A:確定模型的使用頻率。
模型的使用頻率反映了模型在單位時間內(nèi)被使用次數(shù)的多寡。通常可以通過數(shù)據(jù)庫的訪問日志得到模型的使用次數(shù)。具體方法是:解析結(jié)構(gòu)化查詢語言SQL(Structured Query Language)語句的執(zhí)行日志,提取出語句中的模型名稱,若某一個模型在SQL語句中被調(diào)用一次,則使用次數(shù)加一,統(tǒng)計某個模型的30天日均使用次數(shù)或者其他預(yù)設(shè)時間長度內(nèi)的平均使用次數(shù)作為該模型的使用頻率。
步驟B:確定模型的依賴性指數(shù)。
模型的依賴性指數(shù)反映了某個模型本身與其他模型之間關(guān)聯(lián)程度的強弱。若一個模型與較多數(shù)目其他模型相關(guān)聯(lián),則該模型的依賴性指數(shù)較大,反之較小。模型的依賴性指數(shù)有時候也稱為依賴數(shù)量(Relation nums)。確定模型的依賴性指數(shù)的方法可以有多種,本領(lǐng)域技術(shù)人員可以靈活選擇。
步驟C:根據(jù)使用頻率和依賴性指數(shù)計算模型的重要性指數(shù),其中重要性指數(shù)與使用頻率呈正相關(guān),并且重要性指數(shù)與依賴性指數(shù)呈正相關(guān)。
從以上描述中可以看出,本發(fā)明實施方式的評估模型重要性的方法綜合考慮了模型的使用頻率高低和依賴性強弱兩方面因素,能夠客觀地、準(zhǔn)確地判斷模型的重要程度的高低。
本發(fā)明實施方式的評估模型重要性的方法中,重要性指數(shù)的計算公式可以為:Ii=Ri+Vi×W,其中Ii表示第i個模型的重要性指數(shù),Ri表示第i個模型的使用頻率,Vi表示第i個模型的依賴性指數(shù),W表示 權(quán)重系數(shù),其中W為正數(shù)。需要說明的是W的數(shù)值可以根據(jù)經(jīng)驗靈活設(shè)置,通常設(shè)置其數(shù)值大于1。該實施方式的評估模型重要性的方法具有簡便易行等優(yōu)點。
本發(fā)明實施方式的評估模型重要性的方法中,權(quán)重系數(shù)的計算公式可以為:其中n表示模型的總數(shù)量。該實施方式中,權(quán)重系數(shù)W實際上是以數(shù)據(jù)庫中所有模型的平均使用頻率除以所有模型的平均依賴性指數(shù)得到的數(shù)值結(jié)果,該W反應(yīng)了數(shù)據(jù)庫中所有模型的平均情況。該實施方式的評估模型重要性的方法具有簡便易行等優(yōu)點。
本發(fā)明實施方式的評估模型重要性的方法中,步驟B可以具體包括:獲取模型對應(yīng)的依賴樹狀結(jié)構(gòu);遍歷依賴樹狀結(jié)構(gòu)以得到模型的各級子級模型數(shù)量;計算模型的所有子級模型數(shù)量總和,作為模型的依賴性指數(shù)。該實施方式的評估模型重要性的方法具有邏輯合理、適用性強等優(yōu)點。
例如:圖2示出了數(shù)據(jù)庫中模型A對應(yīng)的依賴樹狀結(jié)構(gòu),遍歷該依賴樹狀結(jié)構(gòu),發(fā)現(xiàn)模型A具有B和C這兩個第一子級依賴模型,具有D、E、F、G這四個第二子級依賴模型,還有H、I、J、K、L、M、N、O這八個第三子級依賴模型,因此模型A總共有2+4+8=14個子級依賴模型,記模型A的依賴性指數(shù)為“14”。
可選地,還包括:根據(jù)模型的重要性指數(shù)對所述模型分級。該步驟具體操作方式可以靈活設(shè)置。
例如:可以預(yù)先設(shè)置閾值,若某模型的重要性指數(shù)大于預(yù)設(shè)的閾 值,則該模型屬于重要模型,反之為非重要模型。也可以設(shè)置“重要性指數(shù)排在前20%的模型為重要模型,重要性指數(shù)排在后20%的模型為次要模型,其他模型為普通模型”等規(guī)則,來實現(xiàn)對模型分級。
圖3是根據(jù)本發(fā)明實施方式的評估模型重要性的裝置的主要模塊的示意圖。如圖3所示,本發(fā)明實施方式的評估模型重要性的裝置30主要包括:第一確定模塊31、第二確定模塊32和計算模塊33。第一確定模塊31用于確定模型的使用頻率。第二確定模塊32用于確定模型的依賴性指數(shù)。計算模塊33用于根據(jù)使用頻率和依賴性指數(shù)計算模型的重要性指數(shù),其中重要性指數(shù)與使用頻率呈正相關(guān),并且重要性指數(shù)與依賴性指數(shù)呈正相關(guān)。
從以上描述中可以看出,本發(fā)明實施方式的評估模型重要性的裝置綜合考慮了模型的使用頻率高低和依賴性強弱兩方面因素,能夠客觀地、準(zhǔn)確地判斷模型的重要程度的高低。
本發(fā)明實施方式的評估模型重要性的裝置中,計算模塊33還可以用于按如下公式計算重要性指數(shù):Ii=Ri+Vi×W,其中Ii表示第i個模型的重要性指數(shù),Ri表示第i個模型的使用頻率,Vi表示第i個模型的依賴性指數(shù),W表示權(quán)重系數(shù),其中W為正數(shù)。該實施方式的評估模型重要性的裝置具有簡便易行等優(yōu)點。
本發(fā)明實施方式的評估模型重要性的裝置中,計算模塊33還可以用于按如下公式計算權(quán)重系數(shù):其中n表示模型的總數(shù)量。該實施方式的評估模型重要性的裝置具有簡便易行等優(yōu)點。
本發(fā)明實施方式的評估模型重要性的裝置中,第二確定模塊32還可以用于:獲取模型對應(yīng)的依賴樹狀結(jié)構(gòu);遍歷依賴樹狀結(jié)構(gòu)以得到模型的各級子級模型數(shù)量;計算模型的所有子級模型數(shù)量總和,作為 模型的依賴性指數(shù)。該實施方式的評估模型重要性的裝置具有邏輯合理、適用性強等優(yōu)點。
本發(fā)明實施方式的評估模型重要性的裝置中,還可以包括分級模塊,該分級模塊用于根據(jù)模型的重要性指數(shù)對模型分級。
上述具體實施方式,并不構(gòu)成對本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員應(yīng)該明白的是,取決于設(shè)計要求和其他因素,可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)范圍之內(nèi)。