本發(fā)明是一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的資源安全保護(hù)方法,將以數(shù)據(jù)、信息和知識(shí)等形態(tài)的資源根據(jù)資源存儲(chǔ)代價(jià)和資源挖掘代價(jià)的比較確定應(yīng)在哪一層圖譜存儲(chǔ)架構(gòu)上進(jìn)行存儲(chǔ)。主要用于對數(shù)據(jù)、信息和知識(shí)等資源的隱私性和安全性維護(hù),屬于分布式計(jì)算和軟件工程學(xué)技術(shù)交叉領(lǐng)域。
背景技術(shù):
:大數(shù)據(jù)是進(jìn)幾年來科技界的高頻詞匯,然而大數(shù)據(jù)時(shí)代下隱私保護(hù)的缺失也成為人們面臨的嚴(yán)峻挑戰(zhàn)。資源的收集和使用會(huì)產(chǎn)生價(jià)值,然而數(shù)據(jù)隱私的保護(hù)卻尚未得到管理。資源維護(hù)必須保證資源不會(huì)受到未經(jīng)授權(quán)情況下對資源的使用、篡改、丟失、銷毀以及其他情況的發(fā)生。本發(fā)明提出的一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的資源安全保護(hù)方法的關(guān)鍵技術(shù)在于對在不同層次圖譜上存儲(chǔ)資源時(shí)量化資源的存儲(chǔ)代價(jià)和搜索代價(jià),從而計(jì)算出資源在不同圖譜上存儲(chǔ)時(shí)的安全系數(shù)。在為資源擁有者提供資源保護(hù)服務(wù)時(shí),根據(jù)資源擁有者的投入對其待保護(hù)的資源進(jìn)行合理組織和存儲(chǔ)。技術(shù)實(shí)現(xiàn)要素:技術(shù)問題:本發(fā)明的目的是提供一種對數(shù)據(jù)(datadik)、信息(informationdik)和知識(shí)(knowledgedik)等形態(tài)的資源的原始表述的自然語言的機(jī)器理解、自動(dòng)處理、自動(dòng)綜合和自動(dòng)分析方法,用于解決對不同類型、不同規(guī)模資源的合理存儲(chǔ),提高資源安全系數(shù),為資源提供主動(dòng)防護(hù),降低被攻擊者獲取的概率。技術(shù)方案:本發(fā)明是一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的資源安全保護(hù)方法,從應(yīng)對自動(dòng)增量式結(jié)合經(jīng)驗(yàn)知識(shí)和減少人工專家交互負(fù)擔(dān)等兩個(gè)方面考慮,從資源建模、資源處理、處理優(yōu)化和資源管理等角度進(jìn)行研究,基于對現(xiàn)有知識(shí)圖譜(knowledgegraph)概念的拓展提出了一種三層可自動(dòng)抽象調(diào)整的解決架構(gòu)。這個(gè)架構(gòu)包括:數(shù)據(jù)圖譜(datagraphdik)、信息圖譜(informationgraphdik)和知識(shí)圖譜(knowledgegraphdik)等三個(gè)層面?;诓煌瑢哟蔚膱D譜架構(gòu)存儲(chǔ)資源擁有者需要保護(hù)的資源,根據(jù)資源擁有者的投入確定資源維護(hù)的安全系數(shù)。體系結(jié)構(gòu)圖1給出了投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的資源安全保護(hù)方法的流程圖,獲取到用戶的資源保護(hù)需求后,計(jì)算在不同資源空間上搜索的代價(jià)和存儲(chǔ)代價(jià),根據(jù)用戶投入確定最終方案。表1所示為對datadik、intormationdik和knowledgedik等形態(tài)的資源以及對應(yīng)圖譜層次的介紹。表2所示為單位資源不同類型之間的轉(zhuǎn)換代價(jià)。下面我們給出datagraphdik,informationgraphdik和knowledgegraphdik的具體說明:datagraphdik:datagraphdik:=collection{array,list,stack,queue,tree,graph}.datagraphdik是各種數(shù)據(jù)結(jié)構(gòu)包括數(shù)組(array)、鏈表(list)、棧(stack)、隊(duì)列(queue)、樹(tree)和圖(graph)等的集合(collection)。datagraphdik只能對圖譜上表示的datadik進(jìn)行靜態(tài)分析,無法分析和預(yù)測datadik的動(dòng)態(tài)變化。informationgraphdik:informationgraphdik:=combination{relateddatadik}。informationgraphdik是相互關(guān)聯(lián)的datadik(relateddatadik)的組合(combination),informationdik是通過datadik和datadik組合之后的上下文傳達(dá)的,經(jīng)過概念映射和相關(guān)關(guān)系組合之后的適合分析和解釋的信息。在informationgraphdik上進(jìn)行數(shù)據(jù)清洗,消除冗余數(shù)據(jù),根據(jù)結(jié)點(diǎn)之間的交互度進(jìn)行初步抽象,提高設(shè)計(jì)的內(nèi)聚性。knowledgegraphdik:knowledgegraphdik:=collection{statisticrules}。knowledgegraphdik實(shí)質(zhì)是語義網(wǎng)絡(luò)和由informationdik總結(jié)出的統(tǒng)計(jì)規(guī)則(statisticrules)的集合(collection)。knowledgegraphdik蘊(yùn)含豐富的語義關(guān)系,在knowledgegraphdik上能通過信息推理和實(shí)體鏈接提高knowledgegraphdik的邊密度和結(jié)點(diǎn)密度,knowledgegraphdik的無結(jié)構(gòu)特性使得其自身可以無縫鏈接。信息推理需要有相關(guān)關(guān)系規(guī)則的支持,這些規(guī)則可以由人手動(dòng)構(gòu)建,但往往耗時(shí)費(fèi)力,得到復(fù)雜關(guān)系中的所有推理規(guī)則更加困難。使用路徑排序算法將每個(gè)不同的關(guān)系路徑作為一維特征,通過在knowledgegraphdik中構(gòu)建大量的關(guān)系路徑來構(gòu)建關(guān)系分類的特征向量和關(guān)系分類器來提取關(guān)系,本發(fā)明將搜索目標(biāo)資源集合定義為ipr:={ipr1,ipr2,ipr3},ipr的類型集合為x={x1,x2,x3},每種資源的規(guī)模為n={n1,n2,n3},資源空間為sor={sor1,sor2,sor3},sor的類型集合為y={y1,y2,y3},每種資源的規(guī)模為m={m1,m2,m3},假定ipr中所有類型資源已在當(dāng)前資源存儲(chǔ)空間(sor)以任意一種存儲(chǔ)方案存儲(chǔ)完畢。類型變量集合為z={datadik,informationdik,knowledgedik},對不同類型變量進(jìn)行賦值,datadik:=1,informationdik:=2,knowledgedik:=3。表1.資源類型的漸進(jìn)形式表2.ipr中單位資源類型轉(zhuǎn)換的原子代價(jià)datadikinformationdikknowledgedikx1c11c12c13x2c21c22c23x3c31c32c33標(biāo)注:c11:從x1轉(zhuǎn)移到datadik的代價(jià);c12:從x1轉(zhuǎn)移到informationdik的代價(jià);c13:從x1轉(zhuǎn)移到knowledgedik的代價(jià);c21:從x2轉(zhuǎn)移到datadik的代價(jià);c22:從x2轉(zhuǎn)移到informationdik的代價(jià);c23:從x2轉(zhuǎn)移到knwledgedik的代價(jià);c31:從x3轉(zhuǎn)移到datadik的代價(jià);c32:從x3轉(zhuǎn)移到informationdik的代價(jià);c33:從x3轉(zhuǎn)移到knowledgedik的代價(jià)。表3.sor中單位資源類型轉(zhuǎn)換的原子代價(jià)標(biāo)注:c’11:從datadik轉(zhuǎn)移到y(tǒng)1的代價(jià);c’12:從informationdik轉(zhuǎn)移到y(tǒng)1的代價(jià);c’13:從knowledgedik轉(zhuǎn)移到y(tǒng)1的代價(jià);c’21:從datadik轉(zhuǎn)移到y(tǒng)2的代價(jià);c’22:從informationdik轉(zhuǎn)移到y(tǒng)2的代價(jià);c’23:從knwledgedik轉(zhuǎn)移到y(tǒng)2的代價(jià);c’31:從datadik轉(zhuǎn)移到y(tǒng)3的代價(jià);c’32:從informationdik轉(zhuǎn)移到y(tǒng)3的代價(jià);c’33:從knowledgedik轉(zhuǎn)移到y(tǒng)3的代價(jià)。有益效果:本發(fā)明提出了一種基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的安全性驅(qū)動(dòng)的分類型資源存儲(chǔ)方法,主要用于解決對于以datadik,informaitiondik和knowledgedik形態(tài)存在的資源存儲(chǔ)和資源保護(hù)等問題。通過使用本發(fā)明提出的方法可以實(shí)現(xiàn)對不同類型資源的合理組織和存儲(chǔ),根據(jù)資源擁有者的投入決定資源的安全系數(shù)。該方法具有如下優(yōu)點(diǎn):1)對資源類型的劃分;將資源劃分為datadik、informationdik和knowledgedik,便于挖掘資源之間的聯(lián)系,從datadik經(jīng)過抽象得到informationdik、knowledgedik,從knowledgedik進(jìn)行推理得到datadik、informationdik;2)允許跨層存儲(chǔ)資源僅僅通過資源類型無法判斷出資源應(yīng)存儲(chǔ)在哪一類圖譜上,本發(fā)明提出資源存儲(chǔ)代價(jià)和搜索代價(jià)的計(jì)算,根據(jù)代價(jià)和安全系數(shù)確定資源的存儲(chǔ)位置;3)資源擁有者投入驅(qū)動(dòng)基于datagraphdik,informationgraphdik和knowledgegraphdik的代價(jià)計(jì)算的分類型資源存儲(chǔ)方法,提出在不同圖譜上存儲(chǔ)代價(jià)和安全系數(shù)的衡量,通過參數(shù)化存儲(chǔ)過程和搜索過程,確定安全系數(shù)最高的資源存儲(chǔ)框架,根據(jù)資源擁有者的投入確定在哪一層圖譜上存儲(chǔ)其需要保護(hù)的資源。附圖說明圖1是一種投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的資源安全保護(hù)方法的體系結(jié)構(gòu)流程圖。具體實(shí)施方式投入決定的安全性可定義的基于數(shù)據(jù)圖譜、信息圖譜和知識(shí)圖譜的資源安全保護(hù)方法,其特征在于對以datadik,informaitiondik和knowledgedik形態(tài)存在的資源根據(jù)存儲(chǔ)代價(jià)和安全系數(shù)進(jìn)行合理的組織和存儲(chǔ),僅僅通過資源類型無法判斷資源應(yīng)存儲(chǔ)在哪一層圖譜上。具體實(shí)現(xiàn)步驟為:步驟1)對應(yīng)于圖1中操作001,對x中每個(gè)元素依次取z中的值,形成組合情形x={x1i,x2j,x3k},i,j,k∈{1,2,3};步驟2)對應(yīng)于圖1中操作002,對每種情形,根據(jù)公式1計(jì)算ipr中資源當(dāng)前情形向每種情形轉(zhuǎn)移的代價(jià)(costmt1):costmt1ijk=c1i*n1+c2j*n2+c3k*n3,(1)i,j,k∈{1,2,3}步驟3)對應(yīng)于圖1中操作003,對y中每個(gè)元素依次取z中的值,形成組合情形y={y1m,y2n,y3p},m,n,p∈{1,2,3};步驟4)對應(yīng)于圖1中操作004,根據(jù)公式2計(jì)算在sor中搜索ipr中資源所要花費(fèi)的計(jì)算代價(jià)(cost計(jì)算):cost計(jì)算=λ*m+(1-λ)*αm*βc(xli,x2j,x3p→y1m,y2n,y3p)(2)其中c(x1i,x2j,x3p->y1m,y2n,y3p)為在sor中查找ipr所要花費(fèi)的代價(jià),α和β分別表示圖譜規(guī)模和資源類型轉(zhuǎn)換代價(jià)占cost計(jì)算的權(quán)重,均可通過數(shù)據(jù)訓(xùn)練得出,λ表示資源是否需要轉(zhuǎn)換不同類型,若需要轉(zhuǎn)換,則用0表示,否則,用1表示;步驟5)對應(yīng)于圖1中操作005,對y中每種情形,根據(jù)公式3計(jì)算y中每種資源形態(tài)向sor中資源當(dāng)前情形轉(zhuǎn)移的代價(jià)(costmt2):costmt2mnp=c′m1*m1+c′n2*m2+c′p3*m3,(3)m,n,p∈{1,2,3}步驟6)對應(yīng)于圖1中操作006,根據(jù)步驟2、4、5得到的costmt1ijk、costmt2mnp和cost計(jì)算,根據(jù)公式4計(jì)算從當(dāng)前ipr向x轉(zhuǎn)移的代價(jià)和y中資源向sor狀態(tài)轉(zhuǎn)移的代價(jià)和計(jì)算代價(jià)的總和(total_cost):total_cost=costmt1ijk+costmt2mnp+cost計(jì)算(4)步驟7)根據(jù)步驟5得到的在不同圖譜上搜索資源的cost計(jì)算,由高到低進(jìn)行排序,將cost計(jì)算最高的方案定為最優(yōu)方案,設(shè)定最優(yōu)方案安全系數(shù)為100,并根據(jù)公式5計(jì)算當(dāng)前方案和其他方案資源的安全性系數(shù)st:其中cost計(jì)算i表示方案i的計(jì)算代價(jià),max(cost計(jì)算)表示最優(yōu)方案的計(jì)算代價(jià);步驟8)對應(yīng)于圖1中操作007,獲取用戶預(yù)期投入(inve0)。本發(fā)明設(shè)定一個(gè)總代價(jià)(total_cost0),對應(yīng)于圖1中操作008,將不同情形下total_cost的值與total_cost0進(jìn)行比較,并將對應(yīng)情形所需用戶投入(inve)和inve0作比較,判斷是否滿足條件“total_costi>total_cost0&invei<inve0”。009當(dāng)total_cost大于total_cost0時(shí),令total_cost0等于當(dāng)前total_cost,若total_cost小于total_cost0時(shí),執(zhí)行下一步操作,inve的計(jì)算方法如公式5所示:inve=γ*total_cost(5)其中γ表示單位代價(jià)所需用戶投入,可通過數(shù)據(jù)訓(xùn)練得出;步驟9)對應(yīng)于圖1中操作010,判斷當(dāng)x或y中的組合是否窮舉完畢。若沒有窮舉完畢,返回步驟1繼續(xù)窮舉。若窮舉完,對應(yīng)于圖1中操作011,按照當(dāng)前total_cost0對應(yīng)的的方案調(diào)整ipr和sor中資源的類型;步驟10)輸出調(diào)整后方案的安全系數(shù)。當(dāng)前第1頁12