亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法與流程

文檔序號:12602650閱讀:462來源:國知局
基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法與流程

本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法。



背景技術(shù):

近些年,科學(xué)工作流管理的概念被應(yīng)用到許多企業(yè)信息系統(tǒng)中。類似于Staffware,IBM MQSeries,COSA等的工作流管理系統(tǒng)提供了通用模型和制定結(jié)構(gòu)化業(yè)務(wù)流的能力。通過圖形化的方式對業(yè)務(wù)事件先后執(zhí)行順序的描述,刻畫出更為直觀、可理解的業(yè)務(wù)生命周期模型,也就是所謂的科學(xué)工作流模型,對企業(yè)事務(wù)進(jìn)行更為高效、合理的管理運(yùn)營?,F(xiàn)如今,科學(xué)工作流的概念被運(yùn)用到各個領(lǐng)域,不僅是企業(yè)的業(yè)務(wù)流程框架,更包括諸如高能物理學(xué)、生物信息學(xué)、大氣科學(xué)等的學(xué)術(shù)研究,這些研究過程包含了海量的數(shù)據(jù)分析和處理步驟,科學(xué)家需要通過高層次的工具,將問題抽象化,搭建設(shè)計合理、高效的業(yè)務(wù)流程,以解決復(fù)雜、繁瑣的高層次問題。而科學(xué)工作流提供了這樣的環(huán)境,通過數(shù)據(jù)管理、分析、仿真和可視化的相互結(jié)合,以協(xié)助科學(xué)發(fā)現(xiàn)的過程。

日志,作為計算機(jī)網(wǎng)絡(luò)安全的重要組成部分,記錄著計算機(jī)每次運(yùn)行事件的日期、時間、使用者、動作等相關(guān)操作。事件日志作為信息寶庫,蘊(yùn)藏著無窮的價值。通過對事件日志的分析研究,而獲得整個項(xiàng)目或平臺的結(jié)構(gòu)化業(yè)務(wù)流,也就是科學(xué)工作流,將大大的方便科學(xué)家對現(xiàn)有工作平臺,業(yè)務(wù)事件工作順序的把控。通過計算機(jī)記錄的事件日志而挖掘生成的科學(xué)工作流更具有真實(shí)性,更貼近、符合實(shí)際業(yè)務(wù)事件執(zhí)行的先后次序。其價值之高在于一方面方便業(yè)務(wù)架構(gòu)師在原有業(yè)務(wù)模型的基礎(chǔ)上,對業(yè)務(wù)流程進(jìn)行重構(gòu)、優(yōu)化,另一方面也有助于通過可視化圖形對實(shí)際業(yè)務(wù)流中存的問題、缺陷進(jìn)行進(jìn)一步的優(yōu)化和完善,以提高整個業(yè)務(wù)流的運(yùn)行效率與質(zhì)量。

隨著科技的發(fā)展,各個學(xué)術(shù)領(lǐng)域中所研究的問題規(guī)模日益增大。大型科學(xué)工作流通常需要在復(fù)雜的分布式計算機(jī)系統(tǒng)上執(zhí)行,例如超級計算機(jī)、分布式集群系統(tǒng)以及網(wǎng)絡(luò)系統(tǒng)等。然而,構(gòu)造這樣的系統(tǒng)往往需要付出異常昂貴的代價,申請訪問這些系統(tǒng)也需要復(fù)雜耗時的過程。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提供一種基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法,該方法能夠解決在分布式云平臺環(huán)境下的科學(xué)工作流挖掘問題,具有高效性、完備性和靈活性的特點(diǎn)。

實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案為:一種基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法,通過事件日志信息,挖掘跨云平臺下的科學(xué)工作流,以XES格式描述的事件日志為輸入,以SVG為格式的云間科學(xué)工作流為輸出結(jié)果,該方法具體包括以下步驟:

步驟1,輸入以XES格式描述的事件日志,解析事件日志獲得事件,生成對應(yīng)的事件序列集合,根據(jù)事件序列集合獲得事件直接先于關(guān)系,完成云內(nèi)科學(xué)工作流的挖掘;

步驟2,各個云平臺分別挖掘完成各自云平臺內(nèi)的科學(xué)工作流后,兩兩云平臺之間同時進(jìn)行消息傳遞,完成初步跨云間的科學(xué)工作流的挖掘;

步驟3,通過步驟2的跨云間科學(xué)工作流的挖掘,對整個云平臺聯(lián)盟下的總體科學(xué)工作流進(jìn)行歸約、合并和簡化處理,得到跨云間的科學(xué)工作流。

本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn):(1)在各個云計算平臺下進(jìn)行子科學(xué)工作流的挖掘時,在同等大小的本地日志規(guī)模下,本發(fā)明的挖掘效果較傳統(tǒng)科學(xué)工作流挖掘方法具有明顯優(yōu)勢,其挖出的工作流圖更具有完備性、準(zhǔn)確性、可靠性,更接近實(shí)際的科學(xué)工作流過程;(2)本發(fā)明在科學(xué)工作流的挖掘時間上也具有一定優(yōu)勢,采用云計算,通過多個云平臺同時挖掘的技術(shù),較以往單平臺下的挖掘,大大節(jié)約了時間成本,減輕了單平臺數(shù)據(jù)挖掘的負(fù)擔(dān),減少了單平臺下挖掘可能產(chǎn)生的內(nèi)存溢出、系統(tǒng)崩潰等一系列問題。

附圖說明

圖1是本發(fā)明基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法流程圖。

圖2是跨云間科學(xué)工作流的挖掘過程圖。

圖3是日志挖掘完成后生成的單一平臺下的完整的子科學(xué)工作流圖。

圖4(a)是各云平臺均完成各云平臺下的子科學(xué)工作流的挖掘的圖。

圖4(b)是各云平臺相互發(fā)送消息的科學(xué)工作流圖。

圖4(c)是基于事件直接先于關(guān)系的挖掘完成的云間科學(xué)工作流圖。

圖5(a)是未進(jìn)行傳遞歸約操作的科學(xué)工作流圖。

圖5(b)是進(jìn)行傳遞歸約操作后的科學(xué)工作流圖。

具體實(shí)施方式

結(jié)合圖1,本發(fā)明的一種基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法,通過事件日志信息,挖掘跨云平臺下的科學(xué)工作流,以XES格式描述的事件日志為輸入,以SVG為格式的云間科學(xué)工作流為輸出結(jié)果,該方法具體包括以下步驟:

步驟1,輸入以XES格式描述的事件日志,解析事件日志獲得事件,生成對應(yīng)的事件序列集合,根據(jù)事件序列集合獲得事件直接先于關(guān)系,完成云內(nèi)科學(xué)工作流的挖掘;具體為:

步驟1-1,完成事件日志的解析,將格式為XES的日志文件轉(zhuǎn)化為對應(yīng)的事件序列集合,所述事件序列集合是指日志中事件可能發(fā)生的先后順序的排序組合;

步驟1-2,遍歷事件序列集合,根據(jù)事件序列集合獲得事件直接先于關(guān)系;具體包括:

步驟1-2-1,任意一條事件序列{a1a2a3a4……aN-1aN}包含N個事件,a1……aN代表事件,這N個事件按照事件先后發(fā)生順序,獲得N-1組的事件直接先于關(guān)系:a1L a2、a2L a3、a3L a4……aN-1L aN;a1L a2表示事件a1發(fā)生順序直接先于事件a2;

步驟1-2-2,遍歷事件序列集合,獲得所有可能的事件直接先于關(guān)系,刪除所有重復(fù)的事件直接先于關(guān)系;

步驟1-2-3,在步驟1-2-2中所得到的所有的直接先于關(guān)系的集合中刪除存在并發(fā)關(guān)系的直接先于關(guān)系,并按照最終剩余的事件直接先于關(guān)系,連結(jié)事件生成云內(nèi)科學(xué)工作流。

步驟2,各個云平臺分別挖掘完成各自云平臺內(nèi)的科學(xué)工作流后,兩兩云平臺之間同時進(jìn)行消息傳遞,完成初步跨云間的科學(xué)工作流的挖掘;

步驟3,通過步驟2的跨云間科學(xué)工作流的挖掘,對整個云平臺聯(lián)盟下的總體科學(xué)工作流進(jìn)行歸約、合并和簡化處理,得到跨云間的科學(xué)工作流。

進(jìn)一步的,步驟2中各云平臺相互發(fā)送消息,各個不同云平臺下的事件相互響應(yīng),完成所有云間科學(xué)工作流的消息傳遞,通過這些響應(yīng),將各個子云平臺連結(jié)成為一個完整的云平臺聯(lián)盟,完成初步云間科學(xué)工作流的挖掘。

進(jìn)一步的,步驟3中對整個云平臺聯(lián)盟下的總體科學(xué)工作流進(jìn)行歸約、合并和簡化處理的具體過程為:

對初步跨云間科學(xué)工作流進(jìn)行合并,當(dāng)兩個事件之間存在多條相同的路徑時,刪除重復(fù)的路徑,僅保留一條路徑;

對合并后的初步跨云間科學(xué)工作流進(jìn)行傳遞歸約,即在保證一副圖中可達(dá)關(guān)系不變情況下刪除冗余的路徑,得到跨云間的科學(xué)工作流。

下面結(jié)合具體實(shí)施例對本發(fā)明作進(jìn)一步說明。

實(shí)施例

本發(fā)明基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法,是一個基于云計算平臺下的,通過事件日志進(jìn)行跨云間的科學(xué)工作流的挖掘的方法,具體挖掘過程如圖2所示。

首先,根據(jù)各云平臺下本地事件日志文件進(jìn)行云內(nèi)挖掘,獲得本地子科學(xué)工作流,接著,各云平臺下的子科學(xué)工作流兩兩之間進(jìn)行消息傳遞,連結(jié)各個云平臺下的子科學(xué)工作流,最后云平臺聯(lián)盟進(jìn)一步整合、優(yōu)化生成總的科學(xué)工作流,這個過程稱之為跨云間科學(xué)工作流的挖掘。

本發(fā)明基于事件直接先于關(guān)系的云間科學(xué)工作流挖掘方法,是一個依賴于事件日志中事件發(fā)生的先后次序的、跨平臺的科學(xué)工作流的挖掘方法。首先,各云平臺獨(dú)自完成各平臺下的子科學(xué)工作流的挖掘,這個過程也稱之為云內(nèi)挖掘。云內(nèi)挖掘具體包括解析本地日志文件、根據(jù)日志中所有事件發(fā)生的先后次序所組成的序列分析獲取事件直接先于關(guān)系,根據(jù)事件直接先于關(guān)系構(gòu)建完整的子科學(xué)工作流圖,這個序列在下文中稱之為Trace,Trace條數(shù)不唯一;接著,各平臺完成本地科學(xué)工作流挖掘后,也就是完成云內(nèi)挖掘后,進(jìn)行跨云間的挖掘,各個云平臺之間相互發(fā)送消息日志,根據(jù)消息日志,連結(jié)各個云平臺的子科學(xué)工作流圖,進(jìn)一步挖掘出跨云間各個事件的響應(yīng)先后次序;最后,對于整個云平臺聯(lián)盟下的總體科學(xué)工作流進(jìn)行整理、合并、簡化,挖掘完成總體的科學(xué)工作流。

該方法包括:

步驟1,云內(nèi)挖掘:完成本地日志的解析、根據(jù)事件日志中事件發(fā)生的先后次序序列獲得事件直接先于關(guān)系、挖掘獲取完整的本地子科學(xué)工作流圖,具體步驟如下:

步驟1.1,完成本地日志的解析

輸入以.XES為輸入的本地日志文件,該XES文件存儲了事件日志的信息,包括每個事件發(fā)生的時間、狀態(tài)等等。讀取事件日志,按照日志中Trace條目,依次讀取各個事件,按序讀取的事件組成一條Trace,而一個事件日志中,包含著多條Trace,每一條Trace代表著多個事件可能發(fā)生的先后順序。任意一條Trace記錄的事件排序?yàn)閧a1a2a3a4……aN-1aN},其中a1……aN代表N個不同的事件,根據(jù)該條Trace的事件排序,獲得N-1個事件直接先于關(guān)系:a1L a2、a2L a3、a3L a4……aN-1L aN,代表在該條Trace中,事件a1直接發(fā)生在事件a2之前、事件a2直接發(fā)生于事件a3之前,以此類推,aN-1直接發(fā)生在事件aN之前。

步驟1.2,遍歷Trace集合,每一條Trace都獲得N-1組事件直接先于關(guān)系,刪除這些事件先于關(guān)系中重復(fù)的組合,留下單一、不重復(fù)的事件先于關(guān)系組合。

步驟1.3,挖掘出本地、完備、全面的子科學(xué)工作流。根據(jù)步驟1.2中剩余的事件先于關(guān)系組合中,可能存在apL aq和aqL ap這樣的事件直接先于關(guān)系組合,ap≠aq,這代表這事件ap可能發(fā)生在事件aq之前,也可能發(fā)生在事件aq之后,這也意味著事件ap和事件aq存在并發(fā)關(guān)系;刪除步驟1.2中存在的具有并發(fā)關(guān)系的事件直接先于關(guān)系組合,并根據(jù)剩余的事件直接先于關(guān)系組合,生成云內(nèi)的科學(xué)工作流。

結(jié)合實(shí)例,具體的操作步驟為:假設(shè)讀取某一事件日志,該日志包含四條Trace:GABCDEF、AGBCDEF、ABGCDEF、ABCGDEF。根據(jù)日志中的每一條Trace獲得各事件的直接先于關(guān)系:如根據(jù)第一條Trace:GABCDEF,可以獲得6組直接先于關(guān)系有G到A(簡化為G→L A)、A→LB、B→L C、C→L D、D→L E、E→L F,分析全部四條Trace,并去掉冗余的直接先于關(guān)系,得到12組的事件直接先于關(guān)系:G→L A、A→L B、B→L C、C→L D、D→L E、E→L F、A→L G、G→L B、B→L G、G→L C、C→L G、G→L D。值得注意的是,這12組的事件直接先于關(guān)系中,包含了類似G→L A和A→L G這樣的直接先于關(guān)系,這兩組先于關(guān)系代表了事件G可以發(fā)生在事件A之前,而事件A又可以發(fā)生在事件G之前,這種情況表明了事件A和事件G存在并發(fā)關(guān)系,所以不符合事件直接先于關(guān)系的定義,所以在這12組的事件直接先于關(guān)系中刪除并發(fā)的關(guān)系A(chǔ)→L G和G→L A、B→L G和G→L B以及C→L G和G→L C。所以最終獲得了6組事件直接先于關(guān)系:A→L B、B→L C、C→L D、D→L E、E→L F、G→L D。根據(jù)6組事件直接先于關(guān)系挖掘生成圖3,即單一平臺下的完整的子科學(xué)工作流。

步驟2,各平臺均完成本地子科學(xué)工作流的挖掘后,各平臺之間相互發(fā)送消息,根據(jù)消息日志,連結(jié)各個云平臺的子科學(xué)工作流圖,完成云平臺聯(lián)盟下總體科學(xué)工作流的初步挖掘。

如圖4(a)所示,根據(jù)各個云平臺下的本地日志,云A挖掘出了子科學(xué)工作流A,云B挖掘出了子科學(xué)工作流B,云C挖掘出了子科學(xué)工作流C。各個云平臺之間兩兩存在消息日志,可以是云A發(fā)送消息日志到云B,也可以是云B發(fā)送消息日志到云A,如云A至云B的消息日志包括A→L H,云B到云A的消息日志包括I→L D、I→L E,具體表現(xiàn)如圖4(b)所示,圖中虛線表示各個云平臺之間消息日志的傳遞。

步驟3,對于步驟2挖掘出的初步的云間科學(xué)工作流,根據(jù)本方法需要進(jìn)一步對整個云平臺聯(lián)盟下的總體科學(xué)工作流進(jìn)行整理、合并、簡化。步驟2中初步建立的云間科學(xué)工作流圖,是冗余的科學(xué)工作流,是存在傳遞閉包的科學(xué)工作流,在本方法中需要對該科學(xué)工作流進(jìn)行傳遞歸約操作,刪除這些冗余的邊。所謂傳遞歸約操作就是通過最少的邊,保證一幅圖中可達(dá)關(guān)系不變,而刪除的這些冗余的邊,不影響云間科學(xué)工作流中所有事件的可達(dá)關(guān)系,最終達(dá)到簡化云間科學(xué)工作流的目的,完成挖掘,獲得完整、精簡、優(yōu)化的云間科學(xué)工作流。

各云平臺兩兩進(jìn)行消息傳遞后,生成的圖4(b)中存在類似于I→L D、I→L E、D→LE這樣結(jié)構(gòu)的圖,將圖放大至圖5(a),在科學(xué)工作流中,這種存在冗余關(guān)系的邊的科學(xué)工作流,即I到E的可達(dá)關(guān)系中,存在兩種可達(dá)方式,一種方法為I通過D再到E,另一種方式為I直接到E,在本方法中,這種科學(xué)工作流需要進(jìn)行傳遞歸約的操作,已達(dá)到簡化工作流的目的,所以對圖5(a)進(jìn)過傳遞歸約后,獲得了圖5(b)。而總的科學(xué)工作流需要完成該科學(xué)工作流中所有的需要進(jìn)行傳遞歸約的操作,使整個科學(xué)工作流精簡而又不失其完整性和完備性。最終基于直接先于關(guān)系的云間科學(xué)工作流圖得挖掘如圖4(c)所示,是一個完整的、跨云間的、符合事件現(xiàn)實(shí)依賴關(guān)系的科學(xué)工作流圖。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1