亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于l*算法的業(yè)務(wù)流程增量挖掘方法

文檔序號:6535401閱讀:316來源:國知局
基于l*算法的業(yè)務(wù)流程增量挖掘方法
【專利摘要】一種基于L*算法的業(yè)務(wù)流程增量挖掘方法,屬于業(yè)務(wù)流程挖掘領(lǐng)域。其目的是通過智能挖掘技術(shù)來實現(xiàn)增量日志的挖掘,避免日志增加后需要重新挖掘的情況。首先從業(yè)務(wù)活動軌跡中提取頻數(shù)較大的日志序列,然后進行預(yù)處理;根據(jù)L*算法的查詢思想分析相鄰兩個活動間的序關(guān)系,建立行為輪廓,依據(jù)直接依賴關(guān)系構(gòu)建初始模型;然后比較模型的適合度和適當(dāng)度,驗證增量日志序列的相鄰活動的序關(guān)系與初始模型的行為輪廓的一致性,判斷是否對初始模型作出調(diào)整,利用行為輪廓一致性度選擇較優(yōu)的模型;直到所有增量日志序列驗證完畢,得到最優(yōu)業(yè)務(wù)流程模型。該挖掘方法不僅能夠避免增量日志的重復(fù)操作,而且使得流程的行為符合行為一致性。
【專利說明】基于L*算法的業(yè)務(wù)流程增量挖掘方法【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及基于增量日志的業(yè)務(wù)流程挖掘方法,它避免了以往挖掘方法對于新增加的日志需要重新挖掘的不足,有效適用于從不斷增加的日志序列中逐步確定一個滿足有效行為、經(jīng)濟實用的流程模型,屬于業(yè)務(wù)流程挖掘領(lǐng)域。
【背景技術(shù)】
[0002]目前,很多大型企業(yè)的管理應(yīng)用軟件,如企業(yè)資源計劃、工作流管理系統(tǒng)都會自動生成日志,這些日志是對實際操作流程的記錄。業(yè)務(wù)流程挖掘就是利用這些日志數(shù)據(jù),進行分析、重組,重現(xiàn)業(yè)務(wù)流程的真實過程,且較之與原始模型行為更有效,以達到提高運行效率的目的。
[0003]到目前為止,國內(nèi)外已成功研究出了大量的過程挖掘算法,在一定程度上,它們代表了幾個不同的研究方向,如基于活動間的依賴圖的挖掘算法,該算法假設(shè)日志中的活動是分離的,這樣便使得活動的發(fā)生有了前后順序,進而得到活動間的依賴關(guān)系;再如面向塊結(jié)構(gòu)模型的挖掘算法,該算法把活動間的關(guān)系用四種塊結(jié)構(gòu)(順序結(jié)構(gòu)、并行結(jié)構(gòu)、選擇結(jié)構(gòu)和循環(huán)結(jié)構(gòu))來表示;再如基于Petri網(wǎng)模型的挖掘算法,該算法的代表算法是α算法等等。本發(fā)明則是另尋他法,受到L*算法中的查詢思想的啟發(fā)從而提出了基于L*算法的業(yè)務(wù)流程優(yōu)化挖掘方法。
[0004]L*算法最早是由Angluin因為學(xué)習(xí)確定性的有限自動機(DFA)提供的,后經(jīng)過Rivest和Schapire改進。L*算法本質(zhì)是在字母表Σ上研究一種未知語言U,而字母表Σ是由能夠接受U的最小的DFA產(chǎn)生的。L*算法是一種查詢學(xué)習(xí)方法,主要包括兩種查詢:一是會員身份查詢,即對于字符串σ e Σ%是否有σ eu?二是等價查詢,即對于一個DFAC,是否有L(C) =U?為了學(xué)習(xí)這種未知語言U,L*會反饋答案“Yes/No”給這兩種查詢。如果反饋給等價查詢的是“No”,L*期待一個反例字符串σ使得σ e U-L(C)或者σ e L(C)-U,對于第一種情況σ應(yīng)該添加`到L (C),第二種情況應(yīng)將σ從L(C)中移除。本發(fā)明借鑒L*算法中的查詢思想,將其運用到日志序列中相鄰活動的行為輪廓關(guān)系的確定方法中。

【發(fā)明內(nèi)容】

[0005]本發(fā)明為了豐富現(xiàn)有的挖掘方法,提出了一種基于L*算法的業(yè)務(wù)流程增量挖掘方法,采用L*算法查詢的基本思想,將日志序列相繼活動間的關(guān)系與行為輪廓的兩種序關(guān)系(因為這里考察的是日志序列里的兩個相繼活動,故不考慮排他序關(guān)系)進行查詢,建立行為輪廓,從而建立業(yè)務(wù)流程模型,然后優(yōu)化選擇得到最優(yōu)模型。另外,在日志序列的提取問題上,為了避免同時操作大量日志序列而產(chǎn)生的冗余、錯誤等問題,本發(fā)明采用增量日志的方法。
[0006]在挖掘過程中,首先,從程序運行產(chǎn)生的軌跡中提取頻數(shù)較大的日志序列,將提取的日志序列進行合并,避免出現(xiàn)重復(fù)操作,再將合并后的日志序列按照頻數(shù)大小順序排列,即優(yōu)先考慮頻數(shù)大的序列,以保證這些序列能被模型接受。其次,定義一個日志弱序關(guān)系集合Σ =.(χ卜>,,_y卜xjf jcj,其中x, y是日志序列中兩個相繼的活動,>代表它們之間
的弱序關(guān)系,定義序關(guān)系集合"={(-V卜.V, V Ψ A-H-V卜V, V卜x)j,集合U中依次是行為輪廓關(guān)
系中的嚴格序關(guān)系和交叉序關(guān)系;觀察日志序列中每相鄰兩個活動,經(jīng)過查詢確定是何種序關(guān)系。例如,一組日志W(wǎng)= {AB⑶E,ABDCE,ADBCE},在W中,字母表集合由所有的序關(guān)系組成,即
W -Σ ^ {Ay B, B> C,C y D,D y E,B y D,D y C,C > L 4 ^ D,D y B,B A,D )f- A,C ψ B,五★ C,五> D},根據(jù)U集合的定義,我們可知= p yB,B^ A),{A卜D,D ^ A),(β y C, C ? B\(CC).{DyE.E^ D\{ByD,Dy B\(C yD,Dy C)},故 /丨:W.Σ 丨 | 丨我
們可找到屬于嚴格序關(guān)系的有,(A, B), (A, D), (B,C),(C, E)和(D,E),屬于交叉序關(guān)系的有(B, D), (C, D),據(jù)此,構(gòu)建Petri網(wǎng)模型作為初始模型。然后驗證增量日志序列相鄰活動的序關(guān)系與初始模型的行為輪廓關(guān)系是否一致,若是,則繼續(xù)驗證剩余增量日志序列,若否,則做出調(diào)整再進行模型與模型間的一致性分析,然后繼續(xù)驗證。直到所有增量日志驗證完畢,得到最優(yōu)模型。
[0007]本發(fā)明的優(yōu)點是采用了 L*算法中查詢的基本思想,且在查詢過程中加入了行為輪廓的概念,利用增量日志來減少操作過程中可能會出現(xiàn)的問題(如堵塞、冗余等),在優(yōu)化過程中沿用了行為輪廓一致性及模型間的行為輪廓一致性分析,這樣得出的模型比之原始模型更加合理得當(dāng)。
【專利附圖】

【附圖說明】
[0008]圖1是本發(fā)明實施方式的結(jié)構(gòu)示意圖。
[0009]圖2是本發(fā)明日志序列處理的結(jié)構(gòu)示意圖。
[0010]圖3是本發(fā)明基于L*算法的模型優(yōu)化結(jié)構(gòu)示意圖。
【具體實施方式】
[0011]以下結(jié)合附圖所述實施例對本發(fā)明作進一步的說明。
[0012]圖1為本發(fā)明的整個流程系統(tǒng)的主要部分的示意圖。如圖所示,整個系統(tǒng)是以提取日志為開始,經(jīng)過預(yù)處理,然后進行業(yè)務(wù)流程的挖掘。它主要包括三部分分別是日志序列的處理、初始模型的建立和基于L*算法的業(yè)務(wù)流程優(yōu)化挖掘算法。
[0013]圖2是本發(fā)明日志序列處理的結(jié)構(gòu)示意圖。如圖所示,首先,從程序運行產(chǎn)生的軌跡中提取頻數(shù)較大的日志序列,將提取出的日志序列進行預(yù)處理使之滿足兩個條件:一是沒有相同的日志序列,可避免重復(fù)操作;二是日志序列應(yīng)按照頻數(shù)大小順序排列,以方便優(yōu)先考慮頻數(shù)大的序列,以保證這些序列能被模型接受。
[0014]圖3是本發(fā)明基于L*算法的模型挖掘結(jié)構(gòu)示意圖。如圖所示,從處理過的日志序列開始,構(gòu)建日志序列相鄰活動間的弱序關(guān)系集合,根據(jù)行為輪廓序關(guān)系的定義,得出日志序列相鄰活動的序關(guān)系集合,進而得到它們的行為輪廓,構(gòu)建初始模型;然后不斷地從程序中提取增量日志,驗證增量日志序列的相鄰活動的序關(guān)系與初始模型的行為輪廓的一致性,作出判斷:是否需要調(diào)整初始模型,若是,則調(diào)整模型,進行模型與模型間的一致性分析,擇優(yōu),繼續(xù)驗證;若否,繼續(xù)驗證剩余增量日志序列。直到所有增量日志序列驗證完畢,得到最優(yōu)模型。附:
[0015]行為輪廓一致性度:設(shè)S1 = (P1, T1; F1, M1)和 S2 = (P2, T2; F2, M2)是兩個 Petri 網(wǎng)系統(tǒng),他們關(guān)于~匹配,
【權(quán)利要求】
1.基于L*算法的業(yè)務(wù)流程增量挖掘方法,該方法由日志序列的提取和處理及增量日志的運用、初始模型的建立和基于L*算法業(yè)務(wù)流程的優(yōu)化挖掘方法三部分組成,其特征在于,提取和處理實現(xiàn)對日志序列的規(guī)范化要求,即滿足能夠從日志序列進行挖掘的條件;增量日志的運用可有效地減少因同時操作大量日志序列而產(chǎn)生的錯誤,提高運行效率;基于L*算法的業(yè)務(wù)流程的挖掘方法實現(xiàn)對處理過的日志序列構(gòu)造日志弱序關(guān)系集合和日志序列序關(guān)系集合,從而確定日志序列中相繼活動的行為輪廓關(guān)系,依此構(gòu)建流程模型,并依據(jù)增量日志進行優(yōu)化。
2.根據(jù)權(quán)利要求1所述的業(yè)務(wù)流程挖掘方法,其特征在于:在分析日志序列的活動時,采用L*算法中查詢的思想以及行為輪廓的概念,根據(jù)L*算法的查詢思想構(gòu)建了各個相鄰活動間的行為輪廓關(guān)系。
3.根據(jù)權(quán)利要求1所述的業(yè)務(wù)流程挖掘方法,其特征在于:在整個挖掘過程中,不再將所有的日志序列全部同時提取出來,而是先提取一部分,其余的以增量日志的形式提取出來,用于挖掘算法的逐步優(yōu)化過程中。
4.根據(jù)權(quán)利要求1所述的業(yè)務(wù)流程挖掘方法,其特征在于:在優(yōu)化挖掘過程中,不僅利用了日志序列相鄰活動的序關(guān)系與模型的行為輪廓關(guān)系的一致性驗證,而且還利用了模型與模型的一致性分析,在評價模型與模型的一致性時,采用評價標(biāo)準是行為輪廓一致性度。
【文檔編號】G06F11/34GK103778051SQ201410010776
【公開日】2014年5月7日 申請日期:2014年1月9日 優(yōu)先權(quán)日:2014年1月9日
【發(fā)明者】方賢文, 吳俊枝, 劉璐, 殷志祥, 方新建 申請人:安徽理工大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1