縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法
【專(zhuān)利摘要】本發(fā)明提出一種基于“縱橫交錯(cuò)”方法的混合式資源分配規(guī)則挖掘方法,用于從工作流日志獲取到更為準(zhǔn)確的資源分配知識(shí)。該方法以事件和案例作為基本事務(wù)單位對(duì)工作流日志處理,分別獲得工作流日志的橫向事件視圖和縱向案例視圖。在上述基礎(chǔ)上,基于關(guān)聯(lián)規(guī)則挖掘方法,對(duì)兩種日志視圖進(jìn)行數(shù)據(jù)挖掘,從而得到不同日志視圖下的關(guān)聯(lián)規(guī)則。在上述基礎(chǔ)上,利用當(dāng)前工作流任務(wù)的前置條件對(duì)所有的規(guī)則進(jìn)行篩選,并以支持度和置信度對(duì)兩種視圖下挖掘的關(guān)聯(lián)規(guī)則進(jìn)行綜合排序。本發(fā)明提出的縱橫交錯(cuò)資源分配規(guī)則挖掘方法能夠得到比現(xiàn)有單一日志結(jié)構(gòu)的過(guò)程挖掘方法預(yù)測(cè)準(zhǔn)確度更高的資源分配規(guī)則。
【專(zhuān)利說(shuō)明】
縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及業(yè)務(wù)過(guò)程的知識(shí)發(fā)現(xiàn)領(lǐng)域,針對(duì)過(guò)程感知信息系統(tǒng)在任務(wù)執(zhí)行前的資 源分配規(guī)則發(fā)現(xiàn),具體而言,涉及一種對(duì)歷史工作流日志進(jìn)行深度處理和分配規(guī)則發(fā)現(xiàn)的 縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,從而對(duì)實(shí)例化前的工作流任務(wù)在任務(wù)分配時(shí)的 執(zhí)行資源推薦。
【背景技術(shù)】
[0002] 當(dāng)前大多數(shù)工作流程驅(qū)動(dòng)的信息系統(tǒng)的資源分配任務(wù)仍然是通過(guò)常規(guī)的資源分 類(lèi)方法即角色/組織的方式進(jìn)行組織的,工作流資源主要通過(guò)工作流資源的角色和組織單 元屬性的交集進(jìn)行分類(lèi),從而將所有的工作流資源分割為資源子集合,以方便工作流管理 人員進(jìn)行資源的分配。事實(shí)上,這種基于資源分類(lèi)的方式得到的資源類(lèi)別通常粒度較大,并 且分類(lèi)獲得的資源集內(nèi)部個(gè)體并無(wú)優(yōu)先級(jí)推薦,因此,通常需要由管理人員對(duì)關(guān)鍵任務(wù)手 工分配執(zhí)行人員,不利于管理人員對(duì)知識(shí)密集型任務(wù)的快速分配。
[0003] 工作流管理技術(shù)是制造企業(yè)實(shí)現(xiàn)業(yè)務(wù)過(guò)程自動(dòng)化的重要支撐技術(shù),它能夠有效管 理企業(yè)信息系統(tǒng)(EIS)中的業(yè)務(wù)活動(dòng)、人員與數(shù)據(jù)等重要元素,并協(xié)調(diào)其相互關(guān)系。工作流 是研究整個(gè)或部分業(yè)務(wù)過(guò)程在計(jì)算機(jī)支持下的全自動(dòng)或半自動(dòng)化的技術(shù),是20世紀(jì)90年代 迅速崛起的一門(mén)新興學(xué)科,被Thomas Friedman譽(yù)為二^--世紀(jì)產(chǎn)平"世界的第三大動(dòng)力, 是繼關(guān)系數(shù)據(jù)庫(kù)技術(shù)之后又一個(gè)革命性的基礎(chǔ)軟件平臺(tái)技術(shù)。
[0004] 工作流(workflow)由英文單詞工作(work,可以看作工作或任務(wù))和流(flow,可看 作流動(dòng)或流程)組成。自工業(yè)革命以來(lái),人們就把工作流程的優(yōu)化和組織管理看作企業(yè)管理 的重要研究?jī)?nèi)容,相關(guān)的研究工作一直沒(méi)有間斷過(guò)。而隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)以及數(shù)據(jù) 庫(kù)技術(shù)等快速發(fā)展,基于計(jì)算機(jī)技術(shù)的工作流管理技術(shù)在上世紀(jì)八十年代開(kāi)始出現(xiàn),其最 早應(yīng)用于生產(chǎn)組織和辦公自動(dòng)化(OA)領(lǐng)域,是針對(duì)日常工作中具有固定程序的活動(dòng)的管理 而提出的一個(gè)概念。其目的是通過(guò)將常見(jiàn)的工作分解為粒度合適的任務(wù)和定義良好的角 色,依據(jù)一定的規(guī)則和過(guò)程來(lái)對(duì)其進(jìn)行監(jiān)控,以提高工作效率。隨著不斷的優(yōu)化和發(fā)展,工 作流技術(shù)逐漸進(jìn)入到醫(yī)院、銀行業(yè)、保險(xiǎn)業(yè)等,而制造業(yè)則是工作流技術(shù)更為重要的領(lǐng)域之 O
[0005] 工作流領(lǐng)域的過(guò)程挖掘(Process Mining,也稱(chēng)為工作流挖掘,Workflow Mining) 是一個(gè)年輕的跨領(lǐng)域的交叉學(xué)科,涉及到計(jì)算智能、數(shù)據(jù)挖掘和過(guò)程建模與分析等領(lǐng)域。過(guò) 程挖掘技術(shù),是一種從系統(tǒng)日志中發(fā)掘有用知識(shí)的技術(shù),這些知識(shí)包括任務(wù)的控制流信息, 也可以是系統(tǒng)的資源組織結(jié)構(gòu)信息等。
[0006] 雖然已經(jīng)經(jīng)過(guò)十多年的發(fā)展,過(guò)程挖掘技術(shù)已經(jīng)得到了長(zhǎng)足發(fā)展,但是其研究?jī)?nèi) 容主要集中在過(guò)程模型(控制流)發(fā)現(xiàn),即從事件日志中間發(fā)現(xiàn)過(guò)程模型,包括挖掘過(guò)程中 任務(wù)節(jié)點(diǎn)的邏輯順序等,隸屬于過(guò)程及任務(wù)范疇。其中Cook等人主要研究從軟件日志中發(fā) 現(xiàn)軟件過(guò)程模型。而美國(guó)IBM的Agrawal是最早將過(guò)程模型發(fā)現(xiàn)技術(shù)應(yīng)用于工作流領(lǐng)域的研 究成果,文獻(xiàn)基于圖論來(lái)表達(dá)工作流模型,并提出了一種滿(mǎn)足完整性、非冗余性和最小性的 工作流圖挖掘算法。Aalst等人運(yùn)用歸納法處理工作流管理領(lǐng)域的過(guò)程發(fā)現(xiàn)問(wèn)題。后來(lái) Aalst又研究了一種從過(guò)程運(yùn)行實(shí)例的歷史中發(fā)現(xiàn)時(shí)序模型的方法,繼而發(fā)展了一種基于 啟發(fā)式算法從日志中發(fā)現(xiàn)過(guò)程的算法,和從過(guò)程日志中間發(fā)現(xiàn)工作流模型的α算法。隨后有 中國(guó)吉林大學(xué)劉大有等人提出了 α算法的改進(jìn)算法,以及能夠發(fā)現(xiàn)重復(fù)任務(wù)的α**算法和基 于工作流網(wǎng)的過(guò)程挖掘算法等等。工作流過(guò)程模型作為挖掘結(jié)果,可以用于控制流的符合 性檢查,或者用于改進(jìn)現(xiàn)有的過(guò)程模型等。
[0007] 過(guò)程挖掘技術(shù)并不局限于過(guò)程與任務(wù)層面。隨著過(guò)程挖掘技術(shù)研究的深入,有學(xué) 者開(kāi)始研究挖掘工作流資源相互之間的關(guān)系(社會(huì)網(wǎng)絡(luò)分析),Minsok Song等人基于社會(huì) 網(wǎng)絡(luò)分析技術(shù)對(duì)工作流管理系統(tǒng)中資源之間的工作交接關(guān)系進(jìn)行分析,通過(guò)得到的社會(huì)網(wǎng) 絡(luò)關(guān)系對(duì)當(dāng)前系統(tǒng)資源組織/角色架構(gòu)提供一致性檢查或者改組優(yōu)化方案。在資源角色的 識(shí)別與分配方面,有基于日志挖掘的過(guò)程角色識(shí)別研究以及業(yè)務(wù)過(guò)程模型中的角色分配研 究等。
[0008] 據(jù)筆者所知,在過(guò)程挖掘領(lǐng)域,已經(jīng)有大量的研究成果集中于業(yè)務(wù)過(guò)程的控制流 知識(shí)發(fā)現(xiàn)方面。雖然研究工作流管理過(guò)程中資源與流程以及任務(wù)之間的相互關(guān)系,具有重 要的意義,但在工作流資源管理方面的知識(shí)發(fā)現(xiàn)方面的研究(即組織挖掘,Organizational Mining)也并不常見(jiàn),而這一領(lǐng)域的工作流的資源分配知識(shí)發(fā)現(xiàn)方面的研究則仍處于探索 階段。下面就與工作流資源分配相關(guān)的研究?jī)?nèi)容介紹如下:
[0009] 在挖掘方法方面,德國(guó)烏爾姆大學(xué)的Ly等人把從歷史數(shù)據(jù)中挖掘任務(wù)執(zhí)行規(guī)則的 任務(wù)看成為一個(gè)歸納學(xué)習(xí)問(wèn)題,并基于一種決策樹(shù)學(xué)習(xí)的方法進(jìn)行了一些探索研究。Y.Liu 等人研究了一種基于隱馬爾可夫模型的資源分配規(guī)則發(fā)現(xiàn)方法并討論了一種半自動(dòng)的工 作流資源分配方法,為了減輕系統(tǒng)運(yùn)行時(shí)的工作流任務(wù)手動(dòng)分配負(fù)擔(dān),又將幾種分類(lèi)算法 (C4.5,SVM,NaiiveBayes等)應(yīng)用于工作流運(yùn)行日志,以挖掘任務(wù)的最佳執(zhí)行人信息。
[0010] 在系統(tǒng)架構(gòu)方面,文獻(xiàn)中,Andrzejak等人提出了一種面向工作流控制流知識(shí)挖掘 的閉環(huán)工作流管理框架,該框架遵循規(guī)劃-執(zhí)行-結(jié)果驗(yàn)證-再規(guī)劃這一閉環(huán)生成工作流過(guò) 程模型。Rinderle與van der Aalst教授開(kāi)發(fā)了一個(gè)支持資源分配規(guī)則的全生命周期的軟 件架構(gòu)。國(guó)內(nèi)劉庭煜等人對(duì)工作流資源管理的閉環(huán)控制方法進(jìn)行了探索,并分別基于常規(guī) 統(tǒng)計(jì)方法和權(quán)重矩陣方法研究了資源分配知識(shí)的發(fā)現(xiàn)方法。
[0011 ]工作流管理系統(tǒng)中的快速人員分配知識(shí)的挖掘最早于2006年由德國(guó)烏爾姆大學(xué) 的Linh Thao Ly等人提出,將其看作歸納學(xué)習(xí)方法,并采用了一種決策樹(shù)的學(xué)習(xí)方法從事 務(wù)歷史中挖掘人員分配規(guī)則。隨后,針對(duì)人員分配規(guī)則的挖掘方法,又有研究人員提出了采 用機(jī)器學(xué)習(xí)、隱馬爾科夫模型方法、分類(lèi)學(xué)習(xí)方法(包括C4.5、SVM等)、基于Apriori的關(guān)聯(lián) 規(guī)則搜索算法、增強(qiáng)學(xué)習(xí)算法等。在基礎(chǔ)模型及應(yīng)用方面,有:基于工作流資源分配約束條 件的自適應(yīng)工作流規(guī)劃方法,模糊環(huán)境下工作流任務(wù)分配的多級(jí)模型等,以及過(guò)程感知信 息系統(tǒng)中全生命周期的人員分配支持等。也有學(xué)者基于過(guò)程挖掘技術(shù)對(duì)不同資源之間的并 行工作共享問(wèn)題以及不合理的資源分配等問(wèn)題進(jìn)行了有益的探索。
[0012]基于上述討論可以看出,作為工作流知識(shí)發(fā)現(xiàn)領(lǐng)域的新興研究方向,國(guó)內(nèi)外研究 人員工作流資源分配領(lǐng)域的研究尚屬起步階段,對(duì)于工作流日志的處理手段也比較單一。 據(jù)筆者研究所知,目前尚沒(méi)有對(duì)工作流日志的縱向執(zhí)行邏輯和橫向事務(wù)邏輯進(jìn)行處理和表 征的方法,更鮮見(jiàn)在此基礎(chǔ)上進(jìn)行全局規(guī)則發(fā)現(xiàn)和搜索的方法。
【發(fā)明內(nèi)容】
[0013] 針對(duì)現(xiàn)有技術(shù)中缺陷與不足,本發(fā)明提出一種縱橫交錯(cuò)的混合式資源分配規(guī)則挖 掘方法,實(shí)現(xiàn)對(duì)實(shí)例化前的工作流任務(wù)在任務(wù)分配時(shí)的執(zhí)行資源的快速推薦。
[0014] 為實(shí)現(xiàn)上述目的,本發(fā)明所采用的技術(shù)方案如下:
[0015] -種縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,包括以下步驟:
[0016] 步驟A、以過(guò)程、任務(wù)、資源、工作流實(shí)例及時(shí)間戳五元組來(lái)表示工作流日志;
[0017] 步驟B、以事務(wù)為基本單元對(duì)工作流日志進(jìn)行分解,得到工作流日志橫向事件視圖
[0018] 步驟C、以工作流實(shí)例為基本單元對(duì)工作流日志進(jìn)行分解,得到工作流日志縱向案 例視圖
[0019] 步驟D、基于出現(xiàn)頻次prob及當(dāng)前活動(dòng)的前置條件對(duì)上述兩種日志視圖分別進(jìn)行 資源分配規(guī)則挖掘;
[0020] 步驟E、基于因果條件概率conf方法對(duì)資源分配規(guī)則進(jìn)行全局篩選與排序,獲得全 局優(yōu)化的資源分配規(guī)則。
[0021] 應(yīng)當(dāng)理解,前述構(gòu)思以及在下面更加詳細(xì)地描述的額外構(gòu)思的所有組合只要在這 樣的構(gòu)思不相互矛盾的情況下都可以被視為本公開(kāi)的發(fā)明主題的一部分。另外,所要求保 護(hù)的主題的所有組合都被視為本公開(kāi)的發(fā)明主題的一部分。
[0022] 結(jié)合附圖從下面的描述中可以更加全面地理解本發(fā)明教導(dǎo)的前述和其他方面、實(shí) 施例和特征。本發(fā)明的其他附加方面例如示例性實(shí)施方式的特征和/或有益效果將在下面 的描述中顯見(jiàn),或通過(guò)根據(jù)本發(fā)明教導(dǎo)的【具體實(shí)施方式】的實(shí)踐中得知。
【附圖說(shuō)明】
[0023] 圖1是本發(fā)明縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法的流程示意圖。
[0024] 圖2是熟練度較低人員與本方法執(zhí)行時(shí)間對(duì)比示意圖。
[0025] 圖3是平均熟練度人員與本方法執(zhí)行時(shí)間對(duì)比示意圖。
[0026] 圖4是熟練度較高人員與本方法執(zhí)行時(shí)間對(duì)比示意圖。
【具體實(shí)施方式】
[0027] 根據(jù)圖1所示,本發(fā)明提出的一種縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,包括 以下步驟:
[0028] 步驟A、以過(guò)程、任務(wù)、資源、工作流實(shí)例及時(shí)間戳五元組來(lái)表示工作流日志;
[0029] 步驟B、以事務(wù)為基本單元對(duì)工作流日志進(jìn)行分解,得到工作流日志橫向事件視圖 V1-(L) = E = };
[0030] 步驟C、以工作流實(shí)例為基本單元對(duì)工作流日志進(jìn)行分解,得到工作流日志縱向案 例視圖 h (幻-萬(wàn)(〔')-'
[0031] 步驟D、基于出現(xiàn)頻次prob及當(dāng)前活動(dòng)的前置條件對(duì)上述兩種日志視圖分別進(jìn)行 資源分配規(guī)則挖掘;
[0032] 步驟E、基于因果條件概率conf方法對(duì)資源分配規(guī)則進(jìn)行全局篩選與排序,獲得全 局優(yōu)化的資源分配規(guī)則。
[0033] 前述步驟A中,采用過(guò)程、任務(wù)、資源、工作流實(shí)例及時(shí)間戳五元組的五元組向量來(lái) 表達(dá)工作流日志,即£ "(? =丨tb...,丨,其中:P是工作流流程集合;T是工 作流管理系統(tǒng)中工作流任務(wù)的集合;R是工作流資源的集合,C是工作流實(shí)例的集合,TS為工 作流任務(wù)執(zhí)行的時(shí)間戳。,示例以表格形式表達(dá)如下:
[0035]前述步驟B中,對(duì)于步驟A所得到的工作流事件集五=PxTxiixCxra = k,心…,\}, 對(duì)于事件單元es eE,es: (Pi,tj,rk)記錄的工作流事件涉及流程Pi,任務(wù)tj以及資源rk,基于 上述分解,得到工作流日志橫向事件視圖匕(△) = △'== 丨,示例以表格形式表達(dá)如 下:
[0037]前述步驟C,定義C = E*為事件根據(jù)同一流程實(shí)例的流轉(zhuǎn)軌跡的集合,即一項(xiàng)工作 按照流程的路由進(jìn)行傳遞的記錄集,定義日志LeB(C),其中B(C)為所有共同案例C的活動(dòng) 事件的集合,且其中活動(dòng)事件基于時(shí)間戳順序排列,基于上述分解,得到工作流日志縱向案 例視圖Vc(L)=B(C) = {ci,C2, . . .,C|B(C)|},其中,每一個(gè)元素 Ci都是一個(gè)流程的運(yùn)行實(shí)例,
[0039] 前述步驟D中,對(duì)上述兩種日志視圖分別進(jìn)行資源分配規(guī)則挖掘,具體包括:
[0040] 步驟D-I:對(duì)于工作流日志橫向案例視圖匕U) = E ,…,\},其單位事務(wù)為: es: (pi,tj,rk),Pi,tj,rk為其最小組成元;
[0041] 步驟D-2:對(duì)于工作流日志縱向案例視圖Vc(L)=B(C) = {C1,c2, . . .,c|B(c)|},對(duì)于 事件es: (pi,tj,rk),定義活動(dòng)屬性辨識(shí)算子:π如下:Ji(es) = (pi,tj,rk),3Tp(es)=pi,3it(es) = tj,Jir(es)=rk,算子#(£*)表示:若e ,則替換幻為出,即最終所有Ji相同 的事件都被替換為一個(gè)典型事件,其中E為事件的集合,即E= (ei,ej, ... ,?);基于上述處 理,工作流日志縱向案例視圖的單位案例為:c" :辦...,ek)中的典型事 件即為其最小組成元;
[0042] 步驟D-3:假設(shè)對(duì)于規(guī)則445,滿(mǎn)足以下幾個(gè)條件,即:/1c/,M=/,且 Jn5 = 0,其中,對(duì)于步驟D得到的工作流日志橫向案例視圖和縱向案例視圖,規(guī)則d 4 Z?中 A與B都是其單位事務(wù)中最小組成元的組合,對(duì)于規(guī)則J => S在事務(wù)集合D中有兩個(gè)評(píng)價(jià)指 標(biāo):出現(xiàn)頻度prob和因果條件概率cond,其中:規(guī)則的出現(xiàn)頻度prob表示在集合D中 存在A U B集合的事務(wù)集百分比,及A和B的并集在D中出現(xiàn)的概率,即, 根據(jù)項(xiàng)集AU B的出現(xiàn)概率對(duì)得到的規(guī)則進(jìn)行篩選,對(duì)P(AUB)小于一定的閾值minprob的規(guī) 則進(jìn)行剪除,其中〇〈minprob〈 1;對(duì)于橫向案例視圖,根據(jù)出現(xiàn)頻度prob定義,對(duì)其單位事務(wù) 63:^山,^〇進(jìn)行處理,計(jì)算6 3:^,1:」,^〇中口1,1:」,^{及相互之間的組合的出現(xiàn)頻率,即 prob(pi),prob(tj),prob(rk),prob(pi,tj),prob(pi,rk),prob(tj,rk),prob(pi,tj,rk);而 對(duì)于縱向案例視圖Vc(L)=B(C) = {ci,C2, . . .,cb(〇},對(duì)其c" ^^,,,.,.…,:^^進(jìn)行處理^于 統(tǒng)計(jì)典型事件,及典型事件在案例中的組合出現(xiàn)頻率;在上述計(jì)算結(jié)束后,所有出現(xiàn)頻度 prob小于minprob的組成元組合均被篩除;
[0043] 步驟D-4:基于當(dāng)前任務(wù)ac前置條件A對(duì)獲得的所有資源分配規(guī)則進(jìn)行篩選,對(duì)于 當(dāng)前活動(dòng)a。,首先,針對(duì)在橫向案例視圖中獲取的資源分配規(guī)則,是根據(jù)a。的過(guò)程和任務(wù)屬 性即π p ( a c),π t ( a c)對(duì)視圖(Z)-五-{巧,}中e s : ( p i,t j,r k)中得到的形如 (八4 4的規(guī)則的前置條件進(jìn)行篩選;而在縱向案例視圖中,是根據(jù)a。的前置典型事件序 列對(duì)Vc(L)=B(C) = {ci,C2, ...,c|B(c)|}中的單元案例中的典型事件序列£? :#(e,中 得到的形如氣,…,= 又限篩選,從而根據(jù)ez的資源項(xiàng)對(duì)a。的執(zhí)行資源進(jìn)行推薦。
[0044] 前述步驟E中,采用因果條件概率指標(biāo)對(duì)步驟D得到的規(guī)則進(jìn)行排序,以條件概率P (B IA)最大的規(guī)則為最佳候選規(guī)則;5的因果條件概率cond表不在D中包含A的事務(wù)也 包括B的概率,8卩4μ) = /;/·〇/)(/〗U ,因此,前述因果條件概率 可以通過(guò)步驟前述步驟D-3中的相應(yīng)結(jié)果比值獲得;cond指標(biāo)用于對(duì)minprob指標(biāo)篩選下來(lái) 的進(jìn)彳丁排序;
[0045] 然后將篩選后的規(guī)則匯總,并按照規(guī)則的因果條件概率cond從大到小進(jìn)行排序, 從而得到最優(yōu)資源分配規(guī)則的列表,最終實(shí)現(xiàn)資源的快速分配。
[0046] 本發(fā)明的技術(shù)方案可用于任何工作流驅(qū)動(dòng)的信息系統(tǒng)的任務(wù)實(shí)例化階段,通過(guò)嵌 入在系統(tǒng)任務(wù)分配界面的當(dāng)前任務(wù)執(zhí)行資源優(yōu)先推薦列表,實(shí)現(xiàn)對(duì)任務(wù)分配人員的信息支 撐,從而加快工作流任務(wù)的分配效率和準(zhǔn)確度。
[0047] 為了驗(yàn)證本方法的執(zhí)行效果,發(fā)明人在合作企業(yè)的工藝部門(mén)選擇了幾個(gè)典型產(chǎn)品 和三種工作熟練程度的工人在產(chǎn)品數(shù)據(jù)管理系統(tǒng)的工作流任務(wù)分配環(huán)節(jié)進(jìn)行了測(cè)試,并以 同樣的任務(wù)環(huán)境,用我們開(kāi)發(fā)的測(cè)試程序進(jìn)行分析。找了三個(gè)不同熟練程度的操作人員,從 事本工作時(shí)間分別為2個(gè)月,18個(gè)月和56個(gè)月。每組分別進(jìn)行了十次實(shí)驗(yàn),總計(jì)30次,分別統(tǒng) 計(jì)執(zhí)行時(shí)間對(duì)比如圖2、圖3、圖4所示。實(shí)驗(yàn)證明,本方法的資源分配推薦結(jié)果前三項(xiàng)的準(zhǔn)確 率達(dá)到96.7%,并且100%符合執(zhí)行角色與組織權(quán)限要求,人-機(jī)平均任務(wù)分配時(shí)間消耗比 達(dá)3.68倍。因此,本方法能夠在保證較高推薦準(zhǔn)確率的情況下大幅提升資源分配工作人員 的工作效率。
【主權(quán)項(xiàng)】
1. 一種縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,其特征在于,包括以下步驟: 步驟A、以過(guò)程、任務(wù)、資源、工作流實(shí)例及時(shí)間戳五元組來(lái)表示工作流日志; 步驟B、以事務(wù)為基本單元對(duì)工作流日志進(jìn)行分解,得到工作流日志橫向事件視圖 V,(L) = E = i%,\ : 步驟C、以工作流實(shí)例為基本單元對(duì)工作流日志進(jìn)行分解,得到工作流日志縱向案例視 圖¥。(1)=:8(〇 = {(31,〇2,...,(3|[3(〇|}; 步驟D、基于出現(xiàn)頻次prob及當(dāng)前活動(dòng)的前置條件對(duì)上述兩種日志視圖分別進(jìn)行資源 分配規(guī)則挖掘; 步驟E、基于因果條件概率conf方法對(duì)資源分配規(guī)則進(jìn)行全局篩選與排序,獲得全局優(yōu) 化的資源分配規(guī)則。2. 根據(jù)權(quán)利要求1所述的縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,其特征在于,其特 征在于,前述步驟A中,采用過(guò)程、任務(wù)、資源、工作流實(shí)例及時(shí)間戳五元組的五元組向量來(lái) 表達(dá)工作流日志,即£ = Px『x "x ('x ,其中:P是工作流流程集合;T是工 作流管理系統(tǒng)中工作流任務(wù)的集合;R是工作流資源的集合,C是工作流實(shí)例的集合,TS為工 作流任務(wù)執(zhí)行的時(shí)間戳。3. 根據(jù)權(quán)利要求1所述的縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,其特征在于,前述 步驟Β中,對(duì)于步驟Α所得到的工作流事件集I = Ρ X Γ X X C X A'=批,e2\ },對(duì)于事件單 元es eE,es: (Pi,tj,rk)記錄的工作流事件涉及流程Pi,任務(wù)tj以及資源rk,基于上述分解,得 到工作流日志橫向事件視圖= f = …?'4. 根據(jù)權(quán)利要求1所述的縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,其特征在于,前述 步驟C,定義C = E*為事件根據(jù)同一流程實(shí)例的流轉(zhuǎn)軌跡的集合,即一項(xiàng)工作按照流程的路 由進(jìn)行傳遞的記錄集,定義日志LeB(C),其中B(C)為所有共同案例C的活動(dòng)事件的集合,且 其中活動(dòng)事件基于時(shí)間戳順序排列,基于上述分解,得到工作流日志縱向案例視圖Vc(L) = 8(〇 = {(31,(:2,...,(3_)|},其中,每一個(gè)元素(3 1都是一個(gè)流程的運(yùn)行實(shí)例。5. 根據(jù)權(quán)利要求1所述的縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,其特征在于,前述 步驟D中,對(duì)上述兩種日志視圖分別進(jìn)行資源分配規(guī)則挖掘,具體包括: 步驟D-1:對(duì)于工作流日志橫向案例視圖廠(1)=苦=批,%,-,^},其單位事務(wù)為:^: (Pi,tj,rk),pi,tj,rk為其最小組成元; 步驟0-2:對(duì)于工作流日志縱向案例視圖¥(;(]^)=13(〇 = {(31,〇2,...,(^(〇|},對(duì)于事件 es: (pi,tj,rk),定義活動(dòng)屬性辨識(shí)算子:π如下:Ji(es) = (pi,tj,rk),3Tp(es)=pi,3it(es) = tj,3ir (一^二^算子對(duì)幻表示:若^^^廣反:^出卜:^^丄則替換幻為^即最終所有:^目同的事 件都被替換為一個(gè)典型事件,其中E為事件的集合,即E=(ei,ej, . . .,ek);基于上述處理,工 作流日志縱向案例視圖的單位案例為:&:^^/,...,4),^,6」,...,61〇中的典型事件即為 其最小組成元; 步驟D-3:假設(shè)對(duì)于規(guī)則J 3 5,:滿(mǎn)足以下幾個(gè)條件,SP : /1 cz /,/? c: /,| = 0,其 中,對(duì)于步驟D得到的工作流日志橫向案例視圖和縱向案例視圖,規(guī)則J 中A與B都是其 單位事務(wù)中最小組成元的組合,對(duì)于規(guī)則2 在事務(wù)集合D中有兩個(gè)評(píng)價(jià)指標(biāo):出現(xiàn)頻度 prob和因果條件概率cond,其中:規(guī)則J =5? 的出現(xiàn)頻度prob表示在集合D中存在A U B集合 的事務(wù)集百分比,及A和B的并集在D中出現(xiàn)的概率,8卩聲必(.4 =P(.4U 5),根據(jù)項(xiàng)集A U B的出現(xiàn)概率對(duì)得到的規(guī)則進(jìn)行篩選,對(duì)P(AUB)小于一定的閾值minprob的規(guī)則進(jìn)行剪除, 其中0〈minprob〈l;對(duì)于橫向案例視圖,根據(jù)出現(xiàn)頻度prob定義,對(duì)其單位事務(wù)es: (pi,tj, rk)進(jìn)行處理,計(jì)算es: (pi,tj ,rk)中pi, tj ,rk及相互之間的組合的出現(xiàn)頻率,即prob(pi), prob(tj),prob(rk),prob(pi,tj),prob(pi,rk),prob(tj,rk),prob(pi,tj,rk);而對(duì)于縱向案 例視圖Vc(L)=B(C) = {ci,C2, . . .,C|B(C)|},對(duì)其& :對(duì)^^…-^^進(jìn)行處理^于統(tǒng)計(jì)典型事 件,及典型事件在案例中的組合出現(xiàn)頻率;在上述計(jì)算結(jié)束后,所有出現(xiàn)頻度prob小于 minprob的組成元組合均被篩除; 步驟D-4:基于當(dāng)前任務(wù)a。前置條件A對(duì)獲得的所有資源分配規(guī)則進(jìn)行篩選,對(duì)于當(dāng)前活 動(dòng)a。,首先,針對(duì)在橫向案例視圖中獲取的資源分配規(guī)則,是根據(jù)a。的過(guò)程和任務(wù)屬性即πρ (a c),π t (a c)對(duì)視圖匕(i)=丑=丨q,e2,…,\丨:中e s: (ρ!,t」,r k)中得到的形如(A.,5的規(guī) 則的前置條件進(jìn)行篩選;而在縱向案例視圖中,是根據(jù)a。的前置典型事件序列對(duì)Vc(L)=B (C) = {C1,C2,. . .,c |B(〇 |}中的單元案例中的典型事件序列中得到的形如 僅限篩選,從而根據(jù)ez的資源項(xiàng)對(duì)a。的執(zhí)行資源進(jìn)行推薦。6.根據(jù)權(quán)利要求1所述的縱橫交錯(cuò)的混合式資源分配規(guī)則挖掘方法,其特征在于,前述 步驟E中,采用因果條件概率指標(biāo)對(duì)步驟D得到的規(guī)則進(jìn)行排序,以條件概率P(B|A)最大的 規(guī)則為最佳候選規(guī)則dS的因果條件概率cond表示在D中包含A的事務(wù)也包括B的概率, 即.4二妁=/^( β |/i) = U捫,因此,前述因果條件概率可以通過(guò)步驟 前述步驟D-3中的相應(yīng)結(jié)果比值獲得;cond指標(biāo)用于對(duì)minprob指標(biāo)篩選下來(lái)的進(jìn)行排序; 然后將篩選后的規(guī)則匯總,并按照規(guī)則的因果條件概率cond從大到小進(jìn)行排序,從而 得到最優(yōu)資源分配規(guī)則的列表,最終實(shí)現(xiàn)資源的快速分配。
【文檔編號(hào)】G06Q10/06GK106056300SQ201610404627
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年6月8日
【發(fā)明人】劉庭煜, 汪惠芬
【申請(qǐng)人】南京理工大學(xué)