亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于經(jīng)過遺留系統(tǒng)的蹤跡來分析遺留系統(tǒng)的方法和系統(tǒng)的制作方法

文檔序號:6340272閱讀:173來源:國知局
專利名稱:基于經(jīng)過遺留系統(tǒng)的蹤跡來分析遺留系統(tǒng)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及基于經(jīng)過遺留系統(tǒng)(legacy system)的蹤跡(trail)來分析遺留系統(tǒng) 的方法和系統(tǒng)。
背景技術(shù)
各種機(jī)構(gòu)經(jīng)常使用在遺留系統(tǒng)(例如大型機(jī))上運(yùn)行的應(yīng)用,這些應(yīng)用已經(jīng)存在 很長時(shí)間并且用于驅(qū)動(dòng)任務(wù)關(guān)鍵型計(jì)算。然而,使這些遺留系統(tǒng)和它們的應(yīng)用適應(yīng)于機(jī)構(gòu) 的變化的需求由于多個(gè)原因而是極其困難的。例如,遺留應(yīng)用的源代碼可能不再可得,因此 對遺留應(yīng)用的功能的任何適配都是不可能的。即使源代碼仍然可得(通常是以諸如C0B01 之類的第一代編程語言撰寫的),也通常由于缺乏對棄用的編程語言的專門知識(shí)或者缺乏 代碼的文檔而沒有可用的人員能夠正確地改寫代碼??傊?,遺留系統(tǒng)可以被看做是執(zhí)行最 初開發(fā)所針對的任務(wù)的“黑箱(black box)”,但是確定完成任務(wù)的準(zhǔn)確性是極其困難甚至 不可能的,即不可能知道遺留系統(tǒng)的功能。遺留系統(tǒng)通常與一個(gè)或多個(gè)終端仿真器通信,其中終端仿真器用于顯示在遺留系 統(tǒng)上運(yùn)行的遺留應(yīng)用的畫面(screen)并且允許用戶將數(shù)據(jù)輸入到畫面的數(shù)據(jù)域中。用戶 輸入然后被傳送回遺留系統(tǒng),遺留系統(tǒng)通過將下一畫面發(fā)送到終端仿真器而作出應(yīng)答???之,用戶與遺留系統(tǒng)的會(huì)話因而可被看做是通過用戶輸入而連接起來的顯示畫面(畫面實(shí) 例)的序列。為了理解遺留系統(tǒng)的功能,已知分析由遺留系統(tǒng)提供的數(shù)據(jù)以設(shè)法提取傳送到遺 留系統(tǒng)和從遺留系統(tǒng)傳送來的畫面以及它們的依賴關(guān)系。所提取的畫面然后可用于建立遺 留系統(tǒng)的示圖(map)(即模型),其中該示圖可以是有限狀態(tài)機(jī),該有限狀態(tài)機(jī)的節(jié)點(diǎn)代表 畫面并且它們的轉(zhuǎn)變代表用戶輸入。該繪圖處理的主要困難是遺留系統(tǒng)的各個(gè)畫面的識(shí)別。由于從遺留系統(tǒng)與(一個(gè) 或多個(gè))終端仿真器之間的通信截取的數(shù)據(jù)包括具體畫面實(shí)例(即,具有具體的已填充數(shù) 據(jù)域的畫面),因此判定兩個(gè)遇到的畫面實(shí)例是屬于同一畫面還是不同畫面是非常困難的, 并且在一些情形中甚至是不可能的。為此,已知了諸如申請人的ApplinX之類的系統(tǒng),這些系統(tǒng)用于例如通過讓開發(fā) 者手動(dòng)識(shí)別畫面或者通過(例如從Natural或MainframeBMS/MFS系統(tǒng))引入畫面示圖來 對遺留系統(tǒng)建模。然而,在手動(dòng)方法中,導(dǎo)航步驟通常是基于開發(fā)者的(而非實(shí)際用戶的) 在遺留系統(tǒng)中的導(dǎo)航而捕獲的,這產(chǎn)生不完整的或者完全錯(cuò)誤的畫面分組和識(shí)別。另一方 面,引入宿主畫面示圖(host screen map)通常只允許對畫面數(shù)據(jù)的分析,而不考慮各個(gè)畫 面(例如用戶輸入)之間的導(dǎo)航和關(guān)系。另一種方法是“爬行(crawl)”遺留系統(tǒng)的畫面 (類似于爬行因特網(wǎng)以尋找搜索引擎的爬行器(crawler)),然而這種方法受限于測試環(huán)境 或者受限于不修改數(shù)據(jù)的畫面。此外,多數(shù)已知方法需要在大型機(jī)上安裝另外的組件(例 如datadirect、JIS innovator),這取決于遺留系統(tǒng)的類型而是困難的或者甚至不可能的。此外,US6, 836,780B1公開了一種用于繪制遺留應(yīng)用數(shù)據(jù)的方法和裝置。在第一階段中,與遺留應(yīng)用的交互被記錄為蹤跡,其中每個(gè)蹤跡包括所遇到的每個(gè)畫面的快照以 及所輸入的所有按鍵?;谒涗浀嫩欅E,通過將所遇到的畫面快照分揀(sort)到畫面中 而建立遺留應(yīng)用的示圖。該分揀是基于簡單畫面識(shí)別規(guī)則而完成的,這些規(guī)則設(shè)法根據(jù)在 各個(gè)快照中找到的預(yù)定義的域的數(shù)目、大小和位置來分配快照。然而,簡單畫面識(shí)別規(guī)則僅 足以識(shí)別非常簡單的畫面,因而US6,836,780B1中所提議的方法取決于大量另外的手動(dòng)動(dòng) 作,例如手動(dòng)識(shí)別任何未遇到的畫面、校正錯(cuò)誤分組的畫面快照或者手動(dòng)為畫面數(shù)據(jù)的獨(dú) 特組合(unique combination)加上標(biāo)簽。因此,不可能在沒有大量辛苦的易于發(fā)生錯(cuò)誤的 用戶干預(yù)的情況下可靠地且完整地建立遺留應(yīng)用的正確示圖。此外,US6,697,088B1公開了一種用于遺留應(yīng)用的圖形表示系統(tǒng)。然而,該系統(tǒng)依 賴于已知的畫面識(shí)別技術(shù)(例如上面所給出的),因此不能幫助改善對要分析的遺留應(yīng)用 的畫面的識(shí)別。因此本發(fā)明存在的技術(shù)問題是提供一種方法和系統(tǒng),該方法和系統(tǒng)以更可靠且完 整的方式來生成遺留系統(tǒng)的示圖/模型并從而至少部分地克服上面說明的現(xiàn)有技術(shù)的缺
點(diǎn)ο

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,該問題是由一種基于至少一個(gè)蹤跡來分析遺留系統(tǒng)的方 法來解決的,其中這至少一個(gè)蹤跡包括遺留系統(tǒng)的多個(gè)畫面實(shí)例。在權(quán)利要求1的實(shí)施例 中,該方法包括以下步驟a.計(jì)算所述至少一個(gè)蹤跡中的多個(gè)畫面實(shí)例的多個(gè)逐對距離量度(measure),其 中所述逐對距離量度指示出各對畫面實(shí)例的相似性,該相似性指示出這對畫面實(shí)例可能源 自遺留系統(tǒng)的同一畫面;以及b.對所述多個(gè)逐對距離量度應(yīng)用至少一種成簇分析算法以將畫面實(shí)例分組成至 少一個(gè)畫面群組,并且基于所述至少一個(gè)畫面群組建立遺留系統(tǒng)的示圖。因此,該實(shí)施例定義了一種基于記錄到畫面實(shí)例的蹤跡中的用戶活動(dòng)來產(chǎn)生經(jīng)分 析的遺留系統(tǒng)的示圖的方法。該示圖是通過基于優(yōu)選地為(一個(gè)或多個(gè))蹤跡內(nèi)的每對畫 面實(shí)例計(jì)算出的逐對距離量度將屬于遺留系統(tǒng)的同一畫面的各個(gè)畫面實(shí)例分組成畫面群 組而建立的。由于逐對距離量度指示出各對畫面實(shí)例的相似性,該相似性幫助得出屬于遺 留系統(tǒng)的同一畫面的兩個(gè)畫面實(shí)例的概率,因此本方法提供了一種獲得遺留系統(tǒng)的示圖的 隨機(jī)/或然(stochastic/probabilistic)方法。與現(xiàn)有技術(shù)已知的簡單畫面識(shí)別規(guī)則(其 涉及相當(dāng)大量的手動(dòng)作業(yè))相比,該隨機(jī)/或然方法大大提高了自動(dòng)畫面群組檢測的可靠 性。例如,US6, 836, 780B1中公開的簡單畫面匹配在兩個(gè)給定畫面實(shí)例在同一位置包含相 同域的情況下將這兩個(gè)給定畫面實(shí)例分組成群組。結(jié)果,這樣的二元現(xiàn)有技術(shù)判定算法只 提供了不足的畫面分組結(jié)果,因此需要大量辛苦的手動(dòng)細(xì)微調(diào)諧工作。相反,由于所得出的 距離量度,本方法提供了對給定蹤跡中的哪些畫面實(shí)例屬于所分析的遺留系統(tǒng)的同一畫面 作出準(zhǔn)確得多的判斷,從而相當(dāng)大地提高了所生成的遺留系統(tǒng)示圖的質(zhì)量,而優(yōu)選地沒有 任何手動(dòng)交互。在本發(fā)明的一個(gè)方面中,以上方法步驟中的第一步驟可以包括計(jì)算所述多個(gè)畫面 實(shí)例的逐對距離分?jǐn)?shù)的步驟,其中所述逐對距離分?jǐn)?shù)指示出各對畫面實(shí)例的相似性,該相似性指示出這對畫面實(shí)例可基于各畫面實(shí)例的內(nèi)容而源自同一畫面。因此,為了判斷兩個(gè) 給定畫面實(shí)例是否屬于同一畫面,可以對畫面實(shí)例執(zhí)行統(tǒng)計(jì)內(nèi)容分析。優(yōu)選地,逐對距離分 數(shù)是基于至少一個(gè)畫面參數(shù)而計(jì)算的,這些畫面參數(shù)例如是字母數(shù)字字符的數(shù)量、無保護(hù) 域的數(shù)量、無保護(hù)隱藏域的數(shù)量、位的數(shù)量、字母字符的數(shù)量、空格字符的數(shù)量、獨(dú)特字符的 數(shù)量、列熵分?jǐn)?shù)(column entropy score)、獨(dú)特顏色的數(shù)量、反相顯示模式的字符的數(shù)量、 增強(qiáng)模式的字符的數(shù)量、大寫形式的字符與所有字符相比的百分比、詞的數(shù)量和/或其任 意組合。因此,本發(fā)明與現(xiàn)有技術(shù)相比提供了多個(gè)改善的參數(shù),其中畫面識(shí)別僅僅基于畫面 實(shí)例的域的數(shù)目、大小和位置。優(yōu)選地,為每個(gè)畫面實(shí)例計(jì)算上述畫面參數(shù)分?jǐn)?shù)中的一個(gè)或 多個(gè),并且將計(jì)算出的兩個(gè)畫面實(shí)例的分?jǐn)?shù)在數(shù)值上組合成逐對距離分?jǐn)?shù)。然后可使用該 逐對距離分?jǐn)?shù)來得出距離量度,如在下面的具體實(shí)施方式
中將進(jìn)一步說明的。在本發(fā)明的另一個(gè)方面中,以上方法步驟中的第一步驟可以包括計(jì)算所述多個(gè)畫 面實(shí)例的逐對相似性分?jǐn)?shù)的步驟,其中所述逐對相似性分?jǐn)?shù)指示出各對畫面實(shí)例的相似 性,該相似性指示出這對畫面實(shí)例可基于各畫面實(shí)例的結(jié)構(gòu)而源自同一畫面。因此,對哪些 畫面實(shí)例屬于遺留系統(tǒng)的同一畫面的判斷可以依賴于對給定畫面實(shí)例的結(jié)構(gòu)的分析。在一 個(gè)方面中,逐對相似性分?jǐn)?shù)可以是基于各畫面實(shí)例中的至少一個(gè)域分區(qū)的標(biāo)識(shí)而計(jì)算的, 其中所述至少一個(gè)域分區(qū)包括畫面實(shí)例內(nèi)的多個(gè)相關(guān)域。因此,本發(fā)明可以分析畫面實(shí)例 內(nèi)的域(例如輸入域、標(biāo)簽等等),并且將相關(guān)的域分組成域分區(qū)/片段。換言之,域分區(qū)/ 片段將在語義上屬于一起的畫面實(shí)例域(例如標(biāo)簽/輸入域?qū)?歸成組?;谟蚍謪^(qū),為 了比較兩個(gè)給定畫面實(shí)例并且為了判定這兩個(gè)畫面實(shí)例是否屬于同一畫面,可以對文本樣 式進(jìn)行識(shí)別。在另一個(gè)方面中,以上方法步驟中的第一步驟可以包括以下步驟識(shí)別所述至少 一個(gè)蹤跡內(nèi)的至少一個(gè)導(dǎo)航樣式,并且根據(jù)這至少一個(gè)識(shí)別出的導(dǎo)航樣式對所述至少一個(gè) 蹤跡內(nèi)的畫面實(shí)例進(jìn)行分組。因此為了對將畫面實(shí)例分組成畫面群組進(jìn)行精煉,還可以使 用從(一個(gè)或多個(gè))蹤跡提取的導(dǎo)航信息(例如為了從一個(gè)畫面實(shí)例導(dǎo)航到下一畫面實(shí)例 二提供的用戶輸入)和/或所觀察到的各蹤跡內(nèi)的畫面實(shí)例的序列,如在下面的具體實(shí)施 方式中將進(jìn)一步說明的。在一個(gè)優(yōu)選實(shí)施例中,以上方法步驟中的第一步驟可以包括以下步驟優(yōu)選地基 于預(yù)定義的加權(quán)函數(shù),將給定的一對畫面實(shí)例的逐對距離分?jǐn)?shù)和逐對相似性分?jǐn)?shù)組合成基 于組合后的參數(shù)和片段的距離分?jǐn)?shù)。因此,統(tǒng)計(jì)內(nèi)容分析和結(jié)構(gòu)分析的結(jié)果可被組合,以得 出每對畫面實(shí)例的單個(gè)基于組合后的參數(shù)和片段的距離分?jǐn)?shù),如在下面的具體實(shí)施方式
中 將進(jìn)一步說明的。另外或者作為替代,可以為所述給定一對畫面實(shí)例的至少一對相應(yīng)鄰居計(jì)算至少 一個(gè)基于組合后的參數(shù)和片段的距離分?jǐn)?shù)。因此,對兩個(gè)給定畫面實(shí)例是否屬于遺留系統(tǒng) 的同一畫面的判定不僅可以依賴于為這特定一對畫面實(shí)例得出的分?jǐn)?shù),而且還可以依賴于 為相鄰的畫面實(shí)例(即,在蹤跡所給出的序列內(nèi)位于各畫面實(shí)例之前或之后的畫面實(shí)例) 計(jì)算出的分?jǐn)?shù)。此外,該方法還可以包括以下步驟將給定的畫面實(shí)例中包含的多個(gè)域分組成一 組靜態(tài)域和一組動(dòng)態(tài)域,并且在忽略所述一組動(dòng)態(tài)域的同時(shí)基于所述一組靜態(tài)域?qū)⑺鼋o 定畫面實(shí)例指派給所述至少一個(gè)畫面群組。因此,可以基于預(yù)定義的和/或可編輯的規(guī)則例如根據(jù)文本樣式將畫面實(shí)例分段成分區(qū)。這樣,畫面實(shí)例內(nèi)的域分區(qū)被識(shí)別為優(yōu)選地包 含統(tǒng)一的相關(guān)類型文本,例如各畫面的標(biāo)題、表格的頭部、標(biāo)簽/值對或者還包括所遇到的 畫面實(shí)例的特征部分,如在下面的具體實(shí)施方式
中將進(jìn)一步說明的。申請人發(fā)現(xiàn),使畫面識(shí) 別基于可能是動(dòng)態(tài)的域(這在不管如何都屬于同一畫面的兩個(gè)畫面實(shí)例之間在數(shù)目、大小 和位置上可能非常不同)導(dǎo)致了相當(dāng)大量的被錯(cuò)誤識(shí)別的畫面,例如兩個(gè)畫面實(shí)例被錯(cuò)誤 地指派給同一畫面(雖然它們屬于不同畫面)或者它們被錯(cuò)誤地指派給不同畫面(雖然它 們屬于同一畫面)。因此,本發(fā)明通過提供更準(zhǔn)確的并因而更可靠的畫面識(shí)別(即,使畫面 識(shí)別僅基于靜態(tài)域,而忽視任何動(dòng)態(tài)域)而與已知的畫面識(shí)別方法有所不同,這大大提高 了為所分析的遺留系統(tǒng)生成的示圖的質(zhì)量和正確性。注意,在所發(fā)明的畫面識(shí)別過程中優(yōu) 選地不需要用戶干預(yù),這因此比現(xiàn)有技術(shù)已知的辛苦的且易發(fā)生錯(cuò)誤的手動(dòng)方法是更加高 效的。另外或者作為替代,該方法還可以包括以下步驟通過針對預(yù)定義的規(guī)則集合對 所述至少一個(gè)畫面群組進(jìn)行匹配并且根據(jù)該規(guī)則集合向畫面群組指派至少一種類型來對 所述至少一個(gè)畫面群組分類。因此,所識(shí)別的畫面群組被歸類,這進(jìn)一步提高了所生成的示 圖的質(zhì)量,這是因?yàn)閷嬅嫒航M分類成不同類型的畫面(例如菜單畫面、登入畫面等等)允 許進(jìn)一步的語義分析,如在下面的具體實(shí)施方式
中將進(jìn)一步說明的。對至少一個(gè)畫面群組 的歸類在此方面中基于預(yù)定義的規(guī)則集合,因此歸類可在沒有任何用戶干預(yù)的情況下被自 動(dòng)完成。然而在一些實(shí)例中,尤其當(dāng)對具有復(fù)雜內(nèi)容的畫面實(shí)例進(jìn)行操作時(shí),自動(dòng)歸類可 能仍然提供各畫面群組的多于一個(gè)候選類型。為此,為了僅向畫面群組指派一種類型,本方 法還可以包括基于從提取自至少一個(gè)蹤跡的用戶輸入所提取的信息類對分類/歸類進(jìn)行 精煉(見下面的具體實(shí)施方式
)。本方法還可以包括以下步驟第二次分析所述至少一個(gè)蹤跡以基于從所述至少一 個(gè)蹤跡提取的信息來精煉所述示圖。因此,該方面提供了一種遞增方法,其特征在于已經(jīng)分 析過的蹤跡可被再次分析并且被針對在第一次運(yùn)行期間生成的示圖進(jìn)行匹配,如在下面的具體實(shí)施方式
中將進(jìn)一步說明的。類似地,該方法還可以還可以包括以下步驟分析至少一 個(gè)第二蹤跡以基于所述至少一個(gè)第二蹤跡中包含的信息來對所述示圖進(jìn)行精煉。這樣,所 生成的示圖在每當(dāng)新的蹤跡被分析時(shí)都被進(jìn)一步精煉,因而隨著時(shí)間而“穩(wěn)定化”。本發(fā)明還涉及一種包括用于實(shí)現(xiàn)以上方法中的任一種的指令的計(jì)算機(jī)程序。此外,本發(fā)明提供了一種用于基于至少一個(gè)蹤跡來分析遺留系統(tǒng)的系統(tǒng),其中所 述至少一個(gè)蹤跡包括所述遺留系統(tǒng)的多個(gè)畫面實(shí)例,并且其中所述系統(tǒng)包括a.畫面識(shí)別組件,適用于計(jì)算所述至少一個(gè)蹤跡中的多個(gè)畫面實(shí)例的多個(gè)逐對距 離量度,其中所述逐對距離量度指示出各對畫面實(shí)例的相似性,該相似性指示出這對畫面 實(shí)例可源自所述遺留系統(tǒng)的同一畫面;b.其中所述畫面識(shí)別組件還適用于對所述多個(gè)逐對距離量度應(yīng)用至少一種成簇 分析算法以將畫面實(shí)例分組成至少一個(gè)畫面群組,并且適用于基于所述至少一個(gè)畫面群組 建立所述遺留系統(tǒng)的示圖。該系統(tǒng)還可以包括重定向器,其中該重定向器適用于通過分析在至少一個(gè)現(xiàn)場用 戶會(huì)話期間所述遺留系統(tǒng)與至少一個(gè)終端之間的通信來記錄所述至少一個(gè)蹤跡。因此,不必像現(xiàn)有技術(shù)那樣講任何處理組件安裝在要分析的遺留系統(tǒng)上。相反,本發(fā)明采用了“零足 跡(zero footprint)”方法,其特征在于重定向器被動(dòng)地分析遺留系統(tǒng)和所連接的(一個(gè) 或多個(gè))終端之間的通信,因而根本不與遺留系統(tǒng)相接口。重定向器還可適用于記錄多個(gè)蹤跡以及將所記錄的多個(gè)蹤跡存儲(chǔ)在數(shù)據(jù)存儲(chǔ)庫 中,其中所述畫面識(shí)別組件適用于分析所存儲(chǔ)的多個(gè)蹤跡。因此,大量實(shí)際用戶會(huì)話可被本 發(fā)明的系統(tǒng)記錄并隨后分析。本發(fā)明的系統(tǒng)實(shí)施例的進(jìn)一步有利修改在所附權(quán)利要求中限定。


在下面的具體實(shí)施方式
中,參考附圖進(jìn)一步描述本發(fā)明的當(dāng)前優(yōu)選的實(shí)施例圖1 示出根據(jù)本發(fā)明實(shí)施例的系統(tǒng)的框圖;圖2 示出由根據(jù)本發(fā)明實(shí)施例的方法執(zhí)行的處理步驟的流程圖;圖3a_3i 根據(jù)本發(fā)明實(shí)施例的由遺留系統(tǒng)提供的示例性畫面的截屏圖;圖4 根據(jù)本發(fā)明實(shí)施例的經(jīng)過遺留系統(tǒng)的兩個(gè)示例性軌跡;圖5 根據(jù)本發(fā)明實(shí)施例的經(jīng)過遺留系統(tǒng)的具有注釋畫面參數(shù)的兩個(gè)示例性軌 跡;圖6 根據(jù)本發(fā)明實(shí)施例的從畫面實(shí)例的分組產(chǎn)生的遺留系統(tǒng)的示圖;圖7 根據(jù)本發(fā)明實(shí)施例的從靜態(tài)和動(dòng)態(tài)區(qū)域的識(shí)別產(chǎn)生的遺留系統(tǒng)的示圖;圖8 根據(jù)本發(fā)明實(shí)施例的從所識(shí)別的畫面群組的分類(categorization)產(chǎn)生的 遺留系統(tǒng)的示圖;圖9 根據(jù)本發(fā)明實(shí)施例的具有所指派的語義信息的遺留系統(tǒng)的示圖;圖10 根據(jù)本發(fā)明實(shí)施例的為兩個(gè)給定畫面實(shí)例執(zhí)行的結(jié)構(gòu)分析的示意圖;圖11 根據(jù)本發(fā)明實(shí)施例的兩個(gè)所識(shí)別的相應(yīng)鄰居的兩個(gè)蹤跡的示意圖;以及圖12 根據(jù)本發(fā)明實(shí)施例的對蹤跡進(jìn)行預(yù)處理的示意圖。
具體實(shí)施例方式在具有作為核心系統(tǒng)的遺留系統(tǒng)(例如大型機(jī))的機(jī)構(gòu)中,希望對在大型機(jī)上運(yùn) 行的應(yīng)用的用戶接口的結(jié)構(gòu)進(jìn)行建模,以例如供遺留系統(tǒng)與外部系統(tǒng)交互。這種外部系統(tǒng) 可以是基于現(xiàn)代化產(chǎn)品的屏幕、分析用戶與大型機(jī)的交互的工具(例如因?yàn)槠墼p檢測、商 業(yè)進(jìn)程測量或者進(jìn)程優(yōu)化)、用于訓(xùn)練大型機(jī)用戶的工具等等。這樣的建模的目的是識(shí)別關(guān) 于遺留應(yīng)用/遺留系統(tǒng)的信息,例如畫面的名稱、用于識(shí)別指定的畫面的實(shí)例的手段、這樣 的實(shí)例的圖形表示(例如畫面圖像或縮略圖)、用于導(dǎo)航到其他畫面的手段(例如所需要的 輸入和發(fā)送鍵)、相鄰畫面之間的關(guān)系(例如一對一、一對多)和/或關(guān)于畫面所提供的數(shù) 據(jù)以及用戶可能輸入什么樣的輸入到畫面中的其他信息。本發(fā)明因此在一些實(shí)施例中提議 自動(dòng)生成遺留系統(tǒng)的準(zhǔn)確且完整的模型(即示圖)。圖2示出由本發(fā)明的實(shí)施例執(zhí)行的包括以下步驟在內(nèi)的處理步驟的流程圖收集 用戶數(shù)據(jù)(1000)、分析畫面圖像/實(shí)例(1010)(包括統(tǒng)計(jì)內(nèi)容分析1012、結(jié)構(gòu)分析1014和 /或?qū)Ш綐邮?pattern)的識(shí)別1016)、對畫面實(shí)例進(jìn)行分組(1020)、識(shí)別畫面(1030)、對 畫面分類(1040)和/或指派語義信息(1050)。將會(huì)認(rèn)識(shí)到,本發(fā)明的各個(gè)實(shí)施例可以提供上述步驟和相關(guān)功能的全部或者只提供其子集,以及這些步驟的不同順序。以下將更詳細(xì) 地描述圖2中示出的各個(gè)步驟。收集用戶數(shù)據(jù)1000圖1示出根據(jù)本發(fā)明實(shí)施例的系統(tǒng)1。在圖1中可以看到,遺留系統(tǒng)20與一個(gè)或 多個(gè)終端10通信。遺留系統(tǒng)20與(一個(gè)或多個(gè))終端10之間的通信被重定向器30截取, 重定向器30記錄一個(gè)或多個(gè)蹤跡100、101(參考圖4)并且將所記錄的蹤跡100、101記錄 在數(shù)據(jù)存儲(chǔ)庫40中。圖1中示出的系統(tǒng)1及其畫面識(shí)別組件15然后可以分析所記錄的蹤 跡100、101 (見下面)。為此,畫面識(shí)別組件15可被適配成執(zhí)行下面描述的所有功能或者這 些功能的的至少一個(gè)子集。圖4示出了兩個(gè)示例性蹤跡100和101。蹤跡100包括一個(gè)序列的畫面實(shí)例110, 這些畫面實(shí)例110表現(xiàn)用戶導(dǎo)航到產(chǎn)品列表。蹤跡101包括一個(gè)序列的畫面實(shí)例110,這些 畫面實(shí)例110表現(xiàn)用戶未能一次登入并然后導(dǎo)航到客戶列表。在圖4中可以看到,每個(gè)蹤 跡100、101包括通過用戶輸入120而連接的所遇到的畫面實(shí)例110的序列,其中用戶輸入 120將一個(gè)畫面實(shí)例引導(dǎo)至下一畫面實(shí)例。每個(gè)畫面實(shí)例100、101可以包括任意數(shù)目的域 130,例如標(biāo)簽、輸入域、頭部等等。分析畫面圖像1010步驟1010優(yōu)選地包括分析蹤跡100、101內(nèi)的單個(gè)畫面實(shí)例110,并且可被針對每 個(gè)畫面實(shí)例Iio進(jìn)行重復(fù)。優(yōu)選地,步驟1010包括三個(gè)子步驟,即統(tǒng)計(jì)內(nèi)容分析1012、結(jié)構(gòu) 分析1014和導(dǎo)航樣式的識(shí)別1016。然而,將會(huì)認(rèn)識(shí)到,各個(gè)實(shí)施例可以只采用子步驟1012、 1014和1016中的一些。在統(tǒng)計(jì)內(nèi)容分析1012期間,優(yōu)選地采用多個(gè)畫面參數(shù)來基于所調(diào)查的畫面實(shí)例 110的內(nèi)容計(jì)算分?jǐn)?shù),該內(nèi)容例如是字母數(shù)字字符的數(shù)目、無保護(hù)域130的數(shù)目、無保護(hù)隱 藏域130(例如密碼域)的數(shù)目、位數(shù)、字母字符的數(shù)目、空格字符的數(shù)目、獨(dú)特字符的數(shù) 目、“列熵”分?jǐn)?shù)(指示出列的有序水平的分?jǐn)?shù),例如基于霍夫變換(Hough Transform)或 RANSAC的簡化版本)、獨(dú)特顏色的數(shù)目、“反相顯示(reversed video) ”模式的字符的數(shù)目、 “增強(qiáng)”模式的字符的數(shù)目、所有文本中大寫模式的字符的百分比、詞的數(shù)目和/或其任意組 合。圖5示出了來自圖4的兩個(gè)示例性蹤跡100、101,其中各個(gè)畫面實(shí)例110已被注釋上了 從畫面參數(shù)計(jì)算出的分?jǐn)?shù)(見圖5中的分?jǐn)?shù)M1、M2和M3)。此外,在結(jié)構(gòu)分析1014期間,為了識(shí)別畫面實(shí)例110內(nèi)的特征部分,畫面實(shí)例110 被優(yōu)選地分段成一個(gè)或多個(gè)域分區(qū)140(以下也稱為“片段”)。每個(gè)域分區(qū)140優(yōu)選地包 括多個(gè)在與語義上屬于一起的個(gè)體域130(例如一個(gè)域130表示輸入域并且一個(gè)域130表 示相應(yīng)的標(biāo)簽),然而域分區(qū)140也可以只包括一個(gè)域130。例如,基于預(yù)定義的(并且可 編輯的)規(guī)則,每個(gè)畫面實(shí)例110可被根據(jù)文本樣式而分段成域分區(qū)140。想法是例如通過 采用圖像分段或者其簡化版本來識(shí)別畫面實(shí)例110上包含統(tǒng)一類型的文本的矩形。畫面分 段可以識(shí)別諸如畫面標(biāo)題、系統(tǒng)時(shí)鐘、表頭部區(qū)域、列(例如具有無保護(hù)的類型、數(shù)字、自由 文本等等)、自由文本、標(biāo)簽/值對和/或“裝飾”文本(例如是斑點(diǎn)畫面(splash screen) 或者分隔符形式的)之類的域分區(qū)/片段140。在此階段中優(yōu)選地采用的另一種分析是導(dǎo)航樣式匹配1016,其用于識(shí)別蹤跡 100、101內(nèi)的樣式。在一個(gè)實(shí)施例中,可以使用諸如申請人的Jacada Interface krver或者webMethods ApplinX之類的系統(tǒng)基于可定制的預(yù)定義樣式來識(shí)別有意義的典型大型機(jī) 導(dǎo)航樣式(綠色畫面樣式)。示例性的樣式包括AID(動(dòng)作標(biāo)識(shí)符)鍵遺留應(yīng)用畫面可以在畫面的底部示出AID鍵(也稱為PF 鍵)的列表,這些AID鍵具有描述它們在相應(yīng)畫面內(nèi)的含義的標(biāo)簽,例如“PFl-Help (幫 助)'\"PF3-Save (保存),,、“PF7-Back (后退)”、“PF8-Next Page (下一頁)”。終端仿真 器的用戶按下給定畫面內(nèi)的AID鍵之一通常會(huì)觸發(fā)使遺留大型機(jī)導(dǎo)航到一后續(xù)畫面,該后 續(xù)畫面然后被顯示在終端仿真器上。這樣的AID鍵通常作為導(dǎo)航信息包括在所記錄的蹤跡 100,101 內(nèi)。菜單遺留應(yīng)用可以包括允許在遺留應(yīng)用的不同邏輯部件和功能之間進(jìn)行導(dǎo)航的 菜單畫面。這樣的菜單通常具有特別結(jié)構(gòu),例如每個(gè)菜單項(xiàng)可以包括1至2位的數(shù)字值,之 后是點(diǎn)、空白和菜單項(xiàng)描述。菜單項(xiàng)的列表通常是垂直排列的,每行一個(gè)項(xiàng)。在菜單項(xiàng)列表 之下,可以存在無保護(hù)的域,期望用戶在該域中輸入表示所選擇的菜單項(xiàng)的數(shù)字值。這樣的 菜單信息一旦在給定畫面中被識(shí)別出,就可以用于基于所選擇的AID鍵對在相應(yīng)的蹤跡中 接下來將預(yù)期到哪個(gè)畫面得出結(jié)論。采用這樣的可定制樣式來分析畫面實(shí)例的內(nèi)容當(dāng)在與畫面實(shí)例的蹤跡序列和用 戶輸入相結(jié)合時(shí),可以為稍后對序列實(shí)例的分組提供有價(jià)值的信息。例如如果菜單樣式被認(rèn)出(recognize),則其后是“enter (回車)”AID鍵的、在菜單選 擇域中輸入的任何菜單值將預(yù)期始終導(dǎo)向同一應(yīng)用畫面。在沒有菜單的畫面中,在無保護(hù) 域中輸入的值通常與下一畫面的身份(identity)不具有這樣的強(qiáng)烈相關(guān)。此外,例如可以將鍵“PF7”識(shí)別為在給定畫面實(shí)例B中意味著“Back(后退)”, 并且/或者可以使用字典來將相應(yīng)的鍵標(biāo)簽(不管它將以何種語言出現(xiàn))映射到“Back” 的語義含義。給定示例性的蹤跡100、101,例如[實(shí)例A]—[任意用戶動(dòng)作]—[實(shí)例 B] — [PF7]—[實(shí)例C]。畫面C能夠與畫面A被分組(見下文)在一起的概率很高,這是 因?yàn)楸硎尽癰ack (后退)”動(dòng)作的AID鍵“PF7”在畫面實(shí)例B中被按下。對畫面圖像分組1020在步驟1020中,方法開始針對要建立的示圖250來生成畫面實(shí)例110的群組200, 這優(yōu)選地通過在一個(gè)蹤跡100、101之后運(yùn)行另一個(gè)來執(zhí)行。在第一次運(yùn)行中,這樣優(yōu)選地 基于第一蹤跡100來生成應(yīng)用示圖250,第一蹤跡100被優(yōu)選地利用上述來自畫面實(shí)例分析 步驟1010的信息進(jìn)行了修改/注釋。對畫面實(shí)例110的分組(即,判斷哪些畫面實(shí)例110屬于遺留系統(tǒng)20的同一畫面 或不同畫面)可以基于在蹤跡100、101內(nèi)識(shí)別的與導(dǎo)航樣式相結(jié)合的用戶輸入120(包括 一個(gè)或多個(gè)AID鍵)(見上文)、基于通過畫面參數(shù)而計(jì)算出的一個(gè)或多個(gè)分?jǐn)?shù)(見上文)、 基于域分區(qū)140的結(jié)構(gòu)(見上文)或者其任意組合。為此,為了匹配畫面實(shí)例110而使用以上信息的規(guī)則可以是預(yù)定的,但是允許根 據(jù)適用于采用了本發(fā)明的特定應(yīng)用情形的特定規(guī)則來進(jìn)行定制。這些規(guī)則可被利用各種技 術(shù)來調(diào)整(例如手動(dòng)地或者通過應(yīng)用機(jī)器學(xué)習(xí)算法),以例如改變每個(gè)測得的畫面參數(shù)在 畫面實(shí)例比較式子中的重要性。下面將描述一種優(yōu)選的分組算法如上面已經(jīng)提到的,本發(fā)明提供了三個(gè)分析模 塊基于畫面參數(shù)的統(tǒng)計(jì)內(nèi)容分析1012、基于畫面片段的結(jié)構(gòu)分析1014和/或?qū)Ш綐邮降淖R(shí)別1016,這三個(gè)分析模塊在下面的實(shí)施例中被組合以提供特別有利的畫面分組。因此,為蹤跡100、101內(nèi)的兩個(gè)給定畫面實(shí)例110得出至少一個(gè)距離量度d(sl, s2),優(yōu)選地針對每對畫面實(shí)例IOOsl和s2存在一個(gè)距離量度d (sl,s2)。對于得出的(一個(gè) 或多個(gè))距離量度,可以應(yīng)用各種已知的隨機(jī)成簇(clustering)分析算法中一種或多種。 所產(chǎn)生的畫面實(shí)例110的簇于是表示用于建立遺留系統(tǒng)20的示圖250的畫面群組200。例 如,可以使用光譜成簇(Spectral Clustering)來作為示例性的成簇分析算法。光譜成簇 是尤其有利的,這是因?yàn)樗恍枰付ǘ嗌賯€(gè)簇(畫面群組)將被預(yù)期。距離量度可以包封來自上述三個(gè)分析模塊1012、1014和/或1016的信息。在給 定一對畫面實(shí)例110的情況下,可以對來自每個(gè)畫面實(shí)例110的畫面參數(shù)信息(即,在統(tǒng)計(jì) 內(nèi)容分析1012期間得出的分?jǐn)?shù))在數(shù)值上進(jìn)行比較(見下文),以提供每對畫面實(shí)例的單 個(gè)距離分?jǐn)?shù)。此外,可對(來自結(jié)構(gòu)分析1014的)片段信息進(jìn)行比較(見下文)以提供數(shù) 值相似性分?jǐn)?shù)。為了為給定的一對畫面實(shí)例sl和s2提供基于組合的參數(shù)和片段的距離分 數(shù)ps = f(sl, s2),距離分?jǐn)?shù)和數(shù)值相似性分?jǐn)?shù)可被加權(quán)。此外,(來自導(dǎo)航樣式識(shí)別1016)的導(dǎo)航信息可以指示出基于蹤跡100、101的畫 面實(shí)例相似性。畫面實(shí)例相似性可以與基于組合的參數(shù)和片段的距離分?jǐn)?shù)PS相組合,以提 供最終的距離量度d(sl,s2)。下面將更詳細(xì)地描述上面給出的各個(gè)子步驟比較參數(shù)信息在統(tǒng)計(jì)內(nèi)容分析1012期間從一個(gè)或多個(gè)畫面參數(shù)計(jì)算出的一個(gè) 或多個(gè)分?jǐn)?shù)可被看做是每個(gè)畫面實(shí)例110的η維向量。因此,可以例如通過使用歐幾里得 距離來比較兩個(gè)給定畫面實(shí)例110的η維向量。相應(yīng)向量內(nèi)的每個(gè)維度的重要度可以在比 較中通過經(jīng)驗(yàn)來研究和考慮,例如通過使用(歸一化的)加權(quán)向量。例如,與畫面上的字符 數(shù)目相比,指示出畫面實(shí)例中無保護(hù)域(見上文)的數(shù)目的畫面參數(shù)可被認(rèn)為是更強(qiáng)的匹 配指示符。定義合適的加權(quán)向量是在參數(shù)信息比較期間顧及這種考慮的一種方式??傊容^參數(shù)信息的步驟優(yōu)選地將在統(tǒng)計(jì)內(nèi)容分析1012期間為兩個(gè)給定畫面 實(shí)例110得出的分?jǐn)?shù)作為輸入,并且提供相應(yīng)兩個(gè)畫面實(shí)例110的距離分?jǐn)?shù)作為輸出,該距 離分?jǐn)?shù)可以像前段中所描述的那樣來計(jì)算。比較片段信息如上文已經(jīng)給出的,每個(gè)畫面實(shí)例110可被分段成有限多個(gè)類型 的多個(gè)區(qū)域(優(yōu)選地是矩形),即域分區(qū)140。兩個(gè)給定畫面實(shí)例110的交集可被計(jì)算,其 中該交集被定義為至少包括每個(gè)畫面實(shí)例110中的相同類型的片段/域分區(qū)140的子集的 一個(gè)或多個(gè)相應(yīng)區(qū)域。在圖10的示例中,示出了兩個(gè)示例性畫面實(shí)例IlOa和110b,其中畫面實(shí)例IlOa 包括三個(gè)片段/域分區(qū)140al、140a2和140a3,并且其中畫面實(shí)例IlOb包括三個(gè)片段/域 分區(qū)140bl、140b2禾口 140b3。可以看到,當(dāng)將圖10中的兩個(gè)畫面實(shí)例IlOa和IlOb重疊時(shí), 片段140al和140bl僅部分匹配,這是因?yàn)槠?40bl大于140al。片段140a2和14(Λ2在 形狀上匹配,但在類型上不同。片段140a3和140b3在形狀和類型上都匹配。因此,在圖10 的底部示出并且被表示為相交的畫面實(shí)例110’的兩個(gè)畫面實(shí)例IlOa和IlOb的交集包括 對應(yīng)于片段140a3和140b3的一個(gè)片段/域分區(qū)140。此外,相交的畫面實(shí)例110’包括表 示片段140al和140bl的交集的域分區(qū)140,即,在形狀和類型上匹配的那些域分區(qū)/片段 的部分。
基于兩個(gè)畫面實(shí)例110的相交畫面實(shí)例110’,可以計(jì)算數(shù)值相似性分?jǐn)?shù),例如通 過將片段交集面積除以由兩個(gè)畫面實(shí)例110的片段的并集所覆蓋的面積。注意,整個(gè)畫面 區(qū)域可被分段。計(jì)算包括導(dǎo)航信息的最終距離量度在給定一對畫面實(shí)例110 (sl,s2)和它們的 相應(yīng)蹤跡100、101的情況下,基于組合的參數(shù)和片段的距離分?jǐn)?shù)ps (見上文)可以不僅是 如上所述針對sl和s2計(jì)算的,而且還針對蹤跡100、101內(nèi)相應(yīng)的相鄰畫面實(shí)例。為此,每 個(gè)蹤跡可被認(rèn)為是有向圖(directional graph),其中頂點(diǎn)/節(jié)點(diǎn)表示畫面實(shí)例110并且邊 表示畫面實(shí)例之間的轉(zhuǎn)變,包括導(dǎo)航信息,即用戶輸入和/或AID鍵。在給定圖上的節(jié)點(diǎn)的 情況下,度(degree)為k的鄰居可在該圖上被定義為經(jīng)過k個(gè)轉(zhuǎn)變可達(dá)的節(jié)點(diǎn)。類似地, 該圖上度為-k的鄰居可被定義為經(jīng)過k個(gè)轉(zhuǎn)變而到達(dá)的節(jié)點(diǎn),其中所有轉(zhuǎn)變都是與圖中的 邊的方向相反地經(jīng)過的。對于給定的一對畫面實(shí)例IlOsl和s2,一個(gè)或多個(gè)相應(yīng)的鄰居可被分別定義為具 有相同的度k的sl和s2的兩個(gè)相鄰畫面實(shí)例,其中從蹤跡100、101 二者導(dǎo)向相應(yīng)鄰居的 所有各對轉(zhuǎn)變都是類似和/或相等的。例如,圖11示出了兩個(gè)畫面實(shí)例sl和s2(在圖11 的中間示出)具有在前的兩對相應(yīng)鄰居(上面兩對畫面實(shí)例)和在后的一對相應(yīng)鄰居(圖 11中的倒數(shù)第二對畫面實(shí)例)。剩余的畫面實(shí)例不相對應(yīng),這是因?yàn)閷?dǎo)向這些畫面實(shí)例的 各用戶輸入不匹配。為了計(jì)算兩個(gè)給定畫面實(shí)例sl和s2的最終距離量度d(sl,s2),可以計(jì)算sl和 s2的基于組合的參數(shù)和片段的距離分?jǐn)?shù)ps = f(sl, s2),并且還為sl和s2的所有各對相 應(yīng)鄰居來計(jì)算基于組合的參數(shù)和片段的距離分?jǐn)?shù)ps值。不同的基于組合的參數(shù)和片段的 距離分?jǐn)?shù)ps值然后可被按照如下方式組合這對畫面實(shí)例(sl,s2)的權(quán)重是最大的,而相 應(yīng)的鄰居的權(quán)重減小,例如與k(鄰近度;見上文)的絕對值的增大成比例地減小。例如,可 以采用越過所有相應(yīng)鄰居的高斯加權(quán)函數(shù),其中相應(yīng)鄰居的數(shù)目定義了高斯標(biāo)準(zhǔn)差。如果 不存在相應(yīng)的鄰居,則最終距離量度分?jǐn)?shù)將簡單地是sl和s2的基于組合后的參數(shù)和片段 的距離分?jǐn)?shù),即ps = f (sl,s2)。注意,在每個(gè)方向上的相應(yīng)對的數(shù)目不同(即,僅存在于 一側(cè)上,度為k或者-k)的情況下,權(quán)重將被相應(yīng)地歸一化。應(yīng)用導(dǎo)航樣式信息另外或者作為替代,在步驟1020中運(yùn)行分組算法之前,每個(gè) 蹤跡100、101可被預(yù)處理。例如,在給定包括三個(gè)畫面實(shí)例llOsl、s2和s3的示例性蹤跡 IOOUOl的情況下,導(dǎo)向(S3)的轉(zhuǎn)變中的用戶輸入可以與(S2)上的具有含義“后退”的鍵 樣式相匹配(例如見上面的樣式匹配段落中的示例)。在這種情況下,如果基于組合后的 參數(shù)和片段的距離分?jǐn)?shù)ps (sl,s3)時(shí)指出高水平的相似性,則畫面實(shí)例s2和s3可能已被 預(yù)先(即在各個(gè)蹤跡在步驟1020中被處理之前)分組。又例如,在示例性的蹤跡(sl,s2) 中,導(dǎo)向(s2)的轉(zhuǎn)變中的用戶輸入可以與(sl)上的具有含義“下一個(gè)”或“上一個(gè)”的鍵 樣式相匹配,該鍵樣式通常指示出滾動(dòng)具有比一個(gè)畫面可以顯示的行更多的行的列表或表 格。在這種情況下,如果基于組合后的參數(shù)和片段的距離分?jǐn)?shù)ps (sl,s2)指示出高水平的 相似性,則畫面實(shí)例sl和s2也可被預(yù)先分組。識(shí)別同一蹤跡內(nèi)的這種匹配的好處在于其增大了鄰居對應(yīng)性的平均程度,因而支 持蹤跡中的導(dǎo)航信息的有效性。在這樣的預(yù)處理之后,蹤跡A — B — C — B — D — E(A、 B、C、D和E代表畫面實(shí)例,并且其中轉(zhuǎn)變C — B被識(shí)別為具有含義“后退”;參考圖12左側(cè)的蹤跡)可被表示為具有兩個(gè)源自畫面B的分支的圖(參考圖12右側(cè)的經(jīng)過預(yù)處理的蹤 跡)。結(jié)果,當(dāng)將圖12右側(cè)所示的經(jīng)過預(yù)處理的蹤跡與其他蹤跡(例如A — B — D — E或 者A — B — C — F)進(jìn)行匹配時(shí),可以得出鄰居信息。此外,可以使用菜單樣式來改善對用戶輸入的比較,如上面在樣式匹配段落中所 說明的。圖6示出作為對圖5的畫面實(shí)例110進(jìn)行分組的結(jié)果的示圖250??梢钥吹?,圖6 中的示圖250包括相應(yīng)的畫面群組200,例如圖6中最上方的畫面群組200使得圖5中貼有 "Sign On(登錄)”標(biāo)簽的三個(gè)畫面實(shí)例110成為群組。此外,來自多個(gè)蹤跡100、101的用 戶輸入也被相應(yīng)地分組,如圖6中可以看到的。識(shí)別靜杰/動(dòng)杰區(qū)域1030在步驟1030中,在畫面實(shí)例110中識(shí)別的域130被分類成一組靜態(tài)域132和一組 動(dòng)態(tài)域134。為此,優(yōu)選地按照畫面實(shí)例110的群組200,使用差別來識(shí)別畫面實(shí)例110的 哪個(gè)區(qū)域是動(dòng)態(tài)的(例如輸出)并且哪個(gè)是靜態(tài)的(并且可用于畫面識(shí)別)??梢圆捎迷?探法(heuristics),這是因?yàn)椴荒芗俣恳粋€(gè)可能是動(dòng)態(tài)的區(qū)域都將在所采樣的畫面實(shí)例 110中真正改變。例如,可以在此任務(wù)中使用將畫面實(shí)例110分段成域分區(qū)140(見上文),S卩,如果 在同一域分區(qū)140中只有一個(gè)值(域130)在畫面實(shí)例110之間是不同的,則整個(gè)域分區(qū) 140被認(rèn)為是動(dòng)態(tài)的。在該階段中,畫面群組200變得被識(shí)別(通過靜態(tài)域134),但是仍然 沒有名稱。另外或者作為替代,尤其是如果沒有決定性的標(biāo)識(shí)符可被基于可用數(shù)據(jù)而自動(dòng)發(fā) 現(xiàn),則畫面群組200可被顯示給開發(fā)者,以手動(dòng)地或者優(yōu)選為交互式地識(shí)別畫面群組200或 者校正所生成的分組。圖7示出了精煉后的示圖250,其中畫面群組200的域130已被分類成靜態(tài)域132 和動(dòng)態(tài)域134??梢钥吹?,在圖7中的最上方畫面群組200中示出的域‘‘Sign on(登錄)” 被分類成靜態(tài)域132,這是因?yàn)橛颉癝ignon”出現(xiàn)在所有畫面群組200內(nèi)的所有相應(yīng)畫面實(shí) 例110中(參考圖5中的蹤跡100和101)。另一方面,圖7中由最上方畫面群組200中的 矩形表示的域130已被識(shí)別為動(dòng)態(tài)域134,這是因?yàn)樵撚蛑怀霈F(xiàn)在相應(yīng)畫面實(shí)例110之一中 (見圖5的蹤跡101中的第二畫面實(shí)例110),而不出現(xiàn)在另一相應(yīng)畫面實(shí)例110中(見圖 5的蹤跡101中的最上方畫面實(shí)例110)。此外,圖7示出了多個(gè)所識(shí)別的域分區(qū)140,這些 域分區(qū)140由圖7中的底部且最左方的畫面群組200中的矩形表示。對畫面分類1040在步驟1040中,所識(shí)別的畫面群組200被分類,即,至少一種類型被指派給畫面群 組200,以確定遺留系統(tǒng)20的什么類型的畫面被畫面群組20來表示。可以使用預(yù)定義的畫 面樣式(如上面針對導(dǎo)航樣式所說明的)對畫面分類。本發(fā)明在一些實(shí)施例中提供了用于 確定這至少一種類型的多個(gè)預(yù)定義的規(guī)則,這些規(guī)則中的一些示例在下表中示出
類別描述示例性分類規(guī)則圖示菜單選項(xiàng)的列表(通常是一個(gè)無保護(hù)的域參考圖:3a
權(quán)利要求
1.一種用于基于至少一個(gè)蹤跡(100、101)來分析遺留系統(tǒng)00)的方法,其中所述至少 一個(gè)蹤跡(100、101)包括所述遺留系統(tǒng)00)的多個(gè)畫面實(shí)例(110),并且其中所述方法包 括以下步驟a.計(jì)算所述至少一個(gè)蹤跡(100、101)中的多個(gè)畫面實(shí)例(110)的多個(gè)逐對距離量度, 其中所述逐對距離量度指示出各對畫面實(shí)例(110)的相似性,該相似性指示出這對畫面實(shí) 例可能源自所述遺留系統(tǒng)00)的同一畫面;以及b.對所述多個(gè)逐對距離量度應(yīng)用至少一種成簇分析算法以將畫面實(shí)例(110)分組成 至少一個(gè)畫面群組000),并且基于所述至少一個(gè)畫面群組(200)建立所述遺留系統(tǒng)00) 的示圖050)。
2.如權(quán)利要求1所述的方法,其中步驟a.包括計(jì)算所述多個(gè)畫面實(shí)例(110)的逐對距 離分?jǐn)?shù)的步驟,其中所述逐對距離分?jǐn)?shù)指示出各對畫面實(shí)例(110)的相似性,該相似性指 示出這對畫面實(shí)例可能基于各畫面實(shí)例(110)的內(nèi)容而源自同一畫面。
3.如在前權(quán)利要求2所述的方法,其中所述逐對距離分?jǐn)?shù)是基于至少一個(gè)畫面參數(shù) 而計(jì)算的,這些畫面參數(shù)例如是字母數(shù)字字符的數(shù)量、無保護(hù)域的數(shù)量、無保護(hù)隱藏域的數(shù) 量、數(shù)字的數(shù)量、字母字符的數(shù)量、空格字符的數(shù)量、獨(dú)特字符的數(shù)量、列熵分?jǐn)?shù)、獨(dú)特顏色 的數(shù)量、反相顯示模式的字符的數(shù)量、增強(qiáng)模式的字符的數(shù)量、大寫形式的字符占所有字符 的百分比、詞的數(shù)量和/或其任意組合。
4.如在前權(quán)利要求中任一項(xiàng)所述的方法,其中步驟a.包括計(jì)算所述多個(gè)畫面實(shí)例 (110)的逐對相似性分?jǐn)?shù)的步驟,其中所述逐對相似性分?jǐn)?shù)指示出各對畫面實(shí)例(110)的 相似性,該相似性指示出這對畫面實(shí)例可能基于各畫面實(shí)例(110)的結(jié)構(gòu)而源自同一畫
5.如在前權(quán)利要求4所述的方法,其中所述逐對相似性分?jǐn)?shù)是基于各畫面實(shí)例(110) 中的至少一個(gè)域分區(qū)(140)的識(shí)別而計(jì)算的,其中所述至少一個(gè)域分區(qū)(140)包括畫面實(shí) 例(110)內(nèi)的多個(gè)相關(guān)域(130)。
6.如在前權(quán)利要求中任一項(xiàng)所述的方法,其中步驟a.包括以下步驟識(shí)別所述至少一 個(gè)蹤跡(100、101)內(nèi)的至少一個(gè)導(dǎo)航樣式,并且根據(jù)所識(shí)別的至少一個(gè)導(dǎo)航樣式對所述至 少一個(gè)蹤跡內(nèi)的畫面實(shí)例(110)進(jìn)行分組。
7.如在前權(quán)利要求2-3和4-5中任一項(xiàng)所述的方法,其中步驟a.包括以下步驟基于 預(yù)定義的加權(quán)函數(shù)將給定一對畫面實(shí)例(110)的逐對距離分?jǐn)?shù)和逐對相似性分?jǐn)?shù)組合成 基于組合后的參數(shù)和片段的距離分?jǐn)?shù)。
8.如在前權(quán)利要求7所述的方法,其中步驟a.包括以下步驟計(jì)算所述給定一對畫面 實(shí)例(110)的至少一對相應(yīng)鄰居的至少一個(gè)基于組合后的參數(shù)和片段的距離分?jǐn)?shù)。
9.如在前權(quán)利要求中任一項(xiàng)所述的方法,還包括以下步驟將給定的畫面實(shí)例(110) 中包含的多個(gè)域(130)分組成一組靜態(tài)域(13 和一組動(dòng)態(tài)域(134),并且在忽略所述一組 動(dòng)態(tài)域(134)的同時(shí)基于所述一組靜態(tài)域(13 將所述給定畫面實(shí)例(110)指派給所述至 少一個(gè)畫面群組(200)。
10.如在前權(quán)利要求中任一項(xiàng)所述的方法,包括以下步驟通過針對預(yù)定義的規(guī)則集 合對所述至少一個(gè)畫面群組(200)進(jìn)行匹配并且根據(jù)該規(guī)則集合向畫面群組(200)指派至 少一種類型來對所述至少一個(gè)畫面群組(200)分類(1040)。
11.一種包括用于實(shí)現(xiàn)在前權(quán)利要求中任一項(xiàng)所述的方法的指令的計(jì)算機(jī)程序。
12.一種用于基于至少一個(gè)蹤跡(100、101)來分析遺留系統(tǒng)00)的系統(tǒng)(1),其中所 述至少一個(gè)蹤跡(100、101)包括所述遺留系統(tǒng)00)的多個(gè)畫面實(shí)例(110),并且其中所述 系統(tǒng)⑴包括a.畫面識(shí)別組件(15),適用于計(jì)算所述至少一個(gè)蹤跡(100、101)中的多個(gè)畫面實(shí)例 (110)的多個(gè)逐對距離量度,其中所述逐對距離量度指示出各對畫面實(shí)例(110)的相似性, 該相似性指示出這對畫面實(shí)例可能源自所述遺留系統(tǒng)00)的同一畫面;b.其中所述畫面識(shí)別組件(1 還適用于對所述多個(gè)逐對距離量度應(yīng)用至少一種成簇 分析算法以將畫面實(shí)例(110)分組成至少一個(gè)畫面群組000),并且適用于基于所述至少 一個(gè)畫面群組(200)建立所述遺留系統(tǒng)00)的示圖050)。
13.如前一權(quán)利要求所述的系統(tǒng)(1),還包括重定向器(30),其中該重定向器(30)適用 于通過分析在至少一個(gè)現(xiàn)場用戶會(huì)話期間所述遺留系統(tǒng)00)與至少一個(gè)終端(10)之間的 通信來記錄(1000)所述至少一個(gè)蹤跡(100、101)。
14.如前一權(quán)利要求所述的系統(tǒng)(1),其中所述重定向器(30)適用于記錄(1000)多個(gè) 蹤跡(100、101)以及將所記錄的多個(gè)蹤跡存儲(chǔ)在數(shù)據(jù)存儲(chǔ)庫GO)中,并且其中所述畫面識(shí) 別組件(1 適用于分析所存儲(chǔ)的多個(gè)蹤跡。
15.如在前權(quán)利要求12-14中任一項(xiàng)所述的系統(tǒng)(1),其中所述畫面識(shí)別組件還適用于 執(zhí)行在前權(quán)利要求1-10中任一項(xiàng)所述的方法。
全文摘要
本發(fā)明公開了基于經(jīng)過遺留系統(tǒng)的蹤跡來分析遺留系統(tǒng)的方法和系統(tǒng)。本發(fā)明涉及一種用于基于至少一個(gè)蹤跡(100、101)來分析遺留系統(tǒng)(20)的方法,其中所述至少一個(gè)蹤跡(100、101)包括遺留系統(tǒng)(20)的多個(gè)畫面實(shí)例(110),并且其中該方法包括以下步驟a.計(jì)算所述至少一個(gè)蹤跡(100、101)中的多個(gè)畫面實(shí)例(110)的多個(gè)逐對距離量度,其中所述逐對距離量度指示出各對畫面實(shí)例(110)的相似性,該相似性指示出這對畫面實(shí)例可能源自遺留系統(tǒng)(20)的同一畫面;以及b.對所述多個(gè)逐對距離量度應(yīng)用至少一種成簇分析算法以將畫面實(shí)例(110)分組成至少一個(gè)畫面群組(200),并且基于所述至少一個(gè)畫面群組(200)建立遺留系統(tǒng)(20)的示圖(250)。
文檔編號G06F9/44GK102103502SQ20101060997
公開日2011年6月22日 申請日期2010年12月22日 優(yōu)先權(quán)日2009年12月22日
發(fā)明者蓋伊·納赤姆森 申請人:軟件股份公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1