亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種序列規(guī)則的挖掘方法及系統(tǒng)的制作方法_4

文檔序號:9646601閱讀:來源:國知局
元素而形成的且該目標規(guī)則的前件和 后件也不都是只含有一個頻繁序列元素,則跳到步驟203。否則跳到步驟2023b。
[0164] 步驟2023a、步驟2023b、步驟203和步驟204與實施例4中的步驟2023a、步驟 2023b、步驟203和步驟204相同。
[0165] 本實施例中,步驟2026的加入是為了避免另一種重復目標關(guān)聯(lián)規(guī)則的產(chǎn)生途徑。 為此,于在前件加入一個頻繁序列元素而形成的目標關(guān)聯(lián)規(guī)則,不向該目標關(guān)聯(lián)規(guī)則的后 件加入頻繁序列元素;或者,對于在后件加入一個頻繁序列元素而形成的目標關(guān)聯(lián)規(guī)則,不 向該目標關(guān)聯(lián)規(guī)則的前件加入頻繁序列元素。
[0166] 步驟2026的加入是因為對于同樣的目標關(guān)聯(lián)規(guī)則,其可能是將一個頻繁序列元 素加入到一個目標關(guān)聯(lián)規(guī)則的前件形成,也可能是將一個頻繁序列元素加入到一個目標關(guān) 聯(lián)規(guī)則的后件形成。例如:對于目標關(guān)聯(lián)規(guī)則{a}  - dn8uhelbkzum {c},其可能是先將頻繁序列元 素{M加入到目標關(guān)聯(lián)規(guī)則{a} - dn8uhelbkzum的前件,然后再將頻繁序列元素{c}加入到目標關(guān) 聯(lián)規(guī)則{a}  - dn8uhelbkzum的后件中得到的,也可能是先將頻繁序列元素{c}加入到目標關(guān)聯(lián)規(guī) 則{a} - dn8uhelbkzum的后件中,再將頻繁序列元素加入到目標關(guān)聯(lián)規(guī)則{a} - dn8uhelbkzum {c}的前件 中得到的。
[0167] 本實施例提供了一種數(shù)據(jù)挖掘過程中避免獲得的目標關(guān)聯(lián)規(guī)則重復的方法,避免 了對重復的目標關(guān)聯(lián)規(guī)則的判斷,提高了關(guān)聯(lián)規(guī)則挖掘的效率。
[0168] 實施例7:
[0169] 本實施例記載了另一種序列規(guī)則的挖掘方法。
[0170] 按照圖1中的步驟100獲取至少一個序列中的所有頻繁序列元素。
[0171] 按照圖2中的步驟201獲取以兩個頻繁序列元素分別作為前件和后件而形成的所 有目標關(guān)聯(lián)規(guī)則,并加入第一集合。
[0172] 按照圖3中的步驟2021獲取第一集合中的一個目標關(guān)聯(lián)規(guī)則和不包含在該目標 關(guān)聯(lián)規(guī)則的前件和后件中的一個頻繁序列元素。
[0173] 按照圖3中的步驟2022判斷該頻繁序列元素是否沒有出現(xiàn)在任意一個該目標關(guān) 聯(lián)規(guī)則的相符序列中。若該頻繁序列元素沒有出現(xiàn)在任意一個該目標關(guān)聯(lián)規(guī)則的相符序列 中,則跳到圖3中的步驟203。
[0174] 若該頻繁序列元素出現(xiàn)在了任意一個該目標關(guān)聯(lián)規(guī)則的相符序列中,則按照圖4 中的步驟2024a,判斷在所有的相符序列中,該頻繁序列元素是否全部位于該目標關(guān)聯(lián)規(guī)則 的后件中的頻繁序列元素最后出現(xiàn)的位置之前。
[0175] 若在所有的相符序列中,該頻繁序列元素全部位于該目標關(guān)聯(lián)規(guī)則的后件中的頻 繁序列元素最后出現(xiàn)的位置之前,則跳到圖6中的步驟2026a。否則,跳到步驟2024b。
[0176] 在步驟2024b判斷在所有的相符序列中,該頻繁序列元素是否全部位于該目標關(guān) 聯(lián)規(guī)則的前件中的頻繁序列元素首次出現(xiàn)的位置之后。若在所有的相符序列中,該頻繁序 列元素全部位于該目標關(guān)聯(lián)規(guī)則的前件中的頻繁序列元素首次出現(xiàn)的位置之后,則跳到圖 5中的步驟2025。否則,跳到圖3中的步驟203。
[0177] 在圖5中的步驟2025中,若該目標關(guān)聯(lián)規(guī)則是在后件中加入一個頻繁序列元素而 形成的,則跳到圖6中的步驟2026b,否則跳到圖3中的步驟203。
[0178] 在圖6的步驟2026a中判斷在所有頻繁序列元素排列而成的一個參考序列中,該 頻繁序列元素是否沒有位于該目標關(guān)聯(lián)規(guī)則的前件中的所有頻繁序列元素之前。若該頻 繁序列元素位于該目標關(guān)聯(lián)規(guī)則的前件中的所有頻繁序列元素之前,則跳到圖6中的步驟 2023a,否則跳回到步驟203。
[0179] 在圖6中的步驟2026b中判斷在所有頻繁序列元素排列而成的一個參考序列中, 該頻繁序列元素是否沒有位于該目標關(guān)聯(lián)規(guī)則的后件中的所有頻繁序列元素之前。若該頻 繁序列元素位于該目標關(guān)聯(lián)規(guī)則的后件中的所有頻繁序列元素之前,則跳到圖6中的步驟 2023b。否則,跳到步驟203。
[0180] 執(zhí)行步驟2023a或者步驟2023b后,跳到步驟203。
[0181] 步驟203中,判斷在第一集合中的一個目標關(guān)聯(lián)規(guī)則的前件或后件中加入不包 含在該前件和該后件中的頻繁序列元素是否能得到新的目標關(guān)聯(lián)規(guī)則。
[0182] 若在第一集合中的一個目標關(guān)聯(lián)規(guī)則的前件或后件中加入不包含在該前件和該 后件中的頻繁序列元素能得到新的目標關(guān)聯(lián)規(guī)則,跳回到步驟2021,否則跳到步驟204,結(jié) 束。
[0183] 本實施例將實施例3、實施例4中的判斷一個頻繁序列元素是加入到目標關(guān)聯(lián)規(guī) 則的前件或者后件的步驟和實施例5、實施例6中的避免產(chǎn)生重復的目標關(guān)聯(lián)規(guī)則的步驟 相結(jié)合,提尚了獲取目標關(guān)聯(lián)規(guī)則的效率。
[0184] 實施例8 :
[0185] 本實施例記載了一種序列規(guī)則的挖掘系統(tǒng),包括:第一獲取模塊和第二獲取模塊, 其連接關(guān)系如圖7所示,其中01是第一獲取模塊,02是第二獲取模塊:第一獲取模塊01的 輸出端連接第二獲取模塊02的輸入端。
[0186] 第一獲取模塊01用于在至少一個序列中的所有序列元素中獲取頻繁序列元素; 包含所述頻繁序列元素的序列占所述至少一個序列的比例大于第一閾值;
[0187] 第二獲取模塊02用于在所述頻繁序列元素形成的關(guān)聯(lián)規(guī)則中,獲取所有的目標 關(guān)聯(lián)規(guī)則以組成第一集合;
[0188] 其中,目標關(guān)聯(lián)規(guī)則的前件和后件均由不分順序的至少一個頻繁序列元素組成; 為目標關(guān)聯(lián)規(guī)則的前件和后件各自規(guī)定一種排列順序后形成一個有序目標規(guī)則;
[0189]目標關(guān)聯(lián)規(guī)則的目標支持度大于第二閾值;目標關(guān)聯(lián)規(guī)則的目標支持度為該目標 關(guān)聯(lián)規(guī)則所有有序目標規(guī)則在所述至少一個序列中的支持度的總和;
[0190]目標關(guān)聯(lián)規(guī)則的目標置信度大于第三閾值;目標關(guān)聯(lián)規(guī)則的目標置信度為所述至 少一個序列中符合該目標關(guān)聯(lián)規(guī)則的任一有序目標規(guī)則的序列的數(shù)量,與至少一個序列 中包含該目標關(guān)聯(lián)規(guī)則的前件的序列的數(shù)量之間的比值。
[0191] 需要說明的是:至少一個序列是第一獲取模塊預先獲取的序列,第一閾值是第一 獲取模塊中獲取的一個預設的閾值。
[0192]目標關(guān)聯(lián)規(guī)則的前件和后件均由不分順序的至少一個頻繁序列元素組成;為目標 關(guān)聯(lián)規(guī)則的前件和后件各自規(guī)定一種排列順序后形成一個有序目標規(guī)則。
[0193]目標關(guān)聯(lián)規(guī)則的目標支持度為該目標關(guān)聯(lián)規(guī)則所有有序目標規(guī)則在所述至少一 個序列中的支持度的總和。
[0194]目標關(guān)聯(lián)規(guī)則的目標置信度為至少一個序列中符合該目標關(guān)聯(lián)規(guī)則的所有有序 目標規(guī)則的序列的數(shù)量,與至少一個序列中包含該目標關(guān)聯(lián)規(guī)則的前件的序列的數(shù)量之間 的比值。
[0195] 第二閾值和第三閾值是第二獲取模塊中預先獲取的閾值。第二獲取模塊從第一獲 取模塊獲取的頻繁序列元素和至少一個序列中,獲取目標支持度大于第二閾值且目標置信 度大于第三閾值的目標關(guān)聯(lián)規(guī)則。
[0196] 本實施例提供的序列規(guī)則挖掘系統(tǒng),能夠?qū)⑶凹秃蠹慕M成元素相同但排序不 同的低支持度的關(guān)聯(lián)規(guī)則和高支持度的規(guī)則作為一個整體的規(guī)則進行挖掘。與現(xiàn)有技術(shù)中 的序列規(guī)則挖掘系統(tǒng)相比,本發(fā)明提供的序列規(guī)則挖掘系統(tǒng)將前件和后件的組成元素相同 但排序不同的低支持度的關(guān)聯(lián)規(guī)則挖掘出來,避免了由于沒有將低支持度的關(guān)聯(lián)規(guī)則作為 可以用于預測的有效規(guī)則造成的預測錯誤。
[0197] 實施例9 :
[0198] 本實施例記載了將頻繁序列元素加入到目標關(guān)聯(lián)規(guī)則的前件或后件中后,得到關(guān) 聯(lián)規(guī)則相對于原來的目標關(guān)聯(lián)規(guī)則之間的目標支持度和目標置信度的變化。具體的結(jié)論和 證明過程如下所述。
[0199] 其中,|SID({a} -)|表示在至少一個序列中符合目標關(guān)聯(lián)規(guī)則{a} -的 序列數(shù),|SID({a} {c} -)|表示在至少一個序列中中符合目標關(guān)聯(lián)規(guī)則的兩個有序關(guān) 聯(lián)規(guī)則{a} {c} - 和{c} {a} - 的序列數(shù)的總和,IS|表示至少一個序列的序列總 數(shù)。|SID({a} -  {c}) |表示在至少一個序列中中符合目標關(guān)聯(lián)規(guī)則的兩個有序關(guān)聯(lián)規(guī) 則{a} -  {c}和{a} - {c} 的序列數(shù)的總和。|S|表示至少一個序列的序列總數(shù)。 SID({a}) |表示至少一個序列中,包括序列元素{a}的序列數(shù)。|SID({a} {c}) |表示在至 少一個序列中包含序列元素{a}和序列元素{c}的序列總數(shù)。
[0200] (1)頻繁序列元素加入目標關(guān)聯(lián)規(guī)則的前件對目標支持度的影響
[0201] 如果一個頻繁序列元素{c}加入到目標關(guān)聯(lián)規(guī)則Rl({a} - )的前件中,得到 關(guān)聯(lián)規(guī)則R2 ({a} {c} - )的目標支持度低于或等于目標關(guān)聯(lián)規(guī)則R1 ({a} - )的目 標支持度。該結(jié)論的證明過程如下:
[0202] 證明:目標關(guān)聯(lián)規(guī)則Rl({a} - )和R2({a} {c} - )的目標支持度分別 SID({a} - ) |/|S| 和 |SID({a} {c} - ) |/|S|。因為 |SID({a} - ) | 彡 |SID({a} {c} - ) |,所以目標支持度(Rl)彡目標支持度(R2)。
[0203] (2)頻繁序列元素加入目標關(guān)聯(lián)規(guī)則的后件對目標支持度的影響
[0204] 如果一個頻繁序列元素dn8uhelbkzum加入到目標關(guān)聯(lián)規(guī)則Rl({a} - )的后件中,得到 的目標關(guān)聯(lián)規(guī)則R3({a} - {c})的支持度低于或等于Rl({a} - )的支持度。該結(jié) 論的證明過程如下:
[0205] 證明:R1 ( {a} - )和R3 ( {a} -  {c})的支持度分 別是 |SID({a} - ) |/|S| 和 |SID({a} -  {c}) |/|S|。因為 SID({a} - )I彡ISID({a} -  {c})I,所以目標支持度(Rl)彡目標支持度(R3)。
[0206] (1)和(2)中的特性意味著將頻繁序列元素和目標關(guān)聯(lián)規(guī)則的前件或者后件組 合得到的關(guān)聯(lián)規(guī)則的目標支持度是單調(diào)的。換言之,將頻繁序列元素與目標關(guān)聯(lián)規(guī)則的前 件或者后件組合得到的關(guān)聯(lián)規(guī)則的目標支持度低于或等于原始的目標關(guān)聯(lián)規(guī)則的目標支 持度。
[0207] 因此,所有大于預設的最小支持度閾值的關(guān)聯(lián)規(guī)則可以通過從目標前件和目標后 件中只有一個序列元素的目標關(guān)聯(lián)規(guī)則采用遞歸的方法找到。此外,對具有小于最小支持 度的目標關(guān)聯(lián)規(guī)則的前件和后件中組合的頻繁序列元素不會產(chǎn)生目標支持度大于最小支 持度的關(guān)聯(lián)規(guī)則。
[0208] (3)頻繁序列元素加入目標關(guān)聯(lián)規(guī)則的前件對目標置信度的影響
[0209] 如果一個頻繁序列元素{c}加入到目標關(guān)聯(lián)規(guī)則Rl({a} - )的前件中,得 到的目標關(guān)聯(lián)規(guī)則R2 ({a} {c} - )的目標置信度可能低于,高于或等于目標關(guān)聯(lián)規(guī)則 R1 ({a} - )的目標置信度。該結(jié)論的證明過程如下:
[0210] 證明:關(guān)聯(lián)規(guī)則Rl({a} - )和R2({a}{c} - )的目標置信度分別 是 |SID({a} - ) |/|SID({a}) | 和 |SID({a} {c}
當前第4頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1