專利名稱:數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法以及計算機可讀存儲介質(zhì)的制作方法
技術(shù)領(lǐng)域:
此發(fā)明是關(guān)于一種數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法,特別是一種在支持度以及計算方法中考慮時間因子的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法。
背景技術(shù):
在數(shù)據(jù)采礦(data mining)技術(shù)領(lǐng)域中,從一個充滿大量數(shù)據(jù)的數(shù)據(jù)庫中發(fā)掘出以前不為人知的關(guān)聯(lián)法則,稱為關(guān)聯(lián)法則(association rule)分析,其可應(yīng)用在選擇性行銷、決策分析等企業(yè)管理議題上。其中,最為人所熟知的應(yīng)用為市場籃分析(market basket analysis),用來發(fā)掘出消費者通常會一起購買或依序購買哪幾個商品,然后提供行銷人員擬定有效的行銷策略,近來,關(guān)聯(lián)法則分析也被應(yīng)用到使用者網(wǎng)頁瀏覽行為分析或者是股市交易分析等領(lǐng)域上。
就概念上來說,在使用者給定一支持度下限(minimal support)與一信心水準下限(minimal confidence)的情況下,關(guān)聯(lián)法則分析通常使用下列兩步驟進行分析,首先找出所有超過支持度下限的經(jīng)常關(guān)聯(lián)物品集(frequent itemset),然后,從選定的經(jīng)常關(guān)聯(lián)物品集中,產(chǎn)生所有超過信心水準下限的關(guān)聯(lián)法則。
然而,若想從大量數(shù)據(jù)挖掘出有用的關(guān)聯(lián)法則相當耗時,各式各樣的關(guān)聯(lián)法則技術(shù)無不想辦法提高其運算效率,降低運算時間。除了時間的問題外,關(guān)聯(lián)法則分析技術(shù)最令人詬病的是挖掘到的關(guān)聯(lián)法則,往往是數(shù)以千計,但是里頭又包含了許多原來該領(lǐng)域?qū)<宜赖年P(guān)聯(lián)法則,知道這些經(jīng)過大量運算所得到的關(guān)聯(lián)法則,對于其知識的增益并沒有太大的貢獻。
為了降低運算時間、提高關(guān)聯(lián)法則的有效性,有許多限制性規(guī)則被提出,包括知識類型限制(knowledge type constraints)、數(shù)據(jù)限制(data constraints)、興趣取向限制(interestingness constraints)和法則限制(rule constrains)等,用以篩選掉許多對使用者沒有用的關(guān)聯(lián)法則,得到更有效的關(guān)聯(lián)法則。
雖然以上方法可以從知識類型、數(shù)據(jù)、興趣取向和法則角度來刪除無效的關(guān)聯(lián)法則,但是,對于一個擁有成千上萬筆交易紀錄的數(shù)據(jù)庫來說,交易紀錄的時間性相當重要,但過去所提出的關(guān)聯(lián)法則分析方法卻沒有將此一重要因素納入分析方法中,據(jù)以降低運算時間、篩選掉無效的關(guān)聯(lián)法則。很多關(guān)聯(lián)法則在經(jīng)過一段時間后,會因為外在因素變化而失效,例如,A牌牛奶和B牌面包經(jīng)常一起購買,但是,A牌牛奶已經(jīng)在半個月前停產(chǎn)了,如果使用過去的方法,在為期一年的數(shù)據(jù)庫中挖掘關(guān)聯(lián)法則,這些失效的關(guān)聯(lián)法則還是會被挖掘出來。除此之外,距離現(xiàn)在越接近的物品關(guān)聯(lián)性越重要,例如,C牌牛奶上周被推出,深獲好評,并常搭配D牌土司面包一起購買,如果使用過去的方法,在為期一年的數(shù)據(jù)庫中挖掘關(guān)聯(lián)法則,則會因為支持度不足而被排除在外。
為克服上述的缺點,在進行關(guān)聯(lián)法則分析時,需要一納入時間因素的分析方法,據(jù)以降低運算時間并提高關(guān)聯(lián)法則的有效性。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的是提供一種數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法,降低運算時間,并由于其納入時間考量因素,提高關(guān)聯(lián)的有效性。
依據(jù)上述目的,本發(fā)明的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法首先設(shè)置一數(shù)據(jù)庫、一存儲體與一關(guān)聯(lián)分析單元。數(shù)據(jù)庫存儲一交易紀錄與一權(quán)重紀錄,存儲體存儲一最小支持度。
關(guān)聯(lián)分析單元在進行關(guān)聯(lián)分析時,會循序讀取時間區(qū)段,并以漸增(incremental)的方式,進行關(guān)聯(lián)分析。先使用以時間區(qū)段定義、權(quán)重以及最小支持度為參數(shù)的支持度計算公式,計算出至少一個區(qū)段最小支持度,然后,使用以時間區(qū)段定義以及權(quán)重為參數(shù)的關(guān)聯(lián)系數(shù)計算公式,計算關(guān)聯(lián)對象的區(qū)段關(guān)聯(lián)系數(shù),最后,比較關(guān)聯(lián)系數(shù)是否大于區(qū)間最小支持度,判斷關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
本發(fā)明的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),包括一數(shù)據(jù)庫,用于存儲至少一個權(quán)重紀錄以及至少一個交易紀錄,該權(quán)重紀錄包含一時間區(qū)段定義與一權(quán)重,該交易紀錄依據(jù)該時間區(qū)段定義切分為至少一個區(qū)段交易紀錄,該區(qū)段交易紀錄包含一交易對象集合;一存儲體,用于存儲一最小支持度;以及一關(guān)聯(lián)分析單元,耦接于該數(shù)據(jù)庫以及該存儲體,從該存儲體輸入該最小支持度,從該數(shù)據(jù)庫輸入該交易紀錄以及該權(quán)重紀錄,使用以該時間區(qū)段定義、該權(quán)重以及該最小支持度為參數(shù)的一支持度計算公式,計算出至少一個區(qū)段最小支持度,由該交易對象集合求得至少一個關(guān)聯(lián)對象,使用以該時間區(qū)段定義以及該權(quán)重為參數(shù)的一關(guān)聯(lián)系數(shù)計算公式,計算該關(guān)聯(lián)對象的一區(qū)段關(guān)聯(lián)系數(shù),比較該關(guān)聯(lián)系數(shù)是否大于該區(qū)間最小支持度,判斷該關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
本發(fā)明的數(shù)據(jù)關(guān)聯(lián)分析方法,其方法被一計算機執(zhí)行,包括下列步驟從一數(shù)據(jù)庫中輸入一時間區(qū)段定義、一權(quán)重、相應(yīng)于該時間區(qū)段定義的至少一個區(qū)段交易紀錄,以及從一數(shù)據(jù)存儲體中輸入一最小支持度;從該區(qū)段交易紀錄中檢索出至少一個關(guān)聯(lián)對象;使用以該時間區(qū)段定義、該權(quán)重以及該最小支持度為參數(shù)的一支持度計算公式,計算出至少一個區(qū)段最小支持度;使用以該時間區(qū)段定義以及該權(quán)重為參數(shù)的一關(guān)聯(lián)系數(shù)計算公式,計算該關(guān)聯(lián)對象的一區(qū)段關(guān)聯(lián)系數(shù);以及比較該關(guān)聯(lián)系數(shù)是否大于該區(qū)間最小支持度,判斷該關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
本發(fā)明還提供一種計算機可讀存儲介質(zhì),用于存儲一計算機程序,該計算機程序被加載到一計算機,用以實現(xiàn)數(shù)據(jù)關(guān)聯(lián)分析方法,其方法包括下列步驟輸入一時間區(qū)段定義、一權(quán)重、相應(yīng)于該時間區(qū)段定義的至少一個區(qū)段交易紀錄以及一最小支持度;從該區(qū)段交易紀錄中檢索出至少一個關(guān)聯(lián)對象;使用以該時間區(qū)段定義、該權(quán)重以及該最小支持度為參數(shù)的一支持度計算公式,計算出至少一個區(qū)段最小支持度;使用以該時間區(qū)段定義以及該權(quán)重為參數(shù)的一關(guān)聯(lián)系數(shù)計算公式,計算該關(guān)聯(lián)對象的一區(qū)段關(guān)聯(lián)系數(shù);以及比較該關(guān)聯(lián)系數(shù)是否大于該區(qū)間最小支持度,判斷該關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉實施例,并結(jié)合附圖,進行詳細說明如下圖1示出了本發(fā)明第一實施例的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)的系統(tǒng)方塊圖;圖2示出了本發(fā)明第一實施例的權(quán)重紀錄示意圖;圖3示出了本發(fā)明第一實施例的交易紀錄示意圖;圖4示出了本發(fā)明第一實施例的P1區(qū)段關(guān)聯(lián)分析數(shù)據(jù)示意圖;圖5示出了本發(fā)明第一實施例的P2段關(guān)聯(lián)分析數(shù)據(jù)示意圖;圖6示出了本發(fā)明第一實施例的數(shù)據(jù)關(guān)聯(lián)分析方法的方法流程圖;圖7示出了本發(fā)明第一實施例的計算機可讀存儲介質(zhì)示意圖。
符號說明
11~數(shù)據(jù)庫;12~存儲體;13~關(guān)聯(lián)分析單元;111~交易紀錄;112~權(quán)重紀錄;113~關(guān)聯(lián)對象紀錄;121~最小支持度;S61、S62、…、S68~操作步驟;70~計算機可讀存儲介質(zhì);720~數(shù)據(jù)關(guān)聯(lián)分析計算機程序;721~輸入交易數(shù)據(jù)邏輯;722~檢索雙關(guān)聯(lián)對象邏輯;723~求得區(qū)段最小支持度邏輯;724~計算關(guān)聯(lián)系數(shù)邏輯;725~判斷關(guān)聯(lián)顯著性邏輯;726~加入關(guān)聯(lián)對象集合邏輯。
具體實施例方式
圖1示出了本發(fā)明第一實施例的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)的系統(tǒng)方塊圖。數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)包括數(shù)據(jù)庫11、一存儲體12與一關(guān)聯(lián)分析單元13。數(shù)據(jù)庫11存儲一交易紀錄111、一權(quán)重紀錄112與一關(guān)聯(lián)對象紀錄113,存儲體12存儲一最小支持度(minimum support)121。
數(shù)據(jù)庫11可以實施于關(guān)聯(lián)性數(shù)據(jù)庫或?qū)ο髷?shù)據(jù)庫中,用來存儲多筆交易紀錄111與多筆權(quán)重紀錄112,交易紀錄利用區(qū)段編碼相應(yīng)于權(quán)重紀錄。交易紀錄111和權(quán)重紀錄112在實施時,并不限定于使用單一數(shù)據(jù)表,也可以是多關(guān)聯(lián)性數(shù)據(jù)表組合而成,交易紀錄111含有三個字段,區(qū)段編碼、交易編碼與交易對象,交易編碼字段為一數(shù)據(jù)庫主鍵,用以識別交易數(shù)據(jù),交易對象字段用以存儲一筆交易紀錄中的多個交易對象。權(quán)重紀錄112用來紀錄各時間區(qū)段的定義數(shù)據(jù)與權(quán)重,含有三個字段,區(qū)段編碼、區(qū)段期間與權(quán)重。關(guān)聯(lián)對象紀錄113用來紀錄經(jīng)關(guān)聯(lián)分析結(jié)果,含有兩個字段,關(guān)聯(lián)對象、開始區(qū)段與關(guān)聯(lián)系數(shù)。
圖2示出了本發(fā)明第一實施例的權(quán)重紀錄示意圖,此權(quán)重紀錄中共包含3筆紀錄,其編碼從P1到P3,分別代表1月到3月的資料,且其權(quán)重分別為0.5、1與2。
圖3示出了本發(fā)明第一實施例的交易紀錄示意圖,此交易紀錄中共包含12筆紀錄,其編碼從t1到t12,其中t1到t4、t5到t8、t9到t12分屬三個不同區(qū)段的交易數(shù)據(jù),每一筆交易紀錄存有2到5個不等的交易對象,形成交易對象集合。例如,在t1交易紀錄中,消費者購買了B與D兩對象。
存儲體12可以紀錄于數(shù)據(jù)庫系統(tǒng)、檔案、內(nèi)存,甚至是程序代碼中,紀錄了最小支持度121與最小信心水準122。在本例中,最小支持度設(shè)為0.3,最小信心水準設(shè)為0.75。
關(guān)聯(lián)分析單元13可以實施于數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)倉儲系統(tǒng)、數(shù)據(jù)采礦系統(tǒng)或其它各式各樣的數(shù)據(jù)處理系統(tǒng)中。關(guān)聯(lián)分析單元13在進行關(guān)聯(lián)分析時,會循序讀取時間區(qū)段,并以漸增的方式,進行關(guān)聯(lián)分析。
圖4示出了本發(fā)明第一實施例的P1區(qū)段關(guān)聯(lián)分析數(shù)據(jù)示意圖。關(guān)聯(lián)分析單元13從數(shù)據(jù)庫11中讀取區(qū)段P1的交易紀錄t1到t4,如圖3所示,找出所有的雙關(guān)聯(lián)對象(two itemset)分別為AD、BC、BD與CD,計算其發(fā)生次數(shù),并注記其開始區(qū)段為P1。之后,關(guān)聯(lián)分析單元13從數(shù)據(jù)庫11讀取區(qū)段P1的權(quán)重紀錄,如圖4所示,計算出區(qū)段P1關(guān)聯(lián)系數(shù),其計算公式如下所示區(qū)段P1關(guān)聯(lián)系數(shù)=區(qū)段P1發(fā)生次數(shù)*區(qū)段P1權(quán)重....(1)計算出的關(guān)聯(lián)系數(shù)分別為0.5、1、1與0.5。從存儲體12中讀取最小支持度121,計算出區(qū)段P1最小支持度,其計算公式如下所示區(qū)段P1最小支持度=區(qū)段P1交易紀錄總數(shù)*區(qū)段P1權(quán)重*最小支持度.....................................(2)計算后的區(qū)段最小支持度為0.6(4*0.5*0.3)。最后,將判斷雙關(guān)聯(lián)對象的關(guān)聯(lián)系數(shù)是否大于區(qū)段最小支持度,若是則將此雙關(guān)聯(lián)對象加入雙關(guān)聯(lián)對象集合C2中,然后將結(jié)果存儲到關(guān)聯(lián)對象紀錄113中。
圖5示出了本發(fā)明第一實施例的P2段關(guān)聯(lián)分析數(shù)據(jù)示意圖。關(guān)聯(lián)分析單元13首先從關(guān)聯(lián)對象紀錄113中,讀取雙關(guān)聯(lián)對象集合C2中的雙關(guān)聯(lián)對象,BC與BD,注記其開始區(qū)段為P1,之后,從數(shù)據(jù)庫11中讀取區(qū)段P2的交易紀錄t5到t8,如圖3所示,找出所有不屬于C2的雙關(guān)聯(lián)對象,分別為AB、AC、BE、CD、CE與DE,并注記其開始區(qū)段為P2。從數(shù)據(jù)庫11讀取區(qū)段P2的權(quán)重紀錄,如圖4所示,并依據(jù)不同的開始區(qū)段,使用不同計算公式,計算各雙關(guān)聯(lián)對象的關(guān)聯(lián)系數(shù),開始區(qū)段為P1的關(guān)聯(lián)計算公式如下區(qū)段P2關(guān)聯(lián)系數(shù)=區(qū)段P1關(guān)聯(lián)系數(shù)+區(qū)段P2發(fā)生次數(shù)*區(qū)段P2權(quán)重.........................................(3)雙關(guān)聯(lián)對象BC與BD依據(jù)上述公式,所求得的區(qū)段P2關(guān)聯(lián)系數(shù)分別為3與1。
開始區(qū)段為P2的關(guān)聯(lián)計算公式如下區(qū)段P2關(guān)聯(lián)系數(shù)=區(qū)段P2發(fā)生次數(shù)*區(qū)段P2權(quán)重.....(4)雙關(guān)聯(lián)對象AB、AC、BE、CD、CE與DE,依據(jù)上述公式,所求得的區(qū)段P2關(guān)聯(lián)系數(shù)如圖5所示。
關(guān)聯(lián)分析單元13從存儲體12中讀取最小支持度121,分別計算出區(qū)段P1&2以及區(qū)段P2最小支持度,其計算公式如下所示區(qū)段P1&2最小支持度=區(qū)段P1最小支持度區(qū)段+區(qū)段P2交易紀錄總數(shù)*區(qū)段P2權(quán)重*最小支持度..............(5)P2最小支持度=區(qū)段P2交易紀錄總數(shù)*區(qū)段P2權(quán)重*最小支持度...............................(6)計算后的區(qū)段P1&2最小支持度為1.8(0.6+4*1*0.3),區(qū)段P2最小支持度為1.2(4*1*0.3)。
判斷開始區(qū)段為P1的雙關(guān)聯(lián)對象的關(guān)聯(lián)系數(shù)是否大于區(qū)段P1&2最小支持度,若否,則將此雙關(guān)聯(lián)對象剔除雙關(guān)聯(lián)對象集合C2中,因此,雙關(guān)聯(lián)對象BD被剔除在雙關(guān)聯(lián)對象集合C2之外。判斷開始區(qū)段為P2的雙關(guān)聯(lián)對象的關(guān)聯(lián)系數(shù)是否大于區(qū)段P2最小支持度,若是則將此雙關(guān)聯(lián)對象加入到雙關(guān)聯(lián)對象集合C2中,因此,雙關(guān)聯(lián)對象CE與DE被加入到雙關(guān)聯(lián)對象集合C2中,雙關(guān)聯(lián)對象集合C2中包含BC、CE與DE,然后將結(jié)果存儲到關(guān)聯(lián)對象紀錄113中。
雖然本實施例以雙關(guān)聯(lián)對象為例,但本發(fā)明并不限定于雙關(guān)聯(lián)對象,亦可以實施于三關(guān)聯(lián)對象、四關(guān)聯(lián)對象等多關(guān)聯(lián)對象上。
圖6示出了本發(fā)明第一實施例的數(shù)據(jù)關(guān)聯(lián)分析方法的方法流程圖。
首先,如步驟S61,關(guān)聯(lián)分析單元13從數(shù)據(jù)庫11輸入?yún)^(qū)段P2的交易紀錄111,如圖3所示、權(quán)重紀錄112,如圖4所示,以及關(guān)聯(lián)對象紀錄113,并從存儲體12中輸入最小支持度121。
如步驟S62,從交易紀錄111及關(guān)聯(lián)對象紀錄113中,找出所有的雙關(guān)聯(lián)對象。從關(guān)聯(lián)對象紀錄113中,讀取雙關(guān)聯(lián)對象集合C2中的雙關(guān)聯(lián)對象,BC與BD,注記其開始區(qū)段為P1,從數(shù)據(jù)庫11中讀取區(qū)段P2的交易紀錄找出所有不屬于C2的雙關(guān)聯(lián)對象,分別為AB、AC、BE、CD、CE與DE,并注記其開始區(qū)段為P2。
如步驟S63,求得各區(qū)段最小支持度,各區(qū)段最小支持度不一定要重新計算,如果的前已計算出區(qū)段最小支持度,則沿用即可。由于目前處理的區(qū)段為P2,所以必須求得區(qū)段P2最小支持度與區(qū)段P1&2最小支持度。如果所處理的區(qū)段為P3,則必須求得區(qū)段P3、P2&3以及P1&2&3最小支持度。
如步驟S64,從步驟S62所產(chǎn)生的雙關(guān)聯(lián)對象中,讀取一雙關(guān)聯(lián)對象,計算其關(guān)聯(lián)系數(shù)。在計算之前,會先判斷此雙關(guān)聯(lián)對象是否為此區(qū)段所產(chǎn)生的新雙關(guān)聯(lián),采用不同的計算公式。
如步驟S65,判斷其關(guān)聯(lián)系數(shù)是否大于區(qū)段最小支持度,其判斷方法會因此雙關(guān)聯(lián)對象的開始區(qū)段不同而采用不同的判斷方法。關(guān)聯(lián)對象BC的開始區(qū)段為P1,其關(guān)聯(lián)系數(shù)需與區(qū)段P1&2最小支持度比較;關(guān)聯(lián)對象AB的開始區(qū)段為P2,其關(guān)聯(lián)系數(shù)需與區(qū)段P2最小支持度比較。
若此雙關(guān)聯(lián)對象的關(guān)聯(lián)系數(shù)大于區(qū)段最小支持度,則執(zhí)行步驟S66,將此雙關(guān)聯(lián)對象加入到關(guān)聯(lián)對象集合,否則將已加入到關(guān)聯(lián)對象集合的雙關(guān)聯(lián)對象剔除。
如步驟S67,判斷是否處理完所有此區(qū)段的雙關(guān)聯(lián)對象,若沒有則回到步驟S63繼續(xù)讀取下一個雙關(guān)聯(lián)對象。
如步驟S68,判斷是否處理完所有區(qū)段交易紀錄,若沒有則回到步驟S61繼續(xù)讀取下一個區(qū)段交易紀錄。
本發(fā)明并不限定此方法要由以上順序循序執(zhí)行,只要能達到本發(fā)明所述的功效,任何有可能的順序調(diào)換都在本發(fā)明的范圍中。
再者,本發(fā)明提出一種計算機可讀存儲介質(zhì),用以存儲一計算機程序,上述計算機程序用以實現(xiàn)數(shù)據(jù)關(guān)聯(lián)分析方法,此方法會執(zhí)行如上所述的步驟。
圖7示出了本發(fā)明第一實施例的計算機可讀存儲介質(zhì)示意圖。此計算機可讀存儲介質(zhì)70,用以存儲一計算機程序720,用以實現(xiàn)數(shù)據(jù)關(guān)聯(lián)分析方法。其計算機程序包含六個邏輯,分別為輸入交易數(shù)據(jù)邏輯721、檢索雙關(guān)聯(lián)對象邏輯722、求得區(qū)段最小支持度邏輯723、計算關(guān)聯(lián)系數(shù)邏輯724、判斷關(guān)聯(lián)顯著性邏輯725與加入關(guān)聯(lián)對象集合邏輯726。
因此,通過本發(fā)明所提供的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法,符合漸增計算的特性,降低運算時間,并由于其納入時間考量因素,提高關(guān)聯(lián)的有效性。
雖然本發(fā)明已以優(yōu)選實施例公開如上,然其并非用以限定本發(fā)明,任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當可做些許更動與修改,因此本發(fā)明的保護范圍當以后附的權(quán)利要求書所界定者為準。
權(quán)利要求
1.一種數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),包括一數(shù)據(jù)庫,用于存儲至少一個權(quán)重紀錄以及至少一個交易紀錄,該權(quán)重紀錄包含一時間區(qū)段定義與一權(quán)重,該交易紀錄依據(jù)該時間區(qū)段定義切分為至少一個區(qū)段交易紀錄,該區(qū)段交易紀錄包含一交易對象集合;一存儲體,用于存儲一最小支持度;以及一關(guān)聯(lián)分析單元,耦接于該數(shù)據(jù)庫以及該存儲體,從該存儲體輸入該最小支持度,從該數(shù)據(jù)庫輸入該交易紀錄以及該權(quán)重紀錄,使用以該時間區(qū)段定義、該權(quán)重以及該最小支持度為參數(shù)的一支持度計算公式,計算出至少一個區(qū)段最小支持度,由該交易對象集合求得至少一個關(guān)聯(lián)對象,使用以該時間區(qū)段定義以及該權(quán)重為參數(shù)的一關(guān)聯(lián)系數(shù)計算公式,計算該關(guān)聯(lián)對象的一區(qū)段關(guān)聯(lián)系數(shù),比較該關(guān)聯(lián)系數(shù)是否大于該區(qū)間最小支持度,判斷該關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
2.如權(quán)利要求1所述的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),其中該數(shù)據(jù)庫中,還包括一關(guān)聯(lián)對象紀錄,用以存儲至少一個顯著關(guān)聯(lián)對象。
3.如權(quán)利要求1所述的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),其中該關(guān)聯(lián)分析單元中,該支持度計算公式為一區(qū)段交易紀錄總筆數(shù)乘以該權(quán)重,再乘以該最小支持度。
4.如權(quán)利要求1所述的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),其中該關(guān)聯(lián)分析單元中,該支持度計算公式為該區(qū)段交易紀錄總筆數(shù)乘以該權(quán)重,再乘以該最小支持度,加上該區(qū)段最小支持度。
5.如權(quán)利要求1所述的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),其中該關(guān)聯(lián)分析單元中,該關(guān)聯(lián)系數(shù)計算公式為一關(guān)聯(lián)次數(shù)乘以該權(quán)重。
6.如權(quán)利要求1所述的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),其中該關(guān)聯(lián)分析單元中,該關(guān)聯(lián)系數(shù)計算公式為該關(guān)聯(lián)次數(shù)乘以該權(quán)重,加上該區(qū)段關(guān)聯(lián)系數(shù)。
7.如權(quán)利要求1所述的數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng),其中該關(guān)聯(lián)分析單元中,還包括將具顯著關(guān)聯(lián)的該關(guān)聯(lián)對象紀錄到該關(guān)聯(lián)對象紀錄。
8.一種數(shù)據(jù)關(guān)聯(lián)分析方法,其方法被一計算機執(zhí)行,包括下列步驟從一數(shù)據(jù)庫中輸入一時間區(qū)段定義、一權(quán)重、相應(yīng)于該時間區(qū)段定義的至少一個區(qū)段交易紀錄,以及從一數(shù)據(jù)存儲體中輸入一最小支持度;從該區(qū)段交易紀錄中檢索出至少一個關(guān)聯(lián)對象;使用以該時間區(qū)段定義、該權(quán)重以及該最小支持度為參數(shù)的一支持度計算公式,計算出至少一個區(qū)段最小支持度;使用以該時間區(qū)段定義以及該權(quán)重為參數(shù)的一關(guān)聯(lián)系數(shù)計算公式,計算該關(guān)聯(lián)對象的一區(qū)段關(guān)聯(lián)系數(shù);以及比較該關(guān)聯(lián)系數(shù)是否大于該區(qū)間最小支持度,判斷該關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
9.如權(quán)利要求8所述的數(shù)據(jù)關(guān)聯(lián)分析方法,還包括將具顯著關(guān)聯(lián)的該關(guān)聯(lián)對象存儲到一關(guān)聯(lián)對象紀錄的步驟。
10.如權(quán)利要求8所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在檢索該關(guān)聯(lián)對象步驟中,還包括從該關(guān)聯(lián)對象紀錄,輸入該關(guān)聯(lián)對象。
11.如權(quán)利要求8所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該區(qū)段最小支持度步驟中,該支持度計算公式為一區(qū)段交易紀錄總筆數(shù)乘以該權(quán)重,再乘以該最小支持度。
12.如權(quán)利要求8所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該區(qū)段最小支持度步驟中,該支持度計算公式為該區(qū)段交易紀錄總筆數(shù)乘以該權(quán)重,再乘以該最小支持度,加上該區(qū)段最小支持度。
13.如權(quán)利要求8所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該關(guān)聯(lián)對象的該區(qū)段關(guān)聯(lián)系數(shù)中,該關(guān)聯(lián)系數(shù)計算公式為一關(guān)聯(lián)次數(shù)乘以該權(quán)重。
14.如權(quán)利要求8所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該關(guān)聯(lián)對象的該區(qū)段關(guān)聯(lián)系數(shù)步驟中,該關(guān)聯(lián)系數(shù)計算公式為該關(guān)聯(lián)次數(shù)乘以該權(quán)重,加上該區(qū)段關(guān)聯(lián)系數(shù)。
15.一種計算機可讀存儲介質(zhì),用于存儲一計算機程序,該計算機程序被加載到一計算機,用以實現(xiàn)數(shù)據(jù)關(guān)聯(lián)分析方法,其方法包括下列步驟輸入一時間區(qū)段定義、一權(quán)重、相應(yīng)于該時間區(qū)段定義的至少一個區(qū)段交易紀錄以及一最小支持度;從該區(qū)段交易紀錄中檢索出至少一個關(guān)聯(lián)對象;使用以該時間區(qū)段定義、該權(quán)重以及該最小支持度為參數(shù)的一支持度計算公式,計算出至少一個區(qū)段最小支持度;使用以該時間區(qū)段定義以及該權(quán)重為參數(shù)的一關(guān)聯(lián)系數(shù)計算公式,計算該關(guān)聯(lián)對象的一區(qū)段關(guān)聯(lián)系數(shù);以及比較該關(guān)聯(lián)系數(shù)是否大于該區(qū)間最小支持度,判斷該關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
16.如權(quán)利要求15所述的數(shù)據(jù)關(guān)聯(lián)分析方法,還包括將具顯著關(guān)聯(lián)的該關(guān)聯(lián)對象存儲到一關(guān)聯(lián)對象紀錄的步驟。
17.如權(quán)利要求15所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在檢索出該關(guān)聯(lián)對象步驟中,還包括從該關(guān)聯(lián)對象紀錄,輸入該關(guān)聯(lián)對象。
18.如權(quán)利要求15所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該區(qū)段最小支持度步驟中,該支持度計算公式為一區(qū)段交易紀錄總筆數(shù)乘以該權(quán)重,再乘以該最小支持度。
19.如權(quán)利要求15所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該區(qū)段最小支持度步驟中,該支持度計算公式為該區(qū)段交易紀錄總筆數(shù)乘以該權(quán)重,再乘以該最小支持度,加上該區(qū)段最小支持度。
20.如權(quán)利要求15所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該關(guān)聯(lián)對象的該區(qū)段關(guān)聯(lián)系數(shù)步驟中,該關(guān)聯(lián)系數(shù)計算公式為一關(guān)聯(lián)次數(shù)乘以該權(quán)重。
21.如權(quán)利要求15所述的數(shù)據(jù)關(guān)聯(lián)分析方法,在計算該關(guān)聯(lián)對象的該區(qū)段關(guān)聯(lián)系數(shù)步驟中,該關(guān)聯(lián)系數(shù)計算公式為該關(guān)聯(lián)次數(shù)乘以該權(quán)重,加上該區(qū)段關(guān)聯(lián)系數(shù)。
全文摘要
一種數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)及方法以及計算機可讀存儲介質(zhì),其系統(tǒng)包括一數(shù)據(jù)庫、一存儲體與一關(guān)聯(lián)分析單元,關(guān)聯(lián)分析單元使用以時間區(qū)段定義、權(quán)重以及最小支持度為參數(shù)的支持度計算公式,計算出至少一個區(qū)段最小支持度,使用以時間區(qū)段定義以及權(quán)重為參數(shù)的關(guān)聯(lián)系數(shù)計算公式,計算關(guān)聯(lián)對象的區(qū)段關(guān)聯(lián)系數(shù),比較關(guān)聯(lián)系數(shù)是否大于區(qū)間最小支持度,判斷關(guān)聯(lián)對象的關(guān)聯(lián)顯著性。
文檔編號G06F17/00GK1542642SQ03123099
公開日2004年11月3日 申請日期2003年4月30日 優(yōu)先權(quán)日2003年4月30日
發(fā)明者李昌鴻 申請人:明基電通股份有限公司