專利名稱::基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備和方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,更具體地,涉及時(shí)間序列關(guān)系挖掘。根據(jù)本發(fā)明,提出了一種基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備和方法。
背景技術(shù):
:隨著全球化進(jìn)程的飛速發(fā)展,公司之間形成了比以往更加錯(cuò)綜復(fù)雜的商業(yè)聯(lián)系,同時(shí)一個(gè)公司的發(fā)展進(jìn)程要比以往迅速很多,而發(fā)展進(jìn)程中其他有商業(yè)聯(lián)系的公司對(duì)它的發(fā)展起著至關(guān)重要的作用。另一方面,隨著信息化的發(fā)展,商業(yè)新聞大量地出現(xiàn)在互聯(lián)網(wǎng)等媒介上。這些商業(yè)新聞中包含了大量的公司間商業(yè)關(guān)系的信息。以往到現(xiàn)在積累下來的所有商業(yè)新聞幾乎可以涵蓋所有產(chǎn)業(yè)中的所有商業(yè)聯(lián)系的信息。這些信息形成了一個(gè)時(shí)序性的商業(yè)信息過程。如果商業(yè)咨詢行業(yè)能從中得到這些信息,從這些信息中建立起時(shí)序性的商業(yè)信息過程,并推導(dǎo)出一些對(duì)用戶(用戶主要是一些公司咨詢者)有用的產(chǎn)業(yè)及子產(chǎn)業(yè)關(guān)系以及一些對(duì)應(yīng)的商業(yè)性事件,那么這將是一個(gè)非常有前景的技術(shù)。商業(yè)關(guān)系隨著時(shí)間的發(fā)展會(huì)形成變化的網(wǎng)絡(luò),對(duì)這個(gè)變化的網(wǎng)絡(luò)建立時(shí)序模型之后,如何從中找到產(chǎn)業(yè)結(jié)構(gòu)(即包含多少個(gè)產(chǎn)業(yè),每個(gè)產(chǎn)業(yè)包含有多少子產(chǎn)業(yè),每個(gè)產(chǎn)業(yè)和子產(chǎn)業(yè)中代表性的企業(yè)是誰)是一個(gè)難題。從商業(yè)關(guān)系推廣到一般關(guān)系(如,社會(huì)關(guān)系),給定一個(gè)時(shí)序的關(guān)系圖之后,如何從中找出哪些節(jié)點(diǎn)屬于哪個(gè)類,每個(gè)類又可以如何分為子類,并從中找出每個(gè)類和子類的代表也是一個(gè)難題。在已有的方法中,包括對(duì)基于連接圖的關(guān)系進(jìn)行聚類的技術(shù),如參考文獻(xiàn)lC.H,Ding,X.He,H.Zha,M.Gu,andH.D.Simon.Amin-maxcutalgorithmforgraphpartitioninganddataclustering.InProceedingsofIEEEICDM2001,pages107-114,2001.,參考文獻(xiàn)J.ShiandJ.Malik.Normalizedcutandimagesegmentation.IEEETrans,onPatternAnalysisandMachineIntelligence,22(8):888-905,August2000.。但是,該技術(shù)僅應(yīng)用于簡單的圖形,沒有提及如何針對(duì)根據(jù)時(shí)間變化商業(yè)關(guān)系而建立的圖進(jìn)行聚類的方法。而在商業(yè)性事件檢測(cè)中,有根據(jù)時(shí)間序列檢測(cè)重要的節(jié)點(diǎn)的技術(shù)(如,日本專利JP2005-352817),但是并未提出關(guān)于在將時(shí)序圖進(jìn)行聚類劃分為產(chǎn)業(yè)后、如何進(jìn)行相應(yīng)的事件檢測(cè)的相應(yīng)技術(shù)。
發(fā)明內(nèi)容本發(fā)明針對(duì)隨時(shí)間變化的關(guān)系進(jìn)行綜合,建立特定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖,對(duì)總體綜合關(guān)系圖進(jìn)行基于圖的切分的聚類,以得到最終完成分類的節(jié)點(diǎn)與相應(yīng)的關(guān)系。同時(shí),在將本發(fā)明應(yīng)用于商業(yè)領(lǐng)域后,進(jìn)一步根據(jù)分類號(hào)的節(jié)點(diǎn)與關(guān)系對(duì)商業(yè)領(lǐng)域內(nèi)的公司和關(guān)系做產(chǎn)業(yè)劃分,最后經(jīng)過產(chǎn)業(yè)內(nèi)的商業(yè)事件檢測(cè)得到商業(yè)性事件。為了實(shí)現(xiàn)上述目的,本發(fā)明提出了一種基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,在指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖中,節(jié)點(diǎn)表示實(shí)體,節(jié)點(diǎn)間的連線表示所述指定時(shí)間段內(nèi)的實(shí)體間關(guān)系,所述基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備包括時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置,用于對(duì)輸入的時(shí)序關(guān)系進(jìn)行綜合,生成指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖;以及關(guān)系圖聚類裝置,用于對(duì)所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置所生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類,生成最終分類完成的節(jié)點(diǎn)。優(yōu)選地,所述基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備還包括時(shí)序關(guān)系生成單元,用于對(duì)關(guān)系實(shí)例計(jì)算權(quán)值,解決內(nèi)部沖突,對(duì)沒有出現(xiàn)的時(shí)間進(jìn)行插值,得到所述時(shí)序關(guān)系,并將所述時(shí)序關(guān)系發(fā)送至?xí)r間段內(nèi)總體綜合關(guān)系圖生成裝置。8優(yōu)選地,所述基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備還包括時(shí)序關(guān)系提取單元,用于從外部輸入的時(shí)序關(guān)系圖中提取出所述時(shí)序關(guān)系,并將所述時(shí)序關(guān)系發(fā)送至?xí)r間段內(nèi)總體綜合關(guān)系圖生成裝置。優(yōu)選地,所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置包括總體關(guān)系綜合單元,用于針對(duì)所述指定時(shí)間段,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合,得到兩個(gè)實(shí)體間的單一總體綜合關(guān)系;以及總體綜合關(guān)系圖創(chuàng)建單元,用于針對(duì)所述指定時(shí)間段內(nèi)的單一總體綜合關(guān)系,創(chuàng)建單一的非時(shí)序總體綜合關(guān)系圖。優(yōu)選地,所述總體關(guān)系綜合單元針對(duì)所述指定時(shí)間段,使用以下算法中的至少一種,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合求和算法、平均算法、加權(quán)求和算法、加權(quán)平均算法和最大值選取算法。優(yōu)選地,所述總體關(guān)系綜合單元所生成的兩個(gè)實(shí)體間的總體綜合關(guān)系是無方向的。優(yōu)選地,在所述總體綜合關(guān)系圖創(chuàng)建單元所創(chuàng)建的單一的非時(shí)序總體綜合關(guān)系圖中,以節(jié)點(diǎn)表示實(shí)體,以節(jié)點(diǎn)間的連線表示兩實(shí)體間的總體綜合關(guān)系,每條連線的權(quán)值為兩實(shí)體間的總體綜合關(guān)系的取值。優(yōu)選地,所述總體綜合關(guān)系圖生成裝置針對(duì)指定時(shí)間段內(nèi)的所有時(shí)間單位,生成一個(gè)帶權(quán)值的無向圖。優(yōu)選地,所述關(guān)系圖聚類裝置采用分級(jí)聚類方法,對(duì)所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置所生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類。優(yōu)選地,所述基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備還包括事件檢測(cè)裝置,用于根據(jù)所述關(guān)系圖聚類裝置所產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,對(duì)實(shí)體間關(guān)系進(jìn)行事件檢測(cè),輸出事件結(jié)果。優(yōu)選地,所述事件檢測(cè)裝置包括類別歸類單元,用于針對(duì)所述指定時(shí)間段,對(duì)所有實(shí)體和關(guān)系進(jìn)行類別劃分,按照預(yù)定的類別細(xì)分閾值,選取所述關(guān)系圖聚類裝置所產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,針對(duì)所選取的節(jié)點(diǎn)聚類結(jié)果中的每一類別,對(duì)所述總體綜合關(guān)系圖中的所有節(jié)點(diǎn)和連線進(jìn)行歸類,從而將所有實(shí)體和關(guān)系歸類到各個(gè)類別中;實(shí)體重要度計(jì)算單元,用于針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,計(jì)算各個(gè)實(shí)體在該類別內(nèi)的實(shí)體重要度;以及事件檢測(cè)單元,用于針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,選擇本類別內(nèi)的實(shí)體和關(guān)系,并結(jié)合實(shí)體重要度,進(jìn)行事件檢測(cè)。優(yōu)選地,所述實(shí)體重要度計(jì)算單元采用PageRank方法或HITS算法來計(jì)算實(shí)體重要度。優(yōu)選地,所述事件檢測(cè)單元包括類別選取子單元,用于選取所述類別歸類單元所生成的實(shí)體和關(guān)系分類中的指定類別內(nèi)的實(shí)體和關(guān)系;以及基于規(guī)則的事件提取子單元,用于利用預(yù)定義規(guī)則、所述類別選取子單元的選取結(jié)果、由所述實(shí)體重要度計(jì)算單元生成的各類別內(nèi)的實(shí)體重要度,檢測(cè)并輸出與所述預(yù)定義規(guī)則匹配的事件。優(yōu)選地,所述實(shí)體為公司,所述關(guān)系為商業(yè)關(guān)系,以及所述類別為產(chǎn)業(yè)。為了實(shí)現(xiàn)上述目的,本發(fā)明還提出了一種基于總體綜合關(guān)系圖的實(shí)體分類方法,在指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖中,節(jié)點(diǎn)表示實(shí)體,節(jié)點(diǎn)間的連線表示所述指定時(shí)間段內(nèi)的實(shí)體間關(guān)系,所述基于總體綜合關(guān)系圖的實(shí)體分類方法包括時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟,對(duì)輸入的時(shí)序關(guān)系進(jìn)行綜合,生成指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖;以及關(guān)系圖聚類步驟,對(duì)在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟中生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類,生成最終分類完成的節(jié)點(diǎn)。優(yōu)選地,在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟之前,所述基于總體綜合關(guān)系圖的實(shí)體分類方法還包括時(shí)序關(guān)系生成步驟,對(duì)關(guān)系實(shí)例計(jì)算權(quán)值,解決內(nèi)部沖突,對(duì)沒有出現(xiàn)的時(shí)間進(jìn)行插值,得到所述時(shí)序關(guān)系。優(yōu)選地,在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟之前,所述基于總體綜合關(guān)系圖的實(shí)體分類方法還包括時(shí)序關(guān)系提取步驟,從外部輸入的時(shí)序關(guān)系圖中提取出所述時(shí)序關(guān)系。優(yōu)選地,所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟包括總體關(guān)系綜合子步驟,針對(duì)所述指定時(shí)間段,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合,得到兩個(gè)實(shí)體間的單一總體綜合關(guān)系;以及總體綜合關(guān)系圖創(chuàng)建子步驟,針對(duì)所述指定時(shí)間段內(nèi)的單一總體綜合關(guān)系,創(chuàng)建單一的非時(shí)序總體綜合關(guān)系圖。優(yōu)選地,在所述總體關(guān)系綜合子步驟中,針對(duì)所述指定時(shí)間段,使用以下算法中的至少一種,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合求和算法、平均算法、加權(quán)求和算法、加權(quán)平均算法和最大值選取算法。優(yōu)選地,在所述總體關(guān)系綜合子步驟中生成的兩個(gè)實(shí)體間的總體綜合關(guān)系是無方向的。優(yōu)選地,在所述總體綜合關(guān)系圖創(chuàng)建子步驟中創(chuàng)建的單一的非時(shí)序總體綜合關(guān)系圖中,以節(jié)點(diǎn)表示實(shí)體,以節(jié)點(diǎn)間的連線表示兩實(shí)體間的總體綜合關(guān)系,每條連線的權(quán)值為兩實(shí)體間的總體綜合關(guān)系的取值。優(yōu)選地,在所述總體綜合關(guān)系圖生成步驟中,針對(duì)指定時(shí)間段內(nèi)的所有時(shí)間單位,生成一個(gè)帶權(quán)值的無向圖。優(yōu)選地,在所述關(guān)系圖聚類步驟中,采用分級(jí)聚類方法,對(duì)在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟中生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類。優(yōu)選地,所述基于總體綜合關(guān)系圖的實(shí)體分類方法還包括事件檢測(cè)步驟,根據(jù)所述關(guān)系圖聚類步驟所產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,對(duì)實(shí)體間關(guān)系進(jìn)行事件檢測(cè),輸出事件結(jié)果。優(yōu)選地,所述事件檢測(cè)步驟包括類別歸類子步驟,針對(duì)所述指定時(shí)間段,對(duì)所有實(shí)體和關(guān)系進(jìn)行類別劃分,按照預(yù)定的類別細(xì)分閾值,選取在所述關(guān)系圖聚類步驟中產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,針對(duì)所選取的節(jié)點(diǎn)聚類結(jié)果中的每一類別,對(duì)所述總體綜合關(guān)系圖中的所有節(jié)點(diǎn)和連線進(jìn)行歸類,從而將所有實(shí)體和關(guān)系歸類到各個(gè)類別中;實(shí)體重要度計(jì)算子步驟,針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,計(jì)算各個(gè)實(shí)體在該類別內(nèi)的實(shí)體重要度;以及事件檢測(cè)子步驟,針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,選擇本類別內(nèi)的實(shí)體和關(guān)系,并結(jié)合實(shí)體重要度,進(jìn)行事件檢測(cè)。優(yōu)選地,在所述實(shí)體重要度計(jì)算子步驟中,采用PageRank方法或HITS算法來計(jì)算實(shí)體重要度。ii優(yōu)選地,所述事件檢測(cè)子步驟包括類別選取子步驟,選取在所述類別歸類子步驟中生成的實(shí)體和關(guān)系分類中的指定類別內(nèi)的實(shí)體和關(guān)系;以及基于規(guī)則的事件提取子步驟,利用預(yù)定義規(guī)則、所述類別選取子步驟中的選取結(jié)果、在所述實(shí)體重要度計(jì)算子步驟中生成的各類別內(nèi)的實(shí)體重要度,檢測(cè)并輸出與所述預(yù)定義規(guī)則匹配的事件。優(yōu)選地,所述實(shí)體為公司,所述關(guān)系為商業(yè)關(guān)系,以及所述類別為產(chǎn)業(yè)。根據(jù)本發(fā)明,有效地解決了以下技術(shù)問題從隨時(shí)間變化的關(guān)系實(shí)例中建立時(shí)序關(guān)系,對(duì)時(shí)序關(guān)系進(jìn)行綜合,建立特定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖,然后,再對(duì)總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類;以及根據(jù)時(shí)序性的商業(yè)關(guān)系和對(duì)其進(jìn)行聚類的結(jié)果,進(jìn)行商業(yè)性事件檢測(cè)。通過下面結(jié)合本發(fā)明的優(yōu)選實(shí)施例,將使本發(fā)明的上述及其它目的、特征和優(yōu)點(diǎn)更加清楚,其中圖la示出了時(shí)序關(guān)系分類與分析系統(tǒng)的總體方框圖lb示出了時(shí)序商業(yè)關(guān)系分類與分析系統(tǒng)的總體方框圖2a示出了時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8的方框圖和數(shù)據(jù)流程圖2b2d示出了時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8在處理過程中所產(chǎn)生的時(shí)序詳細(xì)關(guān)系圖示和時(shí)序綜合關(guān)系圖(此后,將時(shí)序綜合關(guān)系圖稱為"時(shí)序關(guān)系圖"),其中圖2b和2c為^和^時(shí)刻的詳細(xì)關(guān)系圖示,圖2d為指定時(shí)間段/,+^的綜合關(guān)系圖3示出了一個(gè)聚類結(jié)果的例子;圖4示出了與圖2d相對(duì)應(yīng)的指定時(shí)間段w2的總的聚類結(jié)果;圖5示出了基于產(chǎn)業(yè)的商業(yè)性事件檢測(cè)模塊6的方框圖和數(shù)據(jù)流程圖6示出了商業(yè)性事件檢測(cè)單元63的方框圖和數(shù)據(jù)流程圖;圖7示出了代理公司案號(hào)IA078650中的圖3所示的時(shí)序公司關(guān)系提取子模塊22"的方框圖和數(shù)據(jù)流程圖。具體實(shí)施例方式下面參照附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)說明,在描述過程中省略了對(duì)于本發(fā)明來說是不必要的細(xì)節(jié)和功能,以防止對(duì)本發(fā)明的理解造成混淆。此外,在以下的描述中,以公司作為實(shí)體的示例、以商業(yè)關(guān)系作為關(guān)系的示例,對(duì)本發(fā)明的、基于時(shí)序關(guān)系圖的實(shí)體分類設(shè)備和方法進(jìn)行詳細(xì)的描述。但是,應(yīng)當(dāng)注意的是,本發(fā)明中所提及的實(shí)體并不局限于公司,也可以表示自然人、國家或者產(chǎn)品等實(shí)體,相應(yīng)地,本發(fā)明中所提及的關(guān)系并不局限于商業(yè)關(guān)系,也可以應(yīng)用于人際關(guān)系、國家關(guān)系等各種其他社會(huì)關(guān)系上。系統(tǒng)概覽圖la示出了時(shí)序關(guān)系分類與分析系統(tǒng)的總體方框圖。符號(hào)1表示輸入的關(guān)系實(shí)例。時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8針對(duì)輸入的關(guān)系實(shí)例,生成一個(gè)指定時(shí)間段內(nèi)的總體綜合關(guān)系圖。例如,可以生成一個(gè)1995年到2007年之間的總體綜合關(guān)系圖,這是一個(gè)單一的非時(shí)序關(guān)系圖。然后,再利用關(guān)系圖聚類模塊3對(duì)時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8所生成這個(gè)單一的非時(shí)序關(guān)系圖進(jìn)行聚類,從而得到聚類結(jié)果5,并生成最終分類完成的節(jié)點(diǎn)與關(guān)系。模塊詳細(xì)描述關(guān)系實(shí)例1是指兩個(gè)實(shí)體之間具有某種關(guān)系,有如下的數(shù)據(jù)結(jié)構(gòu)<table>tableseeoriginaldocumentpage13</column></row><table>表l.關(guān)系實(shí)例數(shù)據(jù)結(jié)構(gòu)例子例如,在商業(yè)領(lǐng)域中,實(shí)體可以表示公司,其中的關(guān)系類型可以有競(jìng)爭(zhēng)、合作、控股、供貨、合并、并購等。在以下的數(shù)學(xué)表達(dá)中,用//"S,Z,0來表示一個(gè)關(guān)系實(shí)例,表示實(shí)體A和實(shí)體B在時(shí)間點(diǎn)/有X關(guān)系實(shí)例。時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8的方框圖和數(shù)據(jù)流程圖如圖2a所示。具體地,時(shí)序關(guān)系生成單元21對(duì)關(guān)系實(shí)例計(jì)算權(quán)值,解決內(nèi)部沖突,對(duì)沒有出現(xiàn)的時(shí)間做插值得到時(shí)序的關(guān)系。這些步驟可以用己有的方法來解決,如在代理公司案號(hào)IA078650中具體描述的商業(yè)關(guān)系挖掘設(shè)備和方法,但是,需要注意的是,商業(yè)關(guān)系只是本發(fā)明中所涉及的關(guān)系的一個(gè)實(shí)例,而不應(yīng)因此限制本發(fā)明的范圍。最終得到的是時(shí)序的實(shí)體間各種類型的帶權(quán)值的關(guān)系。即在一段給定的時(shí)間單位里,兩個(gè)實(shí)體間存在時(shí)序的某種類型關(guān)系及其權(quán)值,權(quán)值是指在此時(shí)間單位內(nèi)有這種關(guān)系的可信度。其數(shù)據(jù)結(jié)構(gòu)的一個(gè)例子如表2所示-_公司A_公司B關(guān)系類型{(月,權(quán)值),(月,權(quán)值),""7]表2.時(shí)序關(guān)系生成單元21得到的時(shí)序關(guān)系數(shù)據(jù)結(jié)構(gòu)例子用^,^W來表示表示實(shí)體A和實(shí)體B在時(shí)間單位t內(nèi)對(duì)X商^關(guān)系的權(quán)值。例如,圖2b和2c示出了時(shí)序關(guān)系生成單元21所產(chǎn)生的時(shí)序詳細(xì)關(guān)系的圖示,其中圖21)為,1時(shí)刻的詳細(xì)關(guān)系圖示,圖2c為^時(shí)刻的詳細(xì)關(guān)系圖示。具體地,在圖2b中,示出了實(shí)體A和實(shí)體B在f,時(shí)刻具有關(guān)系"Cooperation"和"Competition";實(shí)體A和實(shí)體C在r,時(shí)刻具有關(guān)系"Cooperation"和"Competition";實(shí)體A和實(shí)體D在/,時(shí)刻具有關(guān)系"Competition";實(shí)體B和實(shí)體D在/,時(shí)刻具有關(guān)系"Competition";以及實(shí)體C和實(shí)體D在時(shí)刻具有關(guān)系"Competition^而在圖2c中,示出了實(shí)體A和實(shí)體B在^時(shí)刻具有關(guān)系"Cooperation"和"Competition";實(shí)體A和實(shí)體C在/2時(shí)刻具有關(guān)系"Competition";實(shí)體A和實(shí)體D在,2時(shí)刻具有關(guān)系"Competition";實(shí)體B和實(shí)體D在/2時(shí)刻具有關(guān)系"Competition";以及實(shí)體C和實(shí)體D在G時(shí)刻具有關(guān)系"Cooperation"和"Competition"。時(shí)間段內(nèi)總體關(guān)系綜合單元82對(duì)指定時(shí)間段內(nèi)的兩個(gè)實(shí)體間的各種類型關(guān)系進(jìn)行綜合,得到這一指定時(shí)間段內(nèi)的總體綜合關(guān)系。我們用^力來表示兩個(gè)實(shí)體間指定時(shí)間段內(nèi)的總體綜合關(guān)系。這一綜合計(jì)算過程可以采用多種求和方法或加權(quán)求和方法,對(duì)各種類型關(guān)系在時(shí)間段內(nèi)累加,其計(jì)算公式如下-其中AO是對(duì)應(yīng)于關(guān)系X的任意的單調(diào)增函數(shù)或單調(diào)減函數(shù)。g(.)是任意的單調(diào)增函數(shù),其作用是標(biāo)準(zhǔn)化或歸一化最終權(quán)值。A(.)表示對(duì)時(shí)間段內(nèi)各個(gè)時(shí)間單位的某一類型關(guān)系做合并計(jì)算。一個(gè)例子是對(duì)各個(gè)時(shí)間單位做求和處理;另一個(gè)例子是做平均處理;再另一個(gè)例子是選取最大值。通過上述合并計(jì)算,時(shí)間段內(nèi)總體關(guān)系綜合單元82輸出指定時(shí)間段內(nèi)的兩個(gè)實(shí)體間的總體綜合關(guān)系。關(guān)系圖創(chuàng)建單元23針對(duì)兩個(gè)實(shí)體間指定時(shí)間段內(nèi)的單一總體綜合關(guān)系創(chuàng)建單一的非時(shí)序總體綜合關(guān)系圖。圖中的節(jié)點(diǎn)是實(shí)體,節(jié)點(diǎn)間的連線表示所述指定時(shí)間段內(nèi)兩實(shí)體間的總體綜合關(guān)系,每條連線的權(quán)值為兩個(gè)實(shí)體間的總體綜合關(guān)系的取值。這樣對(duì)所述指定時(shí)間段就生成了一個(gè)帶權(quán)值的無向圖。例如,圖2d示出了時(shí)間段內(nèi)總體關(guān)系綜合單元82和關(guān)系圖創(chuàng)建單元23所產(chǎn)生的指定時(shí)間段,1+^2的總體綜合關(guān)系圖。此外,雖然在圖2a中,時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8包括時(shí)序關(guān)系生成單元21,但是應(yīng)當(dāng)清楚的是,時(shí)序關(guān)系生成單元2115并不是時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8的必要組件。也可以在時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8的外部構(gòu)建時(shí)序關(guān)系生成單元21,在這種情況下,時(shí)間段內(nèi)總體綜合關(guān)系圖生成模塊8的輸入可以相應(yīng)地調(diào)整為各實(shí)體間的時(shí)序關(guān)系來代替關(guān)系實(shí)例。另外,本發(fā)明輸入的時(shí)序關(guān)系也可以由之前創(chuàng)建的任何表示實(shí)體關(guān)系的時(shí)序關(guān)系圖中得到。在這種情況下,根據(jù)本發(fā)明的時(shí)序關(guān)系分類與分析系統(tǒng)還可以包括時(shí)序關(guān)系提取單元,用于從外部輸入的時(shí)序關(guān)系圖中提取出時(shí)序關(guān)系,并將所述時(shí)序關(guān)系發(fā)送至?xí)r間段內(nèi)總體綜合關(guān)系圖生成模塊8。關(guān)系圖聚類模塊3采用分級(jí)聚類方法,對(duì)指定時(shí)間段內(nèi)的總體綜合關(guān)系圖進(jìn)行聚類。例如,可以采用已有的基于圖的聚類方法對(duì)總體綜合關(guān)系圖做基于圖二分切分的聚類。已有的方法包括參考文獻(xiàn)ic.H.Ding,X.He,H.Zha,M.Gu,andH.D.Simon.Amin-maxcutalgorithmforgraphpartitioninganddataclustering.InProceedingsofIEEEICDM2001,pages107-114,2001.和參考文獻(xiàn)J.ShiandJ.Malik.Normalizedcutandimagesegmentation.IEEETrans,onPatternAnalysisandMachineIntelligence,22(8):888-905,August2000.。聚類結(jié)果是多級(jí)的二分結(jié)構(gòu),圖3a示出了一個(gè)聚類結(jié)果的例子。在圖3給出的聚類結(jié)果例子中,最細(xì)的分類結(jié)果為4類ABC為一類,DE為一類,F(xiàn)為一類,G為一類;上一層的分類結(jié)果為3類,ABC為一類,DEF為一類,G為一類。例如,在商業(yè)關(guān)系上,更細(xì)的級(jí)別表現(xiàn)為子行業(yè),而更高的級(jí)別則表現(xiàn)為行業(yè)。圖4示出了與圖2d相對(duì)應(yīng)的指定時(shí)間段/,+^的總的聚類結(jié)果。參考圖4,該指定時(shí)間段^W2的總的聚類結(jié)果表明在時(shí)間段^+,2期間,實(shí)體A和B屬于子類2-1,實(shí)體C屬于子類2-2,且實(shí)體A、B和C都屬于子類2;實(shí)體D屬于子類3;且實(shí)體AD都屬于類1。商業(yè)關(guān)系分類與分析實(shí)例圖lb示出了時(shí)序商業(yè)關(guān)系分類與分析系統(tǒng)的總體方框圖。在圖lb中,給出了將本發(fā)明應(yīng)用于商業(yè)關(guān)系的實(shí)例。與圖la的通用時(shí)序關(guān)系分類與分析系統(tǒng)相比,圖lb所示的系統(tǒng)僅應(yīng)用于商業(yè)關(guān)系的分類和分析,模塊l、8和3與圖la中相同,為了簡明起見,這里省略了不必要的重復(fù)描述。符號(hào)6表示基于產(chǎn)業(yè)的商業(yè)性事件檢測(cè)模塊,用于根據(jù)聚類結(jié)果,對(duì)時(shí)序商業(yè)關(guān)系做商業(yè)事件的檢測(cè),最終輸出商業(yè)性事件結(jié)果7。商業(yè)性事件7是指從上述數(shù)據(jù)中以行業(yè)分析的角度得到的高層次的且對(duì)用戶或者其他公司有啟發(fā)意義的事件。例如,公司A從1998年1月到2001年1月是本行業(yè)的核心公司;公司B從1999年1月到2000年1月在本行業(yè)內(nèi)發(fā)展迅速等。圖5示出了基于產(chǎn)業(yè)的商業(yè)性事件檢測(cè)模塊6的方框圖和數(shù)據(jù)流程圖。產(chǎn)業(yè)歸類單元61對(duì)于每個(gè)指定時(shí)間段,對(duì)所有關(guān)系和節(jié)點(diǎn)做產(chǎn)業(yè)劃分,按照某個(gè)產(chǎn)業(yè)細(xì)分閾值選取時(shí)間段聚類結(jié)果,針對(duì)每一類(每一個(gè)行業(yè)),對(duì)該指定時(shí)間段的總體綜合關(guān)系圖中的所有節(jié)點(diǎn)和連線進(jìn)行歸類,從而將所有公司和商業(yè)關(guān)系歸類到各個(gè)產(chǎn)業(yè)中。公司重要度計(jì)算單元62對(duì)每個(gè)指定時(shí)間段內(nèi)的每個(gè)產(chǎn)業(yè),計(jì)算各個(gè)公司在該產(chǎn)業(yè)內(nèi)的重要度??梢圆捎眉河兴惴?,如PageRank方法或HITS算法,或任何可行的辦法。商業(yè)性事件檢測(cè)單元63對(duì)每個(gè)指定時(shí)間段內(nèi)的每個(gè)產(chǎn)業(yè),只選擇本行業(yè)內(nèi)的公司和商業(yè)關(guān)系,結(jié)合公司重要度,進(jìn)行商業(yè)性事件檢、、具體地,圖6示出了商業(yè)性事件檢測(cè)單元63的方框圖和數(shù)據(jù)流程圖。商業(yè)性事件檢測(cè)單元63的輸入包括由產(chǎn)業(yè)歸類單元61生成的時(shí)間段公司產(chǎn)業(yè)分類和時(shí)間段公司間商業(yè)關(guān)系分類、以及由公司重要度計(jì)算單元62生成的產(chǎn)業(yè)內(nèi)時(shí)間段公司商業(yè)重要度。產(chǎn)業(yè)選取子單元631選取產(chǎn)業(yè)歸類單元61所生成的時(shí)間段公司產(chǎn)業(yè)分類和時(shí)間段公司間商業(yè)關(guān)系分類中的指定產(chǎn)業(yè)內(nèi)的公司和商業(yè)關(guān)系,基于規(guī)則的事件提取子單元633利用預(yù)定義規(guī)則632去檢測(cè)所有的輸入數(shù)據(jù)并輸出與規(guī)則匹配的商業(yè)性事件。預(yù)定義規(guī)則632可以由人工預(yù)先定義。一些預(yù)定義規(guī)則632的例子如下用S力)表示在某產(chǎn)業(yè)內(nèi)公司A在t時(shí)的重要度,如果公司八在某產(chǎn)業(yè)內(nèi)的商業(yè)重要度^(,)>77^。^^1,那么A在某產(chǎn)業(yè)內(nèi)從/。到。是一個(gè)關(guān)鍵公司;對(duì)于某產(chǎn)業(yè)內(nèi)的公司A,如果^):&(,。),,那么A在某產(chǎn)業(yè)一/0內(nèi)從/。到、發(fā)展迅速;對(duì)于某產(chǎn)業(yè)內(nèi)的公司A,如果&(,。):^^)〉7V那么A在某產(chǎn)業(yè)。一,O內(nèi)從/。到/,出現(xiàn)問題;對(duì)于某產(chǎn)業(yè)內(nèi)的公司A和B,如果&,"0那么A和B從Z。到、關(guān)系發(fā)展迅速;對(duì)于某產(chǎn)業(yè)內(nèi)的公司A和B,如果",。):、"0,,那么A和,1一,OB從"到/,關(guān)系惡化。至此已經(jīng)結(jié)合優(yōu)選實(shí)施例對(duì)本發(fā)明進(jìn)行了描述。應(yīng)該理解,本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍的情況下,可以進(jìn)行各種其它的改變、替換和添加。因此,本發(fā)明的范圍不局限于上述特定實(shí)施例,而應(yīng)由所附權(quán)利要求所限定。附件*代理公司案號(hào)IA078650中的相關(guān)內(nèi)容(該申請(qǐng)文件中的圖3及相關(guān)描述,這里,為了區(qū)分附圖標(biāo)記的需要,在附件部分中的附圖標(biāo)記均添加(")以示區(qū)別)時(shí)序公司關(guān)系提取子模塊22"圖7示出了時(shí)序公司關(guān)系提取子模塊22"的方框圖和數(shù)據(jù)流程圖。公司商業(yè)關(guān)系實(shí)例強(qiáng)度計(jì)算單元221"根據(jù)每一個(gè)公司商業(yè)關(guān)系實(shí)例^04^,X,,'),計(jì)算其對(duì)應(yīng)時(shí)間單位t內(nèi)的公司商業(yè)關(guān)系A(chǔ),B,X的強(qiáng)度S/(4AU)。在時(shí)間單位t之內(nèi),公司商業(yè)關(guān)系實(shí)例A,B,X可能出現(xiàn)多次,例如不同新聞網(wǎng)站會(huì)提到,在t內(nèi)可能有多次時(shí)間都提到。我們用C,來表示時(shí)間單位t內(nèi)公司商業(yè)關(guān)系實(shí)例出現(xiàn)的次數(shù),那么S/"A義力可以用下式計(jì)算S/"5,Z,/)=^,fl,x(/)=ims(",)其中",是對(duì)應(yīng)的第i個(gè)實(shí)例,ms(",.)是這個(gè)實(shí)例中新聞的匹配得分。實(shí)際上強(qiáng)度就是所有時(shí)間單位t內(nèi)的實(shí)例得分總和。時(shí)序插值單元222"對(duì)一段指定時(shí)間內(nèi)沒有公司商業(yè)關(guān)系實(shí)例出現(xiàn)時(shí)的公司關(guān)系利用插值計(jì)算其權(quán)值,最終在指定時(shí)間段內(nèi)任何公司之間的任何持續(xù)性關(guān)系在任何時(shí)間都有權(quán)值。持續(xù)性的公司關(guān)系是指關(guān)系會(huì)持續(xù)一段時(shí)間,而不是一次性的事件性的關(guān)系,例如競(jìng)爭(zhēng)、合作、控股、供貨等都是持續(xù)性的商業(yè)關(guān)系。例如在2000年6月沒有出現(xiàn)公司A和公司B之間的競(jìng)爭(zhēng)關(guān)系,但是在之前2000年1月出現(xiàn)了這種關(guān)系,那么就利用之前的這種關(guān)系的權(quán)值來插值求得2000年6月的權(quán)值。例如,求插值的方法如下假設(shè)某兩公司的某種關(guān)系W第一次發(fā)生在",最后一次發(fā)生在L。為了計(jì)算"時(shí)的公司關(guān)系強(qiáng)度,假設(shè)在"之前的一次實(shí)例發(fā)生在^,在其之后的一次實(shí)例發(fā)生在一那么。_"事件性商業(yè)關(guān)系以及沖突處理單元223"對(duì)事件性的商業(yè)關(guān)系進(jìn)行處理。事件性的商業(yè)關(guān)系是指這種商業(yè)關(guān)系是一次發(fā)生的事件而不是持續(xù)性的商業(yè)關(guān)系,例如合并、并購都是事件性的商業(yè)關(guān)系,而競(jìng)爭(zhēng)、合作、控股、供貨是持續(xù)性的商業(yè)關(guān)系。處理過程包括本身這種關(guān)系權(quán)值的處理,發(fā)生沖突時(shí)的處理,對(duì)其他有影響的關(guān)系的處理。例如,處理方法如下首先,解決沖突問題。沖突問題的解決辦法如下時(shí)間沖突理論上事件性關(guān)系應(yīng)該只發(fā)生一次,但是互聯(lián)網(wǎng)上信息不完全可靠,因此可能會(huì)發(fā)生沖突。如果發(fā)生沖突,即同時(shí)存在i/C4,S,X,",WM^JA)(^</2),那么調(diào)整新的公司關(guān)系強(qiáng)度為二"仏^(0方向沖突專門針對(duì)于有方向性的事件性關(guān)系的處理,如并購。這種關(guān)系對(duì)兩個(gè)公司來講只可能有一個(gè)方向是正確的。在同時(shí)存在則513乂%(,2)=0否則然后,解決對(duì)其他商業(yè)關(guān)系的影響。如果x是合并或并購關(guān)系而且、^(0>7^,其中77/是一個(gè)預(yù)定閾值,那么A和B在^之后合并為一個(gè)公司,A和B之間不再保存持續(xù)性關(guān)系,合并后公司A(B)和其他公司的關(guān)系權(quán)值按如下調(diào)整在完成上述處理之后,事件性商業(yè)關(guān)系以及沖突處理單元223"輸出帶權(quán)值的時(shí)序公司商業(yè)關(guān)系32"。公司間時(shí)序綜合商業(yè)聯(lián)系度計(jì)算單元224"(在代理公司案號(hào)IA078649的發(fā)明中,無需計(jì)算時(shí)序的綜合商業(yè)聯(lián)系度,實(shí)體間時(shí)序綜合關(guān)系的計(jì)算將由關(guān)系綜合單元22完成)計(jì)算兩個(gè)公司之間時(shí)序的綜合性的商業(yè)聯(lián)系度以及平均的總商業(yè)聯(lián)系度。具體地,對(duì)各種關(guān)系權(quán)值做加權(quán)平均,得到時(shí)序的綜合商業(yè)聯(lián)系度,即其中—X)是各個(gè)關(guān)系的權(quán)值,采用經(jīng)驗(yàn)值或采用統(tǒng)計(jì)的辦法得到。統(tǒng)計(jì)的辦法可以是采用統(tǒng)計(jì)某種關(guān)系在每個(gè)工業(yè)界之內(nèi)出現(xiàn)的概率作為權(quán)值。之后對(duì)所有時(shí)間取平均得到總商業(yè)聯(lián)系度。在完成上述處理之后,公司間時(shí)序綜合商業(yè)聯(lián)系度計(jì)算單元224"輸出公司間時(shí)序綜合商業(yè)聯(lián)系度33"。權(quán)利要求1.一種基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,在指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖中,節(jié)點(diǎn)表示實(shí)體,節(jié)點(diǎn)間的連線表示所述指定時(shí)間段內(nèi)的實(shí)體間關(guān)系,所述基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備包括時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置,用于對(duì)輸入的時(shí)序關(guān)系進(jìn)行綜合,生成指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖;以及關(guān)系圖聚類裝置,用于對(duì)所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置所生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類,生成最終分類完成的節(jié)點(diǎn)。2.根據(jù)權(quán)利要求1所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于還包括時(shí)序關(guān)系生成單元,用于對(duì)關(guān)系實(shí)例計(jì)算權(quán)值,解決內(nèi)部沖突,對(duì)沒有出現(xiàn)的時(shí)間進(jìn)行插值,得到所述時(shí)序關(guān)系,并將所述時(shí)序關(guān)系發(fā)送至?xí)r間段內(nèi)總體綜合關(guān)系圖生成裝置。3.根據(jù)權(quán)利要求1所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于還包括時(shí)序關(guān)系提取單元,用于從外部輸入的時(shí)序關(guān)系圖中提取出所述時(shí)序關(guān)系,并將所述時(shí)序關(guān)系發(fā)送至?xí)r間段內(nèi)總體綜合關(guān)系圖生成裝置。4.根據(jù)權(quán)利要求13之一所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置包括總體關(guān)系綜合單元,用于針對(duì)所述指定時(shí)間段,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合,得到兩個(gè)實(shí)體間的單一總體綜合關(guān)系;以及總體綜合關(guān)系圖創(chuàng)建單元,用于針對(duì)所述指定時(shí)間段內(nèi)的單一總體綜合關(guān)系,創(chuàng)建單一的非時(shí)序總體綜合關(guān)系圖。5.根據(jù)權(quán)利要求4所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述總體關(guān)系綜合單元針對(duì)所述指定時(shí)間段,使用以下算法中的至少一種,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合求和算法、平均算法、加權(quán)求和算法、加權(quán)平均算法和最大值選取算法。6.根據(jù)權(quán)利要求5所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述總體關(guān)系綜合單元所生成的兩個(gè)實(shí)體間的總體綜合關(guān)系是無方向的。7.根據(jù)權(quán)利要求4所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于在所述總體綜合關(guān)系圖創(chuàng)建單元所創(chuàng)建的單一的非時(shí)序總體綜合關(guān)系圖中,以節(jié)點(diǎn)表示實(shí)體,以節(jié)點(diǎn)間的連線表示兩實(shí)體間的總體綜合關(guān)系,每條連線的權(quán)值為兩實(shí)體間的總體綜合關(guān)系的取值。8.根據(jù)權(quán)利要求7所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述總體綜合關(guān)系圖生成裝置針對(duì)指定時(shí)間段內(nèi)的所有時(shí)間單位,生成一個(gè)帶權(quán)值的無向圖。9.根據(jù)權(quán)利要求13之一所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述關(guān)系圖聚類裝置采用分級(jí)聚類方法,對(duì)所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置所生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類。10.根據(jù)權(quán)利要求1所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于還包括事件檢測(cè)裝置,用于根據(jù)所述關(guān)系圖聚類裝置所產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,對(duì)實(shí)體間關(guān)系進(jìn)行事件檢測(cè),輸出事件結(jié)果。11.根據(jù)權(quán)利要求10所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述事件檢測(cè)裝置包括類別歸類單元,用于針對(duì)所述指定時(shí)間段,對(duì)所有實(shí)體和關(guān)系進(jìn)行類別劃分,按照預(yù)定的類別細(xì)分閾值,選取所述關(guān)系圖聚類裝置所產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,針對(duì)所選取的節(jié)點(diǎn)聚類結(jié)果中的每一類別,對(duì)所述總體綜合關(guān)系圖中的所有節(jié)點(diǎn)和連線進(jìn)行歸類,從而將所有實(shí)體和關(guān)系歸類到各個(gè)類別中;實(shí)體重要度計(jì)算單元,用于針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,計(jì)算各個(gè)實(shí)體在該類別內(nèi)的實(shí)體重要度;以及事件檢測(cè)單元,用于針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,選擇本類別內(nèi)的實(shí)體和關(guān)系,并結(jié)合實(shí)體重要度,進(jìn)行事件檢測(cè)。12.根據(jù)權(quán)利要求11所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述實(shí)體重要度計(jì)算單元采用PageRank方法或HITS算法來計(jì)算實(shí)體重要度。13.根據(jù)權(quán)利要求11或12所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述事件檢測(cè)單元包括類別選取子單元,用于選取所述類別歸類單元所生成的實(shí)體和關(guān)系分類中的指定類別內(nèi)的實(shí)體和關(guān)系;以及基于規(guī)則的事件提取子單元,用于利用預(yù)定義規(guī)則、所述類別選取子單元的選取結(jié)果、由所述實(shí)體重要度計(jì)算單元生成的各類別內(nèi)的實(shí)體重要度,檢測(cè)并輸出與所述預(yù)定義規(guī)則匹配的事件。14.根據(jù)權(quán)利要求1所述的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備,其特征在于所述實(shí)體為公司,所述關(guān)系為商業(yè)關(guān)系,以及所述類別為產(chǎn)業(yè)。15.—種基于總體綜合關(guān)系圖的實(shí)體分類方法,在指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖中,節(jié)點(diǎn)表示實(shí)體,節(jié)點(diǎn)間的連線表示所述指定時(shí)間段內(nèi)的實(shí)體間關(guān)系,所述基于總體綜合關(guān)系圖的實(shí)體分類方法包括時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟,對(duì)輸入的時(shí)序關(guān)系進(jìn)行綜合,生成指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖;以及關(guān)系圖聚類步驟,對(duì)在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟中生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類,生成最終分類完成的節(jié)點(diǎn)。16.根據(jù)權(quán)利要求15所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟之前,還包括時(shí)序關(guān)系生成步驟,對(duì)關(guān)系實(shí)例計(jì)算權(quán)值,解決內(nèi)部沖突,對(duì)沒有出現(xiàn)的時(shí)間進(jìn)行插值,得到所述時(shí)序關(guān)系。17.根據(jù)權(quán)利要求15所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟之前,還包括時(shí)序關(guān)系提取步驟,從外部輸入的時(shí)序關(guān)系圖中提取出所述時(shí)序關(guān)系。18.根據(jù)權(quán)利要求1517之一所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟包括總體關(guān)系綜合子步驟,針對(duì)所述指定時(shí)間段,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合,得到兩個(gè)實(shí)體間的單一總體綜合關(guān)系;以及總體綜合關(guān)系圖創(chuàng)建子步驟,針對(duì)所述指定時(shí)間段內(nèi)的單一總體綜合關(guān)系,創(chuàng)建單一的非時(shí)序總體綜合關(guān)系圖。19.根據(jù)權(quán)利要求18所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述總體關(guān)系綜合子步驟中,針對(duì)所述指定時(shí)間段,使用以下算法中的至少一種,對(duì)實(shí)體間各種類型關(guān)系進(jìn)行綜合求和算法、平均算法、加權(quán)求和算法、加權(quán)平均算法和最大值選取算法。20.根據(jù)權(quán)利要求19所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述總體關(guān)系綜合子步驟中生成的兩個(gè)實(shí)體間的總體綜合關(guān)系是無方向的。21.根據(jù)權(quán)利要求18所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述總體綜合關(guān)系圖創(chuàng)建子步驟中創(chuàng)建的單一的非時(shí)序總體綜合關(guān)系圖中,以節(jié)點(diǎn)表示實(shí)體,以節(jié)點(diǎn)間的連線表示兩實(shí)體間的總體綜合關(guān)系,每條連線的權(quán)值為兩實(shí)體間的總體綜合關(guān)系的取值。22.根據(jù)權(quán)利要求18所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述總體綜合關(guān)系圖生成步驟中,針對(duì)指定時(shí)間段內(nèi)的所有時(shí)間單位,生成一個(gè)帶權(quán)值的無向圖。23.根據(jù)權(quán)利要求15所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述關(guān)系圖聚類步驟中,采用分級(jí)聚類方法,對(duì)在所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成步驟中生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類。24.根據(jù)權(quán)利要求15所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于還包括事件檢測(cè)步驟,根據(jù)所述關(guān)系圖聚類步驟所產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,對(duì)實(shí)體間關(guān)系進(jìn)行事件檢測(cè),輸出事件結(jié)果。25.根據(jù)權(quán)利要求24所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于所述事件檢測(cè)步驟包括類別歸類子步驟,針對(duì)所述指定時(shí)間段,對(duì)所有實(shí)體和關(guān)系進(jìn)行類別劃分,按照預(yù)定的類別細(xì)分閾值,選取在所述關(guān)系圖聚類步驟中產(chǎn)生的節(jié)點(diǎn)聚類結(jié)果,針對(duì)所選取的節(jié)點(diǎn)聚類結(jié)果中的每一類別,對(duì)所述總體綜合關(guān)系圖中的所有節(jié)點(diǎn)和連線進(jìn)行歸類,從而將所有實(shí)體和關(guān)系歸類到各個(gè)類別中;實(shí)體重要度計(jì)算子步驟,針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,計(jì)算各個(gè)實(shí)體在該類別內(nèi)的實(shí)體重要度;以及事件檢測(cè)子步驟,針對(duì)所述指定時(shí)間段內(nèi)的每個(gè)類別,選擇本類別內(nèi)的實(shí)體和關(guān)系,并結(jié)合實(shí)體重要度,進(jìn)行事件檢測(cè)。26.根據(jù)權(quán)利要求25所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于在所述實(shí)體重要度計(jì)算子步驟中,采用PageRank方法或HITS算法來計(jì)算實(shí)體重要度。27.根據(jù)權(quán)利要求25或26所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于所述事件檢測(cè)子步驟包括類別選取子步驟,選取在所述類別歸類子步驟中生成的實(shí)體和關(guān)系分類中的指定類別內(nèi)的實(shí)體和關(guān)系;以及基于規(guī)則的事件提取子步驟,利用預(yù)定義規(guī)則、所述類別選取子步驟中的選取結(jié)果、在所述實(shí)體重要度計(jì)算子步驟中生成的各類別內(nèi)的實(shí)體重要度,檢測(cè)并輸出與所述預(yù)定義規(guī)則匹配的事件。28.根據(jù)權(quán)利要求15所述的基于總體綜合關(guān)系圖的實(shí)體分類方法,其特征在于所述實(shí)體為公司,所述關(guān)系為商業(yè)關(guān)系,以及所述類別為產(chǎn)業(yè)。全文摘要本發(fā)明提出了一種基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備和方法。在指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖中,節(jié)點(diǎn)表示實(shí)體,節(jié)點(diǎn)間的連線表示所述指定時(shí)間段內(nèi)的實(shí)體間關(guān)系。本發(fā)明的基于總體綜合關(guān)系圖的實(shí)體分類設(shè)備包括時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置,用于對(duì)輸入的時(shí)序關(guān)系進(jìn)行綜合,生成指定時(shí)間段內(nèi)的單一總體綜合關(guān)系圖;以及關(guān)系圖聚類裝置,用于對(duì)所述時(shí)間段內(nèi)總體綜合關(guān)系圖生成裝置所生成的所述單一總體綜合關(guān)系圖中的節(jié)點(diǎn)進(jìn)行聚類,生成最終分類完成的節(jié)點(diǎn)。文檔編號(hào)G06F17/30GK101482865SQ20081000241公開日2009年7月15日申請(qǐng)日期2008年1月7日優(yōu)先權(quán)日2008年1月7日發(fā)明者福島俊一,胡長建,許荔秦申請(qǐng)人:日電(中國)有限公司