1.一種基于分布式存儲的關(guān)聯(lián)信息索引系統(tǒng),其特征在于:分布式數(shù)據(jù)庫中所有元組按照關(guān)聯(lián)性劃分成若干分類組,設(shè)置二級索引系統(tǒng)進行查找定位,其中,
一級索引為:每一個分類組設(shè)置一個索引,即為分類組索引;
二級索引為:一個分類組中的一個元祖的索引,即為分類組元組索引。
2.根據(jù)權(quán)利要求1所述的基于分布式存儲的關(guān)聯(lián)信息索引,其特征在于:二級索引存放一個分類組中的一組具有關(guān)聯(lián)的元組信息,表示為A1(a11,a12,...,a1k),A2(a21,a22,...,a2m),...An(an1,an2,...,anl),其中,Ai是一個二級索引組,存放所述二級索引;
一級索引存放所述二級索引組的索引信息,表示為I(f(A1),f(A2),...,f(An)),其中,I是一個一級索引組,存放所述一級索引。
3.根據(jù)權(quán)利要求1或2所述的基于分布式存儲的關(guān)聯(lián)信息索引的建立方法,其特征在于:具體包括如下步驟:
步驟一、遍歷分布式數(shù)據(jù)庫中所有元組;
步驟二、使用算法處理所述元組,將具有關(guān)聯(lián)的元組劃分到一個分類組中,形成若干分類組;
步驟三、為一個分類組中的具有關(guān)聯(lián)的一個元組根據(jù)其屬性創(chuàng)建一組索引,即為二級索引;建立一個二級索引組,存放此分類組中的所有二級索引;
步驟四、為所述每一個二級索引組創(chuàng)建一個索引,即為一級索引;建立一個一級索引組,存放所有一級索引。
4.根據(jù)權(quán)利要求2所述的基于分布式存儲的關(guān)聯(lián)信息索引的建立方法,其特征在于:所述步驟二中使用關(guān)聯(lián)規(guī)則算法模型處理所述元組,對所有元組的數(shù)據(jù)進行關(guān)聯(lián)、分類。
5.根據(jù)權(quán)利要求3所述的基于分布式存儲的關(guān)聯(lián)信息索引的建立方法,其特征在于:所述關(guān)聯(lián)規(guī)則算法模型的方法中進行閾值設(shè)定,包括關(guān)聯(lián)規(guī)則中的置信度和支持度。
6.根據(jù)權(quán)利要求1或2所述的基于分布式存儲的關(guān)聯(lián)信息索引的使用方法,其特征在于:采用關(guān)鍵詞查詢關(guān)聯(lián)元組信息,具體步驟包括:
1.查詢所述關(guān)鍵詞所在的一級索引,從一級索引中去查找所有滿足條件的二級索引;
2.確定了二級索引之后,直接到所述分布式數(shù)據(jù)庫中去查找所有關(guān)聯(lián)的元組信息;
3.輸出結(jié)果。