專(zhuān)利名稱(chēng):數(shù)據(jù)索引方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)管理領(lǐng)域,尤其涉及一種數(shù)據(jù)索引方法和裝置。
背景技術(shù):
近幾十年來(lái),數(shù)據(jù)管理技術(shù)發(fā)展迅猛,在國(guó)民經(jīng)濟(jì)建設(shè)中起到了突出作用。以O(shè)racle> DB2、SQL Server等為代表的大型關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)(Relational DatabaseManagement System,RDBMS)更是諸多大型信息管理系統(tǒng)、客戶(hù)關(guān)系管理軟件不可或缺的核 心部分。同時(shí),以可擴(kuò)展標(biāo)記語(yǔ)言(Extensible Markup Language,XML)為代表的半結(jié)構(gòu)化數(shù)據(jù)管理技術(shù)也在數(shù)據(jù)交換和缺乏嚴(yán)格結(jié)構(gòu)的數(shù)據(jù)管理方面占據(jù)一席之地。上述技術(shù)均對(duì)數(shù)據(jù)質(zhì)量、待處理數(shù)據(jù)的準(zhǔn)確性要求非常高。當(dāng)原始數(shù)據(jù)的質(zhì)量不高吋,需要先經(jīng)過(guò)預(yù)處理過(guò)程提升數(shù)據(jù)質(zhì)量。以部門(mén)人事管理系統(tǒng)為例,員エ的個(gè)人資料、薪酬待遇和日??己说刃畔⒈仨殰?zhǔn)確。但在諸如經(jīng)濟(jì)、軍事和電信等領(lǐng)域,數(shù)據(jù)的不確定性普遍存在,其存在性未知而且各屬性值存在誤差。盡管數(shù)據(jù)預(yù)處理能夠提升原始數(shù)據(jù)集合的質(zhì)量,但也可能會(huì)喪失原始數(shù)據(jù)集合的部分性質(zhì),導(dǎo)致無(wú)法返回高質(zhì)量的查詢(xún)結(jié)果。典型的應(yīng)用背景如下?;谖恢玫姆?wù)(Location Base Service, LBS)是移動(dòng)計(jì)算領(lǐng)域的核心問(wèn)題。位置服務(wù)跟蹤移動(dòng)物體(或者用戶(hù)),然后將物體(或用戶(hù))的位置在電子地圖上定位,以此為基礎(chǔ)提供空間信息服務(wù)。在這類(lèi)應(yīng)用中,移動(dòng)物體的位置受到特定技術(shù)手段(例如GPS(Global Positioning System,全球定位系統(tǒng))技術(shù))制約,存在一定的誤差。盡管這項(xiàng)誤差會(huì)隨著技術(shù)手段的提升而逐步縮小,但是“位置隱私”問(wèn)題卻顯得日益突出。移動(dòng)物體的位置信息非常重要,有些用戶(hù)并不愿意公諸于眾,以免帶來(lái)麻煩?!拔恢秒[私”的目的是降低位置的精度——在某時(shí)刻,移動(dòng)物體并非在某一空間“點(diǎn)”上,而是在ー個(gè)“區(qū)域”內(nèi),從而保護(hù)了隱私。與此同時(shí),各互聯(lián)網(wǎng)服務(wù)提供商仍然能夠根據(jù)這項(xiàng)“區(qū)域”信息提供相應(yīng)的服務(wù),例如,查詢(xún)移動(dòng)對(duì)象附近的醫(yī)院、賓館等設(shè)施。索引技術(shù)是數(shù)據(jù)管理技術(shù)的重要內(nèi)容。關(guān)系型數(shù)據(jù)庫(kù)往往采用B+樹(shù)及其變種為一維數(shù)據(jù)建立索引;在多維數(shù)據(jù)管理領(lǐng)域或時(shí)間-空間數(shù)據(jù)管理領(lǐng)域,廣泛使用R樹(shù)以及其變種進(jìn)行索引。這些索引技術(shù)均能夠大幅提高查詢(xún)處理速度。同理,在處理不確定性數(shù)據(jù)中也需要關(guān)注索引問(wèn)題。在某些查詢(xún)?nèi)蝿?wù)中,例如top-k查詢(xún),元組的概率值也非常重要,因此需要針對(duì)概率維度創(chuàng)建ー維索引,此時(shí)傳統(tǒng)索引技術(shù)有效。但傳統(tǒng)的索引技術(shù)無(wú)法解決所有問(wèn)題。當(dāng)各元組的取值必須通過(guò)概率分布函數(shù)描述,且概率分布函數(shù)無(wú)法預(yù)先指定吋,傳統(tǒng)的索引技術(shù)索引效率將大幅降低,無(wú)法滿(mǎn)足應(yīng)用需求。
發(fā)明內(nèi)容
本發(fā)明提供了一種數(shù)據(jù)索引方法和裝置,解決了傳統(tǒng)索引技術(shù)無(wú)法滿(mǎn)足大型數(shù)據(jù)檢索需要的問(wèn)題。一種數(shù)據(jù)索引方法,包括
創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù);根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu);在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期。優(yōu)選的,所述創(chuàng)建至少ー個(gè)被索引對(duì)象R的索引樹(shù)包括創(chuàng)建最上層的TPR-Tree ;在所述TPR-Tree之下鏈接有至少ー個(gè)2維R-Tree ;將各R-Tree通過(guò)哈希鏈接鏈接至一個(gè)ー維R-Tree。優(yōu)選的,所述在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期具體為
在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象處在所述TPR-Tree或所述2維R-Tree或所述ー維R-Tree中的生命期。優(yōu)選的,上述數(shù)據(jù)索引方法還包括在對(duì)任ー被索引對(duì)象進(jìn)行時(shí)間間隔查詢(xún)或時(shí)間片查詢(xún)時(shí),通過(guò)所述哈希結(jié)構(gòu)查找所述被索引對(duì)象的生命期;根據(jù)所述被索引對(duì)象在所述索引樹(shù)中各位置對(duì)應(yīng)的生命期,確定所述被索引對(duì)象對(duì)應(yīng)索引在所述索引樹(shù)中的位置。優(yōu)選的,所述生命期具體為被索引對(duì)象處于同一狀態(tài)下持續(xù)的時(shí)間間隔。本發(fā)明還提供了一種數(shù)據(jù)索引裝置,包括索引樹(shù)創(chuàng)建模塊,用于創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù);哈希結(jié)構(gòu)生成模塊,用于根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu);關(guān)聯(lián)模塊,用于在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期。優(yōu)選的,所述索引樹(shù)創(chuàng)建模塊包括第一創(chuàng)建單元,用于創(chuàng)建最上層的TPR-Tree ;第二創(chuàng)建單元,用于在所述TPR-Tree之下鏈接有至少ー個(gè)2維R-Tree ;第三創(chuàng)建單元,將各R-Tree通過(guò)哈希鏈接鏈接至一個(gè)ー維R-Tree。優(yōu)選的,上述數(shù)據(jù)索引裝置還包括索引模塊,用于在對(duì)任一被索引對(duì)象進(jìn)行時(shí)間間隔查詢(xún)或時(shí)間片查詢(xún)時(shí),通過(guò)所述哈希結(jié)構(gòu)查找所述被索引對(duì)象的生命期,井根據(jù)所述被索引對(duì)象在所述索引樹(shù)中各位置對(duì)應(yīng)的生命期,確定所述被索弓I對(duì)象對(duì)應(yīng)索引在所述索引樹(shù)中的位置。本發(fā)明提供了一種數(shù)據(jù)索引方法和裝置,根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu),創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù),再在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期,將哈希索引和索引樹(shù)索引兩種方式結(jié)合起來(lái)對(duì)數(shù)據(jù)進(jìn)行索引,提高了索引效率和索引精度,解決了傳統(tǒng)索引技術(shù)無(wú)法滿(mǎn)足大型數(shù)據(jù)檢索需要的問(wèn)題。
圖I為本發(fā)明的實(shí)施例一提供的一種數(shù)據(jù)索引方法的流程圖;圖2為本發(fā)明的實(shí)施例中所涉及的索引樹(shù)結(jié)構(gòu)示意圖3為本發(fā)明的實(shí)施例中哈希結(jié)構(gòu)與索引樹(shù)關(guān)聯(lián)關(guān)系的示意圖;圖4為本發(fā)明的實(shí)施例三提供的一種數(shù)據(jù)索引裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式索引技術(shù)是數(shù)據(jù)管理技術(shù)的重要內(nèi)容。關(guān)系型數(shù)據(jù)庫(kù)往往采用B+樹(shù)及其變種為一維數(shù)據(jù)建立索引;在多維數(shù)據(jù)管理領(lǐng)域或時(shí)間-空間數(shù)據(jù)管理領(lǐng)域,廣泛使用R樹(shù)以及其變種進(jìn)行索引。這些索引技術(shù)均能夠大幅提高查詢(xún)處理速度。同理,在處理不確定性數(shù)據(jù) 中也需要關(guān)注索引問(wèn)題。在某些查詢(xún)?nèi)蝿?wù)中,例如top-k查詢(xún),元組的概率值也非常重要,因此需要針對(duì)概率維度創(chuàng)建ー維索引,此時(shí)傳統(tǒng)索引技術(shù)有效。但傳統(tǒng)的索引技術(shù)無(wú)法解決所有問(wèn)題。當(dāng)各元組的取值必須通過(guò)概率分布函數(shù)描述,且概率分布函數(shù)無(wú)法預(yù)先指定吋,傳統(tǒng)的索引技術(shù)索引效率將大幅降低,無(wú)法滿(mǎn)足應(yīng)用需求。為了解決上述問(wèn)題,本發(fā)明的實(shí)施例提供了一種數(shù)據(jù)索引方法和裝置。下文中將結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說(shuō)明。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。首先結(jié)合附圖,對(duì)本發(fā)明的實(shí)施例一進(jìn)行說(shuō)明。本發(fā)明實(shí)施例提供了一種數(shù)據(jù)索引方法,能夠進(jìn)行不確定性數(shù)據(jù)管理索引。傳統(tǒng)的解決方案一般采用樹(shù)索引或者哈希(Hash)索引的方式,但樹(shù)索引技術(shù)和哈希索引技術(shù)都有其優(yōu)缺點(diǎn)。比如,樹(shù)索引技術(shù)適合隨機(jī)數(shù)據(jù)訪(fǎng)問(wèn);哈希索引技術(shù)適合順序結(jié)構(gòu)數(shù)據(jù),類(lèi)似廣播信道。樹(shù)索引技術(shù)對(duì)簇集的數(shù)據(jù)廣播非常有效;但簇集對(duì)哈希索引技術(shù)性能影響不大。哈希索引技術(shù)特別適合多屬性的數(shù)據(jù)索引;樹(shù)索引技術(shù)提供了一種基于索引值較準(zhǔn)確和完整的全局視圖,客戶(hù)機(jī)能快速地在樹(shù)索引上找到想得到的數(shù)據(jù)的到達(dá)時(shí)間,這樣,諧調(diào)時(shí)間自然就縮短了。由于哈希索引不包含數(shù)據(jù)幀的全局信息,它僅僅只能對(duì)客戶(hù)機(jī)判定當(dāng)前數(shù)據(jù)幀是否與查詢(xún)有關(guān)提供幫助。其過(guò)濾的有效性在很大程度上取決于哈希索引的平均失效率。使用本發(fā)明實(shí)施例提供的數(shù)據(jù)索引方法完成數(shù)據(jù)索引的流程如圖I所示,包括步驟101、創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù);本發(fā)明實(shí)施例中,該索引樹(shù)的最上層是TPR-Tree,然后是多個(gè)2維R-Tree,2維的R-Tree的哈希鏈接一個(gè)ー維的R-Tree。本發(fā)明的實(shí)施例所涉及的索引樹(shù)結(jié)構(gòu)如圖2所示。TPR樹(shù)是具有R樹(shù)結(jié)構(gòu)的多路平衡樹(shù)。樹(shù)中每個(gè)非葉子結(jié)點(diǎn)都由若干個(gè)(TPBR,Point)單元組成。TPBR為當(dāng)前包含其對(duì)應(yīng)孩子的帶時(shí)間參數(shù)邊界矩形.Point是ー個(gè)指向孩子結(jié)點(diǎn)的指針。葉子結(jié)點(diǎn)由若干個(gè)(TPBR,ObjectlD)組成。其中TPBR為包含對(duì)應(yīng)移動(dòng)對(duì)象的帶時(shí)間參數(shù)邊界矩形.ObjectlD是ー個(gè)指向移動(dòng)對(duì)象的指針,通過(guò)指針可以得到對(duì)應(yīng)移動(dòng)對(duì)象的詳細(xì)信息。R-tree是B-tree向多維空間發(fā)展的另ー種形式,它將空間對(duì)象按范圍劃分,姆個(gè)結(jié)點(diǎn)都對(duì)應(yīng)ー個(gè)區(qū)域和ー個(gè)磁盤(pán)頁(yè),非葉結(jié)點(diǎn)的磁盤(pán)頁(yè)中存儲(chǔ)其所有子結(jié)點(diǎn)的區(qū)域范圍,非葉結(jié)點(diǎn)的所有子結(jié)點(diǎn)的區(qū)域都落在它的區(qū)域范圍之內(nèi);葉結(jié)點(diǎn)的磁盤(pán)頁(yè)中存儲(chǔ)其區(qū)域范圍之內(nèi)的所有空間對(duì)象的外接矩形。每個(gè)結(jié)點(diǎn)所能擁有的子結(jié)點(diǎn)數(shù)目有上、下限,下限保證對(duì)磁盤(pán)空間的有效利用,上限保證每個(gè)結(jié)點(diǎn)對(duì)應(yīng)ー個(gè)磁盤(pán)頁(yè),當(dāng)插入新的結(jié)點(diǎn)導(dǎo)致某結(jié)點(diǎn)要求的空間大于ー個(gè)磁盤(pán)頁(yè)時(shí),該結(jié)點(diǎn)一分為ニ(分裂)。R樹(shù)是ー種動(dòng)態(tài)索引結(jié)構(gòu),即它的查詢(xún)可與插入或刪除同時(shí)進(jìn)行,而且不需要定期地對(duì)樹(shù)結(jié)構(gòu)進(jìn)行重新組織。步驟102、根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu);對(duì)于全部被索引對(duì)象,可以根據(jù)它們的ID構(gòu)建哈希結(jié)構(gòu)(哈希表)。步驟103、在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期;本步驟中,在哈希結(jié)構(gòu)內(nèi)存儲(chǔ)每個(gè)被索引對(duì)象處在TPR-Tree、R-Tree或(2維R-Tree+1維R-Tree)中的生命期。哈希結(jié)構(gòu)與索引樹(shù)的關(guān)聯(lián)關(guān)系如圖3所示。
步驟104、在對(duì)任ー被索引對(duì)象進(jìn)行時(shí)間間隔查詢(xún)或時(shí)間片查詢(xún)時(shí),通過(guò)所述哈希結(jié)構(gòu)查找所述被索引對(duì)象的生命期;步驟105、根據(jù)所述被索引對(duì)象在所述索引樹(shù)中各位置對(duì)應(yīng)的生命期,確定所述被索引對(duì)象對(duì)應(yīng)索引在所述索引樹(shù)中的位置;本步驟中,在對(duì)于時(shí)間間隔查詢(xún)和時(shí)間片查詢(xún)時(shí),通過(guò)哈希結(jié)構(gòu)中搜索出來(lái)的生命期,可以直接確定從樹(shù)索引中的哪個(gè)索引結(jié)構(gòu)開(kāi)始搜索。下面結(jié)合附圖,對(duì)本發(fā)明的實(shí)施例ニ進(jìn)行說(shuō)明。本發(fā)明實(shí)施例提供了一種數(shù)據(jù)索引方法,下面對(duì)本發(fā)明實(shí)施例所提供的數(shù)據(jù)索引方法應(yīng)用于移動(dòng)通信環(huán)境中的實(shí)現(xiàn)過(guò)程進(jìn)行說(shuō)明。最近十年來(lái),隨著無(wú)線(xiàn)通訊、定位技術(shù)的發(fā)展,基于位置服務(wù)(LBS)得到了非常廣泛的應(yīng)用。我們假定通訊公司需要跟蹤每個(gè)手機(jī)用戶(hù)的實(shí)時(shí)位置,以便給特定區(qū)域分配合理的帶寬,保證通訊的順暢,不至于出現(xiàn)擁塞現(xiàn)象;或者需要知道使用手機(jī)作為通訊工具報(bào)警的人的當(dāng)前位置。這都需要對(duì)手機(jī)用戶(hù)的位置信息進(jìn)行實(shí)時(shí)追蹤。持有手機(jī)者的移動(dòng)可能紛繁復(fù)雜,但無(wú)非就是靜止、類(lèi)似靜止、低速無(wú)限制移動(dòng)、有限制高速移動(dòng)(這通常需要借助交通工具)??梢允褂肦-樹(shù)索引手機(jī)用戶(hù)的靜止和類(lèi)似靜止?fàn)顟B(tài);使用TPR-樹(shù)索引手機(jī)用戶(hù)的低速無(wú)限制移動(dòng);而用(2-維R-樹(shù)+1-維R-樹(shù))索引手機(jī)用戶(hù)在有限制高速移動(dòng)對(duì)象中的類(lèi)似靜止?fàn)顟B(tài)。該混合索引中的每條記錄都有生命期,所謂生命期是指對(duì)象的移動(dòng)速度和方向保持不變的時(shí)間間隔。用[tstart,tmd]表示。例如一手機(jī)用戶(hù)出門(mén)去火車(chē)站,首先是作為ー個(gè)低速移動(dòng)對(duì)象被TPR-樹(shù)索引;火車(chē)開(kāi)動(dòng)后,原記錄被邏輯刪除(令tmd等于現(xiàn)在時(shí)間),將新的特殊記錄插入到TPR-樹(shù),該記錄指向相應(yīng)的高速移動(dòng)對(duì)象索引。到達(dá)目的地后,又將該特殊記錄邏輯刪除,并向TPR-樹(shù)插入ー個(gè)普通的記錄。對(duì)于被索引的全部對(duì)象,可以根據(jù)它們的ID,構(gòu)建哈希結(jié)構(gòu),該結(jié)構(gòu)中還存儲(chǔ)每個(gè)對(duì)象處在TPR-樹(shù)、R-樹(shù)或(2維R-樹(shù)+1維R-樹(shù))中的生命期。對(duì)于時(shí)間間隔查詢(xún)和時(shí)間片查詢(xún),通過(guò)哈希結(jié)構(gòu)中捜索出來(lái)的生命期,可以直接確定從哪個(gè)索引結(jié)構(gòu)開(kāi)始搜索。下面結(jié)合附圖,對(duì)本發(fā)明的實(shí)施例三進(jìn)行說(shuō)明。本發(fā)明實(shí)施例提供了一種數(shù)據(jù)索引裝置,其結(jié)構(gòu)如圖4所示,包括索引樹(shù)創(chuàng)建模塊401,用于創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù);哈希結(jié)構(gòu)生成模塊402,用于根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu);
關(guān)聯(lián)模塊403,用于在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期。優(yōu)選的,所述索引樹(shù)創(chuàng)建模塊401包括第一創(chuàng)建單元,用于創(chuàng)建最上層的TPR-Tree ;第二創(chuàng)建單元,用于在所述TPR-Tree之下鏈接有至少ー個(gè)2維R-Tree ;第三創(chuàng)建單元,將各R-Tree通過(guò)哈希鏈接鏈接至一個(gè)ー維R-Tree。優(yōu)選的,上述數(shù)據(jù)索引裝置還包括
索引模塊404,用于在對(duì)任一被索引對(duì)象進(jìn)行時(shí)間間隔查詢(xún)或時(shí)間片查詢(xún)時(shí),通過(guò)所述哈希結(jié)構(gòu)查找所述被索引對(duì)象的生命期,井根據(jù)所述被索引對(duì)象在所述索引樹(shù)中各位置對(duì)應(yīng)的生命期,確定所述被索引對(duì)象對(duì)應(yīng)索引在所述索引樹(shù)中的位置。本發(fā)明的實(shí)施例提供了一種數(shù)據(jù)索引方法和裝置,根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu),創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù),再在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期,將哈希索引和索引樹(shù)索引兩種方式結(jié)合起來(lái)對(duì)數(shù)據(jù)進(jìn)行索引,提高了索引效率和索引精度,解決了傳統(tǒng)索引技術(shù)無(wú)法滿(mǎn)足大型數(shù)據(jù)檢索需要的問(wèn)題。將樹(shù)索引和哈希索引兩種索引技術(shù)結(jié)合,有效的提高了多維數(shù)據(jù)管理的效率。本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的全部或部分步驟可以使用計(jì)算機(jī)程序流程來(lái)實(shí)現(xiàn),所述計(jì)算機(jī)程序可以存儲(chǔ)于ー計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,所述計(jì)算機(jī)程序在相應(yīng)的硬件平臺(tái)上(如系統(tǒng)、設(shè)備、裝置、器件等)執(zhí)行,在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合??蛇x地,上述實(shí)施例的全部或部分步驟也可以使用集成電路來(lái)實(shí)現(xiàn),這些步驟可以被分別制作成ー個(gè)個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。上述實(shí)施例中的各裝置/功能模塊/功能単元可以采用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,也可以分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上。上述實(shí)施例中的各裝置/功能模塊/功能單元以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述提到的計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求所述的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種數(shù)據(jù)索引方法,其特征在于,包括 創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù); 根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu); 在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期。
2.根據(jù)權(quán)利要求I所述的數(shù)據(jù)索引方法,其特征在于,所述創(chuàng)建至少ー個(gè)被索引對(duì)象R的索引樹(shù)包括 創(chuàng)建最上層的TPR-Tree ; 在所述TPR-Tree之下鏈接有至少ー個(gè)2維R-Tree ; 將各R-Tree通過(guò)哈希鏈接鏈接至一個(gè)ー維R-Tree。
3.根據(jù)要求2所述的數(shù)據(jù)索引方法,其特征在于,所述在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期具體為 在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象處在所述TPR-Tree或所述2維R-Tree或所述ー維R-Tree中的生命期。
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)索引方法,其特征在于,該方法還包括 在對(duì)任ー被索引對(duì)象進(jìn)行時(shí)間間隔查詢(xún)或時(shí)間片查詢(xún)時(shí),通過(guò)所述哈希結(jié)構(gòu)查找所述被索引對(duì)象的生命期; 根據(jù)所述被索引對(duì)象在所述索引樹(shù)中各位置對(duì)應(yīng)的生命期,確定所述被索引對(duì)象對(duì)應(yīng)索引在所述索引樹(shù)中的位置。
5.根據(jù)權(quán)利要求I至4所述的數(shù)據(jù)索引方法,其特征在于,所述生命期具體為被索引對(duì)象處于同ー狀態(tài)下持續(xù)的時(shí)間間隔。
6.一種數(shù)據(jù)索引裝置,其特征在于,包括 索引樹(shù)創(chuàng)建模塊,用于創(chuàng)建所述至少ー個(gè)被索引對(duì)象R的索引樹(shù); 哈希結(jié)構(gòu)生成模塊,用于根據(jù)至少ー個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu); 關(guān)聯(lián)模塊,用于在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期。
7.根據(jù)權(quán)利怵的數(shù)據(jù)索引裝置,其特征在于,所述索引樹(shù)創(chuàng)建模塊包括 第一創(chuàng)建單元,用于創(chuàng)建最上層的TPR-Tree ; 第二創(chuàng)建單元,用于在所述TPR-Tree之下鏈接有至少ー個(gè)2維R-Tree ; 第三創(chuàng)建單元,將各R-Tree通過(guò)哈希鏈接鏈接至一個(gè)ー維R-Tree。
8.根據(jù)權(quán)利嫖6所述的數(shù)據(jù)索引裝置,其特征在于,該裝置還包括 索引模塊,用于在對(duì)任一被索引對(duì)象進(jìn)行時(shí)間間隔查詢(xún)或時(shí)間片查詢(xún)時(shí),通過(guò)所述哈希結(jié)構(gòu)查找所述被索引對(duì)象的生命期,井根據(jù)所述被索引對(duì)象在所述索引樹(shù)中各位置對(duì)應(yīng)的生命期,確定所述被索弓I對(duì)象對(duì)應(yīng)索引在所述索引樹(shù)中的位置。
全文摘要
本發(fā)明提供了一種數(shù)據(jù)索引方法和裝置。涉及數(shù)據(jù)管理領(lǐng)域;解決了傳統(tǒng)索引技術(shù)無(wú)法滿(mǎn)足大型數(shù)據(jù)檢索需要的問(wèn)題。該方法包括創(chuàng)建所述至少一個(gè)被索引對(duì)象R的索引樹(shù);根據(jù)至少一個(gè)被索引對(duì)象的ID建立哈希結(jié)構(gòu);在所述哈希結(jié)構(gòu)中存儲(chǔ)所述被索引對(duì)象在所述索引樹(shù)中各位置的生命期。本發(fā)明提供的技術(shù)方案適用于大型關(guān)系數(shù)據(jù)管理系統(tǒng),實(shí)現(xiàn)了高效率高準(zhǔn)確性的數(shù)據(jù)索引。
文檔編號(hào)G06F17/30GK102646118SQ20121003926
公開(kāi)日2012年8月22日 申請(qǐng)日期2012年2月20日 優(yōu)先權(quán)日2012年2月20日
發(fā)明者劉正偉, 文中領(lǐng), 王恩東 申請(qǐng)人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司