亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種最匹配模糊軌跡問題的查詢方法

文檔序號:6442949閱讀:187來源:國知局
專利名稱:一種最匹配模糊軌跡問題的查詢方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)庫系統(tǒng)、信息檢索、空間索引和查詢技術(shù),特別是涉及一種最匹配模糊軌跡查詢的查詢處理方法。
背景技術(shù)
在實際應(yīng)用中,產(chǎn)生了大量的軌跡數(shù)據(jù)。例如,GPS設(shè)備的廣泛應(yīng)用導(dǎo)致了大量的移動車輛和移動物體軌跡的產(chǎn)生。理想情況下,這樣一條軌跡數(shù)據(jù)被建模為一個帶有時間戳的地理位置的序列。但是,這種建模方法過于簡單,不能考慮到位置信息的不確定性。物體位置信息的不確定性有很多來源。例如,一個GPS設(shè)備讀取的位置信息,本身即不是一個精確的地理位置,而是由一個精確的位置點(精度和維度)和一個誤差范圍表示的。此外,由于基于位置的隱私保護受到了越來越多的重視,很多位置信息在發(fā)布以前,即被泛化成一個不確定的區(qū)域。在這種情況下,一個移動物體的軌跡信息被建模為一個帶有時間戳的位置區(qū)域的序列。并且,對應(yīng)每個時間戳,用概率分布函數(shù)(Pdf)來表示軌跡在該時刻位于相應(yīng)位置區(qū)域中的概率分布情況。模糊軌跡數(shù)據(jù)上的匹配度查詢在現(xiàn)實生活中有著非常廣泛的應(yīng)用。對于模糊軌跡數(shù)據(jù)來說,處理匹配度查詢的一個關(guān)鍵問題是,如何衡量兩個模糊軌跡之間的匹配度。國際上已有一些時間序列數(shù)據(jù)的匹配度衡量標準,例如動態(tài)時間規(guī)整算法 (Discrete Time Warping、DTW),最長公共子串(Longest Common Subsequences、LCSS)等。 但是這些方法都是針對確定型的時間序列數(shù)據(jù)提出的,不能夠應(yīng)用于不確定的軌跡數(shù)據(jù)。 此外,這些衡量標準只適用于帶有離散時間戳的數(shù)據(jù),不能夠應(yīng)用于軌跡數(shù)據(jù)這樣的考慮兩個時間戳之間連續(xù)時間段的數(shù)據(jù)類型。一種直觀的可以衡量模糊軌跡數(shù)據(jù)在連續(xù)時間段內(nèi)的匹配度的衡量標準是歐幾里德距離的數(shù)學期望。但是,歐幾里德距離的數(shù)學期望對于不確定數(shù)據(jù)的歧義點非常敏感。所以對模糊軌跡來說,歐幾里德距離的數(shù)學期望不是一個可靠的衡量標準。在這種情況下,發(fā)明一套可以高效處理最匹配模糊軌跡問題的查詢方法是十分重要的。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種最匹配模糊軌跡問題的查詢方法。本發(fā)明解決其技術(shù)問題采用的技術(shù)方案的步驟如下
1)利用網(wǎng)格方法將值域空間劃分成多個單元格,并利用所有單元格的邊界將每一個模糊軌跡劃分為軌跡片段;
2)在步驟1)中的每一個單元格內(nèi)建立一個一維的時間索引;
3)在查詢處理時,依此訪問步驟1)中的所有單元格,并計算每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界;
4)利用步驟幻中的每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界,對不合格的模糊軌跡進行剪枝,從而得到一個候選答案集合;
5)計算步驟4)中的候選答案集合中的每一個候選模糊軌跡和查詢軌跡之間的匹配度,并判斷每一個候選模糊軌跡是否為真正的查詢結(jié)果。步驟1)利用網(wǎng)格方法將值域空間劃分成多個單元格;所有單元格的邊界將每一個模糊軌跡劃分成了軌跡片段;每一個軌跡片段獨立位于一個單元格內(nèi);每一個軌跡片段還對應(yīng)一個時間區(qū)間,即為該軌跡片段處于相應(yīng)單元格內(nèi)的時間段。步驟幻為步驟1)中得到每一個單元格,建立一個一維的時間索引,用來索引處于該單元格內(nèi)的所有軌跡片段的時間區(qū)間。步驟;3)中依此訪問步驟1)中的單元格,以及單元格中的軌跡片段,計算每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界。步驟4)中找出步驟幻中所有模糊軌跡和查詢軌跡之間的匹配度的上界中的最小值;然后,如果一個模糊軌跡和查詢軌跡之間的匹配度的下界大于該最小值,則該模糊軌跡是不合格的模糊軌跡,將被剪枝掉。步驟幻中計算步驟4)中的候選答案集合中的每一個候選模糊軌跡和查詢軌跡之間的匹配度;如果一個候選模糊軌跡和查詢軌跡之間的匹配度是所有候選模糊軌跡中最大的,則該候選模糊軌跡成為真正的查詢結(jié)果。本發(fā)明具有的有益效果是
本發(fā)明充分利用了數(shù)據(jù)庫和信息檢索的現(xiàn)有研究和實現(xiàn)成果,基于已有的空間索引方法和查詢方法的擴展和融合可以非常方便快捷的提供最匹配模糊軌跡問題的查詢能力,提供最好的性能。本發(fā)明廣泛適用于車輛交通指揮管理、城市日常人口流動的模式挖掘、以及基于匹配的網(wǎng)絡(luò)日志的挖掘和商業(yè)數(shù)據(jù)挖掘。


圖1是索引結(jié)構(gòu)示意圖。圖2是軌跡片段示意圖。圖3是最匹配模糊軌跡問題的查詢方法示意圖。
具體實施例方式現(xiàn)結(jié)合附圖和具體實施例對本發(fā)明作進一步說明。本發(fā)明具體實施過程和工作原理,如圖3所示
1)利用網(wǎng)格方法將值域空間劃分成多個單元格,并利用所有單元格的邊界將每一個模糊軌跡劃分為軌跡片段;
2)在步驟1)中的每一個單元格內(nèi)建立一個一維的時間索引;
3)在查詢處理時,依此訪問步驟1)中的所有單元格,并計算每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界;
4)利用步驟幻中的每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界,對不合格的模糊軌跡進行剪枝,從而得到一個候選答案集合;
5)計算步驟4)中的候選答案集合中的每一個候選模糊軌跡和查詢軌跡之間的匹配度,并判斷每一個候選模糊軌跡是否為真正的查詢結(jié)果。
步驟1)利用網(wǎng)格方法將值域空間劃分成單元格。如圖2所示,所有單元格的邊界將每一個模糊軌跡劃分成了軌跡片段。如圖2中,一個模糊軌跡被劃分為4個軌跡片段。每一個軌跡片段獨立位于一個單元格c內(nèi)。每一個軌跡片段對應(yīng)一個時間區(qū)間,即為該軌跡片段處于單元格c內(nèi)的時間段。如圖2中,第2個軌跡片段對應(yīng)的時間區(qū)間為[t2_,t2+]。同時,每一個軌跡片段還對應(yīng)一個概率方程,入用來描述該模糊軌跡I處于單元格c內(nèi)的概率隨著時間的變化情況。步驟2)中如圖1所示,為步驟1)中得到每一個單元格,建立一個一維的時間索弓丨,用來索引處于該單元格內(nèi)的所有軌跡片段對應(yīng)的時間區(qū)間。具體地,每一個單元格c還對應(yīng)一個指針,指向存儲所有處于單元格c中的軌跡片段的存儲桶(bucket)。當一個存儲桶不足以存儲一個單元格c內(nèi)的所有的軌跡片段時,需要用多于一個的存儲桶來存儲這些軌跡片段。特別地,時間區(qū)間相近的軌跡片段會被聚類在一起,并存儲在一個存儲桶內(nèi)。這樣,每一個存儲桶同樣對應(yīng)一個時間范圍,該時間范圍是覆蓋存儲桶內(nèi)所有軌跡的時間區(qū)間的最小的時間區(qū)間。然后,該方法采用一個一維R-tree作為時間索引,用來索引單元格 c的所有存儲桶對應(yīng)的時間范圍。步驟3)中依此訪問步驟1)中的單元格,以及單元格中的軌跡片段。為了先訪問包含和查詢軌跡最匹配的軌跡片段的單元格,該查詢方法按照每個單元格和查詢軌跡々的距離的升序?qū)卧穹湃胍粋€最小堆//之中。每次訪問一個單元格c,該查詢方法從單元格c的存儲桶中取出軌跡片段的信息,并計算每一個模糊軌跡和查詢軌跡之間的匹配度的上界和下界。在訪問單元格中軌跡片段的過程中,該查詢方法在內(nèi)存中保存所有被訪問到的模糊軌跡的匹配度的上界中的最小值。當所有沒有被訪問的單元格中的模糊軌跡的匹配度的下界大于這個最小值時,訪問單元格的過程終止。步驟4)找出步驟幻中所有模糊軌跡和查詢軌跡之間的匹配度的上界中的最小值。對于任意一條已經(jīng)被訪問到的模糊軌跡I,如果I和查詢軌跡之間的匹配度的下界大于該最小值,模糊軌跡X是不合格的模糊軌跡,不可能成為查詢的結(jié)果,所以被剪枝掉;如果 I和查詢軌跡之間的匹配度的下界小于或等于該最小值,模糊軌跡I可能成為查詢的結(jié)果, 將會被放入一個候選答案集合中。步驟幻中計算步驟4)中的候選答案集合中的每一個候選模糊軌跡和查詢軌跡之間的匹配度。如果一個候選模糊軌跡和查詢軌跡之間的匹配度是所有候選模糊軌跡中最大的,則該候選模糊軌跡成為真正的查詢結(jié)果。
權(quán)利要求
1.一種最匹配模糊軌跡問題的查詢方法,其特征在于采用以下步驟實現(xiàn)1)利用網(wǎng)格方法將值域空間劃分成多個單元格,并利用所有單元格的邊界將每一個模糊軌跡劃分為軌跡片段;2)在步驟1)中的每一個單元格內(nèi)建立一個一維的時間索引;3)在查詢處理時,依此訪問步驟1)中的所有單元格,并計算每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界;4)利用步驟幻中的每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界,對不合格的模糊軌跡進行剪枝,從而得到一個候選答案集合;5)計算步驟4)中的候選答案集合中的每一個候選模糊軌跡和查詢軌跡之間的匹配度,并判斷每一個候選模糊軌跡是否為真正的查詢結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種最匹配模糊軌跡問題的查詢方法,其特征在于步驟1) 利用網(wǎng)格方法將值域空間劃分成多個單元格;所有單元格的邊界將每一個模糊軌跡劃分成了軌跡片段;每一個軌跡片段獨立位于一個單元格內(nèi);每一個軌跡片段還對應(yīng)一個時間區(qū)間,即為該軌跡片段處于相應(yīng)單元格內(nèi)的時間段。
3.根據(jù)權(quán)利要求1所述的一種最匹配模糊軌跡問題的查詢方法,其特征在于步驟2) 為步驟1)中得到每一個單元格,建立一個一維的時間索引,用來索引處于該單元格內(nèi)的所有軌跡片段的時間區(qū)間。
4.根據(jù)權(quán)利要求1所述的一種最匹配模糊軌跡問題的查詢方法,其特征在于步驟3) 中依此訪問步驟1)中的單元格,以及單元格中的軌跡片段,計算每一個模糊軌跡和查詢軌跡之間匹配度的上界和下界。
5.根據(jù)權(quán)利要求1所述的一種最匹配模糊軌跡問題的查詢方法,其特征在于步驟4) 中找出步驟幻中所有模糊軌跡和查詢軌跡之間的匹配度的上界中的最小值;然后,如果一個模糊軌跡和查詢軌跡之間的匹配度的下界大于該最小值,則該模糊軌跡是不合格的模糊軌跡,將被剪枝掉。
6.根據(jù)權(quán)利要求1所述的一種最匹配模糊軌跡問題的查詢方法,其特征在于步驟5) 中計算步驟4)中的候選答案集合中的每一個候選模糊軌跡和查詢軌跡之間的匹配度;如果一個候選模糊軌跡和查詢軌跡之間的匹配度是所有候選模糊軌跡中最大的,則該候選模糊軌跡成為真正的查詢結(jié)果。
全文摘要
本發(fā)明公開了一種最匹配模糊軌跡問題的查詢方法。該方法發(fā)明了一種新的匹配度衡量標準來衡量模糊軌跡之間的匹配程度。該方法先將值域空間劃分成一系列的單元格,然后在每一個單元格內(nèi)建立一個時間索引。在處理匹配查詢時,該方法首先訪問索引結(jié)構(gòu),計算每個模糊軌跡和查詢軌跡之間匹配度的上界和下界;然后利用該上界和下界對不合格的模糊軌跡進行剪枝,從而得到一個候選答案集合;最后該方法計算每一個候選模糊軌跡的精確的匹配度,并判斷該模糊軌跡是否是真正的查詢結(jié)果。本發(fā)明充分利用了數(shù)據(jù)庫和信息檢索的現(xiàn)有研究和實現(xiàn)成果,基于已有的空間數(shù)據(jù)查詢方法的擴展和融合可以非常方便快捷的提供最匹配模糊軌跡問題的查詢能力,提供最好的性能。
文檔編號G06F17/30GK102567497SQ20111043713
公開日2012年7月11日 申請日期2011年12月23日 優(yōu)先權(quán)日2011年12月23日
發(fā)明者壽黎但, 胡天磊, 陳剛, 陳珂, 馬春洋 申請人:浙江大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1