亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種路網(wǎng)移動對象概率聚集查詢方法及系統(tǒng)與流程

文檔序號:12121876閱讀:184來源:國知局
一種路網(wǎng)移動對象概率聚集查詢方法及系統(tǒng)與流程
本發(fā)明涉及時空數(shù)據(jù)管理
技術(shù)領(lǐng)域
,特別涉及一種路網(wǎng)移動對象概率聚集查詢方法及系統(tǒng)。
背景技術(shù)
:大數(shù)據(jù)計算模式是指根據(jù)大數(shù)據(jù)的不同數(shù)據(jù)特征和計算特征,從多樣性的大數(shù)據(jù)計算問題和需求中提煉并建立的各種高層抽象和模型。大數(shù)據(jù)的計算模式主要分為批處理計算模式和流處理計算模式,批處理計算模式是在對數(shù)據(jù)進(jìn)行存儲的基礎(chǔ)上進(jìn)行處理,而流處理計算模式則直接在內(nèi)存中完成,更多的依賴于內(nèi)存中的數(shù)據(jù)摘要結(jié)構(gòu)。路網(wǎng)移動對象的聚集查詢是一種典型的流處理計算模式,但實際數(shù)據(jù)采樣過程中由于數(shù)據(jù)存儲、設(shè)備盲區(qū)、能源節(jié)約和設(shè)備耗損等原因,路網(wǎng)移動對象定位設(shè)備的采樣頻率無法達(dá)到排除不確定數(shù)據(jù)影響的密集采樣程度,連續(xù)采樣間移動對象的位置存在不確定性,如果需要按時空條件查詢某條道路的車輛聚集值就必須帶有概率屬性。這種情況下,單一的流處理計算模式并不能保證聚集查詢的精準(zhǔn)性,因此設(shè)計基于混合式大數(shù)據(jù)計算模式的概率聚集查詢系統(tǒng),將流處理和批處理計算模式相結(jié)合,對數(shù)據(jù)訪問方法進(jìn)行有針對性的優(yōu)化,在兼顧移動對象軌跡不確定性和位置數(shù)據(jù)體量極大性前提下提供精準(zhǔn)、實時的移動對象聚集查詢變得尤為重要。路網(wǎng)非歐氏空間移動對象聚集查詢通常使用數(shù)據(jù)流近似處理技術(shù)解決問題。sketch技術(shù)是計算機(jī)領(lǐng)域處理數(shù)據(jù)流的一種常用近似處理技術(shù)。Tao等人(TaoY,KolliosG,ConsidineJ,LiFandPapadiasD.Spatio-TemporalAggregationUsingSketches[C].ProceedingsoftheInternationalConferenceonDataEngineering,2004:214-226.)將aRB-tree結(jié)合sketch技術(shù),提出利用OR運(yùn)算解決移動對象時空間重復(fù)計數(shù)問題。但是sketch技術(shù)針對歐氏空間移動對象的聚集查詢,對于路網(wǎng)這類非歐氏空間的移動車輛聚集查詢不能直接使用;其次,sketch技術(shù)本身存在sketch數(shù)量與移動對象數(shù)量不一致問題,容易產(chǎn)生較大的查詢誤差。Feng等人(FengJ.,LuC.andWangY.SketchRR-tree:aspatio-temporalaggregationindexfornetwork-constrainedmovingobjects[C].ProceedingsofInternationalConferenceonInnovativeComputing,InformationandControl,Dalian:IEEE,2008:4-7.)將Sketch技術(shù)結(jié)合RR-tree提出了適用于路網(wǎng)的Sketch-RR-tree,在此基礎(chǔ)上結(jié)合AMH動態(tài)劃分思想,提出了DynSketch索引結(jié)構(gòu)。此后在AMH基礎(chǔ)上又將改進(jìn)版本AMH*和AMH+與sketch技術(shù)結(jié)合,保證查詢時間和查詢誤差優(yōu)勢下顯著減少了存儲空間。但是單純使用數(shù)據(jù)流近似處理技術(shù)未考慮路網(wǎng)移動對象基于采樣頻率的不確定性,確定數(shù)據(jù)以概要數(shù)據(jù)結(jié)構(gòu)形式存儲在內(nèi)存中,而必須通過查詢時間前后確定數(shù)據(jù)推導(dǎo)的不確定數(shù)據(jù)無法獲取,查詢精度得不到保證。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于提供一種路網(wǎng)移動對象概率聚集查詢方法及系統(tǒng),能夠?qū)⒋鎯σ苿訉ο髠€體軌跡的批處理技術(shù)融入到路網(wǎng)數(shù)據(jù)流近似聚集查詢中,以提高查詢精度。為實現(xiàn)上述目的,本發(fā)明提供一種路網(wǎng)移動對象概率聚集查詢方法,所述方法包括:對定位設(shè)備獲取的采樣數(shù)據(jù)分別進(jìn)行流處理和批處理;其中,進(jìn)行流處理后的數(shù)據(jù)中包括預(yù)設(shè)參數(shù)的sketch值;根據(jù)批處理后的采樣數(shù)據(jù)構(gòu)建支持不確定數(shù)據(jù)獲取的時空索引,并將流處理后的sketch值記錄于索引結(jié)點(diǎn)項中;根據(jù)所述時空索引,構(gòu)建基于自適應(yīng)多維直方圖的非重復(fù)計數(shù)聚集索引結(jié)構(gòu),所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中包括至少一個桶bucket;獲取用戶的查詢請求,并在所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中查找與所述查詢請求中的查詢區(qū)域相交的所有目標(biāo)bucket;確定各個所述目標(biāo)bucket對應(yīng)的sketch數(shù)量,并根據(jù)各個所述目標(biāo)bucket的面積以及相交區(qū)域的面積,確定所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量;基于所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量,設(shè)置所述查詢區(qū)域?qū)?yīng)的sketch生成器,以獲取所述查詢區(qū)域中各個路段中的移動對象,并生成所述查詢區(qū)域中各個路段對應(yīng)的sketch值;將所述查詢區(qū)域中各個路段對應(yīng)的sketch值進(jìn)行或運(yùn)算,得到所述查詢區(qū)域的全局sketch值,并將所述全局sketch值轉(zhuǎn)換為與所述查詢請求相對應(yīng)的移動車輛的近似聚集值。進(jìn)一步地,對定位設(shè)備獲取的采樣數(shù)據(jù)進(jìn)行流處理具體包括:以路段為單位設(shè)置sketch生成器,通過所述sketch生成器對獲取的所述采樣數(shù)據(jù)進(jìn)行近似處理,以生成單位路段單位時刻的車輛聚集sketch值;對定位設(shè)備獲取的采樣數(shù)據(jù)進(jìn)行批處理具體包括:將獲取的所述采樣數(shù)據(jù)存入數(shù)據(jù)庫。進(jìn)一步地,構(gòu)建基于自適應(yīng)多維直方圖的非重復(fù)計數(shù)聚集索引結(jié)構(gòu)具體包括:將路網(wǎng)劃分為多個柵格單元,其中每個柵格單元對應(yīng)一個路段,各個路段與表征該路段移動車輛sketch值的頻率值相關(guān)聯(lián);對各個頻率值進(jìn)行聚類運(yùn)算,以將所述多個柵格單元劃分為至少一個桶bucket,其中,各個bucket中包含的頻率值處于一個聚類集中;建立與劃分后的所述至少一個bucket相對應(yīng)的二叉樹索引,所述二叉樹索引中的每個葉結(jié)點(diǎn)對應(yīng)一個bucket;將劃分后的所述至少一個bucket寫入內(nèi)存,并對所述至少一個bucket保持更新、合并和分裂,以使得歷史bucket從內(nèi)存轉(zhuǎn)存至數(shù)據(jù)庫中。進(jìn)一步地,按照下述公式確定各個所述目標(biāo)bucket對應(yīng)的sketch數(shù)量:y=0.747978﹒x0.708563其中,y表示查詢過程中各個目標(biāo)bucket中移動對象的數(shù)量,x表示查詢過程中各個目標(biāo)bucket對應(yīng)的sketch數(shù)量。進(jìn)一步地,按照下述公式確定所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量:其中,M表示所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量,bi表示第i個目標(biāo)bucket,qR表示所述查詢區(qū)域,mi表示第i個目標(biāo)bucket中sketch數(shù)量,RqRi表示所述查詢區(qū)域與第i個目標(biāo)bucket相交的面積,Ri表示第i個目標(biāo)bucket的面積。進(jìn)一步地,獲取所述查詢區(qū)域中各個路段中的移動對象具體包括:利用Hadoop開源平臺構(gòu)建支持路網(wǎng)移動對象概率范圍查詢的時空索引結(jié)構(gòu);根據(jù)用戶的查詢請求,分析時間、空間和概率查詢條件;根據(jù)時間查詢條件進(jìn)行時間剪枝,以縮小候選集范圍,判斷輸入的數(shù)據(jù)是確定數(shù)據(jù)還是不確定數(shù)據(jù);若是確定數(shù)據(jù)則根據(jù)所述時空索引結(jié)構(gòu),將空間維度結(jié)合時間維度索引,依據(jù)時間維度索引葉結(jié)點(diǎn)項中的OID與RowKey_TimeStamp唯一確定移動對象;若是不確定數(shù)據(jù)則基于Hadoop的移動對象查詢進(jìn)行并行處理。進(jìn)一步地,利用Hadoop開源平臺構(gòu)建支持路網(wǎng)移動對象概率范圍查詢的時空索引結(jié)構(gòu)具體包括:采用并行多級k路劃分技術(shù)將路網(wǎng)劃分為考慮路段連接關(guān)系的索引基本單元;以路段最大限速下的最短時間作為時間權(quán)重形成各索引基本單元的最短時間矩陣,以構(gòu)建路網(wǎng)索引結(jié)構(gòu);構(gòu)建路網(wǎng)移動對象多維時空索引結(jié)構(gòu),并實現(xiàn)索引的并行創(chuàng)建。為實現(xiàn)上述目的,本發(fā)明另一方面還提供一種路網(wǎng)移動對象概率聚集查詢系統(tǒng),所述系統(tǒng)與定位設(shè)備相連,所述系統(tǒng)包括:數(shù)據(jù)處理單元,用于對定位設(shè)備獲取的采樣數(shù)據(jù)分別進(jìn)行流處理和批處理;其中,進(jìn)行流處理后的數(shù)據(jù)中包括預(yù)設(shè)參數(shù)的sketch值;時空索引構(gòu)建單元,用于根據(jù)批處理后的采樣數(shù)據(jù)構(gòu)建支持不確定數(shù)據(jù)獲取的時空索引,并將流處理后的sketch值記錄于索引結(jié)點(diǎn)項中;非重復(fù)計數(shù)聚集索引構(gòu)建單元,用于根據(jù)所述時空索引,構(gòu)建基于自適應(yīng)多維直方圖的非重復(fù)計數(shù)聚集索引結(jié)構(gòu),所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中包括至少一個桶bucket;查詢請求處理單元,用于獲取用戶的查詢請求,并在所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中查找與所述查詢請求中的查詢區(qū)域相交的所有目標(biāo)bucket;sketch數(shù)量確定單元,用于確定各個所述目標(biāo)bucket對應(yīng)的sketch數(shù)量,并根據(jù)各個所述目標(biāo)bucket的面積以及相交區(qū)域的面積,確定所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量;移動對象獲取單元,用于基于所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量,設(shè)置所述查詢區(qū)域?qū)?yīng)的sketch生成器,以獲取所述查詢區(qū)域中各個路段中的移動對象,并生成所述查詢區(qū)域中各個路段對應(yīng)的sketch值;聚集值確定單元,用于將所述查詢區(qū)域中各個路段對應(yīng)的sketch值進(jìn)行或運(yùn)算,得到所述查詢區(qū)域的全局sketch值,并將所述全局sketch值轉(zhuǎn)換為與所述查詢請求相對應(yīng)的移動車輛的近似聚集值。進(jìn)一步地,所述數(shù)據(jù)處理單元具體包括:近似處理模塊,用于以路段為單位設(shè)置sketch生成器,通過所述sketch生成器對獲取的所述采樣數(shù)據(jù)進(jìn)行近似處理,以生成單位路段單位時刻的車輛聚集sketch值;數(shù)據(jù)存儲模塊,用于將獲取的所述采樣數(shù)據(jù)存入數(shù)據(jù)庫。進(jìn)一步地,所述非重復(fù)計數(shù)聚集索引構(gòu)建單元具體包括:柵格單元劃分模塊,用于將路網(wǎng)劃分為多個柵格單元,其中每個柵格單元對應(yīng)一個路段,各個路段與表征該路段移動車輛sketch值的頻率值相關(guān)聯(lián);桶劃分模塊,用于對各個頻率值進(jìn)行聚類運(yùn)算,以將所述多個柵格單元劃分為至少一個桶bucket,其中,各個bucket中包含的頻率值處于一個聚類集中;二叉樹索引建立模塊,用于建立與劃分后的所述至少一個bucket相對應(yīng)的二叉樹索引,所述二叉樹索引中的每個葉結(jié)點(diǎn)對應(yīng)一個bucket;數(shù)據(jù)更新模塊,用于將劃分后的所述至少一個bucket寫入內(nèi)存,并對所述至少一個bucket保持更新、合并和分裂,以使得歷史bucket從內(nèi)存轉(zhuǎn)存至數(shù)據(jù)庫中。由上可見,本發(fā)明基于混合式大數(shù)據(jù)計算模式處理定位設(shè)備采樣的海量位置數(shù)據(jù),構(gòu)建支持不確定數(shù)據(jù)獲取的索引結(jié)構(gòu)和非重復(fù)計數(shù)聚集索引結(jié)構(gòu),提出了sketch合適化機(jī)制,通過概率范圍查詢獲取特定路段特定時間范圍移動對象的不確定數(shù)據(jù),結(jié)合數(shù)據(jù)流處理技術(shù)實現(xiàn)了移動對象的概率聚集查詢。本發(fā)明實現(xiàn)了對采樣頻率導(dǎo)致的軌跡不確定路網(wǎng)移動對象聚集查詢精度與效率的提高。附圖說明圖1是本申請中路網(wǎng)移動對象概率聚集查詢方法的流程圖;圖2是本申請中考慮數(shù)據(jù)不確定性的數(shù)據(jù)處理模型示意圖;圖3是本申請中桶劃分的示意圖;圖4是本申請中二叉樹索引示意圖;圖5是本申請中路網(wǎng)移動對象概率聚集查詢系統(tǒng)的功能模塊圖。具體實施方式為了使本
技術(shù)領(lǐng)域
的人員更好地理解本申請中的技術(shù)方案,下面將結(jié)合本申請實施方式中的附圖,對本申請實施方式中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施方式僅僅是本申請一部分實施方式,而不是全部的實施方式?;诒旧暾堉械膶嵤┓绞?,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施方式,都應(yīng)當(dāng)屬于本申請保護(hù)的范圍。請參閱圖1,本申請?zhí)峁┮环N路網(wǎng)移動對象概率聚集查詢方法,所述方法包括以下步驟。步驟S1:對定位設(shè)備獲取的采樣數(shù)據(jù)分別進(jìn)行流處理和批處理;其中,進(jìn)行流處理后的數(shù)據(jù)中包括預(yù)設(shè)參數(shù)的sketch值。在本實施方式中,對采樣數(shù)據(jù)進(jìn)行流處理可以指:以路段為單位設(shè)置sketch生成器,通過所述sketch生成器對獲取的所述采樣數(shù)據(jù)進(jìn)行近似處理,以生成單位路段單位時刻的車輛聚集sketch值。對采樣數(shù)據(jù)進(jìn)行批處理可以指:直接將獲取的所述采樣數(shù)據(jù)存入數(shù)據(jù)庫。在本實施方式中,路網(wǎng)移動對象概率聚集查詢?nèi)绻耆A魯?shù)據(jù)流中所有確定數(shù)據(jù)和不確定數(shù)據(jù),隨著時間的延續(xù)必然會導(dǎo)致系統(tǒng)崩潰。如圖2所示,在采樣頻率低前提下,本發(fā)明保留定位設(shè)備采集的基于時間的離散位置值,而不確定數(shù)據(jù)則利用路網(wǎng)移動對象概率范圍查詢,借助存儲下來的相關(guān)采樣數(shù)據(jù)獲取,考慮到此時不確定數(shù)據(jù)占據(jù)數(shù)據(jù)流的主要部分,數(shù)據(jù)量巨大,因此對查詢得到的不確定數(shù)據(jù)并不進(jìn)行存儲,直接與前面保留的采樣數(shù)據(jù)一起通過近似處理技術(shù)得到概要數(shù)據(jù),最終獲得符合精度要求的近似聚集查詢結(jié)果。步驟S2:根據(jù)批處理后的采樣數(shù)據(jù)構(gòu)建支持不確定數(shù)據(jù)獲取的時空索引,并將流處理后的sketch值記錄于索引結(jié)點(diǎn)項中。在本實施方式中,時空索引的空間維度為考慮路段鄰接關(guān)系和時間屬性的路網(wǎng)索引結(jié)構(gòu),葉結(jié)點(diǎn)子圖中每條路段設(shè)計一個一維時間B+-tree索引,B+-tree索引統(tǒng)一用上層時間粒度TID索引下層時間粒度tID,在原有結(jié)點(diǎn)項基礎(chǔ)上增加sketch的處理信息和歷史bucket的標(biāo)識,為后續(xù)非重復(fù)計數(shù)聚集索引方便快捷地獲取每個柵格中的sketch值。步驟S3:根據(jù)所述時空索引,構(gòu)建基于自適應(yīng)多維直方圖的非重復(fù)計數(shù)聚集索引結(jié)構(gòu),所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中包括至少一個桶bucket。在本實施方式中,步驟S3可以通過以下幾個子步驟來完成。步驟S31:將路網(wǎng)劃分為多個柵格單元,其中每個柵格單元對應(yīng)一個路段,各個路段與表征該路段移動車輛sketch值的頻率值相關(guān)聯(lián);具體地,可以實例化路網(wǎng)環(huán)境:將路網(wǎng)劃分為ω﹒ω個規(guī)則的柵格單元,每個柵格c對應(yīng)一個路段,頻率Fc表示路段c中移動車輛的sketch值。本發(fā)明考慮將道路的兩個方向統(tǒng)一,路網(wǎng)劃分為ω﹒ω個規(guī)則的柵格單元,現(xiàn)實中相同道路的兩個方向往往會存在完全不同的車流量情況,解決該問題的方法只需將空間劃分為ω﹒2ω個規(guī)則的柵格單元,一個路段用相鄰的兩列分別表示該路段一個方向的頻率Fc,同樣用sketch表示,然后在bucket信息中增加一個方向值direction。對direction的設(shè)定如下:(1)移動對象如果從路段左邊進(jìn)入,則direction=0;(2)移動對象如果從路段右邊進(jìn)入,則direction=1;(3)如果路段為垂直方向,則規(guī)定移動對象從底部進(jìn)入direction=0,從頂部進(jìn)入direction=1。步驟S32:對各個頻率值進(jìn)行聚類運(yùn)算,以將所述多個柵格單元劃分為至少一個桶bucket,其中,各個bucket中包含的頻率值處于一個聚類集中;在本實施方式中,可以將Fc相互接近的相鄰單元劃分到同一個bucket中,并計算各個bucket的頻率。如圖3所示,本發(fā)明中bucket定義為規(guī)則的矩形,每個bucket中的柵格c不重疊,因此bucket也不重疊。劃分后的bucket數(shù)量n相較之前的柵格數(shù)量ω2要小的多。請參閱表1和表2,任一bucketbk(1≤k≤n)可以表示為一個八元向量(Rk,nk,fk,gk,vk,mk,skk,lifespan[ls,le))。目標(biāo)是使所有bucket的vk總和(weightedvariancesum,WVS)最小,即最小化。bucket所覆蓋的柵格數(shù)nk可以通過面積比由Rk﹒ω2得到,因此所有桶的WVS都能夠通過Rk、fk和gk計算得到。表1bucket八元向量表示表2bucket的信息bkRknkfkgkvkmkskklifespanb1[x1,x2],[y4,y5]415/457/43/165s11[2,now)b2[x3,x4],[y4,y5]424/4144/402s21[3,now)b3[x1,x2],[y2,y3]430/4226/44/167s31[4,now)b4[x3,x4],[y4,y5]416/464/402s41[4,now)b5[x1,x4],[y1,y1]423/4133/43/165s51[3,now)b6[x5,x5],[y1,y5]515/545/502s61[4,now)步驟S33:建立與劃分后的所述至少一個bucket相對應(yīng)的二叉樹索引(BinaryPartitionTree,BPT),所述二叉樹索引中的每個葉結(jié)點(diǎn)對應(yīng)一個bucket。本發(fā)明通過建立二叉樹索引當(dāng)前時刻劃分好的bucket,如圖4所示,每個葉結(jié)點(diǎn)對應(yīng)一個bk,中間結(jié)點(diǎn)是包含左右孩子結(jié)點(diǎn)表示bucket的矩形區(qū)域。處理當(dāng)前概率聚集查詢的時候可以通過遍歷二叉樹來查找到與查詢區(qū)域相交的bucket,縮小計算范圍。當(dāng)前時刻bucket的le均表示為now,表示該bucket由BPT索引。步驟S34:將劃分后的所述至少一個bucket寫入內(nèi)存,并對所述至少一個bucket保持更新、合并和分裂,以使得歷史bucket從內(nèi)存轉(zhuǎn)存至數(shù)據(jù)庫中。具體地,可以將當(dāng)前bucket直接存儲在內(nèi)存,隨著bucket的更新、合并和分裂等維護(hù)操作,歷史bucket從內(nèi)存轉(zhuǎn)存至數(shù)據(jù)庫。本發(fā)明中采樣位置數(shù)據(jù)的不斷更新,各個柵格c的sketch不斷變化,導(dǎo)致bucket的更新、合并和分裂,不斷形成新的bucket。當(dāng)前bucket直接存儲在內(nèi)存方便頻繁的實時查詢;當(dāng)一個bucket在le時刻被更新,則認(rèn)為其超過了lifespan[ls,le),那么該bucket就成為歷史bucket,將由內(nèi)存轉(zhuǎn)存至磁盤數(shù)據(jù)庫中,系統(tǒng)只保留八元向量中的四元(Rk,mk,skk,lifespan[ls,le)),空間維度按Rk中最左上角的柵格,即路段,時間維度按le,即bucket終結(jié)時間,在支持不確定數(shù)據(jù)獲取的時空索引相應(yīng)路段與相應(yīng)時刻建立歷史bucket索引。步驟S4:獲取用戶的查詢請求,并在所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中查找與所述查詢請求中的查詢區(qū)域相交的所有目標(biāo)bucket;步驟S5:確定各個所述目標(biāo)bucket對應(yīng)的sketch數(shù)量,并根據(jù)各個所述目標(biāo)bucket的面積以及相交區(qū)域的面積,確定所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量。具體地,可以依據(jù)sketch合適化機(jī)制來確定所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量。本發(fā)明中sketch合適化的目的是使sketch數(shù)量和待查詢移動對象數(shù)量之間能夠達(dá)到實時的動態(tài)協(xié)調(diào),提高路網(wǎng)移動對象概率聚集查詢精度。具體的講,就是當(dāng)查詢區(qū)域的路段上移動車輛數(shù)量較多時,能夠自動采用較多數(shù)量的sketch進(jìn)行概率聚集查詢;而當(dāng)查詢區(qū)域的路段上移動車輛數(shù)量較少時,能夠自動采用較少數(shù)量sketch進(jìn)行概率聚集查詢。概率聚集查詢過程中涉及sketch合適化的部分主要是:(1)bucket劃分階段,每個bucket的合適sketch數(shù)量計算;(2)查詢階段,查詢區(qū)域的合適sketch數(shù)量計算。每個bucket的合適sketch數(shù)量計算:通過最好擬合曲線來確立路網(wǎng)移動對象數(shù)量和采用sketch數(shù)量。最終的擬合曲線通過最小二乘法獲得:y=0.747978﹒x0.708563式1其中x為聚集查詢過程中采用的sketch數(shù)量,y為對應(yīng)移動對象的數(shù)量。查詢區(qū)域qR的合適sketch數(shù)量M計算:假設(shè)bi為與qR相交的各個bucket,mi為bi的sketch數(shù)量,RqRi為qR與bi相交面積,Ri為相交bi的面積,那么M的值為大于各個bucket內(nèi)由面積比獲得的sketch數(shù)量之和的最小整數(shù),定義M如下:在一個具體例子中,假設(shè)由式1已經(jīng)計算好當(dāng)前時刻的bucket中的mk,利用式2對qR區(qū)域的sketch合適化步驟S6:基于所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量,設(shè)置所述查詢區(qū)域?qū)?yīng)的sketch生成器,以獲取所述查詢區(qū)域中各個路段中的移動對象,并生成所述查詢區(qū)域中各個路段對應(yīng)的sketch值。在本實施方式中,獲取所述查詢區(qū)域中各個路段中的移動對象具體包括:步驟S61:利用Hadoop開源平臺構(gòu)建支持路網(wǎng)移動對象概率范圍查詢的時空索引結(jié)構(gòu);步驟S62:根據(jù)用戶的查詢請求,分析時間、空間和概率查詢條件;步驟S63:根據(jù)時間查詢條件進(jìn)行時間剪枝,以縮小候選集范圍,判斷輸入的數(shù)據(jù)是確定數(shù)據(jù)還是不確定數(shù)據(jù);步驟S64:若是確定數(shù)據(jù)則根據(jù)所述時空索引結(jié)構(gòu),將空間維度結(jié)合時間維度索引,依據(jù)時間維度索引葉結(jié)點(diǎn)項中的OID與RowKey_TimeStamp唯一確定移動對象。步驟S65:若是不確定數(shù)據(jù)則基于Hadoop的移動對象查詢進(jìn)行并行處理。其中,利用Hadoop開源平臺構(gòu)建支持路網(wǎng)移動對象概率范圍查詢的時空索引結(jié)構(gòu)具體包括:步驟S611:采用并行多級k路劃分技術(shù)將路網(wǎng)劃分為考慮路段連接關(guān)系的索引基本單元;步驟S612:以路段最大限速下的最短時間作為時間權(quán)重形成各索引基本單元的最短時間矩陣,以構(gòu)建路網(wǎng)索引結(jié)構(gòu);步驟S613:構(gòu)建路網(wǎng)移動對象多維時空索引結(jié)構(gòu),并實現(xiàn)索引的并行創(chuàng)建。在本實施方式中,路網(wǎng)索引結(jié)構(gòu)作為多維時空索引結(jié)構(gòu)的空間索引部分用以解決路徑查詢,本發(fā)明考慮查詢用時間約束進(jìn)行路段選擇,因此索引結(jié)點(diǎn)鄰接矩陣值采用路段限速行駛下的最短時間,葉結(jié)點(diǎn)矩陣中用最短時間值記錄子圖包含的所有內(nèi)邊路段,行、列為對應(yīng)子圖的所有頂點(diǎn);中間結(jié)點(diǎn)矩陣中用最短時間值記錄子圖涉及的所有外邊路段,行、列為其孩子結(jié)點(diǎn)的所有邊界頂點(diǎn)。本發(fā)明中多維時空索引結(jié)構(gòu)將路網(wǎng)索引結(jié)構(gòu)作為空間維度,將針對一維時間的B+-tree結(jié)構(gòu)作為時間維度,查詢進(jìn)行中逐步記錄下結(jié)點(diǎn)邊界頂點(diǎn)間路徑以Region表形式保存,達(dá)到間接索引部分不確定數(shù)據(jù),提高查詢效率目的。步驟S7:將所述查詢區(qū)域中各個路段對應(yīng)的sketch值進(jìn)行或運(yùn)算,得到所述查詢區(qū)域的全局sketch值,并將所述全局sketch值轉(zhuǎn)換為與所述查詢請求相對應(yīng)的移動車輛的近似聚集值。本發(fā)明采用Flajolet和Martin提出的將概率計數(shù)和隨機(jī)平均相結(jié)合的FM_PCSA算法(TaoY,KolliosG,ConsidineJ,LiFandPapadiasD.Spatio-TemporalaggregationusingSketches[C].ProceedingsoftheInternationalConferenceonDataEngineering,2004:214-226.)將所述全局sketch值轉(zhuǎn)換為與所述查詢請求相對應(yīng)的移動車輛的近似數(shù)量值。FM_PCSA算法采用m張獨(dú)立的sketch,每張sketch由r位組成,初始時m﹒r位均設(shè)為0。對移動對象數(shù)據(jù)集DS中的每一個OID,首先采用第一個隨機(jī)函數(shù)h1為其選擇一張sketchsi(1≤i≤m),然后采用另一個隨機(jī)函數(shù)h2將si的第h2(OID)位置為1,當(dāng)DS中所有OID處理結(jié)束后,對m張sketch中第一個還是0的那位k1,k2,…,km求平均值,那么可求移動對象數(shù)據(jù)集DS中不同的移動對象數(shù)目n為:FM_PCSA算法中的第二個隨機(jī)函數(shù)h2以對象標(biāo)識OID作為輸入,輸出整數(shù)h2(OID),h2(OID)滿足:對于v≥1,Prob[h2(OID)=v]=2-v。即輸出的h2(OID)為1的概率為0.5,為2的概率為0.25,為3的概率為0.125,…,以此類推。本發(fā)明還提供一種路網(wǎng)移動對象概率聚集查詢系統(tǒng),請參閱圖5,所述系統(tǒng)可以包括:數(shù)據(jù)處理單元100,用于對定位設(shè)備獲取的采樣數(shù)據(jù)分別進(jìn)行流處理和批處理;其中,進(jìn)行流處理后的數(shù)據(jù)中包括預(yù)設(shè)參數(shù)的sketch值;時空索引構(gòu)建單元200,用于根據(jù)批處理后的采樣數(shù)據(jù)構(gòu)建支持不確定數(shù)據(jù)獲取的時空索引,并將流處理后的sketch值記錄于索引結(jié)點(diǎn)項中;非重復(fù)計數(shù)聚集索引構(gòu)建單元300,用于根據(jù)所述時空索引,構(gòu)建基于自適應(yīng)多維直方圖的非重復(fù)計數(shù)聚集索引結(jié)構(gòu),所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中包括至少一個桶bucket;查詢請求處理單元400,用于獲取用戶的查詢請求,并在所述非重復(fù)計數(shù)聚集索引結(jié)構(gòu)中查找與所述查詢請求中的查詢區(qū)域相交的所有目標(biāo)bucket;sketch數(shù)量確定單元500,用于確定各個所述目標(biāo)bucket對應(yīng)的sketch數(shù)量,并根據(jù)各個所述目標(biāo)bucket的面積以及相交區(qū)域的面積,確定所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量;移動對象獲取單元600,用于基于所述查詢區(qū)域?qū)?yīng)的sketch數(shù)量,設(shè)置所述查詢區(qū)域?qū)?yīng)的sketch生成器,以獲取所述查詢區(qū)域中各個路段中的移動對象,并生成所述查詢區(qū)域中各個路段對應(yīng)的sketch值;聚集值確定單元700,用于將所述查詢區(qū)域中各個路段對應(yīng)的sketch值進(jìn)行或運(yùn)算,得到所述查詢區(qū)域的全局sketch值,并將所述全局sketch值轉(zhuǎn)換為與所述查詢請求相對應(yīng)的移動車輛的近似聚集值。在本申請一個實施方式中,所述數(shù)據(jù)處理單元100具體包括:近似處理模塊,用于以路段為單位設(shè)置sketch生成器,通過所述sketch生成器對獲取的所述采樣數(shù)據(jù)進(jìn)行近似處理,以生成單位路段單位時刻的車輛聚集sketch值;數(shù)據(jù)存儲模塊,用于將獲取的所述采樣數(shù)據(jù)存入數(shù)據(jù)庫。在本申請一個實施方式中,所述非重復(fù)計數(shù)聚集索引構(gòu)建單元300具體包括:柵格單元劃分模塊,用于將路網(wǎng)劃分為多個柵格單元,其中每個柵格單元對應(yīng)一個路段,各個路段與表征該路段移動車輛sketch值的頻率值相關(guān)聯(lián);桶劃分模塊,用于對各個頻率值進(jìn)行聚類運(yùn)算,以將所述多個柵格單元劃分為至少一個桶bucket,其中,各個bucket中包含的頻率值處于一個聚類集中;二叉樹索引建立模塊,用于建立與劃分后的所述至少一個bucket相對應(yīng)的二叉樹索引,所述二叉樹索引中的每個葉結(jié)點(diǎn)對應(yīng)一個bucket;數(shù)據(jù)更新模塊,用于將劃分后的所述至少一個bucket寫入內(nèi)存,并對所述至少一個bucket保持更新、合并和分裂,以使得歷史bucket從內(nèi)存轉(zhuǎn)存至數(shù)據(jù)庫中。由上可見,本發(fā)明基于混合式大數(shù)據(jù)計算模式處理定位設(shè)備采樣的海量位置數(shù)據(jù),構(gòu)建支持不確定數(shù)據(jù)獲取的索引結(jié)構(gòu)和非重復(fù)計數(shù)聚集索引結(jié)構(gòu),提出了sketch合適化機(jī)制,通過概率范圍查詢獲取特定路段特定時間范圍移動對象的不確定數(shù)據(jù),結(jié)合數(shù)據(jù)流處理技術(shù)實現(xiàn)了移動對象的概率聚集查詢。本發(fā)明實現(xiàn)了對采樣頻率導(dǎo)致的軌跡不確定路網(wǎng)移動對象聚集查詢精度與效率的提高。上面對本申請的各種實施方式的描述以描述的目的提供給本領(lǐng)域技術(shù)人員。其不旨在是窮舉的、或者不旨在將本發(fā)明限制于單個公開的實施方式。如上所述,本申請的各種替代和變化對于上述技術(shù)所屬領(lǐng)域技術(shù)人員而言將是顯而易見的。因此,雖然已經(jīng)具體討論了一些另選的實施方式,但是其它實施方式將是顯而易見的,或者本領(lǐng)域技術(shù)人員相對容易得出。本申請旨在包括在此已經(jīng)討論過的本發(fā)明的所有替代、修改、和變化,以及落在上述申請的精神和范圍內(nèi)的其它實施方式。本說明書中的各個實施方式均采用遞進(jìn)的方式描述,各個實施方式之間相同相似的部分互相參見即可,每個實施方式重點(diǎn)說明的都是與其他實施方式的不同之處。雖然通過實施方式描繪了本申請,本領(lǐng)域普通技術(shù)人員知道,本申請有許多變形和變化而不脫離本申請的精神,希望所附的權(quán)利要求包括這些變形和變化而不脫離本申請的精神。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1