亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于軌跡編碼的軌跡查詢方法與流程

文檔序號(hào):12034731閱讀:938來(lái)源:國(guó)知局

本發(fā)明涉及計(jì)算機(jī)大數(shù)據(jù)處理領(lǐng)域,具體為一種基于位圖的軌跡編碼的軌跡查詢方法。



背景技術(shù):

范圍查詢是分析軌跡數(shù)據(jù)的基礎(chǔ)方法,因?yàn)閼?yīng)用場(chǎng)景不同,解決范圍查詢問(wèn)題的要求和目標(biāo)也不同,例如實(shí)時(shí)監(jiān)控環(huán)境下,必須實(shí)時(shí)跟蹤、監(jiān)測(cè)某個(gè)地點(diǎn)的移動(dòng)對(duì)象,就要求方案能夠快速更新并同時(shí)支持查詢,而例如lugrid、rum-tree的解決方案,主要采取緩存實(shí)現(xiàn)延遲更新、降低磁盤(pán)讀寫(xiě)頻率來(lái)提升性能的策略。但是隨著軌跡記錄技術(shù)的成熟和軌跡數(shù)據(jù)積累的持續(xù)增長(zhǎng),范圍查詢常被用作在海量的歷史軌跡數(shù)據(jù)中提取信息、縮小分析范圍的基本方法,其他挖掘方法比如軌跡聚類、軌跡模式都需要范圍查詢提取挖掘范圍的信息,如何找到合適的查詢方案對(duì)面向軌跡的海量數(shù)據(jù)分析有重要意義。

傳統(tǒng)時(shí)空數(shù)據(jù)查詢采用r-tree索引方案,雖然r-tree結(jié)構(gòu)的索引不僅適合存儲(chǔ)點(diǎn)而且適合拓展的空間類型數(shù)據(jù)(線段、多邊形),但是r-tree結(jié)構(gòu)的索引的性能瓶頸是其內(nèi)部的最小外包矩形(mbr)隨著數(shù)據(jù)的增長(zhǎng)重疊的概率越來(lái)越高,導(dǎo)致索引失去了篩選數(shù)據(jù)范圍的效率,而且,r-tree結(jié)構(gòu)的索引存儲(chǔ)的數(shù)據(jù)維度越高,這個(gè)問(wèn)題越突出明顯。因此,優(yōu)化索引的最有效策略是減少mbr的重疊,即改善索引對(duì)數(shù)據(jù)的分區(qū)策略,在眾多的優(yōu)化方案中,r*-tree是被廣泛接受的效率最好索引版本,即使如此,隨著維度的提升其效率下跌非常明顯。

一般的時(shí)空數(shù)據(jù)數(shù)據(jù)索引,將相鄰數(shù)據(jù)放置在同一個(gè)數(shù)據(jù)分片中,最樸素的設(shè)計(jì)的方法是網(wǎng)格索引,時(shí)空數(shù)據(jù)都存入劃分出的固定大小的子空間;quad-tree增加了劃分的空間區(qū)域的層次,可以根據(jù)數(shù)據(jù)動(dòng)態(tài)調(diào)整劃分區(qū)域的大小,提升了索引的查詢效率。其他優(yōu)化時(shí)空數(shù)據(jù)索引的常見(jiàn)方案還有:減小索引更新代價(jià)、降低更新頻率、使用預(yù)測(cè)模型等方法。但是主流的時(shí)空數(shù)據(jù)索引對(duì)軌跡數(shù)據(jù)支持不佳,一般的時(shí)空數(shù)據(jù)索引以空間點(diǎn)作為索引管理的對(duì)象,缺少面向軌跡查詢問(wèn)題的優(yōu)化,而且軌跡數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模,軌跡點(diǎn)在數(shù)十億的數(shù)量級(jí),一般的空間索引查詢方案維護(hù)代價(jià)很高,整體查詢代價(jià)很大,表現(xiàn)為查詢方案的磁盤(pán)占用高、查詢速度不理想。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的是為了克服上述不足提供一種基于軌跡編碼的軌跡查詢方法。

本發(fā)明基于軌跡編碼的查詢方法,包括以下步驟:

第1步:基于軌跡的位圖編碼生成軌跡的索引結(jié)構(gòu),并持久化存儲(chǔ)到磁盤(pán);

第2步:基于軌跡的位圖編碼將范圍查詢條件轉(zhuǎn)換為位圖數(shù)據(jù);

第3步:遍歷軌跡的索引結(jié)構(gòu),基于軌跡的位圖編碼的重疊關(guān)系運(yùn)算找出符合條件的候選結(jié)果;

第4步:根據(jù)查詢條件具體需求,對(duì)候選結(jié)果使用不同的校準(zhǔn)方法對(duì)候選集進(jìn)行篩選,最終獲得符合條件的查詢結(jié)果。

所述第4步具體包括以下步驟:

第41步:對(duì)候選結(jié)果中所有軌跡的軌跡點(diǎn),當(dāng)查詢問(wèn)題是范圍查詢時(shí),根據(jù)查詢條件的空間范圍校驗(yàn)每個(gè)軌跡點(diǎn)是否符合查詢條件;當(dāng)查詢問(wèn)題是拓?fù)潢P(guān)系查詢時(shí),根據(jù)位圖編碼計(jì)算每個(gè)候選軌跡是否符合查詢條件;

第42步:對(duì)于范圍查詢,將第1步中的符合條件的結(jié)果直接作為查詢返回;對(duì)于拓?fù)潢P(guān)系查詢,將第1步中的符合條件的結(jié)果臨時(shí)存儲(chǔ),將第1步中不符合條件的結(jié)果以時(shí)空關(guān)系計(jì)算算法進(jìn)行二次計(jì)算,得到新的符合查詢條件的結(jié)果,合并兩次符合條件的結(jié)果作為查詢返回。

所述范圍查詢包括以下步驟:

第21步:對(duì)軌跡數(shù)據(jù)統(tǒng)一建立基于位圖的軌跡編碼索引;

第22步:將第21步的軌跡編碼集中存儲(chǔ),當(dāng)遇到查詢時(shí),加載到內(nèi)存;

第23步:將范圍查詢條件的空間范圍條件轉(zhuǎn)換到基于位圖的編碼數(shù)據(jù),與軌跡的編碼格式一致,得到以位圖編碼表示的空間范圍;

第24步:遍歷加載到內(nèi)存中的所有軌跡編碼,每個(gè)軌跡對(duì)應(yīng)的編碼數(shù)據(jù)與查詢條件的編碼數(shù)據(jù)進(jìn)行重疊檢測(cè)計(jì)算;

第25步:將第24步中判斷為與查詢條件重疊的對(duì)應(yīng)的軌跡存入候選集;

第26步:以范圍查詢的原始空間范圍表示校驗(yàn)第25步中候選集的空間特征,以范圍查詢的時(shí)間范圍篩選第25步中的候選集,最終返回滿足范圍查詢條件的結(jié)果。

基于軌跡的位圖編碼的編碼方法包括以下步驟:

第11步:在預(yù)設(shè)的劃分精度下,空間被劃分為多個(gè)近似網(wǎng)格形狀的子空間,每個(gè)網(wǎng)格空間得到一個(gè)唯一的標(biāo)識(shí);

第12步:將一條軌跡拆分成連續(xù)的軌跡段,逐個(gè)對(duì)所述軌跡段進(jìn)行遍

歷,分別計(jì)算出與第11步中得到的網(wǎng)格空間中有共同位置關(guān)系的網(wǎng)格空間,從而得到所述軌跡對(duì)應(yīng)的一組網(wǎng)格標(biāo)識(shí)序列;對(duì)于一個(gè)所述軌跡段,找出屬于該軌跡段的所有軌跡點(diǎn),若軌跡點(diǎn)之間間隔超出劃分網(wǎng)格空間時(shí)設(shè)置的最大距離,則插入補(bǔ)充點(diǎn)使新的軌跡段能被區(qū)域包圍;根據(jù)第21步中得到的每一個(gè)軌跡點(diǎn),通過(guò)geohash算法取得該軌跡點(diǎn)在空間中的哈希編碼;

搜集軌跡段在第22步中計(jì)算得到的所有哈希編碼,轉(zhuǎn)換為全局唯一、不重復(fù)的整數(shù)標(biāo)識(shí)。

第13步:將第12步中得到的所述一組網(wǎng)格標(biāo)識(shí)序列,進(jìn)行去除重復(fù)項(xiàng)處理;

第14步:將第13步中進(jìn)行去除重復(fù)項(xiàng)處理后的一組網(wǎng)格編碼序列轉(zhuǎn)換為一個(gè)位圖格式數(shù)據(jù)。

一種基于位圖的軌跡編碼實(shí)現(xiàn)查詢經(jīng)過(guò)目標(biāo)區(qū)域的軌跡的方法,所述方法的步驟如下:

步驟001.對(duì)軌跡數(shù)據(jù)統(tǒng)一建立基于位圖的軌跡編碼索引;

步驟002.將步驟001的軌跡編碼集中存儲(chǔ),當(dāng)遇到查詢時(shí),加載到內(nèi)存;

步驟003.將范圍查詢條件的空間范圍條件轉(zhuǎn)換到基于位圖的編碼數(shù)據(jù),與軌跡的編碼格式一致,得到以位圖編碼表示的空間范圍;

步驟004.遍歷加載到內(nèi)存中的所有軌跡編碼,每個(gè)軌跡對(duì)應(yīng)的編碼數(shù)據(jù)與查詢條件的編碼數(shù)據(jù)進(jìn)行重疊檢測(cè)計(jì)算;

步驟005.將步驟004中判斷為與查詢條件重疊的對(duì)應(yīng)的軌跡存入候選集;

步驟006.將候選集中的軌跡起終點(diǎn)在查詢區(qū)域內(nèi)的軌跡剔除;

步驟007.在候選集中,計(jì)算每一個(gè)軌跡編碼的長(zhǎng)度,并計(jì)算查詢區(qū)域?qū)?yīng)的位圖編碼與軌跡編碼重疊運(yùn)算后的長(zhǎng)度;

步驟008.當(dāng)軌跡編碼長(zhǎng)度大于重疊運(yùn)算的長(zhǎng)度,將該軌跡放入暫存區(qū)域,反之,則到下一步處理;

步驟009.將步驟007返回的軌跡使用空間關(guān)系計(jì)算模型進(jìn)行校驗(yàn),得到符合查詢條件的軌跡;

步驟010.將步驟007暫存區(qū)域的軌跡和步驟008返回的軌跡合并,作為查詢返回。

由上述基本過(guò)程描述可知,基于位圖編碼的范圍查詢是面向軌跡的搜索范圍搜索,與軌跡的數(shù)量線性相關(guān),而其他面向空間點(diǎn)搜索的查詢方案,與軌跡中采樣點(diǎn)的數(shù)量線性相關(guān),由于軌跡與軌跡點(diǎn)是一對(duì)多的數(shù)量關(guān)系,本發(fā)明的軌跡查詢達(dá)到了縮小搜索空間的效果,來(lái)實(shí)現(xiàn)快速軌跡查詢。

附圖說(shuō)明

圖1為本發(fā)明流程示意圖。

具體實(shí)施方式

下面結(jié)合附圖及實(shí)施例進(jìn)一步說(shuō)明本發(fā)明。

實(shí)施例:一條軌跡可以表示為平面空間中的點(diǎn)的集合,軌跡可以看作平面中的幾何形狀,通過(guò)范圍查詢、拓?fù)潢P(guān)系查詢,判斷軌跡是否穿過(guò)某個(gè)區(qū)域,實(shí)現(xiàn)諸如統(tǒng)計(jì)車流量等應(yīng)用功能。

為統(tǒng)計(jì)得到經(jīng)過(guò)特定區(qū)域的軌跡的信息,首先需要確定軌跡的候選范圍作為候選集,再交由查詢問(wèn)題對(duì)應(yīng)的具體空間計(jì)算過(guò)程處理。范圍查詢對(duì)應(yīng)的具體空間計(jì)算內(nèi)容即判斷候選空間目標(biāo)是否滿足空間和時(shí)間的條件范圍關(guān)系,經(jīng)過(guò)特定區(qū)域這一拓?fù)潢P(guān)系對(duì)應(yīng)的具體計(jì)算內(nèi)容則需要判斷軌跡與指定區(qū)域是否滿足查詢條件所述的穿越關(guān)系。

所述范圍查詢包括以下步驟:

第21步:對(duì)軌跡數(shù)據(jù)統(tǒng)一建立基于位圖的軌跡編碼索引;

第22步:將第21步的軌跡編碼集中存儲(chǔ),當(dāng)遇到查詢時(shí),加載到內(nèi)存;

第23步:將范圍查詢條件的空間范圍條件轉(zhuǎn)換到基于位圖的編碼數(shù)據(jù),與軌跡的編碼格式一致,得到以位圖編碼表示的空間范圍;

第24步:遍歷加載到內(nèi)存中的所有軌跡編碼,每個(gè)軌跡對(duì)應(yīng)的編碼數(shù)據(jù)與查詢條件的編碼數(shù)據(jù)進(jìn)行重疊檢測(cè)計(jì)算;

第25步:將第24步中判斷為與查詢條件重疊的對(duì)應(yīng)的軌跡存入候選集;

第26步:以范圍查詢的原始空間范圍表示校驗(yàn)第25步中候選集的空間特征,以范圍查詢的時(shí)間范圍篩選第25步中的候選集,最終返回滿足范圍查詢條件的結(jié)果。

經(jīng)過(guò)以上步驟,可以確定任一范圍查詢對(duì)應(yīng)的軌跡數(shù)據(jù)集合,但要解決查找經(jīng)過(guò)查詢區(qū)域軌跡的問(wèn)題,除了要找出所有在區(qū)域范圍內(nèi)的數(shù)據(jù),還要給出一部分在區(qū)域范圍外的數(shù)據(jù),才能判斷一條軌跡是穿過(guò)查詢區(qū)域還是完全被包含在查詢區(qū)域中,或者僅僅是進(jìn)入了查詢區(qū)域等等情況。因此,作為縮小問(wèn)題數(shù)據(jù)范圍的范圍不僅要能夠返回范圍查詢區(qū)域內(nèi)部的軌跡數(shù)據(jù)點(diǎn),還要能夠返回查詢區(qū)域外的屬于對(duì)應(yīng)軌跡的軌跡點(diǎn)數(shù)據(jù),才能滿足計(jì)算幾何關(guān)系的數(shù)據(jù)條件。

面向軌跡的范圍查詢解決以上問(wèn)題有兩種處理方法:一種是返回所有落入查詢區(qū)域的軌跡段落,在將軌跡拆分成軌跡段后建立空間索引,而軌跡編碼不需要拆分軌跡為軌跡段,相比之下,將一條軌跡拆分成多個(gè)軌跡段,查詢結(jié)果返回前需要重組軌跡,盡管返回軌跡段比返回完整的軌跡產(chǎn)生的數(shù)據(jù)總量小,但是作為查詢問(wèn)題最初的數(shù)據(jù)過(guò)濾機(jī)制,返回所有落入查詢區(qū)域的軌跡段落會(huì)包含非符合條件的數(shù)據(jù),并且重組軌跡段落也需要額外的排序計(jì)算。

所述軌跡為一個(gè)連續(xù)的(x,y,t)的序列,(x,y)是空間坐標(biāo)下的點(diǎn),t是采樣時(shí)間,表示(xi,yi,ti)在ti時(shí)刻移動(dòng)物體的位置在(xi,yi),所述軌跡可以表示為trajectory=[(x1,y1,t1),....,(xi,yi,ti),....(xn,yn,tn)](t1<ti<tn);在某個(gè)時(shí)間范圍[ti,tj]內(nèi),軌跡的某一部分運(yùn)動(dòng)過(guò)程與整體運(yùn)動(dòng)過(guò)程的關(guān)系可以用子軌跡表示。

所述重疊關(guān)系運(yùn)算,是基于軌跡編碼的運(yùn)算,計(jì)算了位圖數(shù)據(jù)位運(yùn)算后的長(zhǎng)度就是兩個(gè)軌跡對(duì)應(yīng)的重疊區(qū)域的數(shù)量。當(dāng)它為0時(shí),則完全不重合,當(dāng)它不為0時(shí),就可以判斷兩個(gè)編碼相交。

所述時(shí)空關(guān)系計(jì)算,是指使用幾何關(guān)系運(yùn)算庫(kù)判斷軌跡是否與查詢區(qū)域滿足交叉關(guān)系。

所述搜索范圍,給定一個(gè)查詢范圍,存在映射函數(shù)h和一個(gè)不包含重復(fù)項(xiàng)目的編碼集合,集合中存儲(chǔ)的是映射函數(shù)的計(jì)算值,使

coveragebox=set({h|h(x,y)}),(x,y)∈querybox。

所述近似網(wǎng)格形狀的子空間為在空間坐標(biāo)系下,基于geohash算法將經(jīng)度和緯度劃分成間隔范圍一致的數(shù)值區(qū)間。

所述軌跡段為軌跡中任意相鄰兩個(gè)采樣點(diǎn)組成的軌跡段落,軌跡的采樣點(diǎn)數(shù)量是n,則所述軌跡段ts=trajecotry(i,i+1)(1≤i<n)。

一種基于位圖的軌跡編碼實(shí)現(xiàn)查詢經(jīng)過(guò)目標(biāo)區(qū)域的軌跡的方法,所述方法的步驟如下:

步驟001.對(duì)軌跡數(shù)據(jù)統(tǒng)一建立基于位圖的軌跡編碼索引;

步驟002.將步驟001的軌跡編碼集中存儲(chǔ),當(dāng)遇到查詢時(shí),加載到內(nèi)存;

步驟003.將范圍查詢條件的空間范圍條件轉(zhuǎn)換到基于位圖的編碼數(shù)據(jù),與軌跡的編碼格式一致,得到以位圖編碼表示的空間范圍;

步驟004.遍歷加載到內(nèi)存中的所有軌跡編碼,每個(gè)軌跡對(duì)應(yīng)的編碼數(shù)據(jù)與查詢條件的編碼數(shù)據(jù)進(jìn)行重疊檢測(cè)計(jì)算;

步驟005.將步驟004中判斷為與查詢條件重疊的對(duì)應(yīng)的軌跡存入候選集;

步驟006.將候選集中的軌跡起終點(diǎn)在查詢區(qū)域內(nèi)的軌跡剔除;

步驟007.在候選集中,計(jì)算每一個(gè)軌跡編碼的長(zhǎng)度,并計(jì)算查詢區(qū)域?qū)?yīng)的位圖編碼與軌跡編碼重疊運(yùn)算后的長(zhǎng)度;

步驟008.當(dāng)軌跡編碼長(zhǎng)度大于重疊運(yùn)算的長(zhǎng)度,將該軌跡放入暫存區(qū)域,反之,則到下一步處理;

步驟009.將步驟007返回的軌跡使用空間關(guān)系計(jì)算模型進(jìn)行校驗(yàn),得到符合查詢條件的軌跡;

步驟010.將步驟007暫存區(qū)域的軌跡和步驟008返回的軌跡合并,作為查詢返回。

以上步驟描述的拓?fù)潢P(guān)系查詢?cè)砗?jiǎn)單,沒(méi)有重組排序計(jì)算,它依賴范圍查詢保證候選軌跡落入查詢區(qū)域,再將候選軌跡分為兩類,一類是通過(guò)軌跡編碼可以判斷出滿足穿過(guò)查詢區(qū)域的軌跡,剩下的候選軌跡則是另一類需要繼續(xù)依賴幾何關(guān)系運(yùn)算查找的軌跡。它依靠計(jì)算代價(jià)更小的基于位圖計(jì)算的減小計(jì)算代價(jià),因?yàn)樵谕負(fù)潢P(guān)系計(jì)算時(shí),軌跡數(shù)需要轉(zhuǎn)換為幾何數(shù)據(jù)類型,需要的數(shù)據(jù)上下文越多,占用的計(jì)算資源越大,效率越低。

上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1