亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法及裝置制造方法

文檔序號(hào):6523772閱讀:308來源:國知局
一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法及裝置制造方法
【專利摘要】本發(fā)明適用于數(shù)據(jù)處理【技術(shù)領(lǐng)域】,提供了一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法及裝置,包括:分離軌跡數(shù)據(jù)中的空間信息和時(shí)間信息;將所述空間信息編碼成第一類字符,每個(gè)所述第一類字符用于表示一個(gè)地理位置;將所述時(shí)間信息編碼成第二類字符,每個(gè)所述第二類字符用于表示一段間隔時(shí)間;根據(jù)編碼成所述第一類字符的所述空間信息和編碼成所述第二類字符的所述時(shí)間信息,建立廣義后綴樹;查找所述廣義后綴樹中的頻繁子字符串;將查找出的所述頻繁子字符串轉(zhuǎn)換成頻繁子軌跡。本發(fā)明通過使用較為高效的字符串算法來處理較為復(fù)雜的多維數(shù)值數(shù)據(jù),使得整個(gè)頻繁子軌跡查找過程的計(jì)算復(fù)雜度大大降低。
【專利說明】一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于數(shù)據(jù)處理【技術(shù)領(lǐng)域】,尤其涉及一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法及裝置。
【背景技術(shù)】
[0002]軌跡數(shù)據(jù)就是時(shí)空環(huán)境下,通過對一個(gè)或者多個(gè)移動(dòng)對象運(yùn)動(dòng)過程的采樣所獲得的數(shù)據(jù)信息,包括采樣點(diǎn)位置、采樣時(shí)間、速度等,這些采樣點(diǎn)數(shù)據(jù)信息根據(jù)采樣先后順序構(gòu)成了軌跡數(shù)據(jù)。常見的軌跡數(shù)據(jù)包括車輛行駛軌跡、移動(dòng)互聯(lián)網(wǎng)用戶的旅行軌跡、移動(dòng)互聯(lián)網(wǎng)用戶的簽到軌跡,等等,海量的軌跡數(shù)據(jù)里蘊(yùn)含著豐富的信息,其頻繁子軌跡可以表現(xiàn)大多數(shù)人的行為模式及習(xí)慣,或者表現(xiàn)氣候的變化規(guī)律等。
[0003]由于軌跡數(shù)據(jù)是數(shù)值數(shù)據(jù),不能直接套用目前已相當(dāng)成熟的字符串頻繁子串的查找算法來查找軌跡數(shù)據(jù)中的頻繁子軌跡,因此,現(xiàn)有技術(shù)中大多直接對軌跡數(shù)據(jù)進(jìn)行劃分并聚類,將長度為0(n)的軌跡劃分為0(n2)個(gè)子軌跡,再對這些子軌跡進(jìn)行聚類分析來發(fā)現(xiàn)頻繁子軌跡,整個(gè)過程計(jì)算復(fù)雜度高,運(yùn)算時(shí)間長。

【發(fā)明內(nèi)容】

[0004]本發(fā)明實(shí)施例的目的在于提供一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法,旨在解決現(xiàn)有的在軌跡數(shù)據(jù)中查找頻繁子軌跡的算法計(jì)算復(fù)雜度高的問題。
[0005]本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法,包括:
[0006]分離軌跡數(shù)據(jù)中的空間信息和時(shí)間信息;
[0007]將所述空間信息編碼成第一類字符,每個(gè)所述第一類字符用于表示一個(gè)地理位置;
[0008]將所述時(shí)間信息編碼成第二類字符,每個(gè)所述第二類字符用于表示一段間隔時(shí)間;
[0009]根據(jù)編碼成所述第一類字符的所述空間信息和編碼成所述第二類字符的所述時(shí)間信息,建立廣義后綴樹;
[0010]查找所述廣義后綴樹中的頻繁子字符串;
[0011]將查找出的所述頻繁子字符串轉(zhuǎn)換成頻繁子軌跡。
[0012]本發(fā)明實(shí)施例的另一目的在于提供一種軌跡數(shù)據(jù)中的頻繁子軌跡查找裝置,包括:
[0013]分離單元,用于分離軌跡數(shù)據(jù)中的空間信息和時(shí)間信息;
[0014]第一編碼單元,用于將所述空間信息編碼成第一類字符,每個(gè)所述第一類字符用于表示一個(gè)地理位置;
[0015]第二編碼單元,用于將所述時(shí)間信息編碼成第二類字符,每個(gè)所述第二類字符用于表示一段間隔時(shí)間;
[0016]建立單元,用于根據(jù)編碼成所述第一類字符的所述空間信息和編碼成所述第二類字符的所述時(shí)間信息,建立廣義后綴樹;
[0017]查找單元,用于查找所述廣義后綴樹中的頻繁子字符串;
[0018]轉(zhuǎn)換單元,用于將查找出的所述頻繁子字符串轉(zhuǎn)換成頻繁子軌跡。
[0019]本發(fā)明實(shí)施例結(jié)合了數(shù)據(jù)挖掘技術(shù)、后綴樹算法以及非精確匹配,從而實(shí)現(xiàn)了較優(yōu)的軌跡數(shù)據(jù)中的頻繁子軌跡的查找,通過使用較為高效的字符串算法來處理較為復(fù)雜的多維數(shù)值數(shù)據(jù),使得整個(gè)頻繁子軌跡查找過程的計(jì)算復(fù)雜度大大降低。
【專利附圖】

【附圖說明】
[0020]圖1是本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找方法的實(shí)現(xiàn)流程圖;
[0021]圖2是本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找方法S102的具體實(shí)現(xiàn)流程圖;
[0022]圖3是本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找方法對空間信息進(jìn)行聚類的示意圖;
[0023]圖4是本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找方法S103的具體實(shí)現(xiàn)流程圖;
[0024]圖5是本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找方法建立的廣義后綴樹的不意圖;
[0025]圖6是本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找裝置的結(jié)構(gòu)框圖。【具體實(shí)施方式】
[0026]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0027]圖1示出了本發(fā)明實(shí)施例提供的軌跡數(shù)據(jù)中的頻繁子軌跡查找方法的實(shí)現(xiàn)流程,詳述如下:
[0028]在SlOl中,分離軌跡數(shù)據(jù)中的空間信息和時(shí)間信息。
[0029]軌跡數(shù)據(jù)中包括了空間信息和時(shí)間信息,其中,空間信息一般包括所在位置的經(jīng)度、緯度等,而時(shí)間信息通常通過unix時(shí)間戳進(jìn)行表示。
[0030]表1為一段軌跡數(shù)據(jù)的具體示例,其中,記錄的時(shí)間信息為進(jìn)入對應(yīng)的經(jīng)度及緯度的unix時(shí)間戳:
[0031]表1
[0032]
【權(quán)利要求】
1.一種軌跡數(shù)據(jù)中的頻繁子軌跡查找方法,其特征在于,包括: 分離軌跡數(shù)據(jù)中的空間信息和時(shí)間信息; 將所述空間信息編碼成第一類字符,每個(gè)所述第一類字符用于表示一個(gè)地理位置;將所述時(shí)間信息編碼成第二類字符,每個(gè)所述第二類字符用于表示一段間隔時(shí)間;根據(jù)編碼成所述第一類字符的所述空間信息和編碼成所述第二類字符的所述時(shí)間信息,建立廣乂后綴樹; 查找所述廣義后綴樹中的頻繁子字符串; 將查找出的所述頻繁子字符串轉(zhuǎn)換成頻繁子軌跡。
2.如權(quán)利要求1所述的方法,其特征在于,所述將所述空間信息編碼成第一類字符包括: 對所述空間信息進(jìn)行聚類,生成N個(gè)簇,所述N為大于I的整數(shù); 分別確定生成的每個(gè)簇所對應(yīng)的地理位置; 根據(jù)為生成的每個(gè)簇所對應(yīng)的地理位置進(jìn)行字符編碼,分別生成每個(gè)簇對應(yīng)的所述第一類字符。
3.如權(quán)利要求1所述的方法,其特征在于,所述將所述時(shí)間信息編碼成第二類字符,每個(gè)所述第二類字符用于表示一段間隔時(shí)間包括: 將所述時(shí)間信息由時(shí)間戳轉(zhuǎn)換成間隔時(shí)間; 標(biāo)準(zhǔn)化所述間隔時(shí)間; 為每個(gè)標(biāo)準(zhǔn)化后的所述間隔時(shí)間匹配第二類字符。
4.如權(quán)利要求3所述的方法,其特征在于,所述為每個(gè)標(biāo)準(zhǔn)化后的所述間隔時(shí)間匹配第二類字符包括: 確定所述標(biāo)準(zhǔn)化后的所述間隔時(shí)間所在的預(yù)設(shè)數(shù)值區(qū)間的兩個(gè)數(shù)值端點(diǎn); 將所述兩個(gè)數(shù)值端點(diǎn)分別對應(yīng)的兩個(gè)第二類字符匹配給該標(biāo)準(zhǔn)化后的所述間隔時(shí)間。
5.如權(quán)利要求1所述的方法,其特征在于,在所述建立廣義后綴樹之后,所述查找所述廣義后綴樹中的頻繁子字符串之前,所述方法還包括: 為所述廣義后綴樹中的每個(gè)節(jié)點(diǎn)增加一個(gè)計(jì)數(shù)屬性,所述計(jì)數(shù)屬性用于對該節(jié)點(diǎn)對應(yīng)的字符串在所述廣義后綴樹中出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù); 所述查找所述廣義后綴樹中的頻繁子字符串包括: 將所述廣義后綴樹中的所述計(jì)數(shù)屬性大于預(yù)設(shè)閾值的節(jié)點(diǎn)所對應(yīng)的字符串確定為所述頻繁子字符串。
6.一種軌跡數(shù)據(jù)中的頻繁子軌跡查找裝置,其特征在于,包括: 分離單元,用于分離軌跡數(shù)據(jù)中的空間信息和時(shí)間信息; 第一編碼單元,用于將所述空間信息編碼成第一類字符,每個(gè)所述第一類字符用于表示一個(gè)地理位置; 第二編碼單元,用于將所述時(shí)間信息編碼成第二類字符,每個(gè)所述第二類字符用于表示一段間隔時(shí)間; 建立單元,用于根據(jù)編碼成所述第一類字符的所述空間信息和編碼成所述第二類字符的所述時(shí)間信息,建立廣義后綴樹; 查找單元,用于查找所述廣義后綴樹中的頻繁子字符串;轉(zhuǎn)換單元,用于將查找出的所述頻繁子字符串轉(zhuǎn)換成頻繁子軌跡。
7.如權(quán)利要求6所述的裝置,其特征在于,所述第一編碼單元包括: 聚類子單元,用于對所述空間信息進(jìn)行聚類,生成N個(gè)簇,所述N為大于I的整數(shù); 確定子單元,用于分別確定生成的每個(gè)簇所對應(yīng)的地理位置; 編碼子單元,用于根據(jù)為生成的每個(gè)簇所對應(yīng)的地理位置進(jìn)行字符編碼,分別生成每個(gè)簇對應(yīng)的所述第一類字符。
8.如權(quán)利要求6所述的裝置,其特征在于,所述第二編碼單元包括: 轉(zhuǎn)換子單元,用于將所述時(shí)間信息由時(shí)間戳轉(zhuǎn)換成間隔時(shí)間; 標(biāo)準(zhǔn)化子單元,用于標(biāo)準(zhǔn)化所述間隔時(shí)間; 匹配子單元,用于為每個(gè)標(biāo)準(zhǔn)化后的所述間隔時(shí)間匹配第二類字符。
9.如權(quán)利要求8所述的裝置,其特征在于,所述匹配子單元具體用于: 確定所述標(biāo)準(zhǔn)化后的所述間隔時(shí)間所在的預(yù)設(shè)數(shù)值區(qū)間的兩個(gè)數(shù)值端點(diǎn); 將所述兩個(gè)數(shù)值端點(diǎn)分別對應(yīng)的兩個(gè)第二類字符匹配給該標(biāo)準(zhǔn)化后的所述間隔時(shí)間。
10.如權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 增加單元,用于為所述廣義后綴樹中的每個(gè)節(jié)點(diǎn)增加一個(gè)計(jì)數(shù)屬性,所述計(jì)數(shù)屬性用于對該節(jié)點(diǎn)對應(yīng)的字符串在所述廣義后綴樹中出現(xiàn)的次數(shù)進(jìn)行計(jì)數(shù); 所述查找單元具體用 于: 將所述廣義后綴樹中的所述計(jì)數(shù)屬性大于預(yù)設(shè)閾值的節(jié)點(diǎn)所對應(yīng)的字符串確定為所述頻繁子字符串。
【文檔編號(hào)】G06F17/30GK103744861SQ201310687107
【公開日】2014年4月23日 申請日期:2013年12月12日 優(yōu)先權(quán)日:2013年12月12日
【發(fā)明者】黃鑫, 羅軍 申請人:深圳先進(jìn)技術(shù)研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1