的軌跡相似度,將所有 結(jié)果寫入所述S4。
[0112] 最后應(yīng)該說(shuō)明的是,以上僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制。盡管對(duì)本發(fā)明 進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者 等同替換,都不脫離本發(fā)明技術(shù)方案的精神和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍 當(dāng)中。
【主權(quán)項(xiàng)】
1. 一種基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于,所述方法包括: (1) 軌跡組織與篩選步驟,用于去除無(wú)效冗余數(shù)據(jù); (2) 點(diǎn)伴隨計(jì)算步驟,用于維護(hù)中間點(diǎn)伴隨結(jié)果集; (3) 軌跡相似性判定,用于統(tǒng)計(jì)并計(jì)算車輛軌跡相似度,獲得具有相似性軌跡的伴隨車 輛對(duì)。
2. 根據(jù)權(quán)利要求1所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 其中所述的軌跡組織與篩選步驟,利用一種軌跡鏈表結(jié)構(gòu)存儲(chǔ)處理過(guò)程中涉及的車輛識(shí)別 數(shù)據(jù),該步驟通過(guò)三級(jí)流水線的第一級(jí)完成,是一個(gè)MapReduce計(jì)算作業(yè),輸入海量車牌識(shí) 別數(shù)據(jù)集,輸出結(jié)果是軌跡鏈表集合1,并傳遞給第二級(jí)流水線使用。
3. 根據(jù)權(quán)利要求1所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的點(diǎn)伴隨計(jì)算步驟,用于獲得中間點(diǎn)伴隨結(jié)果集;該步驟利用所述的軌跡鏈表集合1 的第一級(jí)的計(jì)算結(jié)果,通過(guò)三級(jí)流水線的第二級(jí)完成,是另一個(gè)MapReduce作業(yè)的實(shí)現(xiàn),輸 入所述的軌跡鏈表結(jié)構(gòu)1,輸出結(jié)果是軌跡鏈表集合2,并傳遞給第三級(jí)流水線使用。
4. 根據(jù)權(quán)利要求1所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的軌跡相似性判定步驟,用于計(jì)算車輛軌跡相似度,獲得具有相似軌跡的伴隨車輛對(duì); 該步驟利用所述的軌跡鏈表集合2的第二級(jí)的計(jì)算結(jié)果,通過(guò)三級(jí)流水線的第三級(jí)完成, 是又一個(gè)MapReduce作業(yè)的實(shí)現(xiàn),輸入所述的軌跡鏈表結(jié)構(gòu)2,輸出結(jié)果是軌跡鏈表集合3, 并最終寫入文件系統(tǒng)或數(shù)據(jù)庫(kù)。
5. 根據(jù)權(quán)利要求1所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的海量車牌識(shí)別數(shù)據(jù)集用L表示,是指受測(cè)路網(wǎng)上各監(jiān)測(cè)點(diǎn)捕獲的所有車輛信息數(shù) 據(jù);每條車牌識(shí)別數(shù)據(jù)1eL可表示為其中Vi表示車牌號(hào)碼(可唯一標(biāo)識(shí)一個(gè)車 輛),4表示車輛Vi經(jīng)過(guò)監(jiān)測(cè)點(diǎn)nk;進(jìn)一步,
其中%J表示車輛經(jīng)過(guò)的監(jiān)測(cè) 點(diǎn)nk的地理位置,〖表示車輛經(jīng)過(guò)監(jiān)測(cè)點(diǎn)nk的時(shí)間。
6. 根據(jù)權(quán)利要求1所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的車輛軌跡用h表示,是車輛v1在一個(gè)時(shí)間范圍內(nèi)按時(shí)間順序經(jīng)過(guò)的一組監(jiān)測(cè)點(diǎn)序 列;進(jìn)一步,心可以表示為:&
其中,對(duì)任意P〈q,有;心中 包含的監(jiān)測(cè)點(diǎn)數(shù)目稱為軌跡的長(zhǎng)度,記為li。
7. 根據(jù)權(quán)利要求3所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的點(diǎn)伴隨用simJvpVj)表示,是指兩個(gè)車輛vJPVj在一定時(shí)間閾值8 t內(nèi)先后經(jīng)過(guò)某 監(jiān)測(cè)點(diǎn)\且其滿足以下條件的一種關(guān)系
;在一定時(shí)間范圍內(nèi)經(jīng)過(guò)同一 監(jiān)測(cè)點(diǎn)的兩個(gè)車輛在該監(jiān)測(cè)點(diǎn)僅可能存在一次點(diǎn)伴隨關(guān)系。
8. 根據(jù)權(quán)利要求4所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 通過(guò)軌跡相似度判定相似軌跡;軌跡相似度是指兩條車輛軌跡的相似程度,用sirnDUi, 表示;進(jìn)一步,
嗔中l(wèi)i和1j分別為車輛i和車輛j軌跡長(zhǎng)度,m為 所述兩輛車途經(jīng)具有點(diǎn)伴隨關(guān)系的監(jiān)測(cè)點(diǎn)數(shù)目。
9. 根據(jù)權(quán)利要求4所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的車輛軌跡^和車輛軌跡h為相似軌跡,是指給定軌跡相似度閾值Sd、軌跡長(zhǎng)度閾值 Si和在時(shí)間范圍dur內(nèi),t肩t馮同時(shí)滿足以下兩個(gè)條件的軌跡對(duì): (1)軌跡心和t」的相似度simD(ti,tj)彡8 d; ⑵軌跡&和t』的軌跡長(zhǎng)度1 >Sp1#S
10. 根據(jù)權(quán)利要求1所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述方法中獲取相似軌跡的計(jì)算,可以按照權(quán)利要求5- 9的描述,設(shè)定不同參數(shù)的閾值用 于限定計(jì)算條件,避免較短車輛軌跡作為相似軌跡的誤判,并對(duì)無(wú)效數(shù)據(jù)進(jìn)行過(guò)濾;具體如 下: 假設(shè)給定點(diǎn)伴隨時(shí)間閾值St、軌跡相似度閾值Sd和軌跡長(zhǎng)度閾值Si,利用已有車牌 識(shí)別數(shù)據(jù)集L,找出在給定的時(shí)間范圍dur內(nèi)所有符合所述定義的車輛相似軌跡集合ST; 具體的
11. 根據(jù)權(quán)利要求2所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的第一級(jí)流水線MapReduce作業(yè)過(guò)程,對(duì)車輛軌跡長(zhǎng)度小于給定軌跡長(zhǎng)度閾值的進(jìn)行 刪除,并進(jìn)一步建立所有車輛的軌跡鏈表;具體的,可以進(jìn)一步分解為以下兩步: (1)Map任務(wù)從文件系統(tǒng)中分片讀取車牌識(shí)別數(shù)據(jù),獲得給定時(shí)間范圍dur的車牌識(shí)別 數(shù)據(jù);所述車牌識(shí)別數(shù)據(jù)按監(jiān)測(cè)時(shí)間劃分?jǐn)?shù)據(jù)分片;所述Map任務(wù)將車牌識(shí)別數(shù)據(jù)記錄轉(zhuǎn) 換為以車牌號(hào)為鍵、以時(shí)間和監(jiān)測(cè)點(diǎn)為值的數(shù)據(jù)項(xiàng);相同鍵的數(shù)據(jù)項(xiàng)將發(fā)送至同一Reduce 任務(wù); (2)Reduce任務(wù)將車牌識(shí)別數(shù)據(jù)按車牌號(hào)組織為車輛軌跡鏈表,形成所述時(shí)間范圍 dur內(nèi)的軌跡;所述Reduce任務(wù)對(duì)每個(gè)車輛軌跡鏈表判斷長(zhǎng)度,刪除小于軌跡長(zhǎng)度閾值Si 的鏈表,將其余符合條件的軌跡作為所述的軌跡鏈表集合1輸出。
12. 根據(jù)權(quán)利要求3所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的第二級(jí)流水線MapReduce作業(yè)過(guò)程可以分為如下兩步: (1)Map任務(wù)讀取第一級(jí)作業(yè)的結(jié)果,轉(zhuǎn)換為監(jiān)測(cè)點(diǎn)為鍵、監(jiān)測(cè)時(shí)間和車牌號(hào)為值的數(shù) 據(jù)項(xiàng),傳遞給Reduce任務(wù);相同鍵的數(shù)據(jù)項(xiàng)將發(fā)送至同一Reduce任務(wù); (2)Reduce任務(wù)將同一監(jiān)測(cè)點(diǎn)的數(shù)據(jù)項(xiàng)組織為一個(gè)過(guò)車鏈表,形成數(shù)個(gè)所述的過(guò)車鏈 表;所述Reduce任務(wù)按照監(jiān)測(cè)時(shí)間先后排序和計(jì)算點(diǎn)伴隨,輸出滿足點(diǎn)伴隨關(guān)系的結(jié)果數(shù) 據(jù)項(xiàng);所述結(jié)果數(shù)據(jù)項(xiàng)包含兩車的車牌號(hào)、伴隨時(shí)間范圍和各自軌跡長(zhǎng)度。
13. 根據(jù)權(quán)利要求12所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在 于,所述的點(diǎn)伴隨計(jì)算,是按如下方式進(jìn)行的: (1) 獲取未處理的過(guò)車鏈表,從表頭開(kāi)始獲取數(shù)據(jù)項(xiàng)1 ; (2) 若數(shù)據(jù)項(xiàng)1存在未掃描的后續(xù)數(shù)據(jù)項(xiàng)2,標(biāo)記數(shù)據(jù)項(xiàng)2為已掃描,判斷兩個(gè)數(shù)據(jù)項(xiàng) 1和數(shù)據(jù)項(xiàng)2所含時(shí)間屬性之差是否小于時(shí)間閾值:如果滿足閾值,輸出數(shù)據(jù)項(xiàng)1包含的車 牌號(hào)1和數(shù)據(jù)項(xiàng)2包含的車牌號(hào)2組合為鍵,伴隨時(shí)間范圍為值,轉(zhuǎn)(2);如果不滿足閾值, 轉(zhuǎn)⑵; (3) 若數(shù)據(jù)項(xiàng)1不存在未掃描的后續(xù),如果數(shù)據(jù)項(xiàng)1不是所述鏈表最后一項(xiàng),則將數(shù)據(jù) 項(xiàng)1的直接后續(xù)數(shù)據(jù)項(xiàng)標(biāo)記為數(shù)據(jù)項(xiàng)1,轉(zhuǎn)(2);如果數(shù)據(jù)項(xiàng)1是所述鏈表最后一項(xiàng),則標(biāo)記 該鏈表已處理,轉(zhuǎn)(1)。
14. 根據(jù)權(quán)利要求4所述的基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法,其特征在于, 所述的的第三級(jí)流水線MapReduce作業(yè)過(guò)程可以分為如下兩步: (1)Map任務(wù)讀取第二級(jí)流水線MapReduce作業(yè)輸出的結(jié)果,車牌號(hào)組合相同數(shù)據(jù)將發(fā) 送至同一Reduce任務(wù)處理; (2)Reduce任務(wù)對(duì)車牌號(hào)組合進(jìn)行計(jì)數(shù),也即形成兩輛的點(diǎn)伴隨關(guān)系計(jì)數(shù);計(jì)算所述 兩輛車的軌跡相似度,輸出滿足相似度閾值的結(jié)果數(shù)據(jù)項(xiàng);所述結(jié)果數(shù)據(jù)項(xiàng),以所述兩輛車 的車牌號(hào)鍵,以伴隨時(shí)間范圍、點(diǎn)伴隨次數(shù)和軌跡相似度為值。
15. -種基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘裝置,其特征在于,包含如下部件: (1) 數(shù)據(jù)存儲(chǔ)模塊:該模塊與數(shù)據(jù)讀取劃分模塊、數(shù)據(jù)分塊計(jì)算模塊和相似軌跡計(jì)算 模塊相連接,采用分布式文件系統(tǒng)架構(gòu);該模塊存放海量車牌識(shí)別數(shù)據(jù)、作業(yè)的中間數(shù)據(jù)和 結(jié)果、路網(wǎng)監(jiān)測(cè)點(diǎn)基礎(chǔ)數(shù)據(jù)和相似軌跡挖掘最終結(jié)果; (2) 數(shù)據(jù)讀取劃分模塊:該模塊與數(shù)據(jù)存儲(chǔ)模塊、數(shù)據(jù)分塊計(jì)算模塊相連接,用于軌跡 組織與篩選;該模塊讀取數(shù)據(jù)存儲(chǔ)模塊中的海量車牌識(shí)別數(shù)據(jù),按監(jiān)測(cè)點(diǎn)劃分去除無(wú)效冗 余數(shù)據(jù),將滿足要求的各分塊的數(shù)據(jù)子集傳給數(shù)據(jù)分塊計(jì)算模塊進(jìn)行計(jì)算; (3) 數(shù)據(jù)分塊計(jì)算模塊:該模塊與數(shù)據(jù)存儲(chǔ)模塊、數(shù)據(jù)讀取劃分模塊相連接,接收數(shù)據(jù) 讀取劃分模塊的分塊數(shù)據(jù)子集,用于點(diǎn)伴隨計(jì)算;計(jì)算結(jié)果存入數(shù)據(jù)存儲(chǔ)模塊的中間結(jié)果 集; (4) 相似軌跡計(jì)算模塊:該模塊與數(shù)據(jù)存儲(chǔ)模塊、人機(jī)交互接口相連接,用于軌跡相似 性計(jì)算及判定;該模塊根據(jù)人機(jī)交互接口傳遞的參數(shù),讀取數(shù)據(jù)分塊計(jì)算模塊存入數(shù)據(jù)存 儲(chǔ)模塊的中間結(jié)果集,計(jì)算獲得具有相似軌跡的車輛對(duì),并將結(jié)果返回人機(jī)交互接口; (5) 人機(jī)交互接口 :此模塊與相似軌跡算模塊相連接,該模塊為用戶提供交互界面,支 持用戶輸入計(jì)算參數(shù),所述參數(shù)包括軌跡長(zhǎng)度閾值,點(diǎn)伴隨時(shí)間閾值,相似度閾值以及時(shí)間 范圍;所述參數(shù)將傳遞給相似軌跡計(jì)算模塊,所述人機(jī)交互接口接收所述相似軌跡計(jì)算模 塊的計(jì)算結(jié)果,并將該計(jì)算結(jié)果在所述交互界面中的地圖中為用戶呈現(xiàn)。
【專利摘要】本發(fā)明公開(kāi)了一種基于海量車牌識(shí)別數(shù)據(jù)的相似軌跡挖掘方法及裝置。該方法包括軌跡組織與篩選、點(diǎn)伴隨關(guān)系計(jì)算、軌跡相似性判定三個(gè)主要步驟;本發(fā)明克服海量數(shù)據(jù)集下計(jì)算響應(yīng)時(shí)間滯后問(wèn)題,基于車牌識(shí)別數(shù)據(jù)分析提高了計(jì)算的準(zhǔn)確度,使用Hadoop MapReduce分布式處理方式提高計(jì)算效率,高效快速挖掘相似軌跡,可以用于交通業(yè)務(wù)領(lǐng)域的伴隨車輛的發(fā)現(xiàn)。
【IPC分類】G06K9-62, G06F17-30
【公開(kāi)號(hào)】CN104778245
【申請(qǐng)?zhí)枴緾N201510167058
【發(fā)明人】丁維龍, 趙卓峰, 盧帥, 張帥, 韓燕波
【申請(qǐng)人】北方工業(yè)大學(xué)
【公開(kāi)日】2015年7月15日
【申請(qǐng)日】2015年4月9日