一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及高速公路信息化管理系統(tǒng),特別是從高速公路運(yùn)營所產(chǎn)生的大量計(jì)算 機(jī)數(shù)據(jù)中使用數(shù)據(jù)分析與挖掘手段找出車輛逃費(fèi)行為數(shù)據(jù)分析方法。
【背景技術(shù)】
[0002] 現(xiàn)代高速公路管理中,逃費(fèi)行為造成經(jīng)濟(jì)損失,同時(shí)破壞正常的運(yùn)營秩序,帶來安 全隱患。我國高速公路迅猛發(fā)展20余年來,車輛逃費(fèi)的手段日趨多樣,其中換卡逃費(fèi)易于 操作且作案隱蔽,難于查處。傳統(tǒng)管理模式下,查處換卡逃費(fèi)車輛主要有以下手段:(1)現(xiàn) 場人工盤查,即收費(fèi)站作業(yè)員依據(jù)經(jīng)驗(yàn)盤查可疑車輛。(2)后臺(tái)數(shù)據(jù)人工檢視,使用SQL, EXCEL等手段定期(如每月)對(duì)營運(yùn)數(shù)據(jù)進(jìn)行人工抽查和判讀,從而追繳逃款或建立預(yù)警名 單,輔助現(xiàn)場盤查。
[0003] 傳統(tǒng)方法在當(dāng)下高速公路管理信息化的建設(shè)中有著諸多局限。首先,憑借人員的 經(jīng)驗(yàn)對(duì)可疑車輛現(xiàn)場盤查缺乏統(tǒng)一的標(biāo)準(zhǔn),水平良莠不齊,精準(zhǔn)度不高。其次,人工盤查與 后臺(tái)數(shù)據(jù)檢視往往耗時(shí)耗力,效率低下。再者,后臺(tái)數(shù)據(jù)分析存在操作上的難度,如:出入口 車牌匹配率低,數(shù)據(jù)量非常龐大,預(yù)編卡發(fā)放導(dǎo)致的無車牌記錄,佐證信息少。
[0004] 在車輛逃費(fèi)規(guī)模日益擴(kuò)大,而同時(shí)人工查處的手段和效率又無法有效治理的現(xiàn)狀 與困局下,
【發(fā)明內(nèi)容】
[0005] 發(fā)明目的:本發(fā)明所要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于數(shù) 據(jù)分析與挖掘的查處高速公路換卡逃費(fèi)行為的方法。
[0006] 為了解決上述技術(shù)問題,本發(fā)明公開了一種針對(duì)高速公路換卡逃費(fèi)行為數(shù)據(jù)分析 與挖掘的方法,包括以下步驟:
[0007] 步驟1,采集所需數(shù)據(jù),包括:用于逃費(fèi)分析的收費(fèi)記錄數(shù)據(jù)以及用于抽取照片取 證分析結(jié)果的路段卡口數(shù)據(jù)和服務(wù)區(qū)卡口數(shù)據(jù),收費(fèi)記錄數(shù)據(jù)記為數(shù)據(jù)集S,路段卡口數(shù)據(jù) 和服務(wù)區(qū)卡口數(shù)據(jù)記為數(shù)據(jù)集K ;收費(fèi)記錄數(shù)據(jù)包含各收費(fèi)站出入車輛進(jìn)收費(fèi)站和出收費(fèi) 站的時(shí)間戳、車輛出入收費(fèi)站被拍照識(shí)別的車牌記錄(即車牌圖像),路段卡口數(shù)據(jù)包含路 段卡口(即安裝在高速公路路面上對(duì)指定車道內(nèi)機(jī)動(dòng)車進(jìn)行不間斷自動(dòng)檢測(cè)和記錄的裝 置,例如設(shè)置休息區(qū)進(jìn)出口以及一些特定位置進(jìn)行超速抓拍的裝置)對(duì)過往車輛抓拍后所 識(shí)別的車牌號(hào)及原始影像數(shù)據(jù),服務(wù)區(qū)卡口數(shù)據(jù)包含服務(wù)區(qū)卡口對(duì)出入服務(wù)區(qū)車輛抓拍后 所識(shí)別的車牌號(hào)及原始影像數(shù)據(jù);
[0008] 步驟2,對(duì)數(shù)據(jù)集S中的記錄數(shù)據(jù)進(jìn)行預(yù)處理,并檢測(cè)是否符合要求;刪除不符合 要求的記錄數(shù)據(jù),保留符合要求的記錄數(shù)據(jù);
[0009] 步驟3,計(jì)算步驟2數(shù)據(jù)集S保留的記錄數(shù)據(jù)中車輛出入收費(fèi)站被拍照識(shí)別的車牌 記錄之間的Levenshitein距離,并追加到每條記錄數(shù)據(jù)末尾,保存為新數(shù)據(jù)集S 1;
[0010] 步驟4,對(duì)數(shù)據(jù)集S1的全部記錄數(shù)據(jù)按照不同的Levenshtein距離大小進(jìn)行頻度 分析,獲得頻度分布直方圖;
[0011] 步驟5,基于步驟4的頻度分布直方圖,使用大津算法求出最大類間方差時(shí)的分割 閾值T ;
[0012] 步驟6,使用步驟5求出的閾值T,對(duì)步驟3獲得的數(shù)據(jù)集51進(jìn)行分割,將 Levenshtein距離大于閾值T的記錄數(shù)據(jù)保存為數(shù)據(jù)集S2;
[0013] 步驟7,對(duì)數(shù)據(jù)集S2進(jìn)行匹配查找,找到疑似換卡記錄對(duì),結(jié)果儲(chǔ)存為數(shù)據(jù)集S 3;
[0014] 步驟8,對(duì)數(shù)據(jù)集S3中的記錄按照各收費(fèi)站出入車輛的車輛出入時(shí)間戳、車輛出入 收費(fèi)站被拍照識(shí)別的車牌記錄在數(shù)據(jù)集K中查找是否存在對(duì)應(yīng)記錄,若存在對(duì)應(yīng)記錄,則 提取對(duì)應(yīng)路段卡口和服務(wù)區(qū)卡口的原始影像數(shù)據(jù)。
[0015] 至此疑似換卡逃費(fèi)的車牌和行駛記錄以及影像證據(jù)均已獲得。
[0016] 本發(fā)明步驟2中的預(yù)處理方法是刪除數(shù)據(jù)集S中不能被分析的記錄數(shù)據(jù),判斷方 法是若數(shù)據(jù)集S中的車牌記錄不全或缺失,即判定車牌是無效車牌并刪除該條記錄數(shù)據(jù)。
[0017] 本發(fā)明步驟2中的預(yù)處理方法包含刪除數(shù)據(jù)集S中正常通行的車輛記錄數(shù)據(jù),判 斷方法是若車輛出入收費(fèi)站被拍照識(shí)別的車牌記錄相符,則刪除該條記錄數(shù)據(jù)。
[0018] 本發(fā)明步驟7中所述對(duì)數(shù)據(jù)集S2進(jìn)行的匹配查找是基于容錯(cuò)換卡模型進(jìn)行的兩 兩匹配查找,方法如下:S i, 分別是數(shù)據(jù)集S2中第i條和第j條收費(fèi)記錄數(shù)據(jù),收費(fèi)記錄數(shù) 據(jù)Si, 同時(shí)滿足以下條件時(shí),判定S 1與\為一對(duì)疑似換卡記錄數(shù)據(jù):
【主權(quán)項(xiàng)】
1. 一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,其特征在于,包括以下步驟: 步驟1,采集所需數(shù)據(jù),包括:用于逃費(fèi)分析的收費(fèi)記錄數(shù)據(jù)以及用于抽取照片取證分 析結(jié)果的路段卡口數(shù)據(jù)和服務(wù)區(qū)卡口數(shù)據(jù),收費(fèi)記錄數(shù)據(jù)記為數(shù)據(jù)集S,路段卡口數(shù)據(jù)和服 務(wù)區(qū)卡口數(shù)據(jù)記為數(shù)據(jù)集K ;收費(fèi)記錄數(shù)據(jù)包含各收費(fèi)站出入車輛進(jìn)收費(fèi)站和出收費(fèi)站的 時(shí)間戳、車輛出入收費(fèi)站被拍照識(shí)別的車牌記錄,路段卡口數(shù)據(jù)包含路段卡口對(duì)過往車輛 抓拍后所識(shí)別的車牌號(hào)及原始影像數(shù)據(jù),服務(wù)區(qū)卡口數(shù)據(jù)包含服務(wù)區(qū)卡口對(duì)出入服務(wù)區(qū)車 輛抓拍后所識(shí)別的車牌號(hào)及原始影像數(shù)據(jù); 步驟2,對(duì)數(shù)據(jù)集S中的記錄數(shù)據(jù)進(jìn)行預(yù)處理,并檢測(cè)是否符合要求;刪除不符合要求 的記錄數(shù)據(jù),保留符合要求的記錄數(shù)據(jù); 步驟3,計(jì)算步驟2數(shù)據(jù)集S保留的記錄數(shù)據(jù)中車輛出入收費(fèi)站被拍照識(shí)別的車牌記錄 之間的Levenshitein距離,并追加到每條記錄數(shù)據(jù)末尾,保存為新數(shù)據(jù)集S1; 步驟4,對(duì)數(shù)據(jù)集S1的全部記錄數(shù)據(jù)按照不同的Levenshtein距離大小進(jìn)行頻度分析, 獲得頻度分布直方圖; 步驟5,基于步驟4的頻度分布直方圖,使用大津算法求出最大類間方差時(shí)的分割閾值 T ; 步驟6,使用步驟5求出的閾值T,對(duì)步驟3獲得的數(shù)據(jù)集51進(jìn)行分割,將Levenshtein 距離大于閾值T的記錄數(shù)據(jù)保存為數(shù)據(jù)集S2; 步驟7,對(duì)數(shù)據(jù)集S2進(jìn)行匹配查找,找到疑似換卡記錄對(duì),結(jié)果儲(chǔ)存為數(shù)據(jù)集S 3; 步驟8,對(duì)數(shù)據(jù)集&中的記錄按照各收費(fèi)站出入車輛的車輛出入時(shí)間戳、車輛出入收費(fèi) 站被拍照識(shí)別的車牌記錄在數(shù)據(jù)集K中查找是否存在對(duì)應(yīng)記錄,若存在對(duì)應(yīng)記錄,則提取 對(duì)應(yīng)路段卡口和服務(wù)區(qū)卡口的原始影像數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,其特征在于,步 驟2中的預(yù)處理方法是刪除數(shù)據(jù)集S中不能被分析的記錄數(shù)據(jù),判斷方法是若數(shù)據(jù)集S中 的車牌記錄不全或缺失,即判定車牌是無效車牌并刪除該條記錄數(shù)據(jù)。
3. 根據(jù)權(quán)利要求2所述的一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,其特征在于,步 驟2中的預(yù)處理方法包含刪除數(shù)據(jù)集S中正常通行的車輛記錄數(shù)據(jù),判斷方法是若車輛出 入收費(fèi)站被拍照識(shí)別的車牌記錄相符,則刪除該條記錄數(shù)據(jù)。
4. 根據(jù)權(quán)利要求1所述的一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,其特征在于,步 驟7中所述對(duì)數(shù)據(jù)集S2進(jìn)行的匹配查找是基于容錯(cuò)換卡模型進(jìn)行的兩兩匹配查找,方法如 下:Si, 別是數(shù)據(jù)集S 2中第i條和第j條收費(fèi)記錄數(shù)據(jù),收費(fèi)記錄數(shù)據(jù)S i,同時(shí)滿足 以下條件時(shí),判定31與\為一對(duì)疑似換卡記錄數(shù)據(jù): ^KPen) ~ ^KPex)八 ^KPex) ~ ^KPenJ (1) sKtbn) ^ sKten) ^ Si(TEX) V sKten) ^ sKtbn) ^ Si(TEX) (2) 其中,Pen和P EX分別為車輛進(jìn)收費(fèi)站和出收費(fèi)站的車牌號(hào),T EN和T EX分別為車輛進(jìn)收費(fèi) 站和出收費(fèi)站的時(shí)間戳,·和·%hi分別為數(shù)據(jù)集S2中第i條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn) 收費(fèi)站和出收費(fèi)站的車牌號(hào),分別為第j條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站 和出收費(fèi)站的車牌號(hào),和分別為數(shù)據(jù)集S2中第i條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收 費(fèi)站和出收費(fèi)站的時(shí)間戳,^σ£)ν)和·%7·βχ)分別為數(shù)據(jù)集S2中第j條收費(fèi)記錄數(shù)據(jù)中車輛 進(jìn)收費(fèi)站和出收費(fèi)站的時(shí)間戳。
5. 根據(jù)權(quán)利要求1所述的一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,其特征在于,步 驟7中所述對(duì)數(shù)據(jù)集S2進(jìn)行的匹配查找是基于容錯(cuò)換卡模型進(jìn)行的兩兩匹配查找,方法如 下:Si, 別是數(shù)據(jù)集s 2中第i條和第j條收費(fèi)記錄數(shù)據(jù),收費(fèi)記錄數(shù)據(jù)s i,同時(shí)滿足 以下條件時(shí),判定31與\為一對(duì)疑似換卡記錄數(shù)據(jù): sKTen) ^ sKTen) ^ sJ(Tex) V SKTbn) < SKTen) < Si(jEx) (3) levisi(fEN),sj(fEX{)S AT Λ levisi'(j>EX、,Sj(尸 en))SAT (4) 其中,Pen和P EN分別為車輛進(jìn)收費(fèi)站和出收費(fèi)站的車牌號(hào),T EN和T EX分別為車輛進(jìn)收費(fèi) 站和出收費(fèi)站的時(shí)間戳,和4(pMy分別為數(shù)據(jù)集S2中第i條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn) 收費(fèi)站和出收費(fèi)站的車牌號(hào),分別為第j條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站 和出收費(fèi)站的車牌號(hào),分別為數(shù)據(jù)集S2中第i條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收 費(fèi)站和出收費(fèi)站的時(shí)間戳,分別為數(shù)據(jù)集S 2中第j條收費(fèi)記錄數(shù)據(jù)中車輛 進(jìn)收費(fèi)站和出收費(fèi)站的時(shí)間戳為第i條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站 的車牌號(hào)Pen和第j條收費(fèi)記錄數(shù)據(jù)中車輛出收費(fèi)站的車牌號(hào)P EX之間的Levenshtein距 離,為第i條收費(fèi)記錄數(shù)據(jù)中車輛出收費(fèi)站的車牌號(hào)ρΕχ和第j條收費(fèi) 記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站的車牌號(hào)P en之間的Levenshtein距離,Δ T的值等于大津算法所 求出的閾值,若-(5,:(^>5/(^〇和^(^(^ >%^;)的值不大于八1',則51與5』為一對(duì) 疑似換卡記錄。
6. 根據(jù)權(quán)利要求1所述的一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,其特征在于,步 驟7中所述對(duì)數(shù)據(jù)集&進(jìn)行的匹配查找是基于改良換卡模型,對(duì)數(shù)據(jù)集S 2編制哈希表,以 哈希檢索法對(duì)數(shù)據(jù)集S2進(jìn)行匹配查找,方法如下:S i,分別是數(shù)據(jù)集S2中第i條和第j條 收費(fèi)記錄數(shù)據(jù),收費(fèi)記錄數(shù)據(jù)Si, Sj茜足以下條件時(shí),判定S 1與\為一對(duì)疑似換卡記錄數(shù) 據(jù): leviSi{PEN)>Sj(^Ex)) =〇Λ lev{SD,SKPEN{) S AT 或 (5) lev(^SiQ,EXySjQ,EN-)) - 0 Λ ?6ν{β?^ΡΕΝ')Α(βΕχ^) S AT 其中,Pen和Pb(分別為車輛進(jìn)收費(fèi)站和出收費(fèi)站的車牌號(hào),和·%分別為數(shù)據(jù) 集S2中第i條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站和出收費(fèi)站的車牌號(hào),和5/(Ρεχ)分別為 第j條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站和出收費(fèi)站的車牌號(hào),-〇>ΕΛ?),為第i條收 費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站的車牌號(hào)Pen和第j條收費(fèi)記錄數(shù)據(jù)中車輛出收費(fèi)站的車牌號(hào) Pex之間的Levenshtein距離,為第i條收費(fèi)記錄數(shù)據(jù)中車輛出收費(fèi)站 的車牌號(hào)Pex和第j條收費(fèi)記錄數(shù)據(jù)中車輛進(jìn)收費(fèi)站的車牌號(hào)P EN之間的Levenshtein距 離,ΔΤ的值等于大津算法所求出的閾值T。
【專利摘要】本發(fā)明涉及一種高速公路車輛逃費(fèi)行為數(shù)據(jù)分析方法,包括:步驟1,采集收費(fèi)數(shù)據(jù),記為數(shù)據(jù)集S,以及對(duì)應(yīng)路段卡口和服務(wù)區(qū)卡口數(shù)據(jù),記為數(shù)據(jù)集K;步驟2,預(yù)處理數(shù)據(jù)集S,保留符合要求的記錄數(shù)據(jù);步驟3,計(jì)算保留的記錄數(shù)據(jù)中車輛出入收費(fèi)站的車牌記錄之間的Levenshitein距離,并追加到每條記錄末尾作為新數(shù)據(jù)集S1;步驟4,對(duì)S1頻度分析,獲得頻度分布直方圖;步驟5,根據(jù)頻度分布直方圖求出最大類間方差時(shí)的分割閾值T;步驟6,將S1中Levenshtein距離大于T的記錄數(shù)據(jù)保存為數(shù)據(jù)集S2;步驟7,在S2中查找疑似換卡記錄對(duì),結(jié)果保存為數(shù)據(jù)集S3;步驟8,在K中查找是否存在與S3中的記錄數(shù)據(jù)相對(duì)應(yīng)的記錄。
【IPC分類】G06F17-30
【公開號(hào)】CN104731879
【申請(qǐng)?zhí)枴緾N201510102666
【發(fā)明人】齊家, 劉若澤, 冒兵, 卞加佳, 焦楓, 邱偉軍
【申請(qǐng)人】江蘇省郵電規(guī)劃設(shè)計(jì)院有限責(zé)任公司
【公開日】2015年6月24日
【申請(qǐng)日】2015年3月9日