一種數(shù)據(jù)檢測(cè)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及數(shù)據(jù)檢測(cè)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)檢測(cè)方法及裝置。
【背景技術(shù)】
[0002] 隨著智能交通系統(tǒng)的不斷發(fā)展及廣泛應(yīng)用,其城市交通誘導(dǎo)應(yīng)用也逐步走向智能 化和動(dòng)態(tài)化,在此基礎(chǔ)上,智能交通系統(tǒng)通過每隔預(yù)定時(shí)間(如2分鐘或5分鐘)獲取城市當(dāng) 前的交通數(shù)據(jù),并及時(shí)發(fā)布,以便用戶能夠及時(shí)的了解其所在城市當(dāng)前的路況信息。由于目 前交通數(shù)據(jù)發(fā)布較為頻繁,積累了大量的歷史交通數(shù)據(jù),因此,可以通過對(duì)歷史交通數(shù)據(jù)進(jìn) 行不同粒度、不同維度的分析,得到城市道路的交通運(yùn)行規(guī)律,從而為城市交通信息的填補(bǔ) 及預(yù)測(cè)提供重要的依據(jù)。
[0003]目前,直接對(duì)城市的所有歷史交通數(shù)據(jù)進(jìn)行典型性分析,得到每條道路在每一類 典型日對(duì)應(yīng)的每個(gè)統(tǒng)計(jì)時(shí)段的交通信息。
[0004] 在實(shí)際應(yīng)用中,由于各種因素(如天氣、交通事故等)均會(huì)導(dǎo)致城市歷史交通數(shù)據(jù) 中的部分?jǐn)?shù)據(jù)為異常數(shù)據(jù),這部分異常數(shù)據(jù)實(shí)際可能并不能真實(shí)反映道路的交通情況,目 前的技術(shù)方案無法對(duì)這些異常數(shù)據(jù)進(jìn)行檢測(cè),因此,直接對(duì)城市的所有歷史交通數(shù)據(jù)進(jìn)行 典型性分析得到每條道路在每一類典型日對(duì)應(yīng)的每個(gè)統(tǒng)計(jì)時(shí)段的交通信息并不準(zhǔn)確。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)存在的所述技術(shù)問題,在根據(jù)歷史交通數(shù)據(jù)分析各道路在每一類典 型日對(duì)應(yīng)的每一個(gè)統(tǒng)計(jì)時(shí)段的交通信息之前,本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)檢測(cè)方法及裝置,將城 市歷史交通數(shù)據(jù)中的異常數(shù)據(jù)檢測(cè)出來,以確保用于分析典型性的歷史交通數(shù)據(jù)均是能夠 較為真實(shí)反映道路交通情況的數(shù)據(jù),從而提高分析結(jié)果的準(zhǔn)確性。
[0006] 本申請(qǐng)?zhí)峁┝艘环N數(shù)據(jù)檢測(cè)方法,包括:
[0007] 獲取目標(biāo)數(shù)據(jù),所述目標(biāo)數(shù)據(jù)包括一目標(biāo)道路在預(yù)設(shè)統(tǒng)計(jì)周期內(nèi)每一天的歷史交 通數(shù)據(jù);
[0008] 按照預(yù)置的典型日類型,從所述目標(biāo)數(shù)據(jù)中,篩選出發(fā)布日期符合所述典型日類 型的歷史交通數(shù)據(jù);
[0009] 對(duì)典型日類型相同且在預(yù)置的同一統(tǒng)計(jì)時(shí)段內(nèi)的歷史交通數(shù)據(jù)進(jìn)行第一異常檢 測(cè),得到第一異常檢測(cè)結(jié)果;
[0010] 對(duì)發(fā)布日期符合典型日類型的每一天的歷史交通數(shù)據(jù)進(jìn)行第二異常檢測(cè),得到第 二異常檢測(cè)結(jié)果;
[0011] 將所述第一異常檢測(cè)結(jié)果及所述第二異常檢測(cè)結(jié)果,確定為所述目標(biāo)數(shù)據(jù)的異常 數(shù)據(jù)檢測(cè)結(jié)果。
[0012] 上述方法,優(yōu)選的,所述對(duì)典型日類型相同且在預(yù)置的同一統(tǒng)計(jì)時(shí)段內(nèi)的歷史交 通數(shù)據(jù)進(jìn)行第一異常檢測(cè),得到第一異常檢測(cè)結(jié)果,包括:
[0013] 確定典型日類型相同且在預(yù)置的同一統(tǒng)計(jì)時(shí)段內(nèi)的每個(gè)歷史交通數(shù)據(jù)的U統(tǒng)計(jì) 量及拒絕域臨界值;
[0014] 判斷所述U統(tǒng)計(jì)量是否大于其拒絕域臨界值,若是,則確定所述歷史交通數(shù)據(jù)異 常,否則,確定所述歷史交通數(shù)據(jù)正常。
[0015] 上述方法,優(yōu)選的,所述對(duì)發(fā)布日期符合典型日類型的每一天的歷史交通數(shù)據(jù)進(jìn) 行第二異常檢測(cè),得到第二異常檢測(cè)結(jié)果,包括:
[0016] 對(duì)發(fā)布日期符合典型日類型的每一天的歷史交通數(shù)據(jù)執(zhí)行以下步驟:
[0017] 將同一天的歷史交通數(shù)據(jù)按照發(fā)布時(shí)間進(jìn)行劃分,得到歷史交通數(shù)據(jù)序列;
[0018] 確定歷史交通數(shù)據(jù)序列中每個(gè)歷史交通數(shù)據(jù)的U統(tǒng)計(jì)量及其拒絕域臨界值;
[0019] 判斷所述U統(tǒng)計(jì)量是否大于其拒絕域臨界值,若是,則確定所述歷史交通數(shù)據(jù)異 常,否則,確定所述歷史交通數(shù)據(jù)正常。
[0020] 上述方法,優(yōu)選的,將同一天的歷史交通數(shù)據(jù)按照發(fā)布時(shí)間進(jìn)行劃分,得到歷史交 通數(shù)據(jù)序列,包括:
[0021] 將同一天的歷史交通數(shù)據(jù)中,發(fā)布時(shí)間處于同一發(fā)布時(shí)間段的歷史交通數(shù)據(jù)劃分 到同一歷史交通數(shù)據(jù)子序列中;
[0022] 從第一個(gè)歷史交通數(shù)據(jù)子序列開始,依次獲取相鄰兩個(gè)歷史交通數(shù)據(jù)子序列的歷 史交通數(shù)據(jù)均值U和方差C,其中,
【主權(quán)項(xiàng)】
1. 一種數(shù)據(jù)檢測(cè)方法,其特征在于,包括: 獲取目標(biāo)數(shù)據(jù),所述目標(biāo)數(shù)據(jù)包括一目標(biāo)道路在預(yù)設(shè)統(tǒng)計(jì)周期內(nèi)每一天的歷史交通數(shù) 據(jù); 按照預(yù)置的典型日類型,從所述目標(biāo)數(shù)據(jù)中,篩選出發(fā)布日期符合所述典型日類型的 歷史交通數(shù)據(jù); 對(duì)典型日類型相同且在預(yù)置的同一統(tǒng)計(jì)時(shí)段內(nèi)的歷史交通數(shù)據(jù)進(jìn)行第一異常檢測(cè),得 到第一異常檢測(cè)結(jié)果; 對(duì)發(fā)布日期符合典型日類型的每一天的歷史交通數(shù)據(jù)進(jìn)行第二異常檢測(cè),得到第二異 常檢測(cè)結(jié)果; 將所述第一異常檢測(cè)結(jié)果及所述第二異常檢測(cè)結(jié)果,確定為所述目標(biāo)數(shù)據(jù)的異常數(shù)據(jù) 檢測(cè)結(jié)果。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)典型日類型相同且在預(yù)置的同一 統(tǒng)計(jì)時(shí)段內(nèi)的歷史交通數(shù)據(jù)進(jìn)行第一異常檢測(cè),得到第一異常檢測(cè)結(jié)果,包括: 確定典型日類型相同且在預(yù)置的同一統(tǒng)計(jì)時(shí)段內(nèi)的每個(gè)歷史交通數(shù)據(jù)的U統(tǒng)計(jì)量及 拒絕域臨界值; 判斷所述U統(tǒng)計(jì)量是否大于其拒絕域臨界值,若是,則確定所述歷史交通數(shù)據(jù)異常,否 貝1J,確定所述歷史交通數(shù)據(jù)正常。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)發(fā)布日期符合典型日類型的每一 天的歷史交通數(shù)據(jù)進(jìn)行第二異常檢測(cè),得到第二異常檢測(cè)結(jié)果,包括: 對(duì)發(fā)布日期符合典型日類型的每一天的歷史交通數(shù)據(jù)執(zhí)行以下步驟: 將同一天的歷史交通數(shù)據(jù)按照發(fā)布時(shí)間進(jìn)行劃分,得到歷史交通數(shù)據(jù)序列; 確定歷史交通數(shù)據(jù)序列中每個(gè)歷史交通數(shù)據(jù)的U統(tǒng)計(jì)量及其拒絕域臨界值; 判斷所述U統(tǒng)計(jì)量是否大于其拒絕域臨界值,若是,則確定所述歷史交通數(shù)據(jù)異常,否 貝1J,確定所述歷史交通數(shù)據(jù)正常。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,將同一天的歷史交通數(shù)據(jù)按照發(fā)布時(shí)間 進(jìn)行劃分,得到歷史交通數(shù)據(jù)序列,包括: 將同一天的歷史交通數(shù)據(jù)中,發(fā)布時(shí)間處于同一發(fā)布時(shí)間段的歷史交通數(shù)據(jù)劃分到同 一歷史交通數(shù)據(jù)子序列中; 從第一個(gè)歷史交通數(shù)據(jù)子序列開始,依次獲取相鄰兩個(gè)歷史交通數(shù)據(jù)子序列的歷史交 通數(shù)據(jù)均值μ和方差σ,其中
Xi為歷史交通數(shù)據(jù) 子序列中第i個(gè)歷史交通數(shù)據(jù)的取值,η為所述歷史交通數(shù)據(jù)子序列中歷史交通數(shù)據(jù)取值 的個(gè)數(shù); 判斷相鄰兩個(gè)歷史交通數(shù)據(jù)子序列的均值μ和方差σ是否均對(duì)應(yīng)相等,若是,將所述 兩個(gè)歷史交通數(shù)據(jù)子序列合并作為一個(gè)歷史交通數(shù)據(jù)序列,否則,將上述兩個(gè)歷史交通數(shù) 據(jù)子序列分別作為歷史交通數(shù)據(jù)序列。
5. 根據(jù)權(quán)利要求2或3所述的方法,其特征在于,確定歷史交通數(shù)據(jù)的U統(tǒng)計(jì)量,包括: 根據(jù)
,確定所述歷史交通數(shù)據(jù)的U統(tǒng)計(jì)量; 其中,U為所述歷史交通數(shù)據(jù)的U統(tǒng)計(jì)量,Xi為第i個(gè)所述歷史交通數(shù)據(jù)的取值,η為 典型日類型相同且在預(yù)置的同一統(tǒng)計(jì)時(shí)段內(nèi)歷史交通數(shù)據(jù)的個(gè)數(shù),或者,η為數(shù)據(jù)序列中的 歷史交通數(shù)據(jù)的個(gè)數(shù),其4 /1
1 其中,確定所述歷史交通數(shù)據(jù)的拒絕域臨界值,包括: 根據(jù)P(U>y α/2) = α和預(yù)置的狀態(tài)分布表,確定拒絕域臨界值μ α/2,其中,α為預(yù)設(shè)的 檢驗(yàn)水平值。
6. 根據(jù)權(quán)