本發(fā)明涉及智能交通領(lǐng)域,尤其涉及一種地理信息數(shù)據(jù)的處理方法及裝置。
背景技術(shù):
1、現(xiàn)有的特征選擇方法常用的為過(guò)濾式方法。具體的,過(guò)濾式方法是在模型訓(xùn)練和運(yùn)算前,對(duì)數(shù)據(jù)進(jìn)行特征篩選,特征篩選與建模過(guò)程不存在交互。該種方式可以避免模型數(shù)據(jù)對(duì)原有數(shù)據(jù)的污染。過(guò)濾式方法的篩選標(biāo)準(zhǔn)主要包括距離準(zhǔn)則、信息準(zhǔn)則、相關(guān)性準(zhǔn)則和一致性準(zhǔn)則。距離準(zhǔn)則采用距離度量數(shù)據(jù)集中各樣本間的相似程度,進(jìn)而刻畫(huà)特征集中各個(gè)特征對(duì)目標(biāo)特征的貢獻(xiàn)程度或作用大小。信息準(zhǔn)則采用信息熵等屬性衡量數(shù)據(jù)集中各個(gè)特征對(duì)于目標(biāo)特征的不確定性程度,特征所擁有的不確定性程度越高,對(duì)目標(biāo)變量的幫助也越大。相關(guān)性準(zhǔn)則通過(guò)衡量特征與目標(biāo)特征之間的相關(guān)性程度,實(shí)現(xiàn)對(duì)各個(gè)特征的重要性度量。一致性準(zhǔn)則采用數(shù)據(jù)樣本的不一致率衡量候選特征子集的分辨能力,不一致率是不一致樣本個(gè)數(shù)與總體樣本數(shù)的比率。
2、過(guò)濾式特征選擇方法存在時(shí)間和空間復(fù)雜度高的問(wèn)題,不利于衛(wèi)星星上計(jì)算等資源有限的場(chǎng)景。
技術(shù)實(shí)現(xiàn)思路
1、現(xiàn)有技術(shù)從數(shù)據(jù)處理角度出發(fā),存在時(shí)間和空間復(fù)雜度高的缺點(diǎn),不利于衛(wèi)星星上計(jì)算等資源有限的場(chǎng)景。
2、為了解決上述技術(shù)問(wèn)題,本發(fā)明第一方面提供一種地理信息數(shù)據(jù)的處理方法,包括:
3、獲取目標(biāo)區(qū)域在預(yù)定時(shí)間范圍內(nèi)的地理信息數(shù)據(jù);
4、根據(jù)所述地理信息數(shù)據(jù),計(jì)算得到交通特征集的多個(gè)數(shù)據(jù)集及各數(shù)據(jù)集的目標(biāo)特征值;
5、利用預(yù)先確定的物理知識(shí)庫(kù),對(duì)所述交通特征集中的特征進(jìn)行一次篩選得到備用交通特征集,所述物理知識(shí)庫(kù)包括具有物理關(guān)聯(lián)關(guān)系的多個(gè)特征集合;
6、根據(jù)所述備用交通特征集中特征間的強(qiáng)相關(guān)性以及所述備用交通特征集中特征與目標(biāo)特征間的強(qiáng)相關(guān)性,對(duì)所述備用交通特征集中的特征進(jìn)行二次篩選,得到最優(yōu)交通特征集,根據(jù)所述最優(yōu)交通特征集及目標(biāo)特征建立目標(biāo)特征預(yù)測(cè)模型。
7、作為本發(fā)明的進(jìn)一步實(shí)施例中,根據(jù)所述備用交通特征集中特征間的強(qiáng)相關(guān)性以及所述備用交通特征集中特征與目標(biāo)特征間的強(qiáng)相關(guān)性,對(duì)所述備用交通特征集中的特征進(jìn)行二次篩選包括:
8、對(duì)于所述備用交通特征集中每一第一交通特征,根據(jù)所述第一交通特征的數(shù)據(jù)集及該數(shù)據(jù)集的目標(biāo)特征值確定所述第一交通特征與所述目標(biāo)特征之間的相關(guān)性;在所述第一交通特征與所述目標(biāo)特征不相關(guān)時(shí),從所述備用交通特征集中刪除所述第一交通特征;
9、對(duì)于所述備用交通特征集中的每?jī)蓚€(gè)交通特征,根據(jù)所述兩個(gè)交通特征的數(shù)據(jù)集確定所述兩個(gè)交通特征之間的相關(guān)性;在所述兩個(gè)交通特征相關(guān)時(shí),從所述兩個(gè)交通特征中刪除其中一交通特征。
10、作為本發(fā)明進(jìn)一步實(shí)施例中,在所述第一交通特征與所述目標(biāo)特征相關(guān)時(shí),從所述備用交通特征集中遍歷交通特征,將遍歷到的交通特征作為第二交通特征;
11、將所述第一交通特征及所述第二交通特征作為所述兩個(gè)交通特征,計(jì)算所述兩個(gè)交通特征之間的相關(guān)性,并在所述兩個(gè)交通特征相關(guān)時(shí),從所述備用交通特征集中刪除所述第一交通特征。
12、作為本發(fā)明的進(jìn)一步實(shí)施例中,在所述兩個(gè)交通特征不相關(guān)時(shí),重復(fù)從所述備用交通特征集中遍歷下個(gè)第二交通特征及其之后的步驟,直至無(wú)法遍歷到第二交通特征時(shí),從所述備用交通特征集中遍歷下個(gè)第一交通特征并重復(fù)確定該第一交通特征與目標(biāo)特征之間的相關(guān)性。
13、作為本發(fā)明的進(jìn)一步實(shí)施例中,所述交通特征集合中的交通特征至少包括:時(shí)刻t的路段i對(duì)應(yīng)的交通運(yùn)行特征,時(shí)刻t的路段i對(duì)應(yīng)的交通設(shè)計(jì)特征及時(shí)刻t的路段i對(duì)應(yīng)的交通設(shè)施特征;
14、所述目標(biāo)特征包括:時(shí)刻t+1的路段i行程時(shí)間或交通狀態(tài)。
15、作為本發(fā)明的進(jìn)一步實(shí)施例中,所述物理知識(shí)庫(kù)建立過(guò)程包括:
16、獲取所述交通特征的物理知識(shí)信息及所述目標(biāo)特征的物理知識(shí)信息;
17、對(duì)獲取的物理知識(shí)信息進(jìn)行去重處理;
18、從去重后物理知識(shí)信息中篩選出目標(biāo)物理知識(shí)信息,所述目標(biāo)物理知識(shí)信息至少包含兩個(gè)交通特征,和/或一個(gè)交通特征及目標(biāo)特征;
19、從所述目標(biāo)物理知識(shí)信息中提取物理量間的關(guān)聯(lián)關(guān)系;
20、將具有物理量關(guān)聯(lián)關(guān)系的交通特征,以及具有物理量關(guān)聯(lián)關(guān)系的交通特征和目標(biāo)特征構(gòu)成一物理知識(shí)集合。
21、作為本發(fā)明的進(jìn)一步實(shí)施例中,利用預(yù)先確定的物理知識(shí)庫(kù),對(duì)所述交通特征集中的特征進(jìn)行一次篩選,包括:
22、將所述交通特征集中的交通特征逐一匹配所述物理知識(shí)庫(kù)的特征集合中的特征,并記錄交通特征匹配的次數(shù);
23、對(duì)于所述物理知識(shí)庫(kù)中的每一特征集合,若該特征集合存在至少兩個(gè)匹配的交通特征,則在交通特征集中保留匹配次數(shù)最小的交通特征。
24、作為本發(fā)明的進(jìn)一步實(shí)施例中,進(jìn)行一次篩選之前,還包括:
25、從所述交通特征集中隨機(jī)選擇預(yù)定數(shù)量的交通特征組成候選特征子集,并將所述候選特征子集中的交通特征從所述交通特征集中刪除;
26、將所述一次篩選及二次篩選過(guò)程替換為:
27、對(duì)所述候選特征子集中的特征進(jìn)行一次篩選以及二次篩選,并記錄刪除交通特征個(gè)數(shù);
28、在所述候選特征子集中所有特征均已分析且所述交通特征集不為空時(shí),從所述交通特征集中隨機(jī)選擇所述刪除交通特征個(gè)數(shù)的交通特征移動(dòng)至所述候選特征子集中,并對(duì)刪除交通特征個(gè)數(shù)進(jìn)行歸零處理,重復(fù)對(duì)所述候選特征子集進(jìn)行一次篩選及二次篩選的過(guò)程。
29、作為本發(fā)明的進(jìn)一步實(shí)施例中,在所述候選特征子集中所有特征均已分析且所述刪除交通特征個(gè)數(shù)為零以及所述交通特征集不為空時(shí),從所述交通特征集中選擇至少一個(gè)交通特征移動(dòng)至所述候選特征子集中,并將選擇的交通特征從所述交通特征集中刪除,重復(fù)對(duì)所述候選特征子集進(jìn)行一次篩選及二次篩選的過(guò)程。
30、作為本發(fā)明的進(jìn)一步實(shí)施例中,從交通特征集中隨機(jī)選擇預(yù)定數(shù)量的交通特征組成候選特征子集,包括:
31、獲取分布式服務(wù)器的性能數(shù)據(jù);
32、根據(jù)各服務(wù)器的性能數(shù)據(jù),確定各服務(wù)器的特征處理量;
33、根據(jù)各服務(wù)器的特征處理量,從交通特征集獲取特征得到各服務(wù)器的候選特征子集;
34、將各服務(wù)器的候選特征子集發(fā)送至各服務(wù)器進(jìn)行分析,以由各服務(wù)器對(duì)候選特征子集進(jìn)行篩選,并統(tǒng)計(jì)候選特征子集中刪除交通特征的數(shù)量,根據(jù)各服務(wù)器刪除交通特征的數(shù)量及各服務(wù)器的性能從交通特征集中獲取交通特征。
35、作為本發(fā)明的進(jìn)一步實(shí)施例中,得到地理信息數(shù)據(jù)之后,還包括:
36、對(duì)地理信息數(shù)據(jù)進(jìn)行預(yù)處理,其中,預(yù)處理包括:
37、對(duì)地理信息數(shù)據(jù)中的非二值數(shù)據(jù)進(jìn)行平滑處理;
38、對(duì)地理信息數(shù)據(jù)中的空間數(shù)據(jù)進(jìn)行坐標(biāo)系轉(zhuǎn)化理;
39、對(duì)地理信息數(shù)據(jù)中的時(shí)變數(shù)據(jù)進(jìn)行時(shí)空冗余清洗;
40、對(duì)缺省數(shù)據(jù)進(jìn)行數(shù)據(jù)補(bǔ)全處理。
41、本發(fā)明第二方面提供一種地理信息數(shù)據(jù)的處理裝置,包括:
42、數(shù)據(jù)獲取單元,用于獲取目標(biāo)區(qū)域在預(yù)定時(shí)間范圍內(nèi)的地理信息數(shù)據(jù);
43、計(jì)算單元,用于根據(jù)所述地理信息數(shù)據(jù),計(jì)算得到交通特征集的多個(gè)數(shù)據(jù)集及各數(shù)據(jù)集的目標(biāo)特征值;
44、第一篩選單元,用于利用預(yù)先確定的物理知識(shí)庫(kù),對(duì)所述交通特征集中的特征進(jìn)行一次篩選得到備用交通特征集,所述物理知識(shí)庫(kù)包括具有物理關(guān)聯(lián)關(guān)系的多個(gè)特征集合;
45、第二篩選單元,用于根據(jù)所述備用交通特征集中特征間的強(qiáng)相關(guān)性以及所述備用交通特征集中特征與目標(biāo)特征間的強(qiáng)相關(guān)性,對(duì)所述備用交通特征集中的特征進(jìn)行二次篩選,得到最優(yōu)交通特征集,根據(jù)所述最優(yōu)交通特征集及目標(biāo)特征建立目標(biāo)特征預(yù)測(cè)模型。
46、本發(fā)明第三方面提供一種導(dǎo)航系統(tǒng),包括:無(wú)人飛行設(shè)備、衛(wèi)星服務(wù)器及客戶(hù)端;
47、所述無(wú)人飛行設(shè)備及衛(wèi)星服務(wù)器上安裝有行程時(shí)間預(yù)測(cè)模型,所述行程時(shí)間預(yù)測(cè)模型的目標(biāo)特征為路段的行程時(shí)間,所述行程時(shí)間預(yù)測(cè)模型的交通特征集利用前述任一實(shí)施例所述的方法確定;
48、所述客戶(hù)端用于供用戶(hù)輸入目的地及檢測(cè)衛(wèi)星信號(hào),在檢測(cè)到衛(wèi)星信號(hào)時(shí),發(fā)送目的地信息至衛(wèi)星服務(wù)器,以由所述衛(wèi)星服務(wù)器利用所述行程時(shí)間預(yù)測(cè)模型計(jì)算得到距離目的地的行程時(shí)間,并返回至所述客戶(hù)端;在未檢測(cè)到衛(wèi)星信號(hào)時(shí),發(fā)送目的地信息至附近無(wú)人飛行設(shè)備,以由所述無(wú)人飛行設(shè)備利用所述行程時(shí)間預(yù)測(cè)模型計(jì)算得到距離目的地的行程時(shí)間,并返回至所述客戶(hù)端。
49、本發(fā)明提供的地理信息數(shù)據(jù)的處理方法及裝置,通過(guò)利用物理知識(shí)庫(kù)對(duì)交通特征集中的特征進(jìn)行一次篩選得到備用交通特征集,根據(jù)備用交通特征集中特征間的強(qiáng)相關(guān)性以及所述備用交通特征集中特征與目標(biāo)特征間的強(qiáng)相關(guān)性,對(duì)備用交通特征集中的特征進(jìn)行二次篩選得到最優(yōu)交通特征集,根據(jù)最優(yōu)交通特征集及目標(biāo)特征建立目標(biāo)特征預(yù)測(cè)模型,能夠降低地理信息數(shù)據(jù)的交通特征選擇算法復(fù)雜度,增加其適用場(chǎng)景,在有限資源下保證計(jì)算精度,減少特征冗余。
50、為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附圖式,作詳細(xì)說(shuō)明如下。