1.一種基于GPS數(shù)據(jù)的公交準點預(yù)測方法,其特征在于,所述方法包括如下步驟:
步驟一、公交GPS數(shù)據(jù)和發(fā)車數(shù)據(jù)采集和處理
數(shù)據(jù)采集:通過3G或4G無線傳輸網(wǎng)絡(luò)實時獲取公交車GPS軌跡信息,并采集公交車的發(fā)車數(shù)據(jù),建立公交運行線路和車輛運行信息數(shù)據(jù)庫;所述的公交車GPS數(shù)據(jù)包括線路標識、車次標識、站點標識、時間、經(jīng)緯度、速度、方位角和上下行標識信息;所述的公交車發(fā)車數(shù)據(jù)包括線路標識、車次標識、起始時間、結(jié)束時間和距首站距離信息;從上述采集到的全網(wǎng)車輛GPS軌跡數(shù)據(jù)中提取具有上下場站的公交線路作為預(yù)測線路,確定線路上的每個站點,并進一步提取每天經(jīng)過上述站點的公交車車次以及每個車次到達站點的時間;
數(shù)據(jù)處理:進行站點標識匹配,將目標站點標識不對應(yīng)的數(shù)據(jù)作為錯誤數(shù)據(jù)剔除,同時與站點標識對應(yīng)的時間信息也相應(yīng)剔除,只保留相同站點標識的數(shù)據(jù);
步驟二、公交準點值的判定
定義公交車早于時刻表規(guī)定時間1分鐘內(nèi)或晚于時刻表規(guī)定時間2分鐘內(nèi)到達站點都認為是公交車準點到達,即準點為1,若在此范圍之外的情況均屬于準點之外,即非準點為0;
通過公交車GPS軌跡數(shù)據(jù)統(tǒng)計各個站點的到站時間,然后與公交車發(fā)車數(shù)據(jù)中到達各個站點的計劃時間做相應(yīng)的差值,最后根據(jù)上述對準點和非準點的定義,計算出公交車各個站點的準點值;若上述差值在準點定義范圍內(nèi),就視為準點,為1,若上述差值不在準點定義范圍內(nèi),就視為不準點,為0;
步驟三、公交準點影響因素的提取
兩個目標站點的旅行時間、相鄰上一個車次和當前車次分別在第一個目標站點的準點值、以及相鄰上一個車次在第二個目標站點的準點值作為訓練學習中的輸入因素;輸出為當前車次在第二個目標站點的準點值;
先提取每一天的小樣本數(shù)據(jù),然后按時間順序組成一個大樣本數(shù)據(jù),按照訓練集和測試集3:1的樣本數(shù)據(jù)比例選出實驗數(shù)據(jù);
步驟四、公交準點的預(yù)測
采用支持向量機算法預(yù)測公交準點情況,根據(jù)上一步驟中選取的訓練集建立預(yù)測模型對當前車次到達第二個目標站點的公交準點情況進行預(yù)測,得到預(yù)測的準點值。
2.根據(jù)權(quán)利要求1所述的一種基于GPS數(shù)據(jù)的公交準點預(yù)測方法,其特征在于:
步驟一中所述的到達站點的時間定義為經(jīng)過站點的進場時間,也就是公交車GPS數(shù)據(jù)到達站點的第一個打點時間。
3.根據(jù)權(quán)利要求2所述的一種基于GPS數(shù)據(jù)的公交準點預(yù)測方法,其特征在于:
步驟三中所述的兩個目標站點的旅行時間是當前車次在第二個目標站點的到達站點的時間和在第一個目標站點的到達站點的時間的差值。