專利名稱:一種基于行程識別的出行者活動規(guī)律分析方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于行程識別的出行者活動規(guī)律分析方法。
背景技術(shù):
目前,城市活動對象的軌跡采集主要有GPS定位和手機(jī)網(wǎng)絡(luò)定位兩種方式。因此,針對軌跡數(shù)據(jù)的研究也主要是以這兩種數(shù)據(jù)來源為基礎(chǔ)進(jìn)行展開的。定位技術(shù)獲取的軌跡數(shù)據(jù)只是包含每一軌跡點(diǎn)的經(jīng)緯度及其對應(yīng)的時刻信息,通過數(shù)據(jù)本身無法直接得到活動行為的特征信息,如出行時間、出行方式、出行目的,以及更深層次的活動規(guī)律等。進(jìn)行以上這些信息統(tǒng)計(jì)分析工作的基礎(chǔ),就是識別出出行者的兩種活動類型,即活動的停留階段和移動階段。因此,出行識別的任務(wù)就是將無法直接理解的軌跡轉(zhuǎn)化為能夠認(rèn)知的停留位置和在各個停留位置之間的移動。如圖I所示,行程識別就是將在空間上離散的軌跡點(diǎn)劃分成停留活動點(diǎn)和移動活動點(diǎn)兩大類。通過停留活動點(diǎn)獲取人進(jìn)行停留活動時的位置或位置范圍,通過移動活動點(diǎn)生成人的移動路徑。這樣,有關(guān)停留時長、停留活動目的等信息可以由停留位置信息進(jìn)行挖掘分析,出行方式、出行時間、出行距離等信息則可以從移動路徑中提取。因此,可以在行程識別的基礎(chǔ)上進(jìn)一步研究出行者的活動規(guī)律。
發(fā)明內(nèi)容
本發(fā)明設(shè)計(jì)開發(fā)了一種基于行程識別的出行者活動規(guī)律分析方法。對η天的經(jīng)行程識別的停留點(diǎn)進(jìn)行分析,當(dāng)停留點(diǎn)符合第一距離閾值條件時,將其合并為一個候選居住地,在所有的候選居住地中,累計(jì)停留時長最大的候選居住地的累計(jì)停留時長達(dá)到第一時間閾值,則將此候選居住地作為居住地。上述過程實(shí)現(xiàn)了對出行者居住地的準(zhǔn)確判斷。在居住地判斷的基礎(chǔ)上,利用本發(fā)明的分析方法,還可以進(jìn)一步研究出行者的日平均休息時長、作息規(guī)律評價指標(biāo)、主要出行位置、日平均出行距離等,從而實(shí)現(xiàn)對出行者的活動規(guī)律的充分了解。本發(fā)明提供的技術(shù)方案為—種基于行程識別的出行者活動規(guī)律分析方法,包括以下步驟步驟一、獲取η天經(jīng)行程識別確定的停留點(diǎn);步驟二、當(dāng)多個停留點(diǎn)的中心與所述多個停留點(diǎn)中任一個停留點(diǎn)之間的距離小于第一距離閾值時,則所述多個停留點(diǎn)的中心判定為出行者的候選居住地,所述多個停留點(diǎn)的停留時長之和為所述候選居住地的累計(jì)停留時長;步驟三、當(dāng)所述累計(jì)停留時長最大的候選居住地的累計(jì)停留時長大于第一時間閾值時,所述累計(jì)停留時長最大的候選居住地判定為出行者的居住地。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述步驟二是通 過以下方式實(shí)現(xiàn)的,(I)將所有待判定的停留點(diǎn)中的一個停留點(diǎn)作為一個聚類,其中,所述停留點(diǎn)為聚類的中心,(2)當(dāng)所有待判定的停留點(diǎn)中的一個停留點(diǎn)到所述聚類的距離小于第一距離閾值時,則將所述停留點(diǎn)放入所述聚類,重新確定所述聚類的中心,(3)重復(fù)(2),直到所有待判定的停留點(diǎn)到所述聚類的距離均大于第一距離閾值,(4)所述聚類的中心判定為出行者的候選居住地,所述聚類中的停留點(diǎn)的停留時長之和為所述候選居住地的累計(jì)停留時長。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法,還包括(5)重復(fù)(I),直到所有停留點(diǎn)均為經(jīng)過判定的停留點(diǎn),(6)所述多個聚類的中心判定為出行者的多個候選居住地。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(2)中,所述聚類的中心是通過以下方式實(shí)現(xiàn)的,計(jì)算所有待判定的停留點(diǎn)中的一個停留點(diǎn)(Sqi. X, Sqi. y)的停留時長Sqi. At與所述聚類中的停留點(diǎn)的停留時長之和At之間的比值Wighti,所述聚類的中心坐標(biāo)(r」.x, Tj. y)為rr X = Wighti · Sqi. X+ (I-Wighti) · Tj. x,Tj. y = Wighti · Sqi. y+ (I-Wighti) · Tj. ya優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法,還包括步驟四、所述η天經(jīng)行程識別確定的停留點(diǎn)中,η天中停留時長大于20分鐘的停留點(diǎn)的停留時長之和與天數(shù)η的比值為出行者的日平均休息時長;步驟五、與居住地對應(yīng)的聚類中的停留點(diǎn)中,屬于同一天的停留點(diǎn)的停留時長之和為出行者在同一天在居住地的停留時長,且出行者在同一天在居住地的停留時長所發(fā)生的時間區(qū)間為休息區(qū)間,則η天中任意兩天的休息區(qū)間的重疊百分比的平均值為出行者的作息規(guī)律評價指標(biāo);步驟六、獲取η天經(jīng)行程識別確定的移動點(diǎn),其中,一天內(nèi)的移動點(diǎn)中兩兩移動點(diǎn)之間的距離之和與天數(shù)η的比值為出行者的日平均出行距離,覆蓋一天內(nèi)的軌跡點(diǎn)的半徑最小的圓的半徑之和與天數(shù)η的比值為出行者的日出行空間半徑,η天內(nèi)的移動點(diǎn)的平均坐標(biāo)為出行者的主要出行位置。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述步驟一中獲取η天經(jīng)行程識別的停留點(diǎn),其中,一天內(nèi)經(jīng)行程識別確定的停留點(diǎn)是通過以下方式實(shí)現(xiàn)的,(I)計(jì)算一天內(nèi)的軌跡點(diǎn)的速度,(2)將多個相鄰的速度均在速度閾值以下的軌跡點(diǎn)合并為一個候選停留位置,其中,所述候選停留位置的停留時長為所述多個軌跡點(diǎn)中第一個軌跡點(diǎn)到最后一個軌跡點(diǎn)之間的時間間隔,(3)當(dāng)多個候選停留位置的中心與所述多個候選停留位置中任一個候選停留位置之間的距離小于第二距離閾值時,并且,當(dāng)所述多個候選停留位置中第一個候選停留位置 的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔大于第二時間閾值時,則將所述多個候選停留位置的中心判定為停留點(diǎn),(4)所述多個候選停留位置中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔為在所述停留點(diǎn)的停留時長。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(3)是通過以下方式實(shí)現(xiàn)的,
(a)將所有待判定候選停留位置中的第一個候選停留位置作為停留序列,其中,所述第一個候選停留位置為停留序列的中心,(b)當(dāng)位于所述停留序列的后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離小于第二距離閾值時,將所述位于所述停留序列的后方的第一個候選停留位置放入所述停留序列,重新確定所述停留序列的中心,(C)重復(fù)(b),直到位于所述停留序列后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離大于第二距離閾值時,當(dāng)所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔大于第二時間閾值時,則(b)中所述停留序列的中心為停留點(diǎn)。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(2)中,所述多個相鄰的速度均在速度閾值以下的軌跡點(diǎn)合并為一個候選停留位置,是通過以下方式實(shí)現(xiàn)的,依次計(jì)算所述候選停留位置中兩個相鄰軌跡點(diǎn)的平均坐標(biāo)(X(i,i+1),y(i,i+1)),依次計(jì)算所述兩個相鄰軌跡點(diǎn)之間的時間間隔Λ t (i, i+1)、與所述候選停留位置的停留時長Stay' . Δ t之間的比值wight(i,i+1),計(jì)算所述候選停留位置的坐標(biāo)(Stay’ . x, Stay’ . y)
I n-lI η-I
Stay' ·χ = Σ wiSht(UM) · %/+1) Stay' -y = Σ wisht(i,i+i) · ·%+ι)
I Iο優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(3)中,(b)中所述停留序列的中心是通過以下方式實(shí)現(xiàn)的,計(jì)算位于所述停留序列的后方的第一個候選停留位置的停留時長Stay’ " Λ t與所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔Sq. Λ t之間的比值wighh,計(jì)算所述停留序列的中心坐標(biāo)(Sq. X, Sq. y)Sq. X = Wighti · Stay' ” x+(Iiighti) · Sq. x,Sq. y = Wighti · Stay' ” y+ (I-Wighti) · Sq. yD優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法,還包括(5)所述(3)中,(C)中位于所述停留序列后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離大于第二距離閾值時,當(dāng)所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔小于第二時間閾值時,則(b)中所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的所有的軌跡點(diǎn)均判定為移動點(diǎn),以及所述停留序列中最后一個候選停留位置的停留時長的結(jié)束時刻到所述停留序列后方的第一個候選停留位置的停留時長的開始時刻之間的所有的軌跡點(diǎn)均判定為移動點(diǎn)。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述第二時間閾值為300秒,所述第二距離閾值為200米。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法中,所述第一距離閾值為200米,所述第一時間閾值為6小時。本發(fā)明所述的一種基于行程識別的出行者活動規(guī)律分析方法,對η天的經(jīng)行程識別的停留點(diǎn)進(jìn)行分析,當(dāng)停留點(diǎn)符合第一距離閾值條件時,將其合并為一個候選居住地,在 所有的候選居住地中,累計(jì)停留時長最大的候選居住地的累計(jì)停留時長達(dá)到第一時間閾值,則將此候選居住地作為居住地。上述過程實(shí)現(xiàn)了對出行者居住地的準(zhǔn)確判斷。在居住地判斷的基礎(chǔ)上,利用本發(fā)明的分析方法,還可以進(jìn)一步研究出行者的日平均休息時長、作息規(guī)律評價指標(biāo)、主要出行位置、日平均出行距離等,從而實(shí)現(xiàn)對出行者的活動規(guī)律的充分了解。此外,本發(fā)明可以針對GPS定位軌跡數(shù)據(jù)進(jìn)行分析,也可以針對手機(jī)定位軌跡數(shù)據(jù)進(jìn)行分析。在對上述兩種數(shù)據(jù)進(jìn)行分析時,僅需要調(diào)整第一距離閾值、第一時間閾值、第二距離閾值、第二時間閾值等參數(shù),均可以獲得準(zhǔn)確的分析結(jié)果。本發(fā)明尤其適用于出租車駕駛員的活動規(guī)律分析。
圖I為行程識別示意圖;圖2為本發(fā)明所述的基于行程識別的出行者活動規(guī)律分析方法的流程圖;圖3為軌跡點(diǎn)的速度計(jì)算示意圖;圖4為軌跡點(diǎn)中候選停留點(diǎn)合并為候選停留位置的示意圖;圖5為停留點(diǎn)識別算法流程圖;圖6為某一出租者駕駛員的居住地的挖掘結(jié)果的可視化顯示;圖7為樣本中出租車駕駛員的居住地分布圖;圖8為樣本中出租車駕駛員的日平均休息時長統(tǒng)計(jì)圖;圖9為樣本中一天中各時段運(yùn)營的出租車分布曲線;圖10(a)為樣本中某一出租車駕駛員在一天的停留點(diǎn)信息,圖10(b)為停留點(diǎn)信息轉(zhuǎn)化后的作息時間序列;圖11為樣本中出租車駕駛員的作息規(guī)律評價指標(biāo)的分布圖;圖12為樣本中具有代表性的駕駛員的出行軌跡,其中,圖12(a)為作息規(guī)律評價指標(biāo)在O. 9 I之間的駕駛員的出行軌跡,圖12(b)為作息規(guī)律評價指標(biāo)在O. 8 O. 9之間的駕駛員的出行軌跡,圖12(c)為作息規(guī)律評價指標(biāo)在O. 7 O. 8之間的駕駛員的出行軌跡,圖12(d)為作息規(guī)律評價指標(biāo)在O. 6 O. 7之間的駕駛員的出行軌跡;圖13為樣本中出租車駕駛員的日平均行駛距離的分布圖;圖14為樣本中某一出租車駕駛員的日平均運(yùn)營空間的示意圖;圖15為樣本中出租車駕駛員的日平均運(yùn)營空間的分布圖;圖16(a)為樣本中出租車駕駛員的主要運(yùn)營位置的分布圖,圖16(b)為圖16(a)中A部的局部放大圖;圖17為樣本中出租車駕駛員的通勤直線距離的分布圖。具體實(shí) 施方式下面結(jié)合附圖對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實(shí)施。如圖I所示,本發(fā)明提供一種基于行程識別的出行者活動規(guī)律分析方法,包括以下步驟步驟一、獲取η天經(jīng)行程識別確定的停留點(diǎn);步驟二、當(dāng)多個停留點(diǎn)的中心與所述多個停留點(diǎn)中任一個停留點(diǎn)之間的距離小于第一距離閾值時,則所述多個停留點(diǎn)的中心判定為出行者的候選居住地,所述多個停留點(diǎn)的停留時長之和為所述候選居住地的累計(jì)停留時長;步驟三、當(dāng)所述累計(jì)停留時長最大的候選居住地的累計(jì)停留時長大于第一時間閾值時,所述累計(jì)停留時長最大的候選居住地判定為出行者的居住地。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述步驟二是通過以下方式實(shí)現(xiàn)的,(I)將所有待判定的停留點(diǎn)中的一個停留點(diǎn)作為一個聚類,其中,所述停留點(diǎn)為聚類的中心,(2)當(dāng)所有待判定的停留點(diǎn)中的一個停留點(diǎn)到所述聚類的距離小于第一距離閾值時,則將所述停留點(diǎn)放入所述聚類,重新確定所述聚類的中心,(3)重復(fù)(2),直到所有待判定的停留點(diǎn)到所述聚類的距離均大于第一距離閾值,(4)所述聚類的中心判定為出行者的候選居住地,所述聚類中的停留點(diǎn)的停留時長之和為所述候選居住地的累計(jì)停留時長。優(yōu)選的是,所述的基于行程識別的出行者活動規(guī)律分析方法,還包括(5)重復(fù)(I),直到所有停留點(diǎn)均為經(jīng)過判定的停留點(diǎn),(6)所述多個聚類的中心判定為出行者的多個候選居住地。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(2)中,所述聚類的中心是通過以下方式實(shí)現(xiàn)的,計(jì)算所有待判定的停留點(diǎn)中的一個停留點(diǎn)(Sqi-X, Sqi. y)的停留時長Sqi. At與所述聚類中的停留點(diǎn)的停留時長之和At之間的比值Wighti,所述聚類的中心坐標(biāo)(r」.x, Tj. y)為Tj. X = Wighti · Sqi. X+ (I-Wighti) · r」· x,Tj. y = Wighti · Sqi. y+ (I-Wighti) · r」· y。所述的基于行程識別的出行者活動規(guī)律分析方法,還包括步驟四、所述η天經(jīng)行程識別確定的停留點(diǎn)中,η天中停留時長大于20分鐘的停留點(diǎn)的停留時長之和與天數(shù)η的比值為出行者的日平均休息時長;步驟五、與居住地對應(yīng)的聚類中的停留點(diǎn)中,屬于同一天的停留點(diǎn)的停留時長之和為出行者在同一天在居住地的停留時長,且出行者在同一天在居住地的停留時長所發(fā)生的時間區(qū)間為休息區(qū)間,則η天中任意兩天的休息區(qū)間的重疊百分比的平均值為出行者的作息規(guī)律評價指標(biāo);步驟六、獲取η天經(jīng)行程識別確定的移動點(diǎn),其中,一天內(nèi)的移動點(diǎn)中兩兩移動點(diǎn)之間的距離之和與天數(shù)η的比值為出行者的日平均出行距離,覆蓋一天內(nèi)的軌跡點(diǎn)的半徑最小的圓的半徑之和與天數(shù)η的比值為出行者的日出行空間半徑,η天內(nèi)的移動點(diǎn)的平均坐標(biāo)為出行者的主要出行位置。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述步驟一中獲取η天經(jīng)行程識別的停留點(diǎn),其中,一天內(nèi)經(jīng)行程識別確定的停留點(diǎn)是通過以下方式實(shí)現(xiàn)的,
(I)計(jì)算一天內(nèi)的軌跡點(diǎn)的速度,(2)將多個相鄰的速度均在速度閾值以下的軌跡點(diǎn)合并為一個候選停留位置,其中,所述候選停留位置的停留時長為所述多個軌跡點(diǎn)中第一個軌跡點(diǎn)到最后一個軌跡點(diǎn)之間的時間間隔,(3)當(dāng)多個候選停留位置的中心與所述多個候選停留位置中任一個候選停留位置之間的距離小于第二距離閾值時,并且,當(dāng)所述多個候選停留位置中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔大于第二時間閾值時,則將所述多個候選停留位置的中心判定為停留點(diǎn),(4)所述多個候選停留位置中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔為在所述停留點(diǎn)的停留時長。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(3)是通過以下方式實(shí)現(xiàn)的,(a)將所有待判定候選停留位置中的第一個候選停留位置作為停留序列,其中,所述第一個候選停留位置為停留序列的中心,(b)當(dāng)位于所述停留序列的后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離小于第二距離閾值時,將所述位于所述停留序列的后方的第一個候選停留位置放入所述停留序列,重新確定所述停留序列的中心,(C)重復(fù)(b),直到位于所述停留序列后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離大于第二距離閾值時,當(dāng)所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔大于第二時間閾值時,則(b)中所述停留序列的中心為停留點(diǎn)。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(2)中,所述多個相鄰的速度均在速度閾值以下的軌跡點(diǎn)合并為一個候選停留位置,是通過以下方式實(shí)現(xiàn)的,依次計(jì)算所述候選停留位置中兩個相鄰軌跡點(diǎn)的平均坐標(biāo)(X(i,i+1),y(i,i+1)),依次計(jì)算所述兩個相鄰軌跡點(diǎn)之間的時間間隔Λ t (i, i+1)、與所述候選停留位置的停留時長Stay' . Δ t之間的比值wight(i,i+1),計(jì)算所述候選停留位置的坐標(biāo)(Stay’ . x, Stay’ . y)
II
Stay' ·χ = Σ wisht(i,μ) · %/+1) Stayf -y = Σ wiShHi,μ) · ·%+ι)
I Iο所述的基于行程識別的出行者活動規(guī)律分析方法中,所述(3)中,(b)中所述停留序列的中心是通過以下方式實(shí)現(xiàn)的,計(jì)算位于所述停留序列的后方的第一個候選停留位置的停留時長Stay’ " Λ t與所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔Sq. Λ t之間的比值wighh,
計(jì)算所述停留序列的中心坐標(biāo)(Sq· X, Sq. y)Sq. X = Wighti · Stay' ” x+ (I-Wighti) · Sq. x,Sq. y = Wighti · Stay' ^ y+ (I-Wighti) · Sq. yD所述的基于行程識別的出行者活動規(guī)律分析方法,還包括(5)所述⑶中,(C)中位于所述停留序列后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離大于第二距離閾值時,當(dāng)所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔小于第二時間閾值時,則(b)中所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的所有的軌跡點(diǎn)均判定為移動點(diǎn),以及所述停留序列中最后一個候選停留位置的停留時長的結(jié)束時刻到所述停留序列后方的第一個候選停留位置的停留時長的開始時刻之間的所有的軌跡點(diǎn)均判定為移動點(diǎn)。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述第二時間閾值為300秒,所述第二距離閾值為200米。所述的基于行程識別的出行者活動規(guī)律分析方法中,所述第一距離閾值為200米,所述第一時間閾值為6小時。以出租車駕駛員為例,出租車駕駛員因工作性質(zhì)的特殊性,作息時間并不嚴(yán)格固定,上路運(yùn)營的時間也比較靈活,如白天出車、夜間出車、凌晨收工等。因此,一般人群的居住地挖掘方法不適用于該群體。通過觀察出租車軌跡發(fā)現(xiàn),出租車駕駛員與一般人群不同,沒有固定的工作地點(diǎn),居住地成為他們一天之中停留時長最長的停留點(diǎn),累積的停留時長遠(yuǎn)遠(yuǎn)大于其他停留點(diǎn),并且考察的軌跡數(shù)量越多該特征越明顯。以此為基礎(chǔ),利用停留的時間特征作為出租車駕駛員居住地挖掘的主要依據(jù)。本發(fā)明的基于行程識別的出行者活動規(guī)律分析方法中對出租車駕駛員的居住地的挖掘的流程見圖2。主要步驟如下步驟I、獲取η天經(jīng)行程識別得到的停留點(diǎn)。步驟2、將第一個停留點(diǎn)作為一個聚類A,該停留點(diǎn)的坐標(biāo)設(shè)置為A的聚類中心坐標(biāo),該停留點(diǎn)的停留時長設(shè)置Sr1的停留時長。步驟3、判斷是否還有未處理的停留點(diǎn),如果有,讀取一個停留點(diǎn),轉(zhuǎn)到步驟3 ;如果否,結(jié)束聚類過程,轉(zhuǎn)到步驟7。步驟4、計(jì)算停留點(diǎn)與各聚類!^之間的距離七,判斷距離最小值4是否小于200米(第一距離閾值),如果是,轉(zhuǎn)到步驟5 ;如果否,轉(zhuǎn)到步驟6。步驟5、停留點(diǎn)加入對應(yīng)的聚類&中,用時間加權(quán)的方法重新計(jì)算&的聚類中心坐標(biāo),將停留點(diǎn)的停留時長累加到h的停留時長,轉(zhuǎn)到步驟3。步驟6、停留點(diǎn)作為新的一個聚類rm+1,停留點(diǎn)的坐標(biāo)設(shè)置為rm+1的聚類中心坐標(biāo),停留點(diǎn)的停留時長設(shè)置為rm+1的停留時長,轉(zhuǎn)到步驟3。步驟7、遍歷各聚類,找出停留時長最長的聚類rn,判斷其停留時長是否超過6個小時(第一時間閾值),如果是,將該聚類的聚類中心作為出行者的居住地位置,中心坐標(biāo)作為居住地的坐標(biāo);如果否,則居住地挖掘失敗。步驟5中使用時間加權(quán)方法重新計(jì)算&聚類中心的公式如下
權(quán)利要求
1.一種基于行程識別的出行者活動規(guī)律分析方法,其特征在于,包括以下步驟 步驟一、獲取n天經(jīng)行程識別確定的停留點(diǎn); 步驟二、當(dāng)多個停留點(diǎn)的中心與所述多個停留點(diǎn)中任一個停留點(diǎn)之間的距離小于第一距離閾值時,則所述多個停留點(diǎn)的中心判定為出行者的候選居住地,所述多個停留點(diǎn)的停留時長之和為所述候選居住地的累計(jì)停留時長; 步驟三、當(dāng)所述累計(jì)停留時長最大的候選居住地的累計(jì)停留時長大于第一時間閾值時,所述累計(jì)停留時長最大的候選居住地判定為出行者的居住地。
2.如權(quán)利要求I所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,所述步驟二是通過以下方式實(shí)現(xiàn)的, (1)將所有待判定的停留點(diǎn)中的一個停留點(diǎn)作為一個聚類,其中,所述停留點(diǎn)為聚類的中心, (2)當(dāng)所有待判定的停留點(diǎn)中的一個停留點(diǎn)到所述聚類的距離小于第一距離閾值時,則將所述停留點(diǎn)放入所述聚類,重新確定所述聚類的中心, (3)重復(fù)(2),直到所有待判定的停留點(diǎn)到所述聚類的距離均大于第一距離閾值, (4)所述聚類的中心判定為出行者的候選居住地,所述聚類中的停留點(diǎn)的停留時長之和為所述候選居住地的累計(jì)停留時長。
3.如權(quán)利要求2所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,還包括 (5)重復(fù)(I),直到所有停留點(diǎn)均為經(jīng)過判定的停留點(diǎn), (6)所述多個聚類的中心判定為出行者的多個候選居住地。
4.如權(quán)利要求3所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,所述(2)中,所述聚類的中心是通過以下方式實(shí)現(xiàn)的, 計(jì)算所有待判定的停留點(diǎn)中的一個停留點(diǎn)(Sqi-X, Sqi. y)的停留時長Sqi. A t與所述聚類中的停留點(diǎn)的停留時長之和At之間的比值Wighti, 所述聚類的中心坐標(biāo)Crj. X, Tj. y)為 Tj. X = Wighti Sqi. X+ (I-Wighti) Tj. X, Tj. y = Wighti Sqi. y+(I-Wighti) Tj. y。
5.如權(quán)利要求4所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,還包括 步驟四、所述n天經(jīng)行程識別確定的停留點(diǎn)中,n天中停留時長大于20分鐘的停留點(diǎn)的停留時長之和與天數(shù)n的比值為出行者的日平均休息時長; 步驟五、與居住地對應(yīng)的聚類中的停留點(diǎn)中,屬于同一天的停留點(diǎn)的停留時長之和為出行者在同一天在居住地的停留時長,且出行者在同一天在居住地的停留時長所發(fā)生的時間區(qū)間為休息區(qū)間,則n天中任意兩天的休息區(qū)間的重疊百分比的平均值為出行者的作息規(guī)律評價指標(biāo); 步驟六、獲取n天經(jīng)行程識別確定的移動點(diǎn),其中,一天內(nèi)的移動點(diǎn)中兩兩移動點(diǎn)之間的距離之和與天數(shù)n的比值為出行者的日平均出行距離,覆蓋一天內(nèi)的軌跡點(diǎn)的半徑最小的圓的半徑之和與天數(shù)n的比值為出行者的日出行空間半徑,n天內(nèi)的移動點(diǎn)的平均坐標(biāo)為出行者的主要出行位置。
6.如權(quán)利要求1-5中任一項(xiàng)所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,所述步驟一中獲取n天經(jīng)行程識別的停留點(diǎn),其中,一天內(nèi)經(jīng)行程識別確定的停留點(diǎn)是通過以下方式實(shí)現(xiàn)的, (1)計(jì)算一天內(nèi)的軌跡點(diǎn)的速度, (2)將多個相鄰的速度均在速度閾值以下的軌跡點(diǎn)合并為一個候選停留位置,其中,所述候選停留位置的停留時長為所述多個軌跡點(diǎn)中第一個軌跡點(diǎn)到最后一個軌跡點(diǎn)之間的時間間隔, (3)當(dāng)多個候選停留位置的中心與所述多個候選停留位置中任一個候選停留位置之間的距離小于第二距離閾值時,并且,當(dāng)所述多個候選停留位置中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔大于第二時間閾值時,則將所述多個候選停留位置的中心判定為停留點(diǎn), (4)所述多個候選停留位置中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔為在所述停留點(diǎn)的停留時長。
7.如權(quán)利要求6所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,所述(3)是通過以下方式實(shí)現(xiàn)的, (a)將所有待判定候選停留位置中的第一個候選停留位置作為停留序列,其中,所述第一個候選停留位置為停留序列的中心, (b)當(dāng)位于所述停留序列的后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離小于第二距離閾值時,將所述位于所述停留序列的后方的第一個候選停留位置放入所述停留序列,重新確定所述停留序列的中心, (c)重復(fù)(b),直到位于所述停留序列后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離大于第二距離閾值時,當(dāng)所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔大于第二時間閾值時,則(b)中所述停留序列的中心為停留點(diǎn)。
8.如權(quán)利要求7所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,所述(2)中,所述多個相鄰的速度均在速度閾值以下的軌跡點(diǎn)合并為一個候選停留位置,是通過以下方式實(shí)現(xiàn)的, 依次計(jì)算所述候選停留位置中兩個相鄰軌跡點(diǎn)的平均坐標(biāo)(X(i,i+1),y(i,i+1)), 依次計(jì)算所述兩個相鄰軌跡點(diǎn)之間的時間間隔At(i,i+1)、與所述候選停留位置的停留時長Stay' . A t之間的比值wight(i,i+1), 計(jì)算所述候選停留位置的坐標(biāo)
9.如權(quán)利要求7所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,所述(3)中,(b)中所述停留序列的中心是通過以下方式實(shí)現(xiàn)的, 計(jì)算位于所述停留序列的后方的第一個候選停留位置的停留時長Stay’ " At與所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔Sq. At之間的比值wi ghh,計(jì)算所述停留序列的中心坐標(biāo)(Sq. X, Sq. y)Sq. X = Wighti Stay' x+ (I-Wighti) Sq. x,Sq. y = Wighti Stay, y+(Iiighti) Sq. y。
10.如權(quán)利要求7所述的基于行程識別的出行者活動規(guī)律分析方法,其特征在于,還包括 (5)所述(3)中,(c)中位于所述停留序列后方的第一個候選停留位置到達(dá)所述停留序列的中心的距離大于第二距離閾值時,當(dāng)所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的時間間隔小于第二時間閾值時,則(b)中所述停留序列中第一個候選停留位置的停留時長的開始時刻到最后一個候選停留位置的停留時長的結(jié)束時刻之間的所有的軌跡點(diǎn)均判定為移動點(diǎn),以及所述停 留序列中最后一個候選停留位置的停留時長的結(jié)束時刻到所述停留序列后方的第一個候 選停留位置的停留時長的開始時刻之間的所有的軌跡點(diǎn)均判定為移動點(diǎn)。
全文摘要
本發(fā)明公開了一種基于行程識別的出行者活動規(guī)律分析方法,對n天的經(jīng)行程識別的停留點(diǎn)進(jìn)行分析,當(dāng)停留點(diǎn)符合第一距離閾值條件時,將其合并為一個候選居住地,在所有的候選居住地中,累計(jì)停留時長最大的候選居住地的累計(jì)停留時長達(dá)到第一時間閾值,則將此候選居住地作為居住地。上述過程實(shí)現(xiàn)了對出行者居住地的準(zhǔn)確判斷。在居住地判斷的基礎(chǔ)上,利用本發(fā)明的分析方法,還可以進(jìn)一步研究出行者的日平均休息時長、作息規(guī)律評價指標(biāo)、主要出行位置、日平均出行距離等,從而實(shí)現(xiàn)對出行者的活動規(guī)律的掌握。本發(fā)明針對GPS定位軌跡數(shù)據(jù)或手機(jī)定位軌跡數(shù)據(jù)進(jìn)行分析,均可以獲得準(zhǔn)確的分析結(jié)果。本發(fā)明尤其適用于裝備GPS的出租車駕駛員的活動規(guī)律分析。
文檔編號G06F19/00GK102629297SQ20121005654
公開日2012年8月8日 申請日期2012年3月6日 優(yōu)先權(quán)日2012年3月6日
發(fā)明者仇培元, 吳海燕, 張健欽, 徐志潔 申請人:北京建筑工程學(xué)院