本發(fā)明涉及行人過街管理,具體涉及一種信號(hào)控制條件下的行人過街忍耐時(shí)間預(yù)測方法。
背景技術(shù):
1、隨著環(huán)境保護(hù)的重視和對(duì)碳排放問題的關(guān)注日益增加,減少化石燃料的使用和降低空氣污染的必要性已經(jīng)變得顯而易見。因此,推廣低碳的交通方式,如步行,已經(jīng)在社會(huì)中廣泛接受。步行不僅是主要的綠色交通方式,還在連接城市公共交通系統(tǒng)中起著關(guān)鍵作用。
2、然而,在以機(jī)動(dòng)車化交通為主的發(fā)展模式引導(dǎo)下,城市普遍存在著步行環(huán)境差、步行設(shè)施設(shè)置不當(dāng)?shù)葐栴},尤其是過街交通信號(hào)控制參數(shù)通?;诩?jì)的行人步行速度,缺乏精細(xì)化和靈活性,因?yàn)樗鼈兒苌倏紤]行人的個(gè)性化量化特征,如當(dāng)前等待行人對(duì)紅燈時(shí)間長度的容忍度。這導(dǎo)致了許多城市中的行人紅燈信號(hào)過長超過其忍耐時(shí)間,出現(xiàn)部分行人在紅燈期間違規(guī)過街的現(xiàn)象,嚴(yán)重影響了行人的過街安全和體驗(yàn)。研究表明,忽視紅燈的行人更容易受傷。因此,研究行人對(duì)紅燈的容忍時(shí)間及其影響因素對(duì)于促進(jìn)低碳出行和行人安全具有重要意義。
3、申請(qǐng)人發(fā)現(xiàn),通過對(duì)各時(shí)段到達(dá)過街等待區(qū)的每個(gè)行人進(jìn)行等待忍耐度計(jì)算,可以得到每個(gè)時(shí)刻的等待人群忍耐時(shí)間的概率分布函數(shù)、期望值、方差等,進(jìn)而可以在一定顯著性水平下(如5%)計(jì)算當(dāng)前總體人群的等待時(shí)間上限,以此作為當(dāng)前信號(hào)最大紅燈時(shí)長的確定依據(jù)。尤其在車聯(lián)網(wǎng)環(huán)境下,路側(cè)網(wǎng)聯(lián)設(shè)施可將過街等待行人的時(shí)間分布對(duì)網(wǎng)聯(lián)車輛進(jìn)行實(shí)時(shí)反饋,以提醒網(wǎng)聯(lián)車輛提前進(jìn)行加速或減速操作。該紅燈時(shí)長的設(shè)置還可以解決目前以固定參數(shù)為主、難以適應(yīng)不同時(shí)段人員構(gòu)成的問題,可伴隨人群的構(gòu)成進(jìn)行實(shí)時(shí)彈性設(shè)置,減少行人違規(guī)過街的概率,協(xié)調(diào)行人與機(jī)動(dòng)車的通行效益。同時(shí)根據(jù)每個(gè)到達(dá)過街等待區(qū)的人員對(duì)于等待時(shí)間的計(jì)算結(jié)果,可對(duì)交通管理人員進(jìn)行預(yù)警。尤其在機(jī)動(dòng)車交通流量過大等原因?qū)е碌臒o法滿足行人在最大忍耐時(shí)間內(nèi)通過的情況下,交通管理人員可針對(duì)低忍耐度人群進(jìn)行必要的關(guān)注或主動(dòng)的情緒安撫,以外界干預(yù)的形式延長該類行人的忍耐時(shí)間長度,降低行人違規(guī)過街概率。
4、目前針對(duì)行人紅燈容忍時(shí)間的研究大致可以分為三個(gè)方面:影響行人紅燈忍耐時(shí)間的因素、行人紅燈忍耐時(shí)間的數(shù)值研究以及行人忍耐時(shí)間的模型選擇和建立。
5、在模型建立方面,許多方案使用了確定性模型如邏輯回歸。盡管這些模型易于實(shí)施和解釋,但其準(zhǔn)確性依賴于數(shù)據(jù)質(zhì)量,并且它們不考慮行人過街?jǐn)?shù)據(jù)的刪失影響。為了解決數(shù)據(jù)刪失的影響,有方案選擇了傳統(tǒng)的生存分析模型,這些模型最初用于醫(yī)學(xué)領(lǐng)域研究患者的生存時(shí)間,可以處理刪失數(shù)據(jù)。然而,這些非參數(shù)持續(xù)時(shí)間模型無法量化影響因素對(duì)闖紅燈行為的影響,也無法考慮協(xié)變量對(duì)容忍時(shí)間的影響。進(jìn)一步的研究結(jié)合了傳統(tǒng)生存分析和威布爾分布創(chuàng)建了全參數(shù)模型進(jìn)行分析,但這些模型要求生存時(shí)間的分布服從威布爾分布,而行人容忍時(shí)間并非總是如此。還有方案引入了deepwait深度學(xué)習(xí)框架,利用虛擬現(xiàn)實(shí)技術(shù)模擬的數(shù)據(jù)來預(yù)測非信號(hào)控制條件下行人的容忍時(shí)間,但這缺乏對(duì)現(xiàn)實(shí)中影響行人容忍時(shí)間的許多因素的考慮。
6、由于過街行人等待忍耐時(shí)間無法直接測量,目前主要集中在通過建立回歸模型進(jìn)行預(yù)測的研究上。該領(lǐng)域的現(xiàn)有研究仍存在的不足包括:1)在行人忍耐度預(yù)測前缺乏忍耐度類型分類。由于不同類型行人在受到相同因素的影響時(shí),其受影響的效果與程度可能并不相同,因此需要將行人根據(jù)其忍耐相關(guān)特性(即類型)進(jìn)行分類。2)大多數(shù)研究集中在行人容忍時(shí)間影響因素的宏觀層面和以群體為對(duì)象的容忍時(shí)間分布,缺乏針對(duì)微觀行人個(gè)體特征的容忍時(shí)間預(yù)測。3)目前研究普遍使用單一模型進(jìn)行預(yù)測,而行人過街容忍時(shí)間所受影響因素復(fù)雜多樣,應(yīng)從不同角度進(jìn)行綜合分析。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)上述現(xiàn)有技術(shù)的不足,本發(fā)明所要解決的技術(shù)問題是:如何提供一種信號(hào)控制條件下的行人過街忍耐時(shí)間預(yù)測方法,通過隨機(jī)生存森林模型和k-means聚類算法對(duì)行人樣本進(jìn)行忍耐度類型分組,以解決預(yù)測前缺乏忍耐度類型分類的問題;通過構(gòu)建行人個(gè)體的stacking集成模型來實(shí)現(xiàn)微觀個(gè)體行人特征的容忍時(shí)間預(yù)測,同時(shí)采用多種模型從不同角度對(duì)人過街容忍時(shí)間進(jìn)行綜合分析,從而提高行人過街忍耐時(shí)間預(yù)測的準(zhǔn)確性和性能。
2、為了解決上述技術(shù)問題,本發(fā)明采用了如下的技術(shù)方案:
3、一種信號(hào)控制條件下的行人過街忍耐時(shí)間預(yù)測方法,包括:
4、s1:獲取行人過街?jǐn)?shù)據(jù)集;
5、s2:通過隨機(jī)生存森林模型計(jì)算行人過街?jǐn)?shù)據(jù)集中每個(gè)行人樣本的風(fēng)險(xiǎn)得分;使用k-means聚類算法結(jié)合風(fēng)險(xiǎn)得分對(duì)行人樣本進(jìn)行忍耐度類型分組,生成若干個(gè)忍耐度類型的數(shù)據(jù)集;將每個(gè)忍耐度的數(shù)據(jù)集劃分為訓(xùn)練集和測試集;
6、s3:構(gòu)建stacking集成模型;stacking集成模型的第一層包括若干個(gè)初級(jí)模型,第二層包括一個(gè)元模型;
7、s4:通過貝葉斯超參數(shù)優(yōu)化算法對(duì)各個(gè)初級(jí)模型進(jìn)行超參數(shù)調(diào)優(yōu);將訓(xùn)練集按照五折交叉驗(yàn)證輸入各個(gè)初級(jí)模型進(jìn)行訓(xùn)練,輸出各個(gè)初級(jí)模型的預(yù)測結(jié)果;
8、s5:將各個(gè)初級(jí)模型的預(yù)測結(jié)果與對(duì)應(yīng)的真實(shí)值整合為新訓(xùn)練集和新測試集輸入至元模型,輸出對(duì)應(yīng)的忍耐時(shí)間預(yù)測值;
9、s6:通過訓(xùn)練好的stacking集成模型基于某個(gè)行人的特征數(shù)據(jù)輸出相應(yīng)的忍耐時(shí)間預(yù)測值。
10、優(yōu)選的,步驟s2中,隨機(jī)生存森林模型的處理步驟如下:
11、s201:定義隨機(jī)生存森林模型的死亡事件為一個(gè)信號(hào)周期內(nèi)行人過街過程中的闖紅燈行為;
12、s202:以行人過街?jǐn)?shù)據(jù)集中的所有行人樣本為根節(jié)點(diǎn)生成n棵生存樹;
13、對(duì)于單棵生存樹,通過如下公式計(jì)算第i個(gè)行人樣本在該生存樹葉節(jié)點(diǎn)h的累積風(fēng)險(xiǎn)函數(shù):
14、
15、式中:xi(i=1,2,3...)表示選取的影響行人樣本i的特征協(xié)變量;t表示行人樣本已被觀察的時(shí)間;ti,h表示葉節(jié)點(diǎn)h中第i個(gè)行人樣本所經(jīng)歷過的時(shí)間點(diǎn);di,h表示在ti,h時(shí)刻死亡的行人樣本數(shù)量;si,h表示在ti,h時(shí)刻存活的行人樣本數(shù)量;
16、s203:將行人過街?jǐn)?shù)據(jù)集中的行人樣本以有放回的形式隨機(jī)抽取樣本建立樣本子集;將樣本子集劃分為袋外數(shù)據(jù)和袋內(nèi)數(shù)據(jù);
17、s204:對(duì)于來自袋外數(shù)據(jù)的第i個(gè)行人樣本,通過如下公式計(jì)算其在所有生存樹中的集成累積風(fēng)險(xiǎn)函數(shù)
18、
19、式中:n表示隨機(jī)生存森林中第n棵生存樹;表示袋外數(shù)據(jù)第n棵生存樹的累積風(fēng)險(xiǎn)函數(shù);當(dāng)行人樣本為袋外數(shù)據(jù)時(shí),定義ii,n=1,否則ii,n=0;
20、s205:對(duì)于來自袋內(nèi)數(shù)據(jù)的第i個(gè)行人樣本,通過如下公式計(jì)算其在所有生存樹中的集成累積風(fēng)險(xiǎn)函數(shù)
21、
22、式中:h*n(t|xi)表示袋內(nèi)數(shù)據(jù)第n棵生存樹的累積風(fēng)險(xiǎn)函數(shù);
23、s206:對(duì)于來自袋外數(shù)據(jù)的第i個(gè)行人樣本,通過如下公式計(jì)算其集成死亡率即風(fēng)險(xiǎn)得分
24、
25、式中:表示來自袋外數(shù)據(jù)的第i個(gè)行人樣本在所有生存樹中的集成累積風(fēng)險(xiǎn)函數(shù);j表示未進(jìn)行自助采樣數(shù)據(jù)中行人樣本總數(shù);tj表示未進(jìn)行自助采樣數(shù)據(jù)中第j個(gè)行人樣本的生存時(shí)間;
26、s207:對(duì)于來自袋內(nèi)數(shù)據(jù)的第i個(gè)行人樣本,通過如下公式計(jì)算其集成死亡率即風(fēng)險(xiǎn)得分
27、
28、式中:表示來自袋內(nèi)數(shù)據(jù)的第i個(gè)行人在所有生存樹中的集成累積風(fēng)險(xiǎn)函數(shù)。
29、優(yōu)選的,步驟s2中,k-means聚類算法的處理步驟如下:
30、s211:確定k-means聚類算法的k值;
31、s212:從行人過街?jǐn)?shù)據(jù)集中隨機(jī)選擇k個(gè)行人樣本作為初始的聚類中心;
32、s213:對(duì)于行人過街?jǐn)?shù)據(jù)集中的每一個(gè)行人樣本,通過風(fēng)險(xiǎn)得分計(jì)算其與每一個(gè)聚類中心的距離,并將其分配到距離最近的聚類中心所屬的類別中;
33、s214:對(duì)于每一個(gè)類別,重新計(jì)算其聚類中心;
34、s215:重復(fù)步驟s213至s214,重新分配行人樣本到最近聚類中心所屬的類別并更新類別的聚類中心,直至達(dá)到預(yù)設(shè)的迭代停止條件,生成k個(gè)忍耐度類型的數(shù)據(jù)集。
35、優(yōu)選的,步驟s211中,通過輪廓系數(shù)法確定k-means聚類算法的最優(yōu)k值;
36、具體步驟如下:
37、s2111:確定k值的取值范圍;
38、s2112:對(duì)于取值范圍內(nèi)的每一個(gè)k值,使用k-means算法對(duì)行人過街?jǐn)?shù)據(jù)集進(jìn)行聚類生成k個(gè)類別;
39、s2113:通過如下公式計(jì)算輪廓系數(shù);
40、
41、式中:s表示行人樣本之間的相似性即輪廓系數(shù);da表示行人樣本與同一簇中所有其他行人樣本的平均歐式距離,即行人樣本與同一簇中其他行人樣本的相似度;db表示行人樣本與下一個(gè)最近簇中所有行人樣本的平均歐式距離,即行人樣本與下一個(gè)最近簇中其他行人樣本的相似度;
42、s2114:選擇輪廓系數(shù)s最靠近1的k值作為k-means聚類算法的最優(yōu)k值。
43、優(yōu)選的,步驟s3中,stacking集成模型的第一層的初級(jí)模型包括神經(jīng)網(wǎng)絡(luò)多層感知機(jī)模型、支持向量機(jī)回歸模型、隨機(jī)森林模型和/或xgboost模型。
44、優(yōu)選的,對(duì)行人過街?jǐn)?shù)據(jù)集中的特征進(jìn)行不同角度劃分,包括:
45、行人自身特征集:性別、年齡、分心狀態(tài)和/或步速;
46、環(huán)境特征集:前方有無違章者、天色、人流量和/或團(tuán)體規(guī)模;
47、隨機(jī)森林模型選出的特征集:年齡、分心狀態(tài)、前方有無違章者、天色、人流量和/或步速;
48、神經(jīng)網(wǎng)絡(luò)多層感知機(jī)模型、支持向量機(jī)回歸模型和xgboost模型選出的特征集:年齡、分心狀態(tài)、前方有無違章者、天色、人流量、團(tuán)體規(guī)模和/或步速。
49、優(yōu)選的,步驟s3中,stacking集成模型的第二層的元模型包括使用多元線性回歸模型。
50、優(yōu)選的,步驟s4中,貝葉斯超參數(shù)優(yōu)化算法的處理步驟如下:
51、s401:定義初級(jí)模型的目標(biāo)函數(shù)和超參數(shù)范圍;
52、s402:選擇一個(gè)代理模型來近似近似初級(jí)模型的目標(biāo)函數(shù);
53、s403:隨機(jī)選擇一組超參數(shù)配置來訓(xùn)練初級(jí)模型,在驗(yàn)證集上評(píng)估初級(jí)模型的性能;將這些超參數(shù)配置和對(duì)應(yīng)的性能指標(biāo)作為初始數(shù)據(jù)點(diǎn)用于訓(xùn)練代理模型;
54、s404:代理模型基于已有的數(shù)據(jù)集預(yù)測整個(gè)超參數(shù)空間中的性能;使用采集函數(shù)來平衡探索和利用,選擇下一個(gè)要評(píng)估的超參數(shù)配置;
55、s405:使用選定的超參數(shù)配置訓(xùn)練初級(jí)模型,并在驗(yàn)證集上評(píng)估其性能;
56、s406:將新的評(píng)估結(jié)果添加到代理模型的數(shù)據(jù)集中,并更新代理模型;
57、s407:重復(fù)步驟s404至s406,直至滿足迭代停止條件。
58、優(yōu)選的,步驟s4中,五折交叉驗(yàn)證訓(xùn)練初級(jí)模型的處理步驟如下:
59、s401:將某種忍耐度類型的數(shù)據(jù)集按照8:2劃分為訓(xùn)練集與測試集;
60、s402:將訓(xùn)練集分為5折;在每次訓(xùn)練中選擇其中4折作為訓(xùn)練集,余下1折作為驗(yàn)證集;
61、s403:根據(jù)步驟s402中的劃分結(jié)果組合出不同的訓(xùn)練集,訓(xùn)練出模型model_i;通過model_i預(yù)測對(duì)應(yīng)組的驗(yàn)證集,得到一個(gè)1折的一維預(yù)測序列驗(yàn)證預(yù)測結(jié)果i;同時(shí)使用model_i預(yù)測測試集,也會(huì)得到一個(gè)一維預(yù)測序列測試預(yù)測結(jié)果i;如此循環(huán),直到遍歷完所有的組合,最終得到5個(gè)驗(yàn)證預(yù)測結(jié)果i和5個(gè)測試預(yù)測結(jié)果i;
62、s404:將5個(gè)驗(yàn)證預(yù)測結(jié)果i依次縱向合并成一個(gè)一維預(yù)測序列新訓(xùn)練特征j,同時(shí)對(duì)5個(gè)測試預(yù)測結(jié)果i求平均得到一個(gè)基于測試集的預(yù)測序列新測試特征j;
63、s405:分別對(duì)各個(gè)初級(jí)模型重復(fù)s403至s404的操作,最終得到4個(gè)新訓(xùn)練特征j和4個(gè)新測試特征j。
64、優(yōu)選的,步驟s5中,訓(xùn)練元模型的處理步驟如下:
65、s501:將4個(gè)新訓(xùn)練特征j和訓(xùn)練集對(duì)應(yīng)的忍耐時(shí)間真實(shí)值依次進(jìn)行橫向合并得到一個(gè)新的5維新訓(xùn)練集;
66、s502:將4個(gè)新測試集j和測試集對(duì)應(yīng)的忍耐時(shí)間真實(shí)值依次進(jìn)行橫向合并,得到一個(gè)新的5維新測試集;
67、s503:使用元模型根據(jù)新訓(xùn)練集和新測試集進(jìn)行訓(xùn)練并輸出忍耐時(shí)間預(yù)測值。
68、本發(fā)明中信號(hào)控制條件下的行人過街忍耐時(shí)間預(yù)測方法與現(xiàn)有技術(shù)相比,具有如下有益效果:
69、本發(fā)明針對(duì)行人忍耐度預(yù)測前缺乏忍耐度類型分類的問題,通過隨機(jī)生存森林模型計(jì)算行人過街?jǐn)?shù)據(jù)集中每個(gè)行人樣本的風(fēng)險(xiǎn)得分,進(jìn)而使用k-means聚類算法結(jié)合風(fēng)險(xiǎn)得分對(duì)行人樣本進(jìn)行忍耐度類型分組生成多個(gè)忍耐度類型的數(shù)據(jù)集。首先隨機(jī)生存森林模型能夠處理含有時(shí)間到事件數(shù)據(jù)的問題,如行人過街忍耐時(shí)間的預(yù)測,通過隨機(jī)生存森林模型計(jì)算的風(fēng)險(xiǎn)得分可以精確量化每個(gè)行人樣本過街前等待時(shí)間的緊迫性或傾向性。其次結(jié)合k-means聚類算法,根據(jù)風(fēng)險(xiǎn)得分將行人樣本分為不同的忍耐度類型(如高忍耐度、中忍耐度、低忍耐度),有助于發(fā)現(xiàn)不同人群在過街行為上的差異,從而為后續(xù)模型的訓(xùn)練提供更加細(xì)致和有針對(duì)性的數(shù)據(jù)集。最后通過忍耐度類型分組,使得每個(gè)忍耐度類型的數(shù)據(jù)集更加純凈,減少了模型在訓(xùn)練過程中的噪聲干擾,從而提高模型對(duì)不同類型行人的預(yù)測精度和泛化能力。
70、本發(fā)明針對(duì)缺乏微觀行人個(gè)體特征的容忍時(shí)間預(yù)測以及模型單一的問題,構(gòu)建了定量化的行人忍耐度分類標(biāo)準(zhǔn)和分類模型即stacking集成模型,其中stacking集成模型是針對(duì)不同類型的行人設(shè)計(jì)專門的預(yù)測模型。首先stacking集成模型的第一層包括神經(jīng)網(wǎng)絡(luò)多層感知機(jī)(mlp)模型、支持向量機(jī)回歸(svr)模型、隨機(jī)森林(rf)模型和xgboost(xgb)模型),第二層為元模型(mlr模型,這些模型具有不同的學(xué)習(xí)機(jī)制和優(yōu)缺點(diǎn),可以采用多模型從不同角度對(duì)人過街容忍時(shí)間進(jìn)行綜合分析,從而提高行人過街忍耐時(shí)間預(yù)測的準(zhǔn)確性和性能。其次stacking集成模型通過第二層的多元線性回歸模型對(duì)第一層初級(jí)模型的預(yù)測結(jié)果進(jìn)行再次學(xué)習(xí),有助于減少單一模型可能產(chǎn)生的過擬合問題,從而提高模型的穩(wěn)定性和泛化能力。最后由于結(jié)合了多個(gè)初級(jí)模型的預(yù)測結(jié)果,stacking集成模型能夠提供更準(zhǔn)確的預(yù)測結(jié)果,特別是在處理復(fù)雜、非線性或高維數(shù)據(jù)時(shí)表現(xiàn)尤為突出。
71、本發(fā)明針對(duì)機(jī)器學(xué)習(xí)模型中的人工設(shè)置超參數(shù)通常不能達(dá)到全局最優(yōu)的問題,通過貝葉斯超參數(shù)優(yōu)化算法對(duì)各個(gè)初級(jí)模型進(jìn)行超參數(shù)調(diào)優(yōu)。首先貝葉斯優(yōu)化算法能夠自動(dòng)化地搜索最優(yōu)的超參數(shù)組合,避免了人工調(diào)參的繁瑣和主觀性,從而能夠提高調(diào)參效率和準(zhǔn)確性。其次貝葉斯優(yōu)化算法通過構(gòu)建代理模型來逼近真實(shí)的目標(biāo)函數(shù),利用貝葉斯超參數(shù)優(yōu)化算法更新代理模型,逐步縮小搜索空間,從而能夠高效地找到最優(yōu)或接近最優(yōu)的超參數(shù)組合。最后通過優(yōu)化超參數(shù),可以使各個(gè)初級(jí)模型在訓(xùn)練過程中更加適應(yīng)數(shù)據(jù)特點(diǎn),從而提升stacking集成模型的預(yù)測性能。
72、本發(fā)明將訓(xùn)練集按照五折交叉驗(yàn)證輸入各個(gè)初級(jí)模型進(jìn)行訓(xùn)練,輸出各個(gè)初級(jí)模型的預(yù)測結(jié)果,進(jìn)而將各個(gè)初級(jí)模型的預(yù)測結(jié)果與對(duì)應(yīng)的真實(shí)值整合為新訓(xùn)練集和新測試集輸入至元模型輸出對(duì)應(yīng)的忍耐時(shí)間預(yù)測值。首先五折交叉驗(yàn)證通過將數(shù)據(jù)集分為五個(gè)部分,輪流作為測試集和訓(xùn)練集進(jìn)行多次訓(xùn)練和測試,可以評(píng)估各個(gè)模型在不同數(shù)據(jù)集上的表現(xiàn)差異,從而判斷初級(jí)模型的穩(wěn)定性。其次交叉驗(yàn)證通過多次訓(xùn)練和測試,可以減少模型對(duì)特定訓(xùn)練數(shù)據(jù)的依賴,降低過擬合的風(fēng)險(xiǎn),從而提高模型的泛化能力。最后由于交叉驗(yàn)證提供了對(duì)模型性能的全面評(píng)估,使得基于該評(píng)估結(jié)果選擇的最佳模型將能夠提供更可靠、更穩(wěn)定的預(yù)測結(jié)果,從而提高行人過街忍耐時(shí)間預(yù)測的性能。