本發(fā)明涉及智能駕駛軌跡預(yù)測(cè),具體為一種基于rcsm-pl網(wǎng)絡(luò)的仿人智能駕駛軌跡規(guī)劃方法。
背景技術(shù):
1、目前針對(duì)車(chē)輛的耗能問(wèn)題的研究,多集中在運(yùn)動(dòng)控制方面、車(chē)輛結(jié)構(gòu)優(yōu)化方面、環(huán)境影響方面對(duì)車(chē)輛的能量消耗問(wèn)題進(jìn)行研究,在車(chē)輛軌跡規(guī)劃方面研究較少,軌跡規(guī)劃對(duì)車(chē)輛的行駛具有指引作用,行駛軌跡的不同將直接影響車(chē)輛行駛消耗情況,故從軌跡規(guī)劃、決策的角度對(duì)工程作業(yè)車(chē)輛的能源消耗情況進(jìn)行研究是非常必要的。
2、常用的軌跡規(guī)劃方法包括圖搜索法、采樣法、人工勢(shì)場(chǎng)法等,其中圖搜索法受環(huán)境輪廓影響較大,較難在場(chǎng)景中搜索出最優(yōu)軌跡;采樣法搜索過(guò)程中隨機(jī)性較大,搜索軌跡會(huì)導(dǎo)致車(chē)輛能耗較高;人工勢(shì)場(chǎng)法在接近障礙物時(shí),規(guī)劃軌跡會(huì)出現(xiàn)大幅擺動(dòng)的現(xiàn)象,故應(yīng)用時(shí)受到限制。非結(jié)構(gòu)環(huán)境中的道路無(wú)法呈現(xiàn)規(guī)則的道路形狀,以上提出的規(guī)劃方法優(yōu)化出的軌跡會(huì)為車(chē)輛帶來(lái)較多的冗余里程負(fù)擔(dān),當(dāng)車(chē)輛跟蹤行駛時(shí)會(huì)消耗較多的能量,并且從能耗方面提取特征從而設(shè)計(jì)出約束函數(shù)具有較大難度,需要尋找合適的方法在非結(jié)構(gòu)環(huán)境中規(guī)劃出使車(chē)輛跟蹤行駛時(shí)減少能源消耗的軌跡。
3、因此提供一種基于rcsm-pl網(wǎng)絡(luò)的仿人智能駕駛軌跡規(guī)劃方法解決上述問(wèn)題,從軌跡規(guī)劃的角度對(duì)車(chē)輛的能耗問(wèn)題進(jìn)行研究,通過(guò)采用數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法來(lái)學(xué)習(xí)人類(lèi)操控行為,規(guī)劃出一種較好的方式能夠符合人類(lèi)操控習(xí)慣的軌跡,并且機(jī)器學(xué)習(xí)方法避免了手動(dòng)設(shè)計(jì)約束函數(shù)的過(guò)程,可以直接從操控?cái)?shù)據(jù)中學(xué)習(xí)決策規(guī)則,人類(lèi)操控員可以根據(jù)復(fù)雜變化的環(huán)境調(diào)整不同的操控路線(xiàn),從而操控車(chē)輛安全、平穩(wěn)的行駛。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的實(shí)施例提供一種基于rcsm-pl網(wǎng)絡(luò)的仿人智能駕駛軌跡規(guī)劃方法,以解決上述背景技術(shù)中提出的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于rcsm-pl網(wǎng)絡(luò)的仿人智能駕駛軌跡規(guī)劃方法,包括以下步驟:
3、步驟1:進(jìn)行駕駛操控軌跡數(shù)據(jù)采集;
4、步驟2:對(duì)步驟1采集的駕駛操控軌跡數(shù)據(jù)進(jìn)行分析;
5、步驟3:對(duì)步驟2處理出的雷達(dá)圖以及原始圖像中的軌跡數(shù)據(jù)特征進(jìn)行提??;
6、步驟4:使用多頭注意力機(jī)制通過(guò)不同維度的線(xiàn)性變換對(duì)步驟3提取出的行駛軌跡空間特征進(jìn)行學(xué)習(xí);
7、步驟5:根據(jù)步驟4中得到的補(bǔ)償網(wǎng)絡(luò)輸出的未來(lái)軌跡點(diǎn)、電量以及動(dòng)力學(xué)特征參數(shù)在時(shí)間上具有較強(qiáng)相關(guān)性,以lstm網(wǎng)絡(luò)作為基礎(chǔ)結(jié)構(gòu),去捕捉和記憶時(shí)間序列中的長(zhǎng)期依賴(lài)關(guān)系。
8、優(yōu)選的,所述人類(lèi)操控原始數(shù)據(jù)采集模塊中駕駛操控軌跡數(shù)據(jù)包括行駛軌跡電量參數(shù)和行駛空間場(chǎng)景參數(shù),其中行駛空間場(chǎng)景參數(shù)為雷達(dá)坐標(biāo)數(shù)據(jù)和行駛區(qū)域圖像像素?cái)?shù)據(jù)。
9、優(yōu)選的,所述人類(lèi)操控?cái)?shù)據(jù)分析模塊中其分析包括以下步驟;
10、步驟2.1:人類(lèi)操控軌跡及電量分析單元中對(duì)行駛軌跡電量參數(shù)進(jìn)行分析,選擇5條行駛路線(xiàn),然后對(duì)不同行駛路線(xiàn)下車(chē)輛行駛過(guò)程中左右輪的電能消耗進(jìn)行累積,根據(jù)電能消耗累積的結(jié)果繪制出5條路線(xiàn)下車(chē)輛電量累積消耗圖,從而選擇圖2中id1路線(xiàn)對(duì)應(yīng)的軌跡數(shù)據(jù),最后對(duì)采集的數(shù)據(jù)進(jìn)行分組處理,用于深度網(wǎng)絡(luò)的訓(xùn)練;
11、步驟2.2:行駛空間場(chǎng)景處理與分析單元中對(duì)行駛空間場(chǎng)景參數(shù)進(jìn)行分析,包括以下步驟:
12、步驟2.2.1:仿人操控軌跡信息,坐標(biāo)轉(zhuǎn)換模型為:其中xl,yl,zl分別表示激光雷達(dá)坐標(biāo)系中點(diǎn)云坐標(biāo),λ表示尺度因子,ui,vi表示像素坐標(biāo)系下點(diǎn)云坐標(biāo),m表示相機(jī)內(nèi)參,r、t分別表示相機(jī)與激光雷達(dá)之間的旋轉(zhuǎn)矩陣和偏移向量;
13、步驟2.2.2:對(duì)激光雷達(dá)采集的點(diǎn)云數(shù)據(jù)在高度方向進(jìn)行投影,處理出二值可行使區(qū)域,黑色像素為不可行使區(qū)域,白色像素為可行使區(qū)域,之后將可行域均分為8個(gè)部分,對(duì)每一部分的中不可行駛區(qū)域占總區(qū)域的百分比進(jìn)行計(jì)算,從而以每一部分的占比作為獨(dú)立維度繪制出雷達(dá)圖,其不可行駛區(qū)域占比計(jì)算模型為:其中ni表示不同區(qū)域的總像素點(diǎn)數(shù)量,nb表示對(duì)應(yīng)區(qū)域黑色像素?cái)?shù)量,p表示黑色像素?cái)?shù)量占比。
14、優(yōu)選的,所述時(shí)空序列軌跡規(guī)劃特征提取模塊中通過(guò)采用resnet50網(wǎng)絡(luò)中的殘差結(jié)構(gòu),殘差模型為:y=r(x,{wi})+x,其中x和y表示殘差塊的輸入和輸出,r(·)表示待學(xué)習(xí)的殘差映射,wi表示待學(xué)習(xí)的參數(shù),r(·)+x表示相應(yīng)位置的和。
15、優(yōu)選的,所述時(shí)空序列軌跡規(guī)劃特征提取模塊中在殘差塊中引入通道注意力,對(duì)有用的特征通道進(jìn)行關(guān)注,忽略其他通道,通過(guò)最大池化和平均池化對(duì)輸入特征圖f的空間信息進(jìn)行聚合,生成兩種不同類(lèi)型的特征:最大池化特征和平均池化特征;然后,將兩種不同類(lèi)型的特征傳送到一個(gè)由具有一個(gè)隱藏層的多層感知器(multi-layer?perceptrons)組成的權(quán)重共享網(wǎng)絡(luò),再經(jīng)過(guò)進(jìn)一步的最大池化和平均池化以及一個(gè)非線(xiàn)性激活單元,生成通道注意力圖mc(f),將生成的mc(f)和輸入特征圖f通過(guò)element-wise?multiplication合并后得出f',計(jì)算模型為:mc(f)=σ(mlp(avgpool(f))+mlp(maxpool(f))),其中σ表示激活函數(shù),表示逐元素相乘。
16、優(yōu)選的,所述時(shí)空序列軌跡規(guī)劃特征提取模塊中將f'輸入空間注意力中,對(duì)感興趣的局部區(qū)域進(jìn)行關(guān)注,沿通道維度進(jìn)行最大池化和平均池化操作,得到突出信息區(qū)域,通過(guò)卷積核尺寸為(3×3)的卷積層合并和卷積后,得出空間注意力圖ms(f'),然后,通過(guò)空間特征圖ms(f')和f'之間的元素相乘,生成細(xì)化特征圖f”,計(jì)算模型為:
17、ms(f')=σ(f([avgpool(f');maxpool(f')])),其中σ表示sigmoid函數(shù),f表示與濾波器大小的卷積運(yùn)算。
18、優(yōu)選的,所述時(shí)空序列軌跡規(guī)劃特征學(xué)習(xí)模塊中使用多頭注意力機(jī)制通過(guò)不同維度的線(xiàn)性變換對(duì)提取出的行駛軌跡空間特征進(jìn)行學(xué)習(xí),并且加入一層誤差補(bǔ)償層,計(jì)算模型為:其中dn,dk,dv表示不同的維度,誤差補(bǔ)償公式為:其中t0為真值的第一個(gè)序列點(diǎn),p0為預(yù)測(cè)的第一個(gè)序列點(diǎn),δa為第一個(gè)序列點(diǎn)中真值與預(yù)測(cè)點(diǎn)的差,wi和bi為可訓(xùn)練參數(shù),pi為預(yù)測(cè)點(diǎn),pl為補(bǔ)償后預(yù)測(cè)點(diǎn)。
19、優(yōu)選的,所述時(shí)空序列軌跡規(guī)劃特征特征參數(shù)依賴(lài)關(guān)系分析模塊中以lstm網(wǎng)絡(luò)作為基礎(chǔ)結(jié)構(gòu),去捕捉和記憶時(shí)間序列中的長(zhǎng)期依賴(lài)關(guān)系,具體計(jì)算模型如下:
20、it=σ(wic⊙ct-1+wihht-1+wixxt+bi),
21、ft=σ(wft⊙ct-1+wfhht-1+wfxxt+bf),
22、ct=ft⊙ct-1+it⊙tanh(wchht-1+wcxxt+bc),
23、ot=σ(woc⊙ct+wohht-1+woxxt+bo),
24、ht=ot⊙tanh(ct),
25、其中it,ft,ot分別是輸入門(mén)、遺忘門(mén)、輸出門(mén);ct為狀態(tài)細(xì)胞;wuv(u,v∈{x,i,f,c,h,o})表示權(quán)值矩陣;bu(u∈{i,f,c,o})為偏置向量;⊙為元素積;σ(x)=1/(1+e-x)為sigmoid激活函數(shù);ht為短期記憶輸出。
26、本發(fā)明的技術(shù)效果和優(yōu)點(diǎn):
27、1、本發(fā)明通過(guò)高程數(shù)據(jù)對(duì)可行使區(qū)域進(jìn)行分割,并計(jì)算出可行使區(qū)域不同部分的危險(xiǎn)程度,以各部分的危險(xiǎn)程度為獨(dú)立維度構(gòu)建出雷達(dá)圖,作為行駛場(chǎng)景的輔助信息和原始圖片一起輸入深度網(wǎng)絡(luò),用于生成仿人操控軌跡信息,并且通過(guò)不同路線(xiàn)耗能程度對(duì)數(shù)據(jù)進(jìn)行篩選,從而構(gòu)建出人類(lèi)操控行為數(shù)據(jù)集;
28、2、本發(fā)明根據(jù)車(chē)輛動(dòng)力學(xué)特征參數(shù)以及行駛過(guò)程中的耗電量作為約束,引入殘差結(jié)構(gòu),從而避免了網(wǎng)絡(luò)退化現(xiàn)象的發(fā)生,以及在特征提取網(wǎng)絡(luò)中從不同維度融入注意力機(jī)制,對(duì)有用的特征通道和感興趣的局部區(qū)域進(jìn)行關(guān)注,有助于更好的從行駛軌跡空間中提取特征;
29、3、本發(fā)明根據(jù)補(bǔ)償網(wǎng)絡(luò)輸出的未來(lái)軌跡點(diǎn)、電量以及動(dòng)力學(xué)特征參數(shù)在時(shí)間上具有較強(qiáng)相關(guān)性,以lstm網(wǎng)絡(luò)作為基礎(chǔ)結(jié)構(gòu),去捕捉和記憶時(shí)間序列中的長(zhǎng)期依賴(lài)關(guān)系,通過(guò)引入專(zhuān)門(mén)的存儲(chǔ)單元和門(mén)控機(jī)制控制信息流的輸出,從而提高對(duì)未來(lái)長(zhǎng)序列軌跡點(diǎn)的規(guī)劃能力。