本發(fā)明涉及鐵路機(jī)車(chē)節(jié)能操縱領(lǐng)域,尤其涉及一種用于實(shí)現(xiàn)機(jī)車(chē)節(jié)能操縱的雙向LSTM模型訓(xùn)練方法。
背景技術(shù):
機(jī)車(chē)運(yùn)行控制系統(tǒng)是一個(gè)典型的多目標(biāo)、多約束、非線性的復(fù)雜控制系統(tǒng),需要保證可靠性、安全性、準(zhǔn)時(shí)性以及節(jié)油性,所以機(jī)車(chē)節(jié)能操縱問(wèn)題是一個(gè)非線性有約束的多目標(biāo)動(dòng)態(tài)優(yōu)化問(wèn)題。而該類(lèi)問(wèn)題由于在解決過(guò)程中需要考慮眾多復(fù)雜的約束條件,整個(gè)優(yōu)化的搜索空間非常大,是一個(gè)短時(shí)間內(nèi)較難搜索到最優(yōu)解的問(wèn)題,對(duì)其研究的現(xiàn)實(shí)意義重大。
現(xiàn)有的機(jī)車(chē)節(jié)能操縱運(yùn)行的優(yōu)化方法可以分為數(shù)值搜索方法、解析求解方法和啟發(fā)式策略設(shè)計(jì)方法。其中數(shù)值搜索指通過(guò)數(shù)值搜索算法對(duì)操縱序列進(jìn)行尋優(yōu)搜索從而得到優(yōu)化的操縱序列,常見(jiàn)的算法有遺傳算法、群搜索算法、動(dòng)態(tài)規(guī)劃等,但是這種方式耗時(shí)長(zhǎng),且很難收斂到最優(yōu)結(jié)果;解析求解方法指基于領(lǐng)域知識(shí)對(duì)操縱控制過(guò)程中不同狀況下的關(guān)鍵轉(zhuǎn)換點(diǎn)根據(jù)解析公式求解來(lái)得到最終的優(yōu)化操縱序列,但這種方式主要缺陷是轉(zhuǎn)換點(diǎn)的解析公式推導(dǎo)過(guò)程復(fù)雜,較難處理多約束條件;啟發(fā)式策略設(shè)計(jì)方法是指考慮諸多復(fù)雜因素,人工通過(guò)現(xiàn)有領(lǐng)域的一些操作規(guī)范等啟發(fā)式的進(jìn)行策略設(shè)計(jì),該種方式過(guò)多的引入人工的分析與設(shè)計(jì),極大的降低了策略設(shè)計(jì)的效率,同時(shí)由于人思考范圍有限,無(wú)法覆蓋所有可能的情況,這勢(shì)必會(huì)導(dǎo)致部分優(yōu)化解遺漏。所以,目前的解決方案均存在著各類(lèi)弊端。
目前由于計(jì)算機(jī)計(jì)算能力的大幅度提升,深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用于多種領(lǐng)域的復(fù)雜問(wèn)題解決方案中,如圖像識(shí)別、機(jī)器翻譯、機(jī)器人控制、自動(dòng)駕駛等。深度學(xué)習(xí)技術(shù)憑借其較強(qiáng)的復(fù)雜狀態(tài)表征能力和復(fù)雜特征抽象能力,在以上這些領(lǐng)域均取得了比傳統(tǒng)解決方法更顯著的成效。所以,將深度學(xué)習(xí)技術(shù)應(yīng)用于機(jī)車(chē)節(jié)能操縱的問(wèn)題解決上,在突破現(xiàn)有方法的復(fù)雜人工設(shè)計(jì)、復(fù)雜公式推導(dǎo)的瓶頸方面具有重要的意義。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種用于實(shí)現(xiàn)機(jī)車(chē)節(jié)能操縱的雙向LSTM模型的訓(xùn)練方法。LSTM屬于遞歸神經(jīng)網(wǎng)絡(luò),特別在處理序列數(shù)據(jù)方面具有較好的效果。本發(fā)明設(shè)計(jì)了雙向LSTM模型,該模型應(yīng)用優(yōu)秀人類(lèi)司機(jī)的歷史駕駛數(shù)據(jù)和機(jī)車(chē)行駛的路段信息數(shù)據(jù)等,進(jìn)行機(jī)車(chē)行駛過(guò)程中的操縱檔位預(yù)測(cè),該檔位的預(yù)測(cè)同時(shí)兼顧安全性(無(wú)超速風(fēng)險(xiǎn)等)、準(zhǔn)時(shí)性以及節(jié)能性;為充分利用數(shù)據(jù)信息,本發(fā)明提出了時(shí)序特征(分為前向特征和后向特征)的提取方法,同時(shí)為有效提升模型的預(yù)測(cè)能力,本發(fā)明也提出了迭代訓(xùn)練雙向LSTM模型的方法。
本發(fā)明通過(guò)如下技術(shù)方案實(shí)現(xiàn):
一種用于實(shí)現(xiàn)機(jī)車(chē)節(jié)能操縱的雙向LSTM模型的訓(xùn)練方法,包括下述步驟:(1)采集司機(jī)歷史駕駛數(shù)據(jù)與機(jī)車(chē)運(yùn)行監(jiān)控日志,作為初始訓(xùn)練數(shù)據(jù);(2)對(duì)初始訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,得到訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集;(3)如果是初次訓(xùn)練,則直接初始化模型的各個(gè)參數(shù),否則在上一次雙向LSTM模型的基礎(chǔ)上繼續(xù)訓(xùn)練雙向LSTM神經(jīng)網(wǎng)絡(luò)模型,并保存訓(xùn)練好的模型;(4)應(yīng)用訓(xùn)練過(guò)的模型對(duì)測(cè)試數(shù)據(jù)集做仿真測(cè)試,得到新的初始訓(xùn)練數(shù)據(jù);(5)將新的初始訓(xùn)練數(shù)據(jù)和上一訓(xùn)練階段的訓(xùn)練數(shù)據(jù)一起作為初始訓(xùn)練數(shù)據(jù)。(6)不斷迭代進(jìn)行(1)~(5)步驟至模型收斂。
所述雙向LSTM模型的訓(xùn)練過(guò)程,特征還在于,所述的初始訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理階段分為兩個(gè)階段:(1)在數(shù)據(jù)滿(mǎn)足安全性、準(zhǔn)點(diǎn)性的基礎(chǔ)上,用如下公式篩選出N條Ji(是第i個(gè)駕駛數(shù)據(jù)的單位車(chē)重油耗)較小的數(shù)據(jù):
其中Ji是第i個(gè)駕駛數(shù)據(jù)的單位車(chē)重油耗,Ei是第i個(gè)駕駛數(shù)據(jù)的總油耗,Wi是第i個(gè)駕駛數(shù)據(jù)的總車(chē)重。
(2)在抽取的數(shù)據(jù)基礎(chǔ)上,進(jìn)一步抽取特征數(shù)據(jù),形成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。本發(fā)明提出的特征數(shù)據(jù)分為前向特征數(shù)據(jù)和后向特征數(shù)據(jù),前向特征數(shù)據(jù)指的是機(jī)車(chē)所處狀態(tài)之前的歷史行駛信息和道路信息,后向特征指機(jī)車(chē)行駛方向的道路信息。
所述雙向LSTM模型的訓(xùn)練過(guò)程,特征還在于,所述的雙向LSTM模型,其輸入層中,特征數(shù)據(jù)分別按照時(shí)間點(diǎn)不同和地理位置不同進(jìn)行輸入,按時(shí)間點(diǎn)不同所對(duì)應(yīng)的輸入數(shù)據(jù)是前向特征數(shù)據(jù),按地理位置不同輸入的數(shù)據(jù)是后向特征數(shù)據(jù)。
所述的本發(fā)明提出的前向特征和后向特征,具體地,前向特征包括17個(gè)特征,分別為車(chē)重、車(chē)長(zhǎng)、重車(chē)輛數(shù)、輕車(chē)輛數(shù)、當(dāng)前坡段平均坡度、當(dāng)前坡段總長(zhǎng)度、當(dāng)前坡段平均速度、當(dāng)前位置的限速值、當(dāng)前限速值的剩余長(zhǎng)度、當(dāng)前點(diǎn)處于的兩個(gè)車(chē)站間的平均速度、當(dāng)前位置距離下一車(chē)站距離、當(dāng)前位置到達(dá)下一車(chē)站的剩余時(shí)間、當(dāng)前檔位、當(dāng)前速度、當(dāng)前位置點(diǎn)的坡度、當(dāng)前速度與限速值的差值;后向特征包括8個(gè)特征,分別為當(dāng)前坡段平均坡度、當(dāng)前坡段總長(zhǎng)度、當(dāng)前坡段剩余長(zhǎng)度、當(dāng)前坡段平均速度、當(dāng)前位置的限速值、當(dāng)前位置距離下一車(chē)站的距離、當(dāng)前位置點(diǎn)的坡度、當(dāng)前機(jī)車(chē)的速度與抽取特征位置點(diǎn)限速的差值。
所述雙向LSTM模型的訓(xùn)練過(guò)程,其特征還在于,所述的不斷迭代過(guò)程也可以設(shè)置迭代固定的次數(shù)之后終止迭代,終止迭代后保存當(dāng)前訓(xùn)練的模型作為最終模型。原始訓(xùn)練數(shù)據(jù)集的采集可以從鐵路機(jī)車(chē)中的LKJ(列車(chē)運(yùn)行控制記錄裝置)獲得,具體包括機(jī)車(chē)屬性,線路屬性以及機(jī)車(chē)行駛?cè)罩尽?/p>
采用上述技術(shù)方案的有益效果是:
(1)本發(fā)明設(shè)計(jì)了17個(gè)前向特征和8個(gè)后向特征,這些特征作為模型的輸入特征數(shù)據(jù),充分利用了數(shù)據(jù)信息。同時(shí)前向特征的設(shè)計(jì)考慮了時(shí)序性和物理位置特點(diǎn),后向特征考慮了位置特點(diǎn),進(jìn)一步提升了模型對(duì)機(jī)車(chē)的狀態(tài)表征能力,從而最終影響預(yù)測(cè)檔位的準(zhǔn)確性;
(2)本發(fā)明在現(xiàn)有LSTM模型的基礎(chǔ)上,提出的雙向LSTM模型和現(xiàn)有技術(shù)最大的區(qū)別在于輸入層中將前向特征和后向特征分離開(kāi)來(lái)分別輸入。本問(wèn)題中的前向特征和后向特征在特征數(shù)量以及特征意義上均有區(qū)別,所以這是根據(jù)本發(fā)明解決問(wèn)題的特殊性而設(shè)計(jì)的結(jié)構(gòu),該結(jié)構(gòu)的設(shè)計(jì)更適用于解決機(jī)車(chē)節(jié)能操縱的問(wèn)題;
(3)本發(fā)明提出了迭代訓(xùn)練雙向LSTM的步驟和方法,經(jīng)過(guò)迭代訓(xùn)練后,模型的檔位預(yù)測(cè)能力將進(jìn)一步得到的提升,甚至得到比人類(lèi)優(yōu)秀司機(jī)更優(yōu)化的操縱檔位。
附圖說(shuō)明
圖1為本發(fā)明的雙向LSTM的訓(xùn)練過(guò)程;
圖2為本發(fā)明的雙向LSTM的網(wǎng)絡(luò)結(jié)構(gòu);
圖3為機(jī)車(chē)在某個(gè)特定線路上應(yīng)用訓(xùn)練好的雙向LSTM模型的仿真行駛流程圖;
圖4為本發(fā)明在特定路線下與人類(lèi)優(yōu)秀司機(jī)駕駛數(shù)據(jù)的對(duì)比圖。
具體實(shí)施方式
為使本發(fā)明更為清晰,下面結(jié)合附圖對(duì)本發(fā)明進(jìn)行詳細(xì)地說(shuō)明。
如圖1所示,本實(shí)施例提供一種基于雙向LSTM的機(jī)車(chē)智能操縱方法,具體包括以下步驟:
步驟S101,采集司機(jī)歷史駕駛數(shù)據(jù)與機(jī)車(chē)運(yùn)行監(jiān)控日志,作為初始訓(xùn)練數(shù)據(jù)。
鐵路機(jī)車(chē)司機(jī)的歷史駕駛數(shù)據(jù)和機(jī)車(chē)運(yùn)行監(jiān)控日志可以從鐵路機(jī)車(chē)中的LKJ(列車(chē)運(yùn)行控制記錄裝置)獲得。針對(duì)一個(gè)特定的司機(jī)在特定的路線上的機(jī)車(chē)駕駛數(shù)據(jù),應(yīng)該收集的數(shù)據(jù)包括:機(jī)車(chē)屬性,線路屬性以及機(jī)車(chē)行駛?cè)罩?。其中,機(jī)車(chē)屬性包括車(chē)重、車(chē)長(zhǎng)、重車(chē)輛數(shù)和輕車(chē)輛數(shù);線路屬性包括線路的坡度、限速信息、車(chē)站信息、兩站之間的運(yùn)行時(shí)間信息;機(jī)車(chē)行駛?cè)罩景〞r(shí)間戳、行駛速度、機(jī)車(chē)行駛檔位、耗油量記錄等信息。收集到的數(shù)據(jù)構(gòu)成初始訓(xùn)練數(shù)據(jù)。
步驟S102,對(duì)初始訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,得到訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。
原始訓(xùn)練數(shù)據(jù)中包含較多冗余信息,且數(shù)據(jù)格式不統(tǒng)一,不能直接作為訓(xùn)練數(shù)據(jù),需要對(duì)原始訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理。預(yù)處理過(guò)程分為兩個(gè)階段,第一階段為從原始訓(xùn)練數(shù)據(jù)中選取司機(jī)駕駛行為較好的數(shù)據(jù)集,選擇標(biāo)準(zhǔn)為滿(mǎn)足安全性、準(zhǔn)點(diǎn)性的基礎(chǔ)上,選擇單位車(chē)重油耗較小的歷史數(shù)據(jù)。其中安全性指行駛過(guò)程中無(wú)安全性問(wèn)題出現(xiàn),準(zhǔn)點(diǎn)性指行駛過(guò)程中無(wú)誤點(diǎn)的現(xiàn)象。以上兩個(gè)指標(biāo)可直接從機(jī)車(chē)行駛?cè)罩局蝎@取。而單位車(chē)重油耗的計(jì)算公式如下:
其中Ji是第i個(gè)駕駛數(shù)據(jù)的單位車(chē)重油耗,Ei是第i個(gè)駕駛數(shù)據(jù)的總油耗,Wi是第i個(gè)駕駛數(shù)據(jù)的總車(chē)重。預(yù)處理第一階段從原始訓(xùn)練數(shù)據(jù)中選取中Ji較小的前N個(gè)駕駛數(shù)據(jù),舍棄其他數(shù)據(jù)。
第二階段,繼續(xù)對(duì)選出的駕駛數(shù)據(jù)進(jìn)行預(yù)處理。根據(jù)雙向LSTM模型處理序列數(shù)據(jù)的特點(diǎn),本發(fā)明提出了針對(duì)機(jī)車(chē)智能操縱問(wèn)題的時(shí)序特征提取方法。對(duì)于一個(gè)特定的機(jī)車(chē)行駛狀態(tài),設(shè)機(jī)車(chē)處于道路的kp公里標(biāo)處,則提取的特征可分為兩部分,分別是在該狀態(tài)前(公里標(biāo)小于kp)機(jī)車(chē)的行駛信息及道路信息和在該狀態(tài)之后(公里標(biāo)大于kp)的道路信息,在該實(shí)施例中分別稱(chēng)作前向特征和后向特征。在該階段,根據(jù)時(shí)序特征提取方法,從原始數(shù)據(jù)中提取出相對(duì)應(yīng)的數(shù)據(jù),最終構(gòu)成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。具體地,該實(shí)施例設(shè)計(jì)的前向特征包括17個(gè)特征,分別為車(chē)重、車(chē)長(zhǎng)、重車(chē)輛數(shù)、輕車(chē)輛數(shù)、當(dāng)前坡段平均坡度、當(dāng)前坡段總長(zhǎng)度、當(dāng)前坡段平均速度、當(dāng)前位置的限速值、當(dāng)前限速值的剩余長(zhǎng)度、當(dāng)前點(diǎn)處于的兩個(gè)車(chē)站間的平均速度、當(dāng)前位置距離下一車(chē)站距離、當(dāng)前位置到達(dá)下一車(chē)站的剩余時(shí)間、當(dāng)前檔位、當(dāng)前速度、當(dāng)前位置點(diǎn)的坡度、當(dāng)前速度與限速值的差值;后向特征包括8個(gè)特征,分別為當(dāng)前坡段平均坡度、當(dāng)前坡段總長(zhǎng)度、當(dāng)前坡段剩余長(zhǎng)度、當(dāng)前坡段平均速度、當(dāng)前位置的限速值、當(dāng)前位置距離下一車(chē)站的距離、當(dāng)前位置點(diǎn)的坡度、當(dāng)前機(jī)車(chē)的速度與抽取特征位置點(diǎn)限速的差值。
本步驟通過(guò)以上闡述的兩階段預(yù)處理方法進(jìn)行數(shù)據(jù)時(shí)序特征點(diǎn)提取,提取出的特征點(diǎn)數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。
步驟S103,在modeli-1的基礎(chǔ)上訓(xùn)練BLSTM神經(jīng)網(wǎng)絡(luò)模型,并保存訓(xùn)練好的模型為modeli。具體的,如果是初次訓(xùn)練,則直接初始化模型的各個(gè)參數(shù),否則在上一次雙向LSTM模型的基礎(chǔ)上繼續(xù)訓(xùn)練雙向LSTM神經(jīng)網(wǎng)絡(luò)模型,并保存訓(xùn)練好的模型;
在本步驟中,根據(jù)步驟S102提取出的訓(xùn)練數(shù)據(jù)進(jìn)行雙向LSTM模型的訓(xùn)練。接下來(lái)首先介紹該實(shí)施例針對(duì)機(jī)車(chē)節(jié)能操縱問(wèn)題提出的雙向LSTM網(wǎng)絡(luò)結(jié)構(gòu)模型如下:
LSTM是一種遞歸神經(jīng)網(wǎng)絡(luò),遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一類(lèi)在隱藏單元上添加了自循環(huán)連接的網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)結(jié)構(gòu)適用于處理序列數(shù)據(jù),特點(diǎn)在于可以將信息持久化,將以前的信息連接到當(dāng)前的任務(wù)中來(lái),增強(qiáng)數(shù)據(jù)的表征能力。但是RNN在處理長(zhǎng)期依賴(lài)數(shù)據(jù)上具有梯度消失的問(wèn)題,LSTM則是解決該問(wèn)題的一種RNN變體。LSTM全稱(chēng)為長(zhǎng)短期記憶網(wǎng)絡(luò),在RNN的基礎(chǔ)上添加了記憶單元、遺忘門(mén)、輸入門(mén)、輸出門(mén)等單元,進(jìn)一步提升其數(shù)據(jù)表征與分析能力。雙向LSTM是在LSTM的基礎(chǔ)上,考慮了序列數(shù)據(jù)上下文信息的網(wǎng)絡(luò)結(jié)構(gòu),也稱(chēng)為BLSTM,該網(wǎng)絡(luò)結(jié)構(gòu)有兩個(gè)獨(dú)立的LSTM網(wǎng)絡(luò),分別處理不同的序列數(shù)據(jù)。BLSTM模型最早在2005年發(fā)表的論文“Framewise phoneme classification with bidirectional LSTM and other neural network architectures”中由Alex Graves等人提出,但該實(shí)施例提出的解決機(jī)車(chē)節(jié)能操縱方法的雙向LSTM的結(jié)構(gòu)與原始BLSTM模型相比,在輸入層的處理方案有所不同,具體結(jié)構(gòu)如圖2所示。
圖2展示的是本實(shí)施例提出的雙向LSTM的3個(gè)時(shí)間步的展開(kāi)形式,整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、前向?qū)?、后向?qū)雍洼敵鰧?。其中輸入層,按時(shí)間輸入的是步驟S102中所述的前向特征信息,每個(gè)時(shí)間步按時(shí)間點(diǎn)輸入該狀態(tài)下的17維度前向特征,按地點(diǎn)輸入的是步驟S102中所述的后向特征信息,每個(gè)時(shí)間步按位置點(diǎn)輸入該位置下的8維度后向特征。其中輸出層使用softmax函數(shù)作為激活函數(shù),輸入層輸入一個(gè)機(jī)車(chē)狀態(tài)對(duì)應(yīng)的多個(gè)前向特征和后向特征后,輸出層能夠輸出所預(yù)測(cè)的下一時(shí)刻的機(jī)車(chē)操縱檔位,這個(gè)檔位是該模型預(yù)測(cè)最優(yōu)的檔位。
以上是對(duì)該實(shí)施例提出的雙向LSTM模型的介紹。在本步驟中,如果是對(duì)雙向LSTM模型的首次訓(xùn)練,則隨機(jī)初始化模型的參數(shù),進(jìn)行模型訓(xùn)練;如果不是首次訓(xùn)練,則模型的初始參數(shù)使用上一次訓(xùn)練結(jié)束時(shí)模型(即模型modeli-1)的參數(shù)。訓(xùn)練結(jié)束后保存模型為modeli。
步驟S104,應(yīng)用模型modeli對(duì)測(cè)試數(shù)據(jù)集做仿真測(cè)試,得到新的初始訓(xùn)練數(shù)據(jù)。模型modeli即步驟S103訓(xùn)練結(jié)束后保存的模型。
本步驟中根據(jù)訓(xùn)練好的雙向LSTM模型,對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行仿真測(cè)試,在測(cè)試結(jié)束后將生成新的初始訓(xùn)練數(shù)據(jù)。仿真測(cè)試的流程如圖3所示。即,首先根據(jù)該實(shí)施例設(shè)計(jì)的前向特征和后向特征,提取出測(cè)試機(jī)車(chē)當(dāng)前狀態(tài)下的特征數(shù)據(jù);然后將提取的特征數(shù)據(jù)作為模型modeli的輸入數(shù)據(jù),并用該模型得出預(yù)測(cè)的檔位;機(jī)車(chē)在仿真環(huán)境下,根據(jù)預(yù)測(cè)的檔位行駛固定的單位時(shí)間T_step,進(jìn)入下一個(gè)新的狀態(tài);如果機(jī)車(chē)已經(jīng)仿真行駛到道路的終點(diǎn),則結(jié)束仿真,否則繼續(xù)進(jìn)行仿真實(shí)驗(yàn)。
根據(jù)以上流程進(jìn)行每個(gè)測(cè)試機(jī)車(chē)的仿真實(shí)驗(yàn),仿真完全模擬真實(shí)環(huán)境下的機(jī)車(chē)行駛效果,所以,本步驟結(jié)束后能夠得到和步驟S101中類(lèi)似的原始訓(xùn)練數(shù)據(jù)。
步驟S105,將新的初始訓(xùn)練數(shù)據(jù)和上一訓(xùn)練階段的訓(xùn)練數(shù)據(jù)一起作為初始訓(xùn)練數(shù)據(jù)。
步驟S104中仿真實(shí)驗(yàn)使用的模型是根據(jù)已有的訓(xùn)練數(shù)據(jù)訓(xùn)練得出的,應(yīng)用該模型能夠生成與優(yōu)秀司機(jī)平均駕駛結(jié)果相似甚至更好的優(yōu)化結(jié)果。所以為了進(jìn)一步提升模型的檔位預(yù)測(cè)效果,將仿真測(cè)試得到的數(shù)據(jù)與原始訓(xùn)練數(shù)據(jù)一起作為初始訓(xùn)練數(shù)據(jù),并迭代進(jìn)行后續(xù)的預(yù)處理與模型訓(xùn)練過(guò)程。
迭代進(jìn)行步驟S102到S105的訓(xùn)練過(guò)程,直到模型提升效果不明顯,即達(dá)到收斂時(shí)停止訓(xùn)練,并保存該階段的模型作為最終模型。在整個(gè)過(guò)程中,迭代訓(xùn)練也可以根據(jù)迭代次數(shù)進(jìn)行隨時(shí)終止,并取上一次訓(xùn)練的結(jié)果作為最終模型。
以上所述是該實(shí)施例提出的基于雙向LSTM模型的機(jī)車(chē)節(jié)能操縱方法及其訓(xùn)練過(guò)程。該實(shí)施例首先創(chuàng)新性的提出了從機(jī)車(chē)歷史駕駛數(shù)據(jù)中提取時(shí)序特征(分為前向特征和后向特征),并按節(jié)油、安全、準(zhǔn)時(shí)性等目標(biāo)進(jìn)行了數(shù)據(jù)預(yù)處理;然后提出應(yīng)用雙向LSTM模型進(jìn)行檔位的預(yù)測(cè),具體實(shí)現(xiàn)時(shí),在現(xiàn)有LSTM網(wǎng)絡(luò)的基礎(chǔ)上,有針對(duì)性的根據(jù)現(xiàn)有問(wèn)題提出在網(wǎng)絡(luò)結(jié)構(gòu)的輸入層進(jìn)行前向特征和后向特征的分開(kāi)輸入,充分利用了機(jī)車(chē)歷史駕駛數(shù)據(jù)、當(dāng)前行駛狀態(tài)和行駛前后方向的道路信息,這對(duì)檔位的有效預(yù)測(cè)帶來(lái)了幫助;同時(shí),該實(shí)施例提出對(duì)所訓(xùn)練的雙向LSTM模型進(jìn)行迭代更新,這在一定程度上能夠進(jìn)一步提升模型的檔位預(yù)測(cè)能力,甚至能夠預(yù)測(cè)得到比優(yōu)秀司機(jī)更為優(yōu)化的檔位操縱序列。
為了全面準(zhǔn)確的評(píng)估本發(fā)明所提出方法的性能,選取真實(shí)路段(沈陽(yáng)-丹東線的兩個(gè)站點(diǎn))和優(yōu)秀司機(jī)駕駛數(shù)據(jù)進(jìn)行模型訓(xùn)練結(jié)果的對(duì)比測(cè)試。本實(shí)驗(yàn)的機(jī)車(chē)車(chē)重為3070.00噸,車(chē)長(zhǎng)為44.00米。對(duì)比結(jié)果如圖4所示。圖4中檔位預(yù)測(cè)的曲線基本和優(yōu)秀司機(jī)的駕駛檔位變化曲線一致,統(tǒng)計(jì)的平均準(zhǔn)確度為95.6%,說(shuō)明該實(shí)施例提出的模型具備了人類(lèi)優(yōu)秀司機(jī)駕駛的水平;相對(duì)應(yīng)的模型控制機(jī)車(chē)運(yùn)行速度曲線與優(yōu)秀司機(jī)駕駛曲線基本一致,而且特別值得注意的是,在412000公里標(biāo)附件的低限速條件下,模型也有效的預(yù)測(cè)出了合適的操縱檔位,機(jī)車(chē)運(yùn)行速度也完全在安全范圍內(nèi),未產(chǎn)生超速等風(fēng)險(xiǎn)情況。同時(shí),統(tǒng)計(jì)得出該實(shí)施例提出的模型相對(duì)人類(lèi)司機(jī)的普通駕駛,節(jié)油率在10%左右。綜上所示,本發(fā)明提出的一種基于雙向LSTM模型的機(jī)車(chē)節(jié)能操縱方法能充分利用機(jī)車(chē)歷史數(shù)據(jù)和道路信息,并結(jié)合預(yù)處理得到的時(shí)序特征序列,能夠預(yù)測(cè)出保證安全性、準(zhǔn)時(shí)性以及節(jié)油性等多目標(biāo)的操縱檔位?;谡鎸?shí)路線和機(jī)車(chē)的實(shí)驗(yàn)測(cè)試,證明了本發(fā)明在保證可靠性和安全性的基礎(chǔ)上,較人類(lèi)司機(jī)在節(jié)省能耗方面更有優(yōu)勢(shì)。
雖然上面結(jié)合本發(fā)明的優(yōu)選實(shí)施例對(duì)本發(fā)明的原理進(jìn)行了詳細(xì)的描述,本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實(shí)施例僅僅是對(duì)本發(fā)明的示意性實(shí)現(xiàn)方式的解釋?zhuān)⒎菍?duì)本發(fā)明包含范圍的限定。實(shí)施例中的細(xì)節(jié)并不構(gòu)成對(duì)本發(fā)明范圍的限制,在不背離本發(fā)明的精神和范圍的情況下,任何基于本發(fā)明技術(shù)方案的等效變換、簡(jiǎn)單替換等顯而易見(jiàn)的改變,均落在本發(fā)明保護(hù)范圍之內(nèi)。