車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置與流程

文檔序號(hào)：11264124閱讀：557來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>其他產(chǎn)品的制造及其應(yīng)用技術(shù)

車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置與流程

本發(fā)明涉及車(chē)輛控制領(lǐng)域，特別是涉及一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置。

背景技術(shù)：

隨著車(chē)輛技術(shù)的發(fā)展，車(chē)輛自動(dòng)駕駛成為熱點(diǎn)研究領(lǐng)域。速度規(guī)劃和控制是自動(dòng)駕駛中的一個(gè)重要研究?jī)?nèi)容，其基本目標(biāo)是根據(jù)檢測(cè)到的狀態(tài)(如當(dāng)前車(chē)速、前車(chē)的車(chē)速、與前車(chē)的距離)規(guī)劃出一系列后續(xù)時(shí)間點(diǎn)車(chē)的預(yù)期車(chē)速，并計(jì)算出車(chē)的最終控制參數(shù)(如油門(mén)和剎車(chē))對(duì)車(chē)進(jìn)行實(shí)際的控制操作。速度規(guī)劃在保證乘客的基本舒適和安全的同時(shí)，需要保證在其它車(chē)輛有非預(yù)期的行為(如突然剎車(chē))時(shí)能保證乘客絕對(duì)的安全。

為了處理各種可能出現(xiàn)的情況，需要設(shè)計(jì)較復(fù)雜的速度規(guī)劃和控制模型。在人工設(shè)計(jì)和實(shí)現(xiàn)中，很容易漏掉某些少見(jiàn)的情況和因素。同時(shí)，從駕駛員駕駛的汽車(chē)上可以采集很豐富的成熟的駕駛數(shù)據(jù)。由于機(jī)器學(xué)習(xí)方法可以很方便的從數(shù)據(jù)中學(xué)習(xí)模型，機(jī)器學(xué)習(xí)方法越來(lái)越多地應(yīng)用到速度規(guī)劃和控制。另外，在現(xiàn)實(shí)世界中，每個(gè)駕駛員都有不同的駕駛習(xí)慣和對(duì)安全舒適程度的界定，因此如果使用同一種規(guī)劃和控制方法很難滿足各種不同的需求，而機(jī)器學(xué)習(xí)方法可以很好的適配這種個(gè)性化駕駛習(xí)慣需求。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的發(fā)明人通過(guò)長(zhǎng)期研究，認(rèn)識(shí)到應(yīng)用機(jī)器學(xué)習(xí)對(duì)車(chē)輛進(jìn)行速度規(guī)劃存在一些問(wèn)題。

首先，通過(guò)機(jī)器學(xué)習(xí)方法學(xué)習(xí)到的模型的效果和訓(xùn)練數(shù)據(jù)直接相關(guān)。由于駕駛員通常都是在一個(gè)很舒適的范圍內(nèi)駕駛，收集到的訓(xùn)練數(shù)據(jù)很難覆蓋到所有可能出現(xiàn)的場(chǎng)景(如車(chē)速極快而據(jù)前車(chē)距離很短等極端場(chǎng)景)，雖然泛化等技術(shù)可以一定程度上解決這個(gè)問(wèn)題，但不能完全解決這個(gè)問(wèn)題。另外，收集到的駕駛員的行為不一定完全滿足舒適安全的需求，如有些駕駛員并不能保證和前車(chē)的距離，因此當(dāng)前車(chē)突然剎車(chē)時(shí)，駕駛車(chē)輛很難保證不碰上前車(chē)的情況下完全剎車(chē)。顯然，用這種數(shù)據(jù)訓(xùn)練出來(lái)的模型同樣也不能處理這種情況。

機(jī)器學(xué)習(xí)存在的另一個(gè)問(wèn)題是很難對(duì)其訓(xùn)練出來(lái)的模型做局部微調(diào)。在應(yīng)用于自動(dòng)駕駛的速度規(guī)劃和控制中，通常需要針對(duì)某種特殊情況對(duì)模型進(jìn)行局部調(diào)整。而對(duì)機(jī)器學(xué)習(xí)得到的模型，對(duì)學(xué)習(xí)到的每個(gè)參數(shù)的調(diào)整，都可能帶來(lái)全局的不易控制的影響。通過(guò)添加更多的訓(xùn)練用例也可以修正模型，但是這種方法周期比較長(zhǎng)，并且最后訓(xùn)練出來(lái)的模型也不能完全預(yù)知。

本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的缺點(diǎn)與不足，提出一種全新的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置。

根據(jù)本發(fā)明的一個(gè)方面，提供一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法，具體包括：

首先為機(jī)器學(xué)習(xí)步驟，采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí)，獲得機(jī)器學(xué)習(xí)模型，每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述，所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量，所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值；

其次為分區(qū)決策表取得步驟，對(duì)于輸入空間進(jìn)行分區(qū)，以及基于所述獲得的機(jī)器學(xué)習(xí)模型，得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果，形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表；

再次為實(shí)時(shí)決策步驟，實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量，確定該輸入特征量所屬于的輸入分區(qū)，基于所確定的分區(qū)，查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。

進(jìn)一步地，速度規(guī)劃方法還可以包括實(shí)時(shí)控制步驟，基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。

進(jìn)一步地，在實(shí)時(shí)控制中，在發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí)，可以對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。

進(jìn)一步地，對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整，可以依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整，也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí)，調(diào)整該分區(qū)的分區(qū)決策結(jié)果。

進(jìn)一步地，各維特征分量可以包括當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速。

進(jìn)一步地，在機(jī)器學(xué)習(xí)步驟之前，需要對(duì)特征空間進(jìn)行離散化編碼。

進(jìn)一步地，根據(jù)本發(fā)明實(shí)施例的速度規(guī)劃方法，離散化編碼方法優(yōu)選為tilingcoding，其中用只有一個(gè)tiling的tilingcoding對(duì)每個(gè)特征分量進(jìn)行編碼，并且將每個(gè)特征分量所處的維度劃分成優(yōu)選的7-13個(gè)區(qū)間，從而對(duì)所述輸入空間進(jìn)行分區(qū)。

進(jìn)一步地，在分區(qū)決策表取得步驟中，首先需要計(jì)算采用離散化編碼方法得到的離散化編碼結(jié)果的空間大小，當(dāng)所述空間大于確定閾值時(shí)，采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表，僅遍歷訓(xùn)練空間的輸入，存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果，同時(shí)除了分區(qū)決策表，還存儲(chǔ)訓(xùn)練出的決策模型備用；當(dāng)所述空間小于所述確定閾值時(shí)，采用靜態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表，遍歷所有編碼空間，存儲(chǔ)決策模型的輸出結(jié)果。

進(jìn)一步地，在實(shí)時(shí)決策步驟中，首先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼，然后將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引，當(dāng)分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)時(shí)，直接獲取分區(qū)決策表中已存儲(chǔ)的決策結(jié)果；

進(jìn)一步地，在實(shí)時(shí)決策步驟中，首先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼，然后將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引，當(dāng)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)時(shí)，如果分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果，則直接從分區(qū)決策表中獲取決策結(jié)果；反之如果分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果，則調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果，并將得到的決策結(jié)果加入到分區(qū)決策表。

進(jìn)一步地，機(jī)器學(xué)習(xí)的方法可以采用監(jiān)督式學(xué)習(xí)方法或非監(jiān)督式學(xué)習(xí)方法，也可以采用增強(qiáng)式學(xué)習(xí)方法。

進(jìn)一步地，對(duì)特征空間進(jìn)行離散化編碼時(shí)，只要兩個(gè)輸入最終的離散編碼相同，即認(rèn)為這兩個(gè)輸入屬于同一個(gè)分區(qū)。

進(jìn)一步地，離散化編碼方法可以包括各類(lèi)coarsecoding方法，如tilecoding。

進(jìn)一步地，在實(shí)時(shí)控制中，在對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整后需要確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目，當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí)，應(yīng)當(dāng)重新執(zhí)行所述機(jī)器學(xué)習(xí)步驟和分區(qū)決策表取得步驟。

根據(jù)本發(fā)明的另一個(gè)方面，提供一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置，該裝置包括機(jī)器學(xué)習(xí)單元、分區(qū)決策表取得單元、實(shí)時(shí)決策單元?？蛇x地，速度規(guī)劃裝置還可以包括實(shí)時(shí)控制單元。

其中，機(jī)器學(xué)習(xí)單元配置為采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí)，獲得機(jī)器學(xué)習(xí)模型，每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述，所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量，所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值。

其中，分區(qū)決策表取得單元配置為對(duì)于輸入空間進(jìn)行分區(qū)，以及基于所述獲得的機(jī)器學(xué)習(xí)模型，得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果，形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表。

其中，實(shí)時(shí)決策單元配置為實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量，確定該輸入特征量所屬于的輸入分區(qū)，基于所確定的分區(qū)，查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。

其中，實(shí)時(shí)控制單元配置為基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。

進(jìn)一步地，其中的實(shí)時(shí)控制單元還配置為在實(shí)時(shí)控制中，在發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí)，對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。

進(jìn)一步地，其中的分區(qū)決策表取得單元還配置為對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整，可以依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整，也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí)，調(diào)整該分區(qū)的分區(qū)決策結(jié)果。

進(jìn)一步地，其中實(shí)時(shí)決策單元還配置為各維特征分量包括當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速。

進(jìn)一步地，本發(fā)明的車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置還包括離散化編碼單元，配置為對(duì)訓(xùn)練樣本和所述實(shí)時(shí)決策階段的輸入特征量進(jìn)行離散化編碼。

進(jìn)一步地，根據(jù)本發(fā)明實(shí)施例的速度規(guī)劃裝置，離散化編碼單元采用的離散化編碼方法為tilingcoding，其中用只有一個(gè)tiling的tilingcoding對(duì)每個(gè)特征分量進(jìn)行編碼，并且將每個(gè)特征分量所處的維度劃分成7-13個(gè)區(qū)間，從而對(duì)所述輸入空間進(jìn)行分區(qū)。

進(jìn)一步地，分區(qū)決策表取得單元配置為計(jì)算采用離散化編碼方法得到的離散化編碼結(jié)果的空間大小，當(dāng)所述空間大于確定閾值時(shí)，采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表，僅遍歷訓(xùn)練空間的輸入，存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果，同時(shí)還存儲(chǔ)訓(xùn)練出的決策模型備用；當(dāng)所述空間小于所述確定閾值時(shí)，采用靜態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表，遍歷所有編碼空間，存儲(chǔ)決策模型的輸出結(jié)果。

進(jìn)一步地，實(shí)時(shí)決策單元配置為采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼，將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引，當(dāng)分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)時(shí)，直接獲取分區(qū)決策表中已存儲(chǔ)的決策結(jié)果。

進(jìn)一步地，實(shí)時(shí)決策單元配置為采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼，將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引，當(dāng)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)時(shí)，如果分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果，則直接從分區(qū)決策表中獲取決策結(jié)果；反之如果分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果，則調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果，并將得到的決策結(jié)果加入到分區(qū)決策表。

進(jìn)一步地，機(jī)器學(xué)習(xí)的方法可以為監(jiān)督式學(xué)習(xí)方法或非監(jiān)督式學(xué)習(xí)方法，也可以為增強(qiáng)式學(xué)習(xí)方法。

進(jìn)一步地，分區(qū)決策表取得單元配置為只要兩個(gè)輸入最終的離散編碼相同，即認(rèn)為這兩個(gè)輸入屬于同一個(gè)分區(qū)。

進(jìn)一步地，離散化編碼方法選自可以包括各類(lèi)coarsecoding方法，如tilecoding。

進(jìn)一步地，反饋單元配置為確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目，當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí)，引發(fā)所述機(jī)器學(xué)習(xí)單元和分區(qū)決策表取得單元重新進(jìn)行機(jī)器學(xué)習(xí)操作和分區(qū)決策表取得操作。

根據(jù)本發(fā)明的另一個(gè)方面，提供一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃的計(jì)算裝置，包括存儲(chǔ)部件和處理器，存儲(chǔ)部件中存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令集合，當(dāng)所述計(jì)算機(jī)可執(zhí)行指令集合被所述處理器執(zhí)行時(shí)，執(zhí)行下述步驟：機(jī)器學(xué)習(xí)步驟，采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí)，獲得機(jī)器學(xué)習(xí)模型，每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述，所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量，所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值；分區(qū)決策表取得步驟，對(duì)于輸入空間進(jìn)行分區(qū)，以及基于所述獲得的機(jī)器學(xué)習(xí)模型，得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果，形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表；實(shí)時(shí)決策步驟，實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量，確定該輸入特征量所屬于的輸入分區(qū)，基于所確定的分區(qū)，查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果；以及實(shí)時(shí)控制步驟，基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。

本發(fā)明采用分區(qū)決策表技術(shù)提供的速度規(guī)劃方法、裝置及計(jì)算裝置適用于車(chē)輛自動(dòng)駕駛技術(shù)，很好的解決了不能對(duì)機(jī)器學(xué)習(xí)訓(xùn)練出的模型做局部調(diào)整的問(wèn)題，可以很容易修改某個(gè)分區(qū)的決策，而完全不影響其它分區(qū)的決策結(jié)果，從而完成局部調(diào)整。同時(shí)，分區(qū)決策表的直觀特性可以很好的幫助發(fā)現(xiàn)和解決機(jī)器學(xué)習(xí)過(guò)程中存在的問(wèn)題。分區(qū)決策表可以加速?zèng)Q策過(guò)程，查分區(qū)決策表可以獲得更快的決策速度。

附圖說(shuō)明

從下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例的詳細(xì)描述中，本發(fā)明的這些和/或其它方面和優(yōu)點(diǎn)將變得更加清楚并更容易理解，其中：

圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法的總體流程圖；

圖2示意性地示出了機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖；

圖3示出了在應(yīng)用機(jī)器學(xué)習(xí)方法之前，進(jìn)行離散化編碼處理的機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖；

圖4示出了coarsecoding類(lèi)別中的tilecoding離散化編碼方法。

圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的、在采用離散化編碼情況下的整個(gè)決策分區(qū)表的建立和優(yōu)化過(guò)程。

圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的實(shí)時(shí)決策步驟的實(shí)現(xiàn)方法的流程圖。

圖7示出了根據(jù)本發(fā)明實(shí)施例的含有實(shí)時(shí)控制步驟的速度規(guī)劃控制方法的700的流程圖。

圖8示出了根據(jù)本發(fā)明實(shí)施例的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置800的結(jié)構(gòu)框圖。

具體實(shí)施方式

為了使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明，下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。

在進(jìn)行詳細(xì)說(shuō)明之前，首先介紹一下本發(fā)明的總體思想，以便于本領(lǐng)域技術(shù)人員把握本發(fā)明。

如前所述，發(fā)明人經(jīng)實(shí)現(xiàn)和分析發(fā)現(xiàn)，利用機(jī)器學(xué)習(xí)具有嚴(yán)重依賴(lài)于訓(xùn)練數(shù)據(jù)，由于訓(xùn)練數(shù)據(jù)的局限性使得訓(xùn)練出來(lái)的模型不能處理一些實(shí)際突發(fā)情況等問(wèn)題，以及還具有難于做局部微調(diào)，整體調(diào)整周期長(zhǎng)且效果難以預(yù)知的問(wèn)題。為此，發(fā)明人提出了本發(fā)明，將機(jī)器學(xué)習(xí)模型的訓(xùn)練和應(yīng)用分別處理：在訓(xùn)練時(shí)，我們按照通用的機(jī)器學(xué)習(xí)方法來(lái)進(jìn)行訓(xùn)練；在應(yīng)用這些訓(xùn)練出來(lái)的模型之前，將輸入空間按分成多個(gè)分區(qū)，并且將模型中決策結(jié)果存入到不同分區(qū)，從而形成一個(gè)按分區(qū)組織的決策表，由此，應(yīng)用模型的決策過(guò)程轉(zhuǎn)化為一個(gè)查分區(qū)決策表的過(guò)程。這樣，可以很容易修改某個(gè)分區(qū)的決策，而完全不影響其它分區(qū)的決策結(jié)果，從而完成局部調(diào)整。同時(shí)，分區(qū)決策表的直觀特性可以很好的幫助發(fā)現(xiàn)和解決機(jī)器學(xué)習(xí)過(guò)程中存在的問(wèn)題。分區(qū)決策表可以加速?zèng)Q策過(guò)程，查分區(qū)決策表可以獲得更快的決策速度。對(duì)于實(shí)時(shí)性要求較高的自動(dòng)駕駛速度規(guī)劃來(lái)說(shuō)，易于調(diào)整局部策略和具有迅捷的決策速度是非常重要的。

下面結(jié)合圖1描述根據(jù)本發(fā)明實(shí)施例的車(chē)輛自動(dòng)駕駛方法示例。圖1示出了本發(fā)明一個(gè)實(shí)施例的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法的總體流程圖。

在步驟s110中，執(zhí)行機(jī)器學(xué)習(xí)步驟，采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí)，獲得機(jī)器學(xué)習(xí)模型，每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述，所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量，所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值。在步驟s110完成后，前進(jìn)到步驟s120。

在步驟s120中，執(zhí)行分區(qū)決策表取得步驟，對(duì)于輸入空間進(jìn)行分區(qū)，以及基于所述獲得的機(jī)器學(xué)習(xí)模型，得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果，形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表。

在步驟s130中，進(jìn)行實(shí)時(shí)決策，實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量，確定該輸入特征量所屬于的輸入分區(qū)，基于所確定的分區(qū)，查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。

根據(jù)本發(fā)明實(shí)施例，將機(jī)器學(xué)習(xí)模型的訓(xùn)練和應(yīng)用分別處理。在訓(xùn)練時(shí)按照通用的事先收集的訓(xùn)練用例訓(xùn)練模型，具體的機(jī)器學(xué)習(xí)方法可以是需要標(biāo)注數(shù)據(jù)的監(jiān)督式學(xué)習(xí)，也可以是不需要標(biāo)注數(shù)據(jù)的非監(jiān)督式學(xué)習(xí)，也可以是增強(qiáng)學(xué)習(xí)等。和傳統(tǒng)方法不同的是，在應(yīng)用這些訓(xùn)練出來(lái)的模型之前，將輸入空間按訓(xùn)練時(shí)的離散化編碼方法劃分成多個(gè)分區(qū)，并且將模型中決策結(jié)果存入到不同分區(qū)，從而形成一個(gè)按分區(qū)組織的決策表。因此，采用本發(fā)明實(shí)施例的車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法，就是將應(yīng)用模型的決策過(guò)程轉(zhuǎn)化為一個(gè)查分區(qū)決策表的過(guò)程。

為便于理解，圖2示意性地示出了機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖。

在圖2所示，針對(duì)輸入的各個(gè)訓(xùn)練用例(訓(xùn)練樣本)210，進(jìn)行機(jī)器學(xué)習(xí)220，得到?jīng)Q策模型230，對(duì)輸入空間分區(qū)240，結(jié)合分區(qū)和決策模型，得到分區(qū)決策表250。

在利用分區(qū)決策表進(jìn)行決策時(shí)，對(duì)于到來(lái)的輸入270，首先對(duì)其進(jìn)行分區(qū)240，在確定所屬分區(qū)后，到分區(qū)決策表250中查詢(xún)獲得對(duì)應(yīng)的決策結(jié)果。作為進(jìn)行分區(qū)的例子，對(duì)于連續(xù)維度的分區(qū)，例如可以基于車(chē)輛控制專(zhuān)家的經(jīng)驗(yàn)知識(shí)來(lái)進(jìn)行分區(qū)。

在一個(gè)示例中，在應(yīng)用機(jī)器學(xué)習(xí)方法前，采用某種編碼方式對(duì)輸入空間進(jìn)行離散化處理提取特征后再進(jìn)行處理，這些離散化編碼方法很自然的將連續(xù)輸入空間劃分成多個(gè)分區(qū)。這里的分區(qū)不限定是同一維度數(shù)據(jù)連續(xù)空間的分區(qū)，只要其最終的編碼相同，即可以認(rèn)為兩個(gè)樣本屬于同一分區(qū)；換句話說(shuō)這里的分區(qū)并不一定是按原空間連續(xù)劃分的，而是按照離散編碼的結(jié)果劃分。圖3示出了在應(yīng)用機(jī)器學(xué)習(xí)方法之前，進(jìn)行離散化編碼處理的機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖，其中任何輸入，不管是訓(xùn)練示例，還是應(yīng)用示例，都要先進(jìn)行離散化編碼處理380。

圖4示出了示出了粗編碼(coarsecoding)類(lèi)別中的tilecoding離散化編碼方法。在圖4所示的二維輸入空間中，三個(gè)不同位置的tiling將整個(gè)空間劃分為不同的小區(qū)域，這些小區(qū)域即可作為分區(qū)。

作為輸入空間的示例，可以由當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速四個(gè)維度構(gòu)成。需要說(shuō)明的是，這里的前車(chē)是一個(gè)寬泛的概念，并不局限于車(chē)輛。當(dāng)前面沒(méi)有任何物體時(shí)，可以虛擬出一輛前車(chē)，并設(shè)置虛擬前車(chē)的距離和相對(duì)速度。最大車(chē)速是由各種條件限制(如道路限制、天氣條線限制)下的最高行駛速度。因此，自動(dòng)駕駛領(lǐng)域中的速度規(guī)劃和控制的編碼空間通常不大，因此比較適合進(jìn)行分區(qū)。

發(fā)明人實(shí)踐得到的一個(gè)優(yōu)選例子為：用只有一個(gè)tiling的tilingcoding對(duì)每個(gè)輸入維度進(jìn)行編碼，將每個(gè)輸入維度劃分成10個(gè)左右分區(qū)即可很好的滿足自動(dòng)駕駛的速度決策需求。比如對(duì)于最大車(chē)速，我們可以以10公里每小時(shí)的分區(qū)大小對(duì)其進(jìn)行分區(qū)，結(jié)合現(xiàn)實(shí)情況，將其劃分成[0，10，20，30，40，50，60，70，80，90，100，110，120]共12個(gè)分區(qū)。此時(shí)的分區(qū)數(shù)為10⁴左右。對(duì)計(jì)算機(jī)而言，這樣大小的分區(qū)表非常容易存儲(chǔ)和處理。在某些極端情況下(如輸入維度很多或離散化編碼輸出空間很大)，最后出來(lái)的編碼空間可能超出計(jì)算機(jī)的存儲(chǔ)空間。此時(shí)，基于來(lái)自現(xiàn)實(shí)世界的真實(shí)輸入非常稀疏，可以采用哈希表或其它節(jié)省存儲(chǔ)空間的方法來(lái)動(dòng)態(tài)存儲(chǔ)和處理分區(qū)決策表。

下面參考圖5描述根據(jù)本發(fā)明一個(gè)實(shí)施例的、在采用離散化編碼情況下的整個(gè)決策分區(qū)表的建立和優(yōu)化過(guò)程示例，該過(guò)程可以用于執(zhí)行圖1所示的步驟s120。需要說(shuō)明的是，圖5中的閾值可以根據(jù)機(jī)器的存儲(chǔ)空間設(shè)定。需要說(shuō)明的是，此僅為示例，并非在機(jī)器學(xué)習(xí)訓(xùn)練之前，必須要對(duì)訓(xùn)練樣本進(jìn)行離散化編碼，

如圖5所示，在步驟s510中，計(jì)算機(jī)器學(xué)習(xí)方法采用離散化編碼結(jié)果的空間大小。

在步驟s520中，判斷空間大小是否大于某個(gè)閾值。

當(dāng)步驟s520中判斷結(jié)果為否時(shí)，前進(jìn)到步驟s530，靜態(tài)存儲(chǔ)分區(qū)決策表：遍歷所有編碼空間，存儲(chǔ)決策模型的輸出結(jié)果；反之，當(dāng)判斷結(jié)果為是時(shí)，前進(jìn)到步驟s540，用哈?；蚱渌鼊?dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表：僅遍歷訓(xùn)練空間的輸入，存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果；接下來(lái)前進(jìn)到步驟s550，除了分區(qū)決策表，還存儲(chǔ)訓(xùn)練出的決策模型備用。需要說(shuō)明的是，當(dāng)需要?jiǎng)討B(tài)存儲(chǔ)分區(qū)決策表時(shí)，為了降低后續(xù)動(dòng)態(tài)應(yīng)用時(shí)動(dòng)態(tài)建表的開(kāi)銷(xiāo)，可以選擇提前添加訓(xùn)練集對(duì)應(yīng)的表項(xiàng)，也可以選擇添加其它輸入集對(duì)應(yīng)的表項(xiàng)，或者不添加任何表項(xiàng)，等后續(xù)需要時(shí)再動(dòng)態(tài)添加。此時(shí)，由于后面需要?jiǎng)討B(tài)插入決策表項(xiàng)，除了初始分區(qū)決策表以外，也需要保存機(jī)器學(xué)習(xí)得到的決策模型，如步驟s550所示。

下面參考附圖6描述根據(jù)本發(fā)明一個(gè)實(shí)施例的實(shí)時(shí)決策步驟s130的實(shí)現(xiàn)方法的操作過(guò)程示例，這里，假設(shè)采用離散化編碼方法對(duì)輸入進(jìn)行處理，而且分區(qū)決策表是通過(guò)圖5所示的方法構(gòu)建和存儲(chǔ)的。

如圖6所示，在步驟s610中，應(yīng)用離散編碼方法對(duì)輸入進(jìn)行編碼。這里的輸入可以為車(chē)輛自動(dòng)駕駛過(guò)程中實(shí)時(shí)獲得的當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速。不過(guò)此僅為示例，輸入的維度和具體特征量可以根據(jù)速度規(guī)劃方法的不同而不同。

在步驟s620中，將獲得的離散化結(jié)果作為分區(qū)塊的索引，查詢(xún)分區(qū)決策表。

在分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)的或者雖為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)的但是分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果時(shí)，能夠直接從分區(qū)決策表中獲取決策結(jié)果；反之當(dāng)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)且分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果時(shí)，則不能直接從分區(qū)決策表中獲得決策結(jié)果。

在步驟s630中，判斷是否得到?jīng)Q策結(jié)果。如果答案為“是”，則前進(jìn)到步驟s650，返回決策結(jié)果。反之，答案為“否”，則前進(jìn)到步驟s640，調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果，并將得到的決策結(jié)果加入到分區(qū)決策表，然后前進(jìn)到步驟s650。

需要說(shuō)明的是，圖6是在進(jìn)行了離散編碼而且先前視情況采用了靜態(tài)存儲(chǔ)或動(dòng)態(tài)存儲(chǔ)情況下的決策過(guò)程示例。不過(guò)這僅為示例，而不是作為本發(fā)明的限制，在不進(jìn)行離散編碼的情況下，利用分區(qū)決策表進(jìn)行決策的過(guò)程可以不同，例如，此時(shí)可以直接根據(jù)輸入來(lái)確定其所屬分區(qū)，然后查詢(xún)分區(qū)決策表，獲得決策結(jié)果；在沒(méi)有通過(guò)查詢(xún)分區(qū)決策表得到?jīng)Q策結(jié)果的情況下，在存儲(chǔ)了決策模型的情況下，可以調(diào)用存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果，或者也可以直接給出反饋表明此時(shí)無(wú)法給出決策結(jié)果等等。

根據(jù)本發(fā)明實(shí)施例的速度規(guī)劃方法，當(dāng)發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí)，能夠迅速對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。不需要修改訓(xùn)練用例集或調(diào)整訓(xùn)練參數(shù)重新訓(xùn)練，也不需要調(diào)整訓(xùn)練出來(lái)的模型的參數(shù)，而只需要修改分區(qū)決策表上相應(yīng)分區(qū)的決策結(jié)果，從而保證所做的調(diào)整只局限于這個(gè)分區(qū)，而不會(huì)影響其它分區(qū)上的決策結(jié)果。

針對(duì)分區(qū)決策結(jié)果進(jìn)行調(diào)整的具體方法可以是依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整，也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí)。比如，當(dāng)發(fā)現(xiàn)在當(dāng)前車(chē)速是10公里每小時(shí)、和前車(chē)的距離是200米、前車(chē)相對(duì)速度是5公里每小時(shí)、最大車(chē)速是30公里每小時(shí)的時(shí)候速度控制不正常時(shí)，即可以參考某個(gè)有經(jīng)驗(yàn)的駕駛員在這種情況下的反應(yīng)，將其轉(zhuǎn)換成相應(yīng)的決策結(jié)果，存儲(chǔ)到該輸入所屬區(qū)間對(duì)應(yīng)的決策表項(xiàng)?；蛘咭部梢允占芏囫{駛員在駕駛時(shí)的數(shù)據(jù)，將所有和該輸入空間相應(yīng)的決策結(jié)果收集起來(lái)，通過(guò)歸納或者簡(jiǎn)單的機(jī)器學(xué)習(xí)方法得到一個(gè)期望的決策結(jié)果。

在一個(gè)示例中，在獲得決策結(jié)果后，執(zhí)行實(shí)時(shí)控制步驟，基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。圖7示出了根據(jù)本發(fā)明實(shí)施例的含有實(shí)時(shí)控制步驟的速度規(guī)劃控制方法的700的流程圖，圖7中的步驟s710-s730與圖1所示的步驟s110-s130類(lèi)似，不同在于多了實(shí)時(shí)控制步驟s740，即基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。

需要說(shuō)明的是，這里根據(jù)速度規(guī)劃決策結(jié)果，執(zhí)行實(shí)時(shí)控制，并不是排他式的控制，而是可以結(jié)合自動(dòng)駕駛的其他控制策略(例如轉(zhuǎn)向控制等)來(lái)一起綜合對(duì)車(chē)輛進(jìn)行控制。

根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例，當(dāng)發(fā)現(xiàn)某些分區(qū)的決策結(jié)果不符合預(yù)期時(shí)，在對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整后可以確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目，當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí)，則重新執(zhí)行整體訓(xùn)練步驟，重新機(jī)器學(xué)習(xí)，然后得到新的決策模型，再次進(jìn)行分區(qū)，即可以基于這些反饋結(jié)果來(lái)重新執(zhí)行例如圖1所示的步驟s110至步驟s130，即機(jī)器學(xué)習(xí)步驟和分區(qū)決策表取得步驟，在重新進(jìn)行機(jī)器學(xué)習(xí)時(shí)，可以基于應(yīng)用決策結(jié)果的反饋來(lái)嘗試通過(guò)修改訓(xùn)練參數(shù)、添加相應(yīng)的訓(xùn)練用例等方法來(lái)得到更好的機(jī)器學(xué)習(xí)。

根據(jù)本發(fā)明的另一實(shí)施例，還提供了一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置。下面將結(jié)合圖8進(jìn)行說(shuō)明，速度規(guī)劃裝置包括以下單元：機(jī)器學(xué)習(xí)單元810、分區(qū)決策表取得單元820和實(shí)時(shí)決策單元830?？蛇x地，還可以包括實(shí)時(shí)控制單元830。

機(jī)器學(xué)習(xí)單元810配置為采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí)，獲得機(jī)器學(xué)習(xí)模型，每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述，所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量，所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值。

分區(qū)決策表取得單820配置為對(duì)于輸入空間進(jìn)行分區(qū)，以及基于所述獲得的機(jī)器學(xué)習(xí)模型，得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果，形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表。

實(shí)時(shí)決策單元830配置為實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量，確定該輸入特征量所屬于的輸入分區(qū)，基于所確定的分區(qū)，查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。

實(shí)時(shí)控制單元840配置為基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。

在一個(gè)示例中，速度規(guī)劃裝置還可以包括局部分區(qū)決策調(diào)整單元，配置為當(dāng)發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí)，對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。

局部分區(qū)決策調(diào)整單元對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整時(shí)，可以依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整，也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí)，調(diào)整該分區(qū)的分區(qū)決策結(jié)果。

在一個(gè)示例中，速度規(guī)劃裝置還包括離散化編碼單元，配置為對(duì)訓(xùn)練樣本和所述實(shí)時(shí)決策階段的輸入特征量進(jìn)行離散化編碼。

因?yàn)樽罱K的編碼空間通常不大，比如在實(shí)現(xiàn)自動(dòng)巡航系統(tǒng)時(shí)的速度規(guī)劃和控制中，輸入只有當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速四個(gè)維度。離散化編碼單元優(yōu)選采用的離散化編碼方法為tilingcoding，只有一個(gè)tiling的tilingcoding對(duì)每個(gè)輸入維度進(jìn)行編碼，將每個(gè)輸入維度劃分成優(yōu)選的7-13個(gè)區(qū)間，這樣即可很好的滿足自動(dòng)駕駛的速度決策需求。

因?yàn)樵谀承O端情況下(如輸入維度很多或離散化編碼輸出空間很大)，最后出來(lái)的編碼空間可能超出計(jì)算機(jī)的存儲(chǔ)空間，所以分區(qū)決策表取得單元820還配置為計(jì)算采用離散化編碼方法得到的離散化編碼結(jié)果的空間大小。

當(dāng)分區(qū)決策表取得單元820計(jì)算出采用離散化編碼方法得到的離散化編碼結(jié)果的空間大于所確定的閾值時(shí)，則決定選擇采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表，此時(shí)僅遍歷訓(xùn)練空間的輸入，存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果，同時(shí)還存儲(chǔ)訓(xùn)練出的決策模型備用。

相應(yīng)的，本發(fā)明的實(shí)時(shí)決策單元830配置為先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼，再將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引，因?yàn)榇藭r(shí)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)，如果分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果，則直接從分區(qū)決策表中獲取決策結(jié)果；反之如果分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果，則調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果，并將得到的決策結(jié)果加入到分區(qū)決策表。

當(dāng)本發(fā)明的分區(qū)決策表取得單元820計(jì)算出采用離散化編碼方法得到的離散化編碼結(jié)果的空間小于所述確定閾值時(shí)，采用靜態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表，遍歷所有編碼空間，存儲(chǔ)決策模型的輸出結(jié)果。

相應(yīng)的，本發(fā)明的實(shí)時(shí)決策單元830配置為先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼，再將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引，因?yàn)榇藭r(shí)分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)，可以直接獲取分區(qū)決策表中已存儲(chǔ)的決策結(jié)果。

機(jī)器學(xué)習(xí)單元810配置為采用的機(jī)器學(xué)習(xí)的方法可以為監(jiān)督式學(xué)習(xí)方法或非監(jiān)督式學(xué)習(xí)方法，也可以為增強(qiáng)式學(xué)習(xí)方法。

分區(qū)決策表取得單元820配置為只要兩個(gè)輸入最終的離散編碼相同，即認(rèn)為這兩個(gè)輸入屬于同一個(gè)分區(qū)。

作為離散化編碼單元配置為所采用的離散化編碼方法可以選自各類(lèi)coarsecoding方法，如tilecoding。

在一個(gè)示例中，速度規(guī)劃裝置800還可以包括反饋單元，配置為當(dāng)發(fā)現(xiàn)某些分區(qū)的決策結(jié)果不符合預(yù)期時(shí)，在對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整后需要確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目，當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí)，引發(fā)所述機(jī)器學(xué)習(xí)單元810和分區(qū)決策表取得單元820重新進(jìn)行機(jī)器學(xué)習(xí)操作和分區(qū)決策表取得操作。

本發(fā)明另一個(gè)實(shí)施例還提供了一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃的計(jì)算裝置，包括存儲(chǔ)部件和處理器，存儲(chǔ)部件中存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令集合，當(dāng)所述計(jì)算機(jī)可執(zhí)行指令集合被所述處理器執(zhí)行時(shí)，執(zhí)行下述步驟：機(jī)器學(xué)習(xí)步驟，采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí)，獲得機(jī)器學(xué)習(xí)模型，每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述，所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量，所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值；分區(qū)決策表取得步驟，對(duì)于輸入空間進(jìn)行分區(qū)，以及基于所述獲得的機(jī)器學(xué)習(xí)模型，得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果，形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表；實(shí)時(shí)決策步驟，實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量，確定該輸入特征量所屬于的輸入分區(qū)，基于所確定的分區(qū)，查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。

可選地，當(dāng)所述計(jì)算機(jī)可執(zhí)行指令集合被所述處理器執(zhí)行時(shí)，還可以執(zhí)行下述步驟：實(shí)時(shí)控制步驟，基于所獲得的決策結(jié)果，對(duì)車(chē)輛發(fā)出控制命令，從而控制車(chē)輛的速度。

需要說(shuō)明的是，本文中的車(chē)輛應(yīng)該做廣義理解，包括各種大中小型車(chē)輛，也包括水上交通工具等。

需要說(shuō)明的是，有關(guān)方法的各個(gè)步驟可以在車(chē)輛本地執(zhí)行，也可以在云端執(zhí)行，或者在本地和云端結(jié)合起來(lái)執(zhí)行，有關(guān)數(shù)據(jù)的存儲(chǔ)也可以存儲(chǔ)在本地，或者存儲(chǔ)在云端，或者在本地和云端結(jié)合起來(lái)存儲(chǔ)。

以上已經(jīng)描述了本發(fā)明的各實(shí)施例，上述說(shuō)明是示例上性的，并非窮盡性的，并且也不限于所披露的各實(shí)施例。在不偏離所說(shuō)明的各實(shí)施例的范圍和精神的情況下，對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)許多修改和變更都是顯而易見(jiàn)的。因此，本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：周小成;姜巖;彭進(jìn)展;周鑫;張丹;羅賽
技術(shù)所有人：馭勢(shì)科技（北京）有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、霍老師：1. 木質(zhì)纖維組分高效分離及高值化轉(zhuǎn)化 2.(納米)纖維素功能材料
2、楊老師：生物質(zhì)資源利用與制漿技術(shù)
3、崔老師：1. 印刷電子 2. 仿生圖案化功能結(jié)構(gòu)
4、劉老師：1.生物質(zhì)纖維及其功能材料 2.紙基功能材料
5、劉老師：1. 納米基復(fù)合功能膠體油墨的設(shè)計(jì)制備 2. 可穿戴功能(光電、電子、傳感、儲(chǔ)能等)器件的設(shè)計(jì)構(gòu)建 3. 基于3D打印的功能器件的構(gòu)建及集成
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

固定裝置的非運(yùn)輸車(chē)輛相關(guān)技術(shù)

鐵道車(chē)輛電氣裝置相關(guān)技術(shù)

鐵路車(chē)輛制動(dòng)裝置相關(guān)技術(shù)

城軌車(chē)輛受流裝置相關(guān)技術(shù)

車(chē)輛右轉(zhuǎn)彎提醒裝置相關(guān)技術(shù)

車(chē)輛的被動(dòng)安全裝置有相關(guān)技術(shù)

陸地車(chē)輛推進(jìn)裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置與流程

車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置與流程