本發(fā)明涉及車(chē)輛控制領(lǐng)域,特別是涉及一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置。
背景技術(shù):
隨著車(chē)輛技術(shù)的發(fā)展,車(chē)輛自動(dòng)駕駛成為熱點(diǎn)研究領(lǐng)域。速度規(guī)劃和控制是自動(dòng)駕駛中的一個(gè)重要研究?jī)?nèi)容,其基本目標(biāo)是根據(jù)檢測(cè)到的狀態(tài)(如當(dāng)前車(chē)速、前車(chē)的車(chē)速、與前車(chē)的距離)規(guī)劃出一系列后續(xù)時(shí)間點(diǎn)車(chē)的預(yù)期車(chē)速,并計(jì)算出車(chē)的最終控制參數(shù)(如油門(mén)和剎車(chē))對(duì)車(chē)進(jìn)行實(shí)際的控制操作。速度規(guī)劃在保證乘客的基本舒適和安全的同時(shí),需要保證在其它車(chē)輛有非預(yù)期的行為(如突然剎車(chē))時(shí)能保證乘客絕對(duì)的安全。
為了處理各種可能出現(xiàn)的情況,需要設(shè)計(jì)較復(fù)雜的速度規(guī)劃和控制模型。在人工設(shè)計(jì)和實(shí)現(xiàn)中,很容易漏掉某些少見(jiàn)的情況和因素。同時(shí),從駕駛員駕駛的汽車(chē)上可以采集很豐富的成熟的駕駛數(shù)據(jù)。由于機(jī)器學(xué)習(xí)方法可以很方便的從數(shù)據(jù)中學(xué)習(xí)模型,機(jī)器學(xué)習(xí)方法越來(lái)越多地應(yīng)用到速度規(guī)劃和控制。另外,在現(xiàn)實(shí)世界中,每個(gè)駕駛員都有不同的駕駛習(xí)慣和對(duì)安全舒適程度的界定,因此如果使用同一種規(guī)劃和控制方法很難滿足各種不同的需求,而機(jī)器學(xué)習(xí)方法可以很好的適配這種個(gè)性化駕駛習(xí)慣需求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的發(fā)明人通過(guò)長(zhǎng)期研究,認(rèn)識(shí)到應(yīng)用機(jī)器學(xué)習(xí)對(duì)車(chē)輛進(jìn)行速度規(guī)劃存在一些問(wèn)題。
首先,通過(guò)機(jī)器學(xué)習(xí)方法學(xué)習(xí)到的模型的效果和訓(xùn)練數(shù)據(jù)直接相關(guān)。由于駕駛員通常都是在一個(gè)很舒適的范圍內(nèi)駕駛,收集到的訓(xùn)練數(shù)據(jù)很難覆蓋到所有可能出現(xiàn)的場(chǎng)景(如車(chē)速極快而據(jù)前車(chē)距離很短等極端場(chǎng)景),雖然泛化等技術(shù)可以一定程度上解決這個(gè)問(wèn)題,但不能完全解決這個(gè)問(wèn)題。另外,收集到的駕駛員的行為不一定完全滿足舒適安全的需求,如有些駕駛員并不能保證和前車(chē)的距離,因此當(dāng)前車(chē)突然剎車(chē)時(shí),駕駛車(chē)輛很難保證不碰上前車(chē)的情況下完全剎車(chē)。顯然,用這種數(shù)據(jù)訓(xùn)練出來(lái)的模型同樣也不能處理這種情況。
機(jī)器學(xué)習(xí)存在的另一個(gè)問(wèn)題是很難對(duì)其訓(xùn)練出來(lái)的模型做局部微調(diào)。在應(yīng)用于自動(dòng)駕駛的速度規(guī)劃和控制中,通常需要針對(duì)某種特殊情況對(duì)模型進(jìn)行局部調(diào)整。而對(duì)機(jī)器學(xué)習(xí)得到的模型,對(duì)學(xué)習(xí)到的每個(gè)參數(shù)的調(diào)整,都可能帶來(lái)全局的不易控制的影響。通過(guò)添加更多的訓(xùn)練用例也可以修正模型,但是這種方法周期比較長(zhǎng),并且最后訓(xùn)練出來(lái)的模型也不能完全預(yù)知。
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的缺點(diǎn)與不足,提出一種全新的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法、裝置及計(jì)算裝置。
根據(jù)本發(fā)明的一個(gè)方面,提供一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法,具體包括:
首先為機(jī)器學(xué)習(xí)步驟,采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí),獲得機(jī)器學(xué)習(xí)模型,每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述,所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量,所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值;
其次為分區(qū)決策表取得步驟,對(duì)于輸入空間進(jìn)行分區(qū),以及基于所述獲得的機(jī)器學(xué)習(xí)模型,得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果,形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表;
再次為實(shí)時(shí)決策步驟,實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量,確定該輸入特征量所屬于的輸入分區(qū),基于所確定的分區(qū),查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。
進(jìn)一步地,速度規(guī)劃方法還可以包括實(shí)時(shí)控制步驟,基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。
進(jìn)一步地,在實(shí)時(shí)控制中,在發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí),可以對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。
進(jìn)一步地,對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整,可以依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整,也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí),調(diào)整該分區(qū)的分區(qū)決策結(jié)果。
進(jìn)一步地,各維特征分量可以包括當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速。
進(jìn)一步地,在機(jī)器學(xué)習(xí)步驟之前,需要對(duì)特征空間進(jìn)行離散化編碼。
進(jìn)一步地,根據(jù)本發(fā)明實(shí)施例的速度規(guī)劃方法,離散化編碼方法優(yōu)選為tilingcoding,其中用只有一個(gè)tiling的tilingcoding對(duì)每個(gè)特征分量進(jìn)行編碼,并且將每個(gè)特征分量所處的維度劃分成優(yōu)選的7-13個(gè)區(qū)間,從而對(duì)所述輸入空間進(jìn)行分區(qū)。
進(jìn)一步地,在分區(qū)決策表取得步驟中,首先需要計(jì)算采用離散化編碼方法得到的離散化編碼結(jié)果的空間大小,當(dāng)所述空間大于確定閾值時(shí),采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表,僅遍歷訓(xùn)練空間的輸入,存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果,同時(shí)除了分區(qū)決策表,還存儲(chǔ)訓(xùn)練出的決策模型備用;當(dāng)所述空間小于所述確定閾值時(shí),采用靜態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表,遍歷所有編碼空間,存儲(chǔ)決策模型的輸出結(jié)果。
進(jìn)一步地,在實(shí)時(shí)決策步驟中,首先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼,然后將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引,當(dāng)分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)時(shí),直接獲取分區(qū)決策表中已存儲(chǔ)的決策結(jié)果;
進(jìn)一步地,在實(shí)時(shí)決策步驟中,首先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼,然后將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引,當(dāng)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)時(shí),如果分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果,則直接從分區(qū)決策表中獲取決策結(jié)果;反之如果分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果,則調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果,并將得到的決策結(jié)果加入到分區(qū)決策表。
進(jìn)一步地,機(jī)器學(xué)習(xí)的方法可以采用監(jiān)督式學(xué)習(xí)方法或非監(jiān)督式學(xué)習(xí)方法,也可以采用增強(qiáng)式學(xué)習(xí)方法。
進(jìn)一步地,對(duì)特征空間進(jìn)行離散化編碼時(shí),只要兩個(gè)輸入最終的離散編碼相同,即認(rèn)為這兩個(gè)輸入屬于同一個(gè)分區(qū)。
進(jìn)一步地,離散化編碼方法可以包括各類(lèi)coarsecoding方法,如tilecoding。
進(jìn)一步地,在實(shí)時(shí)控制中,在對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整后需要確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目,當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí),應(yīng)當(dāng)重新執(zhí)行所述機(jī)器學(xué)習(xí)步驟和分區(qū)決策表取得步驟。
根據(jù)本發(fā)明的另一個(gè)方面,提供一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置,該裝置包括機(jī)器學(xué)習(xí)單元、分區(qū)決策表取得單元、實(shí)時(shí)決策單元??蛇x地,速度規(guī)劃裝置還可以包括實(shí)時(shí)控制單元。
其中,機(jī)器學(xué)習(xí)單元配置為采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí),獲得機(jī)器學(xué)習(xí)模型,每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述,所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量,所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值。
其中,分區(qū)決策表取得單元配置為對(duì)于輸入空間進(jìn)行分區(qū),以及基于所述獲得的機(jī)器學(xué)習(xí)模型,得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果,形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表。
其中,實(shí)時(shí)決策單元配置為實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量,確定該輸入特征量所屬于的輸入分區(qū),基于所確定的分區(qū),查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。
其中,實(shí)時(shí)控制單元配置為基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。
進(jìn)一步地,其中的實(shí)時(shí)控制單元還配置為在實(shí)時(shí)控制中,在發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí),對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。
進(jìn)一步地,其中的分區(qū)決策表取得單元還配置為對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整,可以依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整,也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí),調(diào)整該分區(qū)的分區(qū)決策結(jié)果。
進(jìn)一步地,其中實(shí)時(shí)決策單元還配置為各維特征分量包括當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速。
進(jìn)一步地,本發(fā)明的車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置還包括離散化編碼單元,配置為對(duì)訓(xùn)練樣本和所述實(shí)時(shí)決策階段的輸入特征量進(jìn)行離散化編碼。
進(jìn)一步地,根據(jù)本發(fā)明實(shí)施例的速度規(guī)劃裝置,離散化編碼單元采用的離散化編碼方法為tilingcoding,其中用只有一個(gè)tiling的tilingcoding對(duì)每個(gè)特征分量進(jìn)行編碼,并且將每個(gè)特征分量所處的維度劃分成7-13個(gè)區(qū)間,從而對(duì)所述輸入空間進(jìn)行分區(qū)。
進(jìn)一步地,分區(qū)決策表取得單元配置為計(jì)算采用離散化編碼方法得到的離散化編碼結(jié)果的空間大小,當(dāng)所述空間大于確定閾值時(shí),采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表,僅遍歷訓(xùn)練空間的輸入,存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果,同時(shí)還存儲(chǔ)訓(xùn)練出的決策模型備用;當(dāng)所述空間小于所述確定閾值時(shí),采用靜態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表,遍歷所有編碼空間,存儲(chǔ)決策模型的輸出結(jié)果。
進(jìn)一步地,實(shí)時(shí)決策單元配置為采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼,將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引,當(dāng)分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)時(shí),直接獲取分區(qū)決策表中已存儲(chǔ)的決策結(jié)果。
進(jìn)一步地,實(shí)時(shí)決策單元配置為采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼,將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引,當(dāng)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)時(shí),如果分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果,則直接從分區(qū)決策表中獲取決策結(jié)果;反之如果分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果,則調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果,并將得到的決策結(jié)果加入到分區(qū)決策表。
進(jìn)一步地,機(jī)器學(xué)習(xí)的方法可以為監(jiān)督式學(xué)習(xí)方法或非監(jiān)督式學(xué)習(xí)方法,也可以為增強(qiáng)式學(xué)習(xí)方法。
進(jìn)一步地,分區(qū)決策表取得單元配置為只要兩個(gè)輸入最終的離散編碼相同,即認(rèn)為這兩個(gè)輸入屬于同一個(gè)分區(qū)。
進(jìn)一步地,離散化編碼方法選自可以包括各類(lèi)coarsecoding方法,如tilecoding。
進(jìn)一步地,反饋單元配置為確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目,當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí),引發(fā)所述機(jī)器學(xué)習(xí)單元和分區(qū)決策表取得單元重新進(jìn)行機(jī)器學(xué)習(xí)操作和分區(qū)決策表取得操作。
根據(jù)本發(fā)明的另一個(gè)方面,提供一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃的計(jì)算裝置,包括存儲(chǔ)部件和處理器,存儲(chǔ)部件中存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令集合,當(dāng)所述計(jì)算機(jī)可執(zhí)行指令集合被所述處理器執(zhí)行時(shí),執(zhí)行下述步驟:機(jī)器學(xué)習(xí)步驟,采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí),獲得機(jī)器學(xué)習(xí)模型,每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述,所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量,所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值;分區(qū)決策表取得步驟,對(duì)于輸入空間進(jìn)行分區(qū),以及基于所述獲得的機(jī)器學(xué)習(xí)模型,得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果,形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表;實(shí)時(shí)決策步驟,實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量,確定該輸入特征量所屬于的輸入分區(qū),基于所確定的分區(qū),查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果;以及實(shí)時(shí)控制步驟,基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。
本發(fā)明采用分區(qū)決策表技術(shù)提供的速度規(guī)劃方法、裝置及計(jì)算裝置適用于車(chē)輛自動(dòng)駕駛技術(shù),很好的解決了不能對(duì)機(jī)器學(xué)習(xí)訓(xùn)練出的模型做局部調(diào)整的問(wèn)題,可以很容易修改某個(gè)分區(qū)的決策,而完全不影響其它分區(qū)的決策結(jié)果,從而完成局部調(diào)整。同時(shí),分區(qū)決策表的直觀特性可以很好的幫助發(fā)現(xiàn)和解決機(jī)器學(xué)習(xí)過(guò)程中存在的問(wèn)題。分區(qū)決策表可以加速?zèng)Q策過(guò)程,查分區(qū)決策表可以獲得更快的決策速度。
附圖說(shuō)明
從下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例的詳細(xì)描述中,本發(fā)明的這些和/或其它方面和優(yōu)點(diǎn)將變得更加清楚并更容易理解,其中:
圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法的總體流程圖;
圖2示意性地示出了機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖;
圖3示出了在應(yīng)用機(jī)器學(xué)習(xí)方法之前,進(jìn)行離散化編碼處理的機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖;
圖4示出了coarsecoding類(lèi)別中的tilecoding離散化編碼方法。
圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的、在采用離散化編碼情況下的整個(gè)決策分區(qū)表的建立和優(yōu)化過(guò)程。
圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的實(shí)時(shí)決策步驟的實(shí)現(xiàn)方法的流程圖。
圖7示出了根據(jù)本發(fā)明實(shí)施例的含有實(shí)時(shí)控制步驟的速度規(guī)劃控制方法的700的流程圖。
圖8示出了根據(jù)本發(fā)明實(shí)施例的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置800的結(jié)構(gòu)框圖。
具體實(shí)施方式
為了使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。
在進(jìn)行詳細(xì)說(shuō)明之前,首先介紹一下本發(fā)明的總體思想,以便于本領(lǐng)域技術(shù)人員把握本發(fā)明。
如前所述,發(fā)明人經(jīng)實(shí)現(xiàn)和分析發(fā)現(xiàn),利用機(jī)器學(xué)習(xí)具有嚴(yán)重依賴(lài)于訓(xùn)練數(shù)據(jù),由于訓(xùn)練數(shù)據(jù)的局限性使得訓(xùn)練出來(lái)的模型不能處理一些實(shí)際突發(fā)情況等問(wèn)題,以及還具有難于做局部微調(diào),整體調(diào)整周期長(zhǎng)且效果難以預(yù)知的問(wèn)題。為此,發(fā)明人提出了本發(fā)明,將機(jī)器學(xué)習(xí)模型的訓(xùn)練和應(yīng)用分別處理:在訓(xùn)練時(shí),我們按照通用的機(jī)器學(xué)習(xí)方法來(lái)進(jìn)行訓(xùn)練;在應(yīng)用這些訓(xùn)練出來(lái)的模型之前,將輸入空間按分成多個(gè)分區(qū),并且將模型中決策結(jié)果存入到不同分區(qū),從而形成一個(gè)按分區(qū)組織的決策表,由此,應(yīng)用模型的決策過(guò)程轉(zhuǎn)化為一個(gè)查分區(qū)決策表的過(guò)程。這樣,可以很容易修改某個(gè)分區(qū)的決策,而完全不影響其它分區(qū)的決策結(jié)果,從而完成局部調(diào)整。同時(shí),分區(qū)決策表的直觀特性可以很好的幫助發(fā)現(xiàn)和解決機(jī)器學(xué)習(xí)過(guò)程中存在的問(wèn)題。分區(qū)決策表可以加速?zèng)Q策過(guò)程,查分區(qū)決策表可以獲得更快的決策速度。對(duì)于實(shí)時(shí)性要求較高的自動(dòng)駕駛速度規(guī)劃來(lái)說(shuō),易于調(diào)整局部策略和具有迅捷的決策速度是非常重要的。
下面結(jié)合圖1描述根據(jù)本發(fā)明實(shí)施例的車(chē)輛自動(dòng)駕駛方法示例。圖1示出了本發(fā)明一個(gè)實(shí)施例的用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法的總體流程圖。
在步驟s110中,執(zhí)行機(jī)器學(xué)習(xí)步驟,采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí),獲得機(jī)器學(xué)習(xí)模型,每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述,所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量,所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值。在步驟s110完成后,前進(jìn)到步驟s120。
在步驟s120中,執(zhí)行分區(qū)決策表取得步驟,對(duì)于輸入空間進(jìn)行分區(qū),以及基于所述獲得的機(jī)器學(xué)習(xí)模型,得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果,形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表。
在步驟s130中,進(jìn)行實(shí)時(shí)決策,實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量,確定該輸入特征量所屬于的輸入分區(qū),基于所確定的分區(qū),查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。
根據(jù)本發(fā)明實(shí)施例,將機(jī)器學(xué)習(xí)模型的訓(xùn)練和應(yīng)用分別處理。在訓(xùn)練時(shí)按照通用的事先收集的訓(xùn)練用例訓(xùn)練模型,具體的機(jī)器學(xué)習(xí)方法可以是需要標(biāo)注數(shù)據(jù)的監(jiān)督式學(xué)習(xí),也可以是不需要標(biāo)注數(shù)據(jù)的非監(jiān)督式學(xué)習(xí),也可以是增強(qiáng)學(xué)習(xí)等。和傳統(tǒng)方法不同的是,在應(yīng)用這些訓(xùn)練出來(lái)的模型之前,將輸入空間按訓(xùn)練時(shí)的離散化編碼方法劃分成多個(gè)分區(qū),并且將模型中決策結(jié)果存入到不同分區(qū),從而形成一個(gè)按分區(qū)組織的決策表。因此,采用本發(fā)明實(shí)施例的車(chē)輛自動(dòng)駕駛的速度規(guī)劃方法,就是將應(yīng)用模型的決策過(guò)程轉(zhuǎn)化為一個(gè)查分區(qū)決策表的過(guò)程。
為便于理解,圖2示意性地示出了機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖。
在圖2所示,針對(duì)輸入的各個(gè)訓(xùn)練用例(訓(xùn)練樣本)210,進(jìn)行機(jī)器學(xué)習(xí)220,得到?jīng)Q策模型230,對(duì)輸入空間分區(qū)240,結(jié)合分區(qū)和決策模型,得到分區(qū)決策表250。
在利用分區(qū)決策表進(jìn)行決策時(shí),對(duì)于到來(lái)的輸入270,首先對(duì)其進(jìn)行分區(qū)240,在確定所屬分區(qū)后,到分區(qū)決策表250中查詢(xún)獲得對(duì)應(yīng)的決策結(jié)果。作為進(jìn)行分區(qū)的例子,對(duì)于連續(xù)維度的分區(qū),例如可以基于車(chē)輛控制專(zhuān)家的經(jīng)驗(yàn)知識(shí)來(lái)進(jìn)行分區(qū)。
在一個(gè)示例中,在應(yīng)用機(jī)器學(xué)習(xí)方法前,采用某種編碼方式對(duì)輸入空間進(jìn)行離散化處理提取特征后再進(jìn)行處理,這些離散化編碼方法很自然的將連續(xù)輸入空間劃分成多個(gè)分區(qū)。這里的分區(qū)不限定是同一維度數(shù)據(jù)連續(xù)空間的分區(qū),只要其最終的編碼相同,即可以認(rèn)為兩個(gè)樣本屬于同一分區(qū);換句話說(shuō)這里的分區(qū)并不一定是按原空間連續(xù)劃分的,而是按照離散編碼的結(jié)果劃分。圖3示出了在應(yīng)用機(jī)器學(xué)習(xí)方法之前,進(jìn)行離散化編碼處理的機(jī)器學(xué)習(xí)訓(xùn)練和應(yīng)用的操作過(guò)程和輸入、輸出的示例性示意圖,其中任何輸入,不管是訓(xùn)練示例,還是應(yīng)用示例,都要先進(jìn)行離散化編碼處理380。
圖4示出了示出了粗編碼(coarsecoding)類(lèi)別中的tilecoding離散化編碼方法。在圖4所示的二維輸入空間中,三個(gè)不同位置的tiling將整個(gè)空間劃分為不同的小區(qū)域,這些小區(qū)域即可作為分區(qū)。
作為輸入空間的示例,可以由當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速四個(gè)維度構(gòu)成。需要說(shuō)明的是,這里的前車(chē)是一個(gè)寬泛的概念,并不局限于車(chē)輛。當(dāng)前面沒(méi)有任何物體時(shí),可以虛擬出一輛前車(chē),并設(shè)置虛擬前車(chē)的距離和相對(duì)速度。最大車(chē)速是由各種條件限制(如道路限制、天氣條線限制)下的最高行駛速度。因此,自動(dòng)駕駛領(lǐng)域中的速度規(guī)劃和控制的編碼空間通常不大,因此比較適合進(jìn)行分區(qū)。
發(fā)明人實(shí)踐得到的一個(gè)優(yōu)選例子為:用只有一個(gè)tiling的tilingcoding對(duì)每個(gè)輸入維度進(jìn)行編碼,將每個(gè)輸入維度劃分成10個(gè)左右分區(qū)即可很好的滿足自動(dòng)駕駛的速度決策需求。比如對(duì)于最大車(chē)速,我們可以以10公里每小時(shí)的分區(qū)大小對(duì)其進(jìn)行分區(qū),結(jié)合現(xiàn)實(shí)情況,將其劃分成[0,10,20,30,40,50,60,70,80,90,100,110,120]共12個(gè)分區(qū)。此時(shí)的分區(qū)數(shù)為104左右。對(duì)計(jì)算機(jī)而言,這樣大小的分區(qū)表非常容易存儲(chǔ)和處理。在某些極端情況下(如輸入維度很多或離散化編碼輸出空間很大),最后出來(lái)的編碼空間可能超出計(jì)算機(jī)的存儲(chǔ)空間。此時(shí),基于來(lái)自現(xiàn)實(shí)世界的真實(shí)輸入非常稀疏,可以采用哈希表或其它節(jié)省存儲(chǔ)空間的方法來(lái)動(dòng)態(tài)存儲(chǔ)和處理分區(qū)決策表。
下面參考圖5描述根據(jù)本發(fā)明一個(gè)實(shí)施例的、在采用離散化編碼情況下的整個(gè)決策分區(qū)表的建立和優(yōu)化過(guò)程示例,該過(guò)程可以用于執(zhí)行圖1所示的步驟s120。需要說(shuō)明的是,圖5中的閾值可以根據(jù)機(jī)器的存儲(chǔ)空間設(shè)定。需要說(shuō)明的是,此僅為示例,并非在機(jī)器學(xué)習(xí)訓(xùn)練之前,必須要對(duì)訓(xùn)練樣本進(jìn)行離散化編碼,
如圖5所示,在步驟s510中,計(jì)算機(jī)器學(xué)習(xí)方法采用離散化編碼結(jié)果的空間大小。
在步驟s520中,判斷空間大小是否大于某個(gè)閾值。
當(dāng)步驟s520中判斷結(jié)果為否時(shí),前進(jìn)到步驟s530,靜態(tài)存儲(chǔ)分區(qū)決策表:遍歷所有編碼空間,存儲(chǔ)決策模型的輸出結(jié)果;反之,當(dāng)判斷結(jié)果為是時(shí),前進(jìn)到步驟s540,用哈?;蚱渌鼊?dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表:僅遍歷訓(xùn)練空間的輸入,存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果;接下來(lái)前進(jìn)到步驟s550,除了分區(qū)決策表,還存儲(chǔ)訓(xùn)練出的決策模型備用。需要說(shuō)明的是,當(dāng)需要?jiǎng)討B(tài)存儲(chǔ)分區(qū)決策表時(shí),為了降低后續(xù)動(dòng)態(tài)應(yīng)用時(shí)動(dòng)態(tài)建表的開(kāi)銷(xiāo),可以選擇提前添加訓(xùn)練集對(duì)應(yīng)的表項(xiàng),也可以選擇添加其它輸入集對(duì)應(yīng)的表項(xiàng),或者不添加任何表項(xiàng),等后續(xù)需要時(shí)再動(dòng)態(tài)添加。此時(shí),由于后面需要?jiǎng)討B(tài)插入決策表項(xiàng),除了初始分區(qū)決策表以外,也需要保存機(jī)器學(xué)習(xí)得到的決策模型,如步驟s550所示。
下面參考附圖6描述根據(jù)本發(fā)明一個(gè)實(shí)施例的實(shí)時(shí)決策步驟s130的實(shí)現(xiàn)方法的操作過(guò)程示例,這里,假設(shè)采用離散化編碼方法對(duì)輸入進(jìn)行處理,而且分區(qū)決策表是通過(guò)圖5所示的方法構(gòu)建和存儲(chǔ)的。
如圖6所示,在步驟s610中,應(yīng)用離散編碼方法對(duì)輸入進(jìn)行編碼。這里的輸入可以為車(chē)輛自動(dòng)駕駛過(guò)程中實(shí)時(shí)獲得的當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速。不過(guò)此僅為示例,輸入的維度和具體特征量可以根據(jù)速度規(guī)劃方法的不同而不同。
在步驟s620中,將獲得的離散化結(jié)果作為分區(qū)塊的索引,查詢(xún)分區(qū)決策表。
在分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ)的或者雖為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)的但是分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果時(shí),能夠直接從分區(qū)決策表中獲取決策結(jié)果;反之當(dāng)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)且分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果時(shí),則不能直接從分區(qū)決策表中獲得決策結(jié)果。
在步驟s630中,判斷是否得到?jīng)Q策結(jié)果。如果答案為“是”,則前進(jìn)到步驟s650,返回決策結(jié)果。反之,答案為“否”,則前進(jìn)到步驟s640,調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果,并將得到的決策結(jié)果加入到分區(qū)決策表,然后前進(jìn)到步驟s650。
需要說(shuō)明的是,圖6是在進(jìn)行了離散編碼而且先前視情況采用了靜態(tài)存儲(chǔ)或動(dòng)態(tài)存儲(chǔ)情況下的決策過(guò)程示例。不過(guò)這僅為示例,而不是作為本發(fā)明的限制,在不進(jìn)行離散編碼的情況下,利用分區(qū)決策表進(jìn)行決策的過(guò)程可以不同,例如,此時(shí)可以直接根據(jù)輸入來(lái)確定其所屬分區(qū),然后查詢(xún)分區(qū)決策表,獲得決策結(jié)果;在沒(méi)有通過(guò)查詢(xún)分區(qū)決策表得到?jīng)Q策結(jié)果的情況下,在存儲(chǔ)了決策模型的情況下,可以調(diào)用存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果,或者也可以直接給出反饋表明此時(shí)無(wú)法給出決策結(jié)果等等。
根據(jù)本發(fā)明實(shí)施例的速度規(guī)劃方法,當(dāng)發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí),能夠迅速對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。不需要修改訓(xùn)練用例集或調(diào)整訓(xùn)練參數(shù)重新訓(xùn)練,也不需要調(diào)整訓(xùn)練出來(lái)的模型的參數(shù),而只需要修改分區(qū)決策表上相應(yīng)分區(qū)的決策結(jié)果,從而保證所做的調(diào)整只局限于這個(gè)分區(qū),而不會(huì)影響其它分區(qū)上的決策結(jié)果。
針對(duì)分區(qū)決策結(jié)果進(jìn)行調(diào)整的具體方法可以是依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整,也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí)。比如,當(dāng)發(fā)現(xiàn)在當(dāng)前車(chē)速是10公里每小時(shí)、和前車(chē)的距離是200米、前車(chē)相對(duì)速度是5公里每小時(shí)、最大車(chē)速是30公里每小時(shí)的時(shí)候速度控制不正常時(shí),即可以參考某個(gè)有經(jīng)驗(yàn)的駕駛員在這種情況下的反應(yīng),將其轉(zhuǎn)換成相應(yīng)的決策結(jié)果,存儲(chǔ)到該輸入所屬區(qū)間對(duì)應(yīng)的決策表項(xiàng)?;蛘咭部梢允占芏囫{駛員在駕駛時(shí)的數(shù)據(jù),將所有和該輸入空間相應(yīng)的決策結(jié)果收集起來(lái),通過(guò)歸納或者簡(jiǎn)單的機(jī)器學(xué)習(xí)方法得到一個(gè)期望的決策結(jié)果。
在一個(gè)示例中,在獲得決策結(jié)果后,執(zhí)行實(shí)時(shí)控制步驟,基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。圖7示出了根據(jù)本發(fā)明實(shí)施例的含有實(shí)時(shí)控制步驟的速度規(guī)劃控制方法的700的流程圖,圖7中的步驟s710-s730與圖1所示的步驟s110-s130類(lèi)似,不同在于多了實(shí)時(shí)控制步驟s740,即基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。
需要說(shuō)明的是,這里根據(jù)速度規(guī)劃決策結(jié)果,執(zhí)行實(shí)時(shí)控制,并不是排他式的控制,而是可以結(jié)合自動(dòng)駕駛的其他控制策略(例如轉(zhuǎn)向控制等)來(lái)一起綜合對(duì)車(chē)輛進(jìn)行控制。
根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例,當(dāng)發(fā)現(xiàn)某些分區(qū)的決策結(jié)果不符合預(yù)期時(shí),在對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整后可以確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目,當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí),則重新執(zhí)行整體訓(xùn)練步驟,重新機(jī)器學(xué)習(xí),然后得到新的決策模型,再次進(jìn)行分區(qū),即可以基于這些反饋結(jié)果來(lái)重新執(zhí)行例如圖1所示的步驟s110至步驟s130,即機(jī)器學(xué)習(xí)步驟和分區(qū)決策表取得步驟,在重新進(jìn)行機(jī)器學(xué)習(xí)時(shí),可以基于應(yīng)用決策結(jié)果的反饋來(lái)嘗試通過(guò)修改訓(xùn)練參數(shù)、添加相應(yīng)的訓(xùn)練用例等方法來(lái)得到更好的機(jī)器學(xué)習(xí)。
根據(jù)本發(fā)明的另一實(shí)施例,還提供了一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃裝置。下面將結(jié)合圖8進(jìn)行說(shuō)明,速度規(guī)劃裝置包括以下單元:機(jī)器學(xué)習(xí)單元810、分區(qū)決策表取得單元820和實(shí)時(shí)決策單元830??蛇x地,還可以包括實(shí)時(shí)控制單元830。
機(jī)器學(xué)習(xí)單元810配置為采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí),獲得機(jī)器學(xué)習(xí)模型,每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述,所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量,所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值。
分區(qū)決策表取得單820配置為對(duì)于輸入空間進(jìn)行分區(qū),以及基于所述獲得的機(jī)器學(xué)習(xí)模型,得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果,形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表。
實(shí)時(shí)決策單元830配置為實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量,確定該輸入特征量所屬于的輸入分區(qū),基于所確定的分區(qū),查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。
實(shí)時(shí)控制單元840配置為基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。
在一個(gè)示例中,速度規(guī)劃裝置還可以包括局部分區(qū)決策調(diào)整單元,配置為當(dāng)發(fā)現(xiàn)確定分區(qū)的決策結(jié)果不符合預(yù)期時(shí),對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整。
局部分區(qū)決策調(diào)整單元對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整時(shí),可以依經(jīng)驗(yàn)對(duì)該分區(qū)的分區(qū)決策內(nèi)容進(jìn)行調(diào)整,也可以通過(guò)機(jī)器學(xué)習(xí)方法對(duì)該分區(qū)進(jìn)行學(xué)習(xí),調(diào)整該分區(qū)的分區(qū)決策結(jié)果。
在一個(gè)示例中,速度規(guī)劃裝置還包括離散化編碼單元,配置為對(duì)訓(xùn)練樣本和所述實(shí)時(shí)決策階段的輸入特征量進(jìn)行離散化編碼。
因?yàn)樽罱K的編碼空間通常不大,比如在實(shí)現(xiàn)自動(dòng)巡航系統(tǒng)時(shí)的速度規(guī)劃和控制中,輸入只有當(dāng)前車(chē)速、和前車(chē)的距離、前車(chē)相對(duì)速度和最大車(chē)速四個(gè)維度。離散化編碼單元優(yōu)選采用的離散化編碼方法為tilingcoding,只有一個(gè)tiling的tilingcoding對(duì)每個(gè)輸入維度進(jìn)行編碼,將每個(gè)輸入維度劃分成優(yōu)選的7-13個(gè)區(qū)間,這樣即可很好的滿足自動(dòng)駕駛的速度決策需求。
因?yàn)樵谀承O端情況下(如輸入維度很多或離散化編碼輸出空間很大),最后出來(lái)的編碼空間可能超出計(jì)算機(jī)的存儲(chǔ)空間,所以分區(qū)決策表取得單元820還配置為計(jì)算采用離散化編碼方法得到的離散化編碼結(jié)果的空間大小。
當(dāng)分區(qū)決策表取得單元820計(jì)算出采用離散化編碼方法得到的離散化編碼結(jié)果的空間大于所確定的閾值時(shí),則決定選擇采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表,此時(shí)僅遍歷訓(xùn)練空間的輸入,存儲(chǔ)相應(yīng)決策模型的輸出結(jié)果,同時(shí)還存儲(chǔ)訓(xùn)練出的決策模型備用。
相應(yīng)的,本發(fā)明的實(shí)時(shí)決策單元830配置為先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼,再將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引,因?yàn)榇藭r(shí)分區(qū)決策表為采用動(dòng)態(tài)存儲(chǔ)方法存儲(chǔ),如果分區(qū)決策表內(nèi)存儲(chǔ)有該離散化編碼結(jié)果的決策結(jié)果,則直接從分區(qū)決策表中獲取決策結(jié)果;反之如果分區(qū)決策表內(nèi)沒(méi)有存儲(chǔ)該離散化編碼結(jié)果的決策結(jié)果,則調(diào)用所述存儲(chǔ)的決策模型來(lái)得到?jīng)Q策結(jié)果,并將得到的決策結(jié)果加入到分區(qū)決策表。
當(dāng)本發(fā)明的分區(qū)決策表取得單元820計(jì)算出采用離散化編碼方法得到的離散化編碼結(jié)果的空間小于所述確定閾值時(shí),采用靜態(tài)存儲(chǔ)方法存儲(chǔ)分區(qū)決策表,遍歷所有編碼空間,存儲(chǔ)決策模型的輸出結(jié)果。
相應(yīng)的,本發(fā)明的實(shí)時(shí)決策單元830配置為先采用所述離散化編碼方法對(duì)所述輸入特征量進(jìn)行離散化編碼,再將獲得的離散化編碼結(jié)果作為分區(qū)決策表的索引,因?yàn)榇藭r(shí)分區(qū)決策表為采用靜態(tài)存儲(chǔ)方法存儲(chǔ),可以直接獲取分區(qū)決策表中已存儲(chǔ)的決策結(jié)果。
機(jī)器學(xué)習(xí)單元810配置為采用的機(jī)器學(xué)習(xí)的方法可以為監(jiān)督式學(xué)習(xí)方法或非監(jiān)督式學(xué)習(xí)方法,也可以為增強(qiáng)式學(xué)習(xí)方法。
分區(qū)決策表取得單元820配置為只要兩個(gè)輸入最終的離散編碼相同,即認(rèn)為這兩個(gè)輸入屬于同一個(gè)分區(qū)。
作為離散化編碼單元配置為所采用的離散化編碼方法可以選自各類(lèi)coarsecoding方法,如tilecoding。
在一個(gè)示例中,速度規(guī)劃裝置800還可以包括反饋單元,配置為當(dāng)發(fā)現(xiàn)某些分區(qū)的決策結(jié)果不符合預(yù)期時(shí),在對(duì)該分區(qū)的分區(qū)決策結(jié)果進(jìn)行調(diào)整后需要確定被調(diào)整過(guò)分區(qū)決策結(jié)果的分區(qū)的數(shù)目,當(dāng)所述分區(qū)的數(shù)目超過(guò)預(yù)定閾值時(shí),引發(fā)所述機(jī)器學(xué)習(xí)單元810和分區(qū)決策表取得單元820重新進(jìn)行機(jī)器學(xué)習(xí)操作和分區(qū)決策表取得操作。
本發(fā)明另一個(gè)實(shí)施例還提供了一種用于車(chē)輛自動(dòng)駕駛的速度規(guī)劃的計(jì)算裝置,包括存儲(chǔ)部件和處理器,存儲(chǔ)部件中存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令集合,當(dāng)所述計(jì)算機(jī)可執(zhí)行指令集合被所述處理器執(zhí)行時(shí),執(zhí)行下述步驟:機(jī)器學(xué)習(xí)步驟,采用訓(xùn)練樣本集進(jìn)行機(jī)器學(xué)習(xí),獲得機(jī)器學(xué)習(xí)模型,每個(gè)訓(xùn)練樣本由形成輸入空間的多維特征分量和形成輸出空間的決策結(jié)果來(lái)描述,所述多維特征分量的每維是用于描述車(chē)輛特定時(shí)刻狀態(tài)的、與速度規(guī)劃有關(guān)的變量,所述決策結(jié)果指示下一時(shí)刻的預(yù)期速度和/或與速度控制相關(guān)的控制參數(shù)數(shù)值;分區(qū)決策表取得步驟,對(duì)于輸入空間進(jìn)行分區(qū),以及基于所述獲得的機(jī)器學(xué)習(xí)模型,得到與確定分區(qū)對(duì)應(yīng)的決策結(jié)果,形成各個(gè)分區(qū)對(duì)應(yīng)于相應(yīng)決策結(jié)果的分區(qū)決策表;實(shí)時(shí)決策步驟,實(shí)時(shí)獲得行駛中車(chē)輛的各維特征分量作為輸入特征量,確定該輸入特征量所屬于的輸入分區(qū),基于所確定的分區(qū),查詢(xún)分區(qū)決策表來(lái)獲得相應(yīng)的決策結(jié)果。
可選地,當(dāng)所述計(jì)算機(jī)可執(zhí)行指令集合被所述處理器執(zhí)行時(shí),還可以執(zhí)行下述步驟:實(shí)時(shí)控制步驟,基于所獲得的決策結(jié)果,對(duì)車(chē)輛發(fā)出控制命令,從而控制車(chē)輛的速度。
需要說(shuō)明的是,本文中的車(chē)輛應(yīng)該做廣義理解,包括各種大中小型車(chē)輛,也包括水上交通工具等。
需要說(shuō)明的是,有關(guān)方法的各個(gè)步驟可以在車(chē)輛本地執(zhí)行,也可以在云端執(zhí)行,或者在本地和云端結(jié)合起來(lái)執(zhí)行,有關(guān)數(shù)據(jù)的存儲(chǔ)也可以存儲(chǔ)在本地,或者存儲(chǔ)在云端,或者在本地和云端結(jié)合起來(lái)存儲(chǔ)。
以上已經(jīng)描述了本發(fā)明的各實(shí)施例,上述說(shuō)明是示例上性的,并非窮盡性的,并且也不限于所披露的各實(shí)施例。在不偏離所說(shuō)明的各實(shí)施例的范圍和精神的情況下,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)許多修改和變更都是顯而易見(jiàn)的。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。