本公開(kāi)涉及一種用于控制機(jī)器人設(shè)備的方法。
背景技術(shù):
1、用于機(jī)器人設(shè)備、例如自主車輛的控制策略——當(dāng)為此使用了人工智能時(shí)——通常在訓(xùn)練數(shù)據(jù)的基礎(chǔ)上進(jìn)行訓(xùn)練,即,所述控制策略針對(duì)訓(xùn)練控制狀況(或訓(xùn)練場(chǎng)景)進(jìn)行訓(xùn)練。然后,經(jīng)如此訓(xùn)練的控制策略可以在如下假設(shè)下使用:所述控制策略對(duì)于訓(xùn)練中未見(jiàn)過(guò)的控制狀況也提供良好的結(jié)果,即所述控制策略可以充分地泛化。在合適的訓(xùn)練數(shù)據(jù)的情況下,這種假設(shè)通常被表明是正確的,但是,盡管如此可能出現(xiàn)如下情況:控制策略面對(duì)控制狀況,對(duì)于該控制狀況所述控制策略提供不佳的結(jié)果,因?yàn)樗隹刂撇呗垣@得的輸入數(shù)據(jù)描述一種控制狀況,在該控制狀況上所述控制策略不能夠泛化,或亦因?yàn)樗鲚斎霐?shù)據(jù)具有低質(zhì)量,即例如不佳地描述相應(yīng)的控制狀況。因此,一些辦法是值得期望的,以便在這種情況下仍然實(shí)現(xiàn)合適的(例如安全的)控制。
2、johannes?christian?müller所著的出版物《用于具有外部感知的封閉路口處的聯(lián)網(wǎng)的自主車輛的運(yùn)動(dòng)規(guī)劃(motion?planning?for?connected?automated?vehicles?atoccluded?junctions?with?external?perception)》(烏爾姆大學(xué)測(cè)量、控制和微技術(shù)研究所系列出版物第41卷,2022年,下面稱為參考文獻(xiàn)[1])描述一種基于主觀邏輯的方法,用于評(píng)價(jià)自動(dòng)化駕駛中的外部感知的可靠性。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)不同的實(shí)施方式,提供一種用于控制機(jī)器人設(shè)備的方法,該方法具有:在大量訓(xùn)練控制狀況的基礎(chǔ)上對(duì)用于機(jī)器人設(shè)備的控制策略進(jìn)行訓(xùn)練,以及針對(duì)多個(gè)控制時(shí)間點(diǎn)中的每個(gè)控制時(shí)間點(diǎn):
2、針對(duì)該控制時(shí)間點(diǎn)求取關(guān)于該機(jī)器人設(shè)備的周圍環(huán)境的信息;
3、通過(guò)將控制狀況與訓(xùn)練控制狀況進(jìn)行比較,該控制狀況說(shuō)明針對(duì)該控制時(shí)間點(diǎn)所求取的信息,求取針對(duì)該控制時(shí)間點(diǎn)所求取的信息的第一一致性度量;
4、通過(guò)將針對(duì)該控制時(shí)間點(diǎn)所求取的信息
5、與根據(jù)針對(duì)一個(gè)或多個(gè)之前的控制時(shí)間點(diǎn)關(guān)于該機(jī)器人設(shè)備的周圍環(huán)境的信息對(duì)周圍環(huán)境的狀態(tài)的預(yù)測(cè),
6、與先驗(yàn)知識(shí)(vorwissen),
7、相互間,和/或
8、與針對(duì)一個(gè)或多個(gè)之前的控制時(shí)間點(diǎn)所求取的信息與針對(duì)一個(gè)或多個(gè)之前的控制時(shí)間點(diǎn)所求取的信息
9、進(jìn)行比較,求取針對(duì)該控制時(shí)間點(diǎn)所求取的信息的至少一個(gè)第二一致性度量;
10、通過(guò)將第一一致性度量與至少一個(gè)第二一致性度量組合,求取組合后的一致性度量;以及
11、根據(jù)該組合后的一致性度量求取用于該機(jī)器人設(shè)備的一個(gè)或多個(gè)控制動(dòng)作。
12、上面所描述的方法能夠?qū)崿F(xiàn)安全的控制,因?yàn)樵诖丝紤]到如下情況:關(guān)于待控制的機(jī)器人設(shè)備的周圍環(huán)境的當(dāng)前信息在不同方面(例如相互間、與先驗(yàn)知識(shí)或與訓(xùn)練狀況)不一致。如果探測(cè)到低一致性(即例如,組合后的一致性度量低于預(yù)給定的閾值),則可根據(jù)安全模式進(jìn)行控制(例如,謹(jǐn)慎地駕駛),并且因此在對(duì)于相應(yīng)的控制而言存在不適合的信息的情況下實(shí)現(xiàn)安全的控制。
13、下面說(shuō)明不同的實(shí)施例。
14、實(shí)施例1是一種用于控制機(jī)器人的方法,如上面所描述的那樣。
15、實(shí)施例2是根據(jù)實(shí)施例1所述的方法,其中,所述第一一致性度量和至少一個(gè)第二一致性度量是主觀邏輯意見(jiàn)(subjective-logic-opinion),并且第一一致性度量與至少一個(gè)第二一致性度量的組合是在至少一個(gè)主觀邏輯融合算子(subjective-logic-fusionsoperator)的意義上的融合。
16、借助主觀邏輯,可以在一致性評(píng)價(jià)中明確地考慮認(rèn)知不確定性。因此,其適合用于對(duì)具有不確定性和不可靠來(lái)源(在本應(yīng)用情況下為例如傳感器)的狀況(在本應(yīng)用情況下為控制狀況)進(jìn)行建模和分析。下面,結(jié)合主觀邏輯(即“subjective-logic”)使用常見(jiàn)的英文術(shù)語(yǔ),尤其用于算子,如其也被用于例如參考文獻(xiàn)[1]中的那樣。
17、實(shí)施例3是根據(jù)實(shí)施例2所述的方法,其中,第一一致性度量和至少一個(gè)第二一致性度量通過(guò)應(yīng)用不確定性加權(quán)平均信任融合算子(uncertainty-weighted-average-belief-fusionsoperators)進(jìn)行組合。
18、這能夠?qū)崿F(xiàn),在評(píng)價(jià)一致性時(shí)考慮到不確定性,并且可以避免指示良好的一致性的(不確定的)評(píng)價(jià)對(duì)控制產(chǎn)生負(fù)面影響,例如不導(dǎo)致謹(jǐn)慎的駕駛行為,即使謹(jǐn)慎的駕駛行為可能是適當(dāng)?shù)模驗(yàn)橐恢滦詫?shí)際上是低的。
19、實(shí)施例4是根據(jù)實(shí)施例1所述的方法,其中,第一一致性度量和第二一致性度量是dempster?shafer信任質(zhì)量(dempster-shafer-belief-massen)。
20、實(shí)施例5是根據(jù)實(shí)施例1所述的方法,其中,第一一致性度量和第二一致性度量是借助貝葉斯推斷確定的。
21、dempster?shafer和貝葉斯推斷是使用主觀邏輯的替代方案,其同樣可以提供一致性度量,以便實(shí)現(xiàn)合適的(例如安全的)控制。
22、實(shí)施例6是根據(jù)實(shí)施例1至5中任一項(xiàng)所述的方法,其中,將第一一致性度量與至少一個(gè)第二一致性度量組合具有:對(duì)第一一致性度量和/或第二一致性度量進(jìn)行時(shí)間過(guò)濾,以及將第一一致性度量或過(guò)濾后的第一一致性度量與第二一致性度量或過(guò)濾后的第二一致性度量組合。
23、時(shí)間過(guò)濾能夠?qū)崿F(xiàn),濾出由于錯(cuò)誤的(例如特別悲觀的)一致性評(píng)價(jià)而引起的一致性評(píng)價(jià)中的跳變。在(實(shí)際的)組合發(fā)生之前,可以對(duì)所有一致性度量或一致性度量中的僅一個(gè)或(在多個(gè)第二一致性度量的情況下)一部分進(jìn)行過(guò)濾。
24、實(shí)施例7是根據(jù)實(shí)施例4所述的方法,其中,第一一致性度量和至少一個(gè)第二一致性度量是主觀邏輯意見(jiàn),并且第一一致性度量和/或至少一個(gè)第二一致性度量通過(guò)應(yīng)用累積信任融合算子(cumulative-belief-fusion-operators)進(jìn)行時(shí)間過(guò)濾。
25、在跳變的情況下,一致性評(píng)價(jià)的不確定性通常急劇增加,并且因此由該融合算子較低程度加權(quán),由此考慮緊接在跳變之后,相應(yīng)的一致性度量的說(shuō)服力通常是低的。
26、實(shí)施例8是根據(jù)實(shí)施例7所述的方法,其中,在對(duì)第一一致性度量和/或至少一個(gè)第二一致性度量進(jìn)行時(shí)間過(guò)濾時(shí),針對(duì)相應(yīng)的一致性度量,如果與之前的過(guò)濾結(jié)果的沖突程度(degree-of-conflict)的結(jié)果高于預(yù)給定的閾值,則將該一致性度量的當(dāng)前值作為時(shí)間過(guò)濾的結(jié)果。
27、實(shí)施例9是根據(jù)實(shí)施例1至8中任一項(xiàng)所述的方法,其中,第一一致性度量和/或至少一個(gè)第二一致性度量是根據(jù)多個(gè)測(cè)量值求取的,其中,測(cè)量值的重要性根據(jù)測(cè)量值的相關(guān)性借助置信度降低而降低。
28、例如,可以考慮到多個(gè)測(cè)量值來(lái)自同一數(shù)據(jù)源(例如來(lái)自同一傳感器),并且避免數(shù)據(jù)源的錯(cuò)誤使一致性度量失真。
29、實(shí)施例10是根據(jù)實(shí)施方式1至9中任一項(xiàng)所述的方法,其中,信息具有環(huán)境模型。
30、特別是,可以評(píng)價(jià)由傳感器數(shù)據(jù)推導(dǎo)出的信息(例如對(duì)象探測(cè)或軌跡預(yù)測(cè))的一致性。
31、實(shí)施方式11是根據(jù)實(shí)施方式1至10中任一項(xiàng)所述的方法,其中,根據(jù)組合后的一致性度量求取一個(gè)或多個(gè)控制動(dòng)作具有:根據(jù)品質(zhì)函數(shù)求取一個(gè)或多個(gè)控制動(dòng)作,該品質(zhì)函數(shù)對(duì)所述控制動(dòng)作進(jìn)行評(píng)價(jià),組合后的一致性度量進(jìn)入到該品質(zhì)函數(shù)中。
32、換句話說(shuō),例如根據(jù)品質(zhì)函數(shù)對(duì)可能的控制動(dòng)作進(jìn)行評(píng)價(jià)(組合后的一致性度量進(jìn)入到該品質(zhì)函數(shù)中),并且相應(yīng)地選擇(具有最佳評(píng)價(jià)的)一個(gè)或多個(gè)控制動(dòng)作。如此,可以有效地考慮到組合后的一致性度量,而不一定需要設(shè)置硬性限制(如一致性的閾值比較)。
33、實(shí)施例12是一種控制裝置,該控制裝置設(shè)立為執(zhí)行根據(jù)實(shí)施例1至11中任一項(xiàng)所述的方法。
34、實(shí)施例13是一種計(jì)算機(jī)程序,該計(jì)算機(jī)程序具有指令,當(dāng)該指令通過(guò)處理器實(shí)施時(shí),該指令促使該處理器執(zhí)行根據(jù)實(shí)施例1至11中任一種所述的方法。
35、實(shí)施例14是一種計(jì)算機(jī)可讀的介質(zhì),該介質(zhì)存儲(chǔ)有指令,當(dāng)該指令通過(guò)處理器實(shí)施時(shí),該指令促使該處理器執(zhí)行根據(jù)實(shí)施例1至11中任一種所述的方法。