1.本發(fā)明涉及:一種用來(lái)運(yùn)行車輛組件的用于機(jī)器學(xué)習(xí)、尤其是用于處理或產(chǎn)生訓(xùn)練數(shù)據(jù)集的計(jì)算機(jī)實(shí)現(xiàn)的方法;和一種相對(duì)應(yīng)的用來(lái)運(yùn)行車輛組件的方法。還提供了一種相對(duì)應(yīng)的控制單元以及一種相對(duì)應(yīng)的車輛。
背景技術(shù):2.在現(xiàn)有技術(shù)的機(jī)器學(xué)習(xí)方法的情況下的訓(xùn)練表明:在具有代表性過(guò)度或代表性不足的場(chǎng)景的分布不均勻的數(shù)據(jù)集的情況下效率低下。由此,可能導(dǎo)致在有先前未知的數(shù)據(jù)的情況下性能不佳。這進(jìn)而導(dǎo)致:在安全關(guān)鍵的環(huán)境中的方法以及適用性的魯棒性受到明顯損害。
3.僅作為另一技術(shù)背景而參閱現(xiàn)有技術(shù),該現(xiàn)有技術(shù)處理在輸出數(shù)據(jù)集中的所謂的少數(shù)類和多數(shù)類之間非常極端的分布不均勻的情況下的另一、非常特殊的問題。在s. yen等人的出版物“cluster-based under-sampling approaches for imbalanced data distributions”,expert system with applications 36,2009,年,5718-5727頁(yè),doi:10.1016/j.eswa.2008.06.108中,描述了這些稀有的少數(shù)類的加權(quán)分布。在m. mostafizur rahman等人的出版物“cluster based under-sampling for unbalanced cardiovascular data”,proceedings of the world congress on engineering, 2013, vol. iii, issn: 2078-0966 (online)中,稀有的少數(shù)類的該特別的特殊情況同樣得以處理。在此,輸入數(shù)據(jù)集被分為多數(shù)類和少數(shù)類,其中只關(guān)于多數(shù)類方面進(jìn)行聚類,并且然后通過(guò)將每個(gè)聚類與這些少數(shù)類進(jìn)行配對(duì)來(lái)實(shí)現(xiàn)多個(gè)數(shù)據(jù)集。接著,這些組合的最好的一對(duì)被用作訓(xùn)練數(shù)據(jù)集。
4.除了這些特殊問題之外,在現(xiàn)有技術(shù)中執(zhí)行其中訓(xùn)練性能被測(cè)試并且接著基于獨(dú)立數(shù)據(jù)來(lái)被驗(yàn)證的方法。在此,通常使用描繪了目標(biāo)行為的非常大的訓(xùn)練數(shù)據(jù)集。
5.對(duì)于大數(shù)據(jù)集來(lái)說(shuō),由于大數(shù)據(jù)集、諸如加標(biāo)簽?zāi)菢拥臄?shù)據(jù)集處理、匿名化,還形成高計(jì)算花費(fèi),而且為了處理訓(xùn)練過(guò)程的這些大數(shù)據(jù)量而必須提供增加的計(jì)算資源。迭代的、手動(dòng)的數(shù)據(jù)集生成容易出錯(cuò),并且由于反復(fù)試驗(yàn)(trial und error)而通常緩慢。考慮所有數(shù)據(jù)也導(dǎo)致非常耗時(shí)且無(wú)效的訓(xùn)練。
6.此外,故障案例的分析常?;趯<抑R(shí)。這里,困難主要在于不同原因的耦合以及對(duì)參數(shù)的復(fù)雜探測(cè)。解決方案大多在于:使用更多數(shù)據(jù),以便實(shí)現(xiàn)更好的性能。沒有進(jìn)行對(duì)多維空間的客觀分析。為了擴(kuò)展或增大數(shù)據(jù)集,由專家來(lái)進(jìn)行分析。
7.特別是車輛領(lǐng)域是安全關(guān)鍵領(lǐng)域,在該安全關(guān)鍵領(lǐng)域,各種不同的車輛組件必須以高安全要求來(lái)被運(yùn)行。高性能和快速訓(xùn)練時(shí)間在該領(lǐng)域尤為重要。在機(jī)器學(xué)習(xí)算法的支持下運(yùn)行車輛組件時(shí),訓(xùn)練數(shù)據(jù)集和性能有時(shí)在是否發(fā)生嚴(yán)重錯(cuò)誤方面是決定性的。
技術(shù)實(shí)現(xiàn)要素:8.現(xiàn)在,本發(fā)明所基于的任務(wù)在于:提供一種用于運(yùn)行車輛組件的計(jì)算機(jī)實(shí)現(xiàn)的機(jī)器學(xué)習(xí)方法和一種對(duì)應(yīng)的用于運(yùn)行車輛組件的方法,該方法解決了上述問題中的至少一部
分或者至少使上述問題中的至少一部分減小到最低限度。本發(fā)明的一個(gè)方面尤其在于確??缢袌?chǎng)景的良好性能并且同時(shí)允許節(jié)省時(shí)間和資源地產(chǎn)生訓(xùn)練數(shù)據(jù)集。此外,目標(biāo)在于:實(shí)現(xiàn)時(shí)間效率高且精度高的訓(xùn)練的前提條件。
9.在本發(fā)明的優(yōu)選的設(shè)計(jì)方案中,提供了一種用來(lái)運(yùn)行車輛組件的用于機(jī)器學(xué)習(xí)的、尤其是用于處理或產(chǎn)生訓(xùn)練數(shù)據(jù)集的計(jì)算機(jī)實(shí)現(xiàn)的方法。在第一步驟中,該方法包括:提供多個(gè)多維數(shù)據(jù)點(diǎn)。在另一步驟中,該方法包括:通過(guò)在使用聚類算法的情況下將所述多個(gè)數(shù)據(jù)點(diǎn)劃分成多維聚類來(lái)產(chǎn)生基本訓(xùn)練數(shù)據(jù)集,其中每個(gè)數(shù)據(jù)點(diǎn)都被分配給正好一個(gè)聚類。在另一步驟中,通過(guò)從基本訓(xùn)練數(shù)據(jù)集中選擇數(shù)據(jù)點(diǎn)來(lái)產(chǎn)生訓(xùn)練數(shù)據(jù)集。在此,對(duì)訓(xùn)練數(shù)據(jù)集的產(chǎn)生包括:確定在多個(gè)聚類中的具有最少數(shù)目的數(shù)據(jù)點(diǎn)的最小聚類。在另一步驟中,對(duì)訓(xùn)練數(shù)據(jù)集的產(chǎn)生包括:為該訓(xùn)練數(shù)據(jù)集選擇該最小聚類的數(shù)據(jù)點(diǎn)的至少一個(gè)子集。此外,在另一步驟中,為該訓(xùn)練數(shù)據(jù)集從其余聚類中的每個(gè)聚類中選擇數(shù)據(jù)點(diǎn)的子集,使得每個(gè)其余聚類的所選擇的數(shù)據(jù)點(diǎn)的數(shù)目都對(duì)應(yīng)于該最小聚類的所選擇的數(shù)據(jù)點(diǎn)的數(shù)目。
10.多維數(shù)據(jù)點(diǎn)可以通過(guò)向量來(lái)被表示并且配備有多個(gè)條目。數(shù)據(jù)點(diǎn)的集合可以形成時(shí)間序列。例如,多維數(shù)據(jù)點(diǎn)可包括物理或運(yùn)動(dòng)學(xué)變量,如車速、位置、方向、轉(zhuǎn)向力矩、橫向加速度、橫擺率、方向盤角速度、加速度要不然還有軌跡或者軌跡部段,其中上述示例只是示例性的列舉并且本發(fā)明并不限于此。原則上,數(shù)據(jù)點(diǎn)是與車輛相關(guān)的測(cè)量數(shù)據(jù)點(diǎn)、例如傳感器數(shù)據(jù)點(diǎn),即可通過(guò)傳感器來(lái)被檢測(cè)的參量。例如,輪胎壓力也可以是數(shù)據(jù)點(diǎn)的條目。數(shù)據(jù)點(diǎn)例如可以是傳感器信號(hào)。在其它情況下,這些數(shù)據(jù)點(diǎn)是經(jīng)模擬的數(shù)據(jù)或者由服務(wù)器提供的數(shù)據(jù),這些數(shù)據(jù)是從之前發(fā)生的測(cè)量過(guò)程中獲得的。傳感器信號(hào)可以由車輛的多個(gè)傳感器來(lái)檢測(cè),尤其是由車輛的不同的傳感器來(lái)檢測(cè)。優(yōu)選地,可以使用k-means算法作為聚類算法。然而,本發(fā)明并不依賴于所使用的聚類算法。例如,也可以使用em聚類或模糊c-means算法等等。每個(gè)聚類都是一個(gè)特定場(chǎng)景。此外,場(chǎng)景是整個(gè)數(shù)據(jù)集的可清晰分離的子集。在此,場(chǎng)景可以通過(guò)聚類算法的多維輸入來(lái)被區(qū)分。通過(guò)聚類,自動(dòng)化地提取整個(gè)非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的重要區(qū)域。將每個(gè)數(shù)據(jù)點(diǎn)唯一分配給一個(gè)聚類的聚類算法也被稱作硬方法。優(yōu)選地,數(shù)據(jù)是物理和/或運(yùn)動(dòng)學(xué)數(shù)據(jù),這些數(shù)據(jù)對(duì)于確定用來(lái)運(yùn)行車輛的車輛組件的目標(biāo)參量或額定參量來(lái)說(shuō)是必需的。
11.本發(fā)明所具有的優(yōu)點(diǎn)在于:產(chǎn)生跨不同場(chǎng)景的訓(xùn)練數(shù)據(jù)集的自動(dòng)化的均勻分布。這通過(guò)如下方式來(lái)被實(shí)現(xiàn):為該訓(xùn)練數(shù)據(jù)集從其余的聚類中獲取數(shù)目完全相同的數(shù)據(jù)點(diǎn)。朝向最小聚類的方向是有利的,因?yàn)樵撟钚【垲愂桥c其它聚類相比由于數(shù)據(jù)點(diǎn)的數(shù)目少而代表性不足的場(chǎng)景。在新的訓(xùn)練數(shù)據(jù)集中,先前代表性不足的聚類與其它聚類相同地被加權(quán)或表示。因此,每個(gè)聚類以及借此每個(gè)場(chǎng)景都有利地基于并關(guān)于由聚類算法產(chǎn)生的聚類的數(shù)據(jù)點(diǎn)的數(shù)目通過(guò)聚類的所產(chǎn)生的均勻分布來(lái)平等地被考慮。通過(guò)有針對(duì)性地減少數(shù)據(jù)點(diǎn),還可以顯著節(jié)省訓(xùn)練時(shí)間并且也可以提供測(cè)試和驗(yàn)證數(shù)據(jù)的數(shù)據(jù)池。均勻分布的數(shù)據(jù)集還具有更好的性能。這里以及在下文,提供了一種用于考慮對(duì)數(shù)據(jù)的多維分析的客觀方法,由于復(fù)雜性和多維性,該多維分析主觀上幾乎無(wú)法被掌握。
12.本發(fā)明的其它優(yōu)選的設(shè)計(jì)方案從其余的、在從屬權(quán)利要求中提到的特征中得到。
13.優(yōu)選地,該方法包括:將最小聚類和/或其余聚類的未被選擇的數(shù)據(jù)點(diǎn)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器中,作為測(cè)試和/或驗(yàn)證數(shù)據(jù)。因此,這些未使用的數(shù)據(jù)點(diǎn)是數(shù)據(jù)池,該數(shù)據(jù)池可以被用于測(cè)試和驗(yàn)證機(jī)器學(xué)習(xí)算法及其性能。這些數(shù)據(jù)點(diǎn)還可以被用于關(guān)于聚類性能方面改進(jìn)
訓(xùn)練數(shù)據(jù)集,如下面進(jìn)一步描述的那樣。如果最小聚類中的數(shù)據(jù)點(diǎn)也被存儲(chǔ),則該最小聚類的性能也可以被檢查。
14.在特殊的實(shí)施方式中,該方法包括:為該訓(xùn)練數(shù)據(jù)集選擇最小聚類的所有數(shù)據(jù)點(diǎn)的全體。原則上,基本數(shù)據(jù)集的最小聚類由于數(shù)據(jù)點(diǎn)的數(shù)目最少而代表性不足。因而,通常也需要該聚類的所有或幾乎所有數(shù)據(jù)點(diǎn)來(lái)對(duì)聚類進(jìn)行掃描,以便充分限定或表征該聚類。
15.優(yōu)選地,該方法包括:為該訓(xùn)練數(shù)據(jù)集從最小聚類和/或其余聚類中隨機(jī)選擇數(shù)據(jù)點(diǎn)。這是一種特別快速的方法,借此在最短時(shí)間內(nèi)可以自動(dòng)化地實(shí)現(xiàn)訓(xùn)練集的均勻分布。在其它實(shí)施方案中,也可以根據(jù)時(shí)間標(biāo)準(zhǔn)來(lái)進(jìn)行該選擇。
16.在特殊的實(shí)施方式中,該方法包括:從最小聚類和/或其余聚類中選擇數(shù)據(jù)點(diǎn),使得聚類的所選擇的數(shù)據(jù)點(diǎn)彼此間具有最大距離。通過(guò)該距離標(biāo)準(zhǔn)來(lái)除去冗余數(shù)據(jù),并且這樣保持用于限定或用于覆蓋該聚類的重要數(shù)據(jù)。尤其是,換言之實(shí)現(xiàn)了聚類的盡可能大的擴(kuò)展。因此,依據(jù)重要性標(biāo)準(zhǔn)來(lái)進(jìn)行對(duì)數(shù)據(jù)點(diǎn)的選擇。
17.優(yōu)選地,該方法包括:借助于所產(chǎn)生的訓(xùn)練數(shù)據(jù)集,對(duì)機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練。這種訓(xùn)練可以提供關(guān)于所創(chuàng)建的訓(xùn)練數(shù)據(jù)集是否還可以或必須被改進(jìn)的信息。尤其是考慮人工神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)算法,其中本發(fā)明并不限于此并且也應(yīng)用其它有關(guān)的機(jī)器學(xué)習(xí)算法。優(yōu)選地,具有預(yù)先給定的目標(biāo)結(jié)果的監(jiān)督訓(xùn)練被應(yīng)用于該訓(xùn)練。為了實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法的最佳工作點(diǎn),可以使用未被選擇的數(shù)據(jù)點(diǎn)的測(cè)試數(shù)據(jù)。利用測(cè)試數(shù)據(jù),可以避免機(jī)器學(xué)習(xí)算法的過(guò)適,也稱為過(guò)擬合。
18.在一個(gè)特殊的實(shí)施方式中,該方法包括:借助于質(zhì)量標(biāo)準(zhǔn)在使用驗(yàn)證數(shù)據(jù)的情況下確定各個(gè)聚類的性能。因此,通過(guò)定位各個(gè)聚類的性能、即例如相應(yīng)各個(gè)聚類的質(zhì)量或精度,可以檢查:針對(duì)相應(yīng)的聚類所使用的數(shù)據(jù)點(diǎn)是否足夠或者針對(duì)該聚類的數(shù)據(jù)點(diǎn)是否必須被增加并且因此被密集。
19.優(yōu)選地,通過(guò)所屬聚類的未被選擇的數(shù)據(jù)點(diǎn)的組中的數(shù)據(jù)點(diǎn),確定各個(gè)聚類的性能。如果從特定聚類中提取了數(shù)據(jù)點(diǎn)作為驗(yàn)證數(shù)據(jù)并且將該數(shù)據(jù)點(diǎn)用于驗(yàn)證,則驗(yàn)證結(jié)果可以特別提供關(guān)于所屬聚類的性能的信息。因此,先前未被選擇的數(shù)據(jù)點(diǎn)有利地對(duì)于從中提取了這些數(shù)據(jù)點(diǎn)的那些聚類來(lái)說(shuō)靈敏或有選擇性。如果數(shù)據(jù)點(diǎn)是從最小聚類中被提取的,則也可以有利地關(guān)于該最小聚類的性能方面對(duì)該最小聚類進(jìn)行檢查。
20.優(yōu)選地,質(zhì)量標(biāo)準(zhǔn)可以是輸出值相對(duì)于目標(biāo)值的高于閾值的均方差。在某些情況下,也可以使用一定數(shù)目的此類閾值超出,作為質(zhì)量標(biāo)準(zhǔn)。均方差以及尤其是閾超出是一種用于各個(gè)聚類的性能的靈敏的量度。
21.在一個(gè)特殊的實(shí)施方式中,該方法包括:通過(guò)將數(shù)據(jù)點(diǎn)添加給不滿足該質(zhì)量標(biāo)準(zhǔn)的聚類,創(chuàng)建經(jīng)修改的訓(xùn)練數(shù)據(jù)集。由此,可以逐點(diǎn)地或局部地改進(jìn)各個(gè)聚類,也就是說(shuō)改善這些聚類的統(tǒng)計(jì)或數(shù)據(jù)點(diǎn)密度,以便逐點(diǎn)地或有針對(duì)性地改善這些聚類的性能。優(yōu)點(diǎn)在于:只在不滿足質(zhì)量標(biāo)準(zhǔn)并且因此能夠?qū)崿F(xiàn)高效的改進(jìn)的那些聚類的情況下進(jìn)行改進(jìn),因?yàn)橐呀?jīng)性能優(yōu)越的聚類未被改變。
22.優(yōu)選地,從不滿足質(zhì)量標(biāo)準(zhǔn)的所屬聚類的未被選擇的數(shù)據(jù)點(diǎn)的組中提取被添加的數(shù)據(jù)點(diǎn)。由此,可以有針對(duì)性地重新利用之前未被選擇的數(shù)據(jù)點(diǎn),以便通過(guò)密集或更高的表示來(lái)使各個(gè)聚類升值。尤其是,由于這些未被選擇的數(shù)據(jù)點(diǎn),對(duì)于每個(gè)聚類來(lái)說(shuō)都存在特別適合的數(shù)據(jù)點(diǎn),使得在數(shù)據(jù)池中總是有適合的數(shù)據(jù)點(diǎn)準(zhǔn)備就緒。
23.在本發(fā)明的一個(gè)特殊的實(shí)施方式中,該方法包括:重復(fù)對(duì)訓(xùn)練數(shù)據(jù)集的修改,直至對(duì)于所有聚類來(lái)說(shuō)都滿足該質(zhì)量標(biāo)準(zhǔn)為止。因此,包括性能檢查的上述步驟可以一直被實(shí)施,直至所有聚類都滿足質(zhì)量標(biāo)準(zhǔn)為止。
24.因此,基于基本訓(xùn)練數(shù)據(jù)集,已經(jīng)產(chǎn)生性能優(yōu)越的訓(xùn)練數(shù)據(jù)集,該性能優(yōu)越的訓(xùn)練數(shù)據(jù)集根據(jù)質(zhì)量標(biāo)準(zhǔn)來(lái)描繪每個(gè)場(chǎng)景或在每個(gè)聚類中都是性能優(yōu)越的。然而,通過(guò)節(jié)省冗余數(shù)據(jù)點(diǎn),通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集的上述系統(tǒng)性的、自動(dòng)化的創(chuàng)建可以顯著節(jié)省計(jì)算時(shí)間,如前幾段中已經(jīng)描述的那樣。
25.本發(fā)明的另一方面包括一種用于運(yùn)行車輛組件的方法。該方法包括:基于根據(jù)上述實(shí)施方案之一所述的方法來(lái)訓(xùn)練的機(jī)器學(xué)習(xí)算法的輸出來(lái)運(yùn)行車輛組件。這里以及在下文,運(yùn)行可包括控制和/或調(diào)節(jié)。運(yùn)行還可以是監(jiān)控、維護(hù)、報(bào)警,其中本發(fā)明并不限于此。純示例性地,車輛組件可以是轉(zhuǎn)向裝置、駕駛輔助系統(tǒng)、制動(dòng)裝置、報(bào)警系統(tǒng)、照明單元等等。然而,本發(fā)明這里并不限于特定車輛組件。通過(guò)使用這樣被訓(xùn)練的機(jī)器學(xué)習(xí)算法,直接利用該機(jī)器學(xué)習(xí)算法的高精度、精密和性能,以便能夠?qū)崿F(xiàn)車輛組件例如恰好在安全關(guān)鍵領(lǐng)域的靈敏且安全的運(yùn)行。
26.在本發(fā)明的優(yōu)選的設(shè)計(jì)方案中,提供了一種用于運(yùn)行車輛組件的方法。在第一步驟中,用于運(yùn)行車輛組件的方法包括:提供多個(gè)多維數(shù)據(jù)點(diǎn)。在另一步驟中,該方法包括:通過(guò)在使用聚類算法的情況下將所述多個(gè)數(shù)據(jù)點(diǎn)劃分成多維聚類來(lái)產(chǎn)生基本訓(xùn)練數(shù)據(jù)集,其中每個(gè)數(shù)據(jù)點(diǎn)都被分配給正好一個(gè)聚類。在另一步驟中,通過(guò)從基本訓(xùn)練數(shù)據(jù)集中選擇數(shù)據(jù)點(diǎn)來(lái)產(chǎn)生訓(xùn)練數(shù)據(jù)集。在此,對(duì)訓(xùn)練數(shù)據(jù)集的產(chǎn)生包括:確定在多個(gè)聚類中的具有最少數(shù)目的數(shù)據(jù)點(diǎn)的最小聚類。在另一步驟中,對(duì)訓(xùn)練數(shù)據(jù)集的產(chǎn)生包括:為該訓(xùn)練數(shù)據(jù)集選擇該最小聚類的數(shù)據(jù)點(diǎn)的至少一個(gè)子集。此外,在另一步驟中,為該訓(xùn)練數(shù)據(jù)集從其余聚類中的每個(gè)聚類中選擇數(shù)據(jù)點(diǎn)的子集,使得每個(gè)其余聚類的所選擇的數(shù)據(jù)點(diǎn)的數(shù)目都對(duì)應(yīng)于該最小聚類的所選擇的數(shù)據(jù)點(diǎn)的數(shù)目。其它方法步驟可以從上文和下文描述的方法中得知。該方法還包括如下步驟:基于利用所產(chǎn)生的訓(xùn)練數(shù)據(jù)集所訓(xùn)練的機(jī)器學(xué)習(xí)算法的輸出來(lái)運(yùn)行車輛組件。此外,該方法的其它優(yōu)選的實(shí)施方式同樣與用于運(yùn)行車輛組件的方法能結(jié)合并且因此被一并公開。通過(guò)使用這樣訓(xùn)練的機(jī)器學(xué)習(xí)算法,可以利用該機(jī)器學(xué)習(xí)算法的高精度、精密和性能,這恰好在安全關(guān)鍵領(lǐng)域重要。
27.本發(fā)明的另一方面包括一種用于車輛的控制單元,該控制單元被設(shè)立為實(shí)施用于運(yùn)行車輛組件的方法或根據(jù)上述實(shí)施方式所述的方法。從上述實(shí)施方案中得出優(yōu)點(diǎn)。
28.本發(fā)明的另一方面包括一種車輛,該車輛包括根據(jù)上述實(shí)施方案的控制單元。
29.只要在個(gè)別情況下不另作解釋,本發(fā)明的在本技術(shù)中提到的不同的實(shí)施方式就能有利地彼此結(jié)合。
附圖說(shuō)明
30.隨后,本發(fā)明在實(shí)施例中依據(jù)所屬的附圖來(lái)被闡述。其中:圖1至6示出了按照本發(fā)明的實(shí)施方式的用于運(yùn)行車輛組件的計(jì)算機(jī)實(shí)現(xiàn)的機(jī)器學(xué)習(xí)方法的步驟和按照本發(fā)明的實(shí)施方式的用來(lái)運(yùn)行用于運(yùn)行車輛組件的方法的過(guò)程;以及圖7示意性示出了按照本發(fā)明的控制單元。
具體實(shí)施方式
31.圖1至6示出了用來(lái)運(yùn)行車輛組件的尤其是用于處理或產(chǎn)生訓(xùn)練數(shù)據(jù)集的、用于機(jī)器學(xué)習(xí)的計(jì)算機(jī)實(shí)現(xiàn)的方法以及包括該方法的用于運(yùn)行車輛組件的方法。在下文,如果僅提及一種方法,則除非另有明確說(shuō)公開,則原則上借此一并包括兩種方法。
32.在圖1以圖解說(shuō)明的方式示出了第一方法步驟,在該第一方法步驟中提供多個(gè)多維數(shù)據(jù)點(diǎn)f1, ..., fn,為此參見圖1的左側(cè)。數(shù)據(jù)點(diǎn)f1, ..., fn可以是測(cè)量數(shù)據(jù)點(diǎn),例如通過(guò)相對(duì)應(yīng)的傳感器來(lái)被測(cè)量或記錄。服務(wù)器也可以提供之前測(cè)量的測(cè)量數(shù)據(jù)點(diǎn)。然而,原則上,這些數(shù)據(jù)點(diǎn)f1, ..., fn也可以是經(jīng)模擬的測(cè)量數(shù)據(jù)點(diǎn)。數(shù)據(jù)點(diǎn)、例如數(shù)據(jù)點(diǎn)f1,可以被呈現(xiàn)為向量,該向量具有相對(duì)應(yīng)的運(yùn)動(dòng)學(xué)或物理?xiàng)l目。每個(gè)條目都可包括數(shù)值和維度。本發(fā)明也一并公開了該向量只具有一個(gè)分量的情況。相應(yīng)的參量例如可以是車速、轉(zhuǎn)向力矩、橫向加速度、橫擺率、方向盤角速度、輪胎壓力要不然還有行駛軌跡或者行駛軌跡部段,其中本發(fā)明并不限于此。為特定應(yīng)用選擇重要條目取決于相應(yīng)的車輛組件以及該車輛組件應(yīng)該如何被運(yùn)行。
33.在另一步驟中,為此參見圖1的用于闡明的右側(cè),創(chuàng)建基本訓(xùn)練數(shù)據(jù)集。該步驟通過(guò)將多個(gè)數(shù)據(jù)點(diǎn)f1, ..., fn劃分成多維聚類c1, ..., cm來(lái)實(shí)現(xiàn)。為此,使用聚類算法,該聚類算法將每個(gè)數(shù)據(jù)點(diǎn)f1, ..., fn都分配給正好一個(gè)聚類c1, ..., cm。換言之,按照所識(shí)別出的場(chǎng)景來(lái)將這些數(shù)據(jù)點(diǎn)f1, ..., fn編組成聚類。因此,每個(gè)聚類c1, ..., cm都形成一個(gè)特定場(chǎng)景。這里,場(chǎng)景可以被視為這些數(shù)據(jù)點(diǎn)f1, ..., fn的整個(gè)非結(jié)構(gòu)化數(shù)據(jù)庫(kù)中的可清晰分離的子集,為此將圖1的左側(cè)與右側(cè)進(jìn)行比較。這意味著:場(chǎng)景可以通過(guò)聚類算法的多維輸入來(lái)被描述和區(qū)分。由此,這樣來(lái)自動(dòng)化地提取重要的工作區(qū)域。
34.在僅用于圖解說(shuō)明的當(dāng)前示例中,數(shù)據(jù)點(diǎn)f1, ..., fn被分布或劃分到四個(gè)不同的聚類 c1、c2、c3、c4上。因此,純示例性地存在四種不同的場(chǎng)景。此外,這些聚類 c1、c2、c3、c4是不相交的,也就是說(shuō),給每個(gè)數(shù)據(jù)點(diǎn)f1, ..., fn都分派正好一個(gè)聚類 c1、c2、c3、c4。在實(shí)踐中,要處理可能超過(guò)上述示例幾個(gè)量級(jí)的數(shù)目的數(shù)據(jù)點(diǎn)和/或聚類。
35.作為對(duì)圖1的補(bǔ)充,圖2示出了真實(shí)數(shù)據(jù),用于進(jìn)一步闡明上文的描述。在這種情況下,分別示出了不同的聚類,在該具體示例中是聚類1至聚類9,這些不同的聚類分別表明被分配給聚類的數(shù)據(jù)。如上所述,該分配通過(guò)聚類算法來(lái)實(shí)現(xiàn),優(yōu)選地通過(guò)k-means算法來(lái)實(shí)現(xiàn)。在這種情況下,每個(gè)聚類c1, ..., c9都形成一個(gè)特定場(chǎng)景。在當(dāng)前示例中,示出了車速v作為物理或運(yùn)動(dòng)學(xué)參量,其中本發(fā)明并不限于此。替選地,根據(jù)哪個(gè)車輛組件應(yīng)該被運(yùn)行以及哪個(gè)參量對(duì)此重要,可以使用之前已經(jīng)提及的像輪胎壓力、轉(zhuǎn)向力矩、轉(zhuǎn)向速度等等那樣的參量。此外,這里也只示出了向量的這一個(gè)分量,而在多維數(shù)據(jù)點(diǎn)f1, ..., fn的情況下形成相對(duì)應(yīng)的、無(wú)法用圖形呈現(xiàn)的多維聚類。還能看出:如圖1中圖解說(shuō)明的那樣,數(shù)據(jù)點(diǎn)的數(shù)目因聚類而異。這意味著:有些聚類相對(duì)于其它聚類而言在統(tǒng)計(jì)上代表性過(guò)度或代表性不足。
36.因此,在最小聚類、這里例如聚類9的多個(gè)數(shù)據(jù)點(diǎn)是如下場(chǎng)景,該場(chǎng)景與在整個(gè)數(shù)據(jù)集中的其它子集(聚類)相比代表性不足。
37.冗余、即基本上是對(duì)數(shù)據(jù)點(diǎn)的多重描述,可以在較大的聚類的情況下被識(shí)別出,為此例如尤其是參見聚類3和7。這種冗余通過(guò)如下步驟來(lái)被減少或消除。
38.圖3以圖解說(shuō)明的方式示出了方法步驟,在該方法步驟中,通過(guò)從基本訓(xùn)練數(shù)據(jù)集
中選擇數(shù)據(jù)點(diǎn)來(lái)創(chuàng)建訓(xùn)練數(shù)據(jù)集。在此,該方法包括:確定最小聚類。在該僅僅圖解性的圖示中,最小聚類示例性地對(duì)應(yīng)于多個(gè)聚類c1、c2、c3、c4中的聚類c2。該最小聚類包括數(shù)目最少的數(shù)據(jù)點(diǎn)。在圖2中,例如聚類9對(duì)應(yīng)于在聚類1至9的組中的最小聚類。
39.在另一步驟中,為該訓(xùn)練數(shù)據(jù)集選擇最小聚類c2的數(shù)據(jù)點(diǎn)t1, t2, t3, ..., tk的至少一個(gè)子集,為此以圖解說(shuō)明的方式參見在圖3的右側(cè)的聚類c2中的被標(biāo)記或被突出的數(shù)據(jù)點(diǎn)。在當(dāng)前情況下,為該訓(xùn)練數(shù)據(jù)集選擇最小聚類c2的數(shù)據(jù)點(diǎn)的部分或子集,這里示例性地是90 %。這具有如下優(yōu)點(diǎn):與之互補(bǔ)的部分、在當(dāng)前示例中是10 %可以作為用于機(jī)器學(xué)習(xí)算法的測(cè)試和/或驗(yàn)證數(shù)據(jù)被存儲(chǔ)在相對(duì)應(yīng)的數(shù)據(jù)存儲(chǔ)器中并且被使用,為此參見下文的描述。
40.例如可以隨機(jī)地、即按照隨機(jī)過(guò)程來(lái)選擇最小聚類的數(shù)據(jù)點(diǎn)t1, t2, t3, ..., tk的子集。這是一種特別快速的省時(shí)的選擇過(guò)程。然而,優(yōu)選地可以按照重要性度量來(lái)進(jìn)行選擇。例如,可以從最小聚類中選擇數(shù)據(jù)點(diǎn)t1, ..., tk,使得最小聚類的所選擇的數(shù)據(jù)點(diǎn)t1, ..., tk彼此間具有最大距離。由此,在最小聚類中的冗余被有效消除。此外,根據(jù)該標(biāo)準(zhǔn)所選擇的數(shù)據(jù)點(diǎn)t1, ..., tk在幾何上在多維聚類的伸展方面適當(dāng)?shù)匦纬稍摱嗑S聚類,這進(jìn)而改善了機(jī)器學(xué)習(xí)算法在應(yīng)用中的性能。換言之,通過(guò)根據(jù)該標(biāo)準(zhǔn)所選擇的數(shù)據(jù)點(diǎn)t1, ..., tk,將引起聚類的盡可能大的擴(kuò)展,使得該聚類在沒有冗余的情況下或者至少在只有微小的冗余的情況下被有效限定。
41.在另一實(shí)施方式中,也可以為該訓(xùn)練數(shù)據(jù)集選擇最小聚類的所有數(shù)據(jù)點(diǎn)的全體,這里未明確示出。這尤其是當(dāng)這些數(shù)據(jù)點(diǎn)的數(shù)目使得最終這些數(shù)據(jù)點(diǎn)t1, ..., tk中的每個(gè)數(shù)據(jù)點(diǎn)都被需要用于最小聚類的足夠的聚類性能時(shí)是有利的,為此參見如下描述。
42.在另一步驟中,為該訓(xùn)練數(shù)據(jù)集從其余聚類c1、c3、c4中的每個(gè)聚類中選擇數(shù)據(jù)點(diǎn)r1, ..., rk的子集。在此,進(jìn)行該選擇,使得每個(gè)其余聚類、在圖3中聚類c1、c3、c4的所選擇的數(shù)據(jù)點(diǎn)r1, ..., rk的數(shù)目都對(duì)應(yīng)于最小聚類c2的所選擇的數(shù)據(jù)點(diǎn)t1, ..., tk的數(shù)目。因此,每個(gè)聚類c1, ..., cm的數(shù)據(jù)點(diǎn)的數(shù)目都彼此相同并且因此尤其是與從最小聚類中選擇的數(shù)據(jù)點(diǎn)t1, ..., tk的數(shù)目相同。因此,最小聚類的所選擇的數(shù)據(jù)點(diǎn)的數(shù)目相同地規(guī)定了其余聚類中的每個(gè)聚類的所選擇的數(shù)據(jù)點(diǎn)r1, ..., rk的數(shù)目。
43.因此,本發(fā)明具有如下有利性質(zhì):產(chǎn)生跨不同場(chǎng)景的均勻分布的、自動(dòng)化生成的訓(xùn)練數(shù)據(jù)集,這提升性能并且因此尤其是在運(yùn)行車輛組件時(shí)也是重要的。在知道該場(chǎng)景與其它聚類相比由于數(shù)據(jù)點(diǎn)的數(shù)目少而代表性不足的情況下,實(shí)現(xiàn)朝向最小聚類的方向。在所產(chǎn)生的訓(xùn)練數(shù)據(jù)集中,先前代表性不足的聚類以與其它聚類相同的方式來(lái)被表示。在此,僅基于相應(yīng)的數(shù)據(jù)點(diǎn)的數(shù)目來(lái)進(jìn)行編排。
44.減少在其余聚類中的數(shù)據(jù)點(diǎn)還引起訓(xùn)練時(shí)間減少。在大的聚類的情況下,這種減少可能明顯。在這種情況下,視聚類大小而定,按照現(xiàn)場(chǎng)研究可以實(shí)現(xiàn)多達(dá)40分之一的計(jì)算時(shí)間。此外,這對(duì)于車輛組件的運(yùn)行來(lái)說(shuō)重要。
45.與最小聚類相似,利用未被選擇的數(shù)據(jù)點(diǎn)可以進(jìn)行如下過(guò)程。其余聚類的未被選擇的數(shù)據(jù)點(diǎn)可以被存放在數(shù)據(jù)存儲(chǔ)器中。接著,這些數(shù)據(jù)點(diǎn)同樣可以被用作測(cè)試數(shù)據(jù)和/或驗(yàn)證數(shù)據(jù)。除了場(chǎng)景的均勻分布之外,通過(guò)該選擇,同時(shí)也提供了高測(cè)試和驗(yàn)證數(shù)據(jù)量。
46.同樣可以從其余聚類c1, ..., ci-1, ci+1, ..., cm中隨機(jī)選擇數(shù)據(jù)點(diǎn),以便節(jié)省接下來(lái)的計(jì)算時(shí)間。優(yōu)選地,如上所述,將選擇其余聚類c1, ..., ci-1, ci+1, ..., cm
的數(shù)據(jù)點(diǎn)r1, ..., rk,使得聚類的所選擇的數(shù)據(jù)點(diǎn)彼此間具有最大距離。由此,尤其是冗余數(shù)據(jù)點(diǎn)被除去,并且限定聚類的重要的數(shù)據(jù)點(diǎn)被添加給該訓(xùn)練數(shù)據(jù)集。
47.優(yōu)選地,在使用測(cè)試數(shù)據(jù)的情況下,利用該訓(xùn)練數(shù)據(jù)集可以使用未被選擇的車輛數(shù)據(jù)用來(lái)避免過(guò)適或用來(lái)找到最佳工作點(diǎn),以便對(duì)機(jī)器學(xué)習(xí)算法、尤其是人工神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
48.圖4至6示出了用于改善所編排的訓(xùn)練數(shù)據(jù)集來(lái)運(yùn)行車輛組件的方法的其它步驟。
49.為此,在第一步驟中,可以借助于所產(chǎn)生的訓(xùn)練數(shù)據(jù)集來(lái)訓(xùn)練機(jī)器學(xué)習(xí)算法、例如人工神經(jīng)網(wǎng)絡(luò)。如上文已經(jīng)描述的那樣,在訓(xùn)練時(shí)可以使用測(cè)試數(shù)據(jù)。這些測(cè)試數(shù)據(jù)用于:在訓(xùn)練時(shí)找出最佳工作點(diǎn)并且防止神經(jīng)網(wǎng)絡(luò)的過(guò)適?,F(xiàn)在,可以使用未被選擇的數(shù)據(jù)點(diǎn)的組的有利的子集,作為測(cè)試數(shù)據(jù)。在這種情況下,本發(fā)明具有如下優(yōu)點(diǎn):通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集的上述編排,這種測(cè)試數(shù)據(jù)大量供支配,使得由此可以清楚地規(guī)定訓(xùn)練中止的最佳時(shí)間點(diǎn)。
50.接著,借助于驗(yàn)證數(shù)據(jù),可以有利地測(cè)試各個(gè)聚類c1, ..., cm的性能、也就是說(shuō)功能能力,如在圖4中示例性示出的那樣。
51.為此,在圖4中示出了第一聚類c1的性能測(cè)試的結(jié)果。在圖4中,為此示例性地借助于驗(yàn)證點(diǎn)來(lái)確定轉(zhuǎn)向力矩l。在此,這些圖表示出了經(jīng)訓(xùn)練的人工神經(jīng)網(wǎng)絡(luò)的輸出,作為在使用驗(yàn)證數(shù)據(jù)作為輸入的情況下的機(jī)器學(xué)習(xí)算法的示例。在此,人工神經(jīng)網(wǎng)絡(luò)的輸出與驗(yàn)證數(shù)據(jù)的轉(zhuǎn)向力矩的已知的額定值或目標(biāo)值共同被繪制。
52.在這種情況下,聚類的性能的質(zhì)量可以借助于質(zhì)量標(biāo)準(zhǔn)來(lái)被確定。在當(dāng)前情況下,可以有利地使用機(jī)器學(xué)習(xí)算法ann的輸出與所屬的目標(biāo)值target的均方差mean err。由此,機(jī)器學(xué)習(xí)算法的平均誤差mean err被量化。作為另一特別靈敏的質(zhì)量標(biāo)準(zhǔn),可以確定目標(biāo)值和輸出值的高于閾值的均方差的數(shù)目n err。在當(dāng)前示例中,圖表示例性表明了42274個(gè)數(shù)據(jù)點(diǎn)、為0.18177 nm的平均誤差以及為750的閾值超出數(shù)目,其中這些數(shù)值示例只是為了圖解說(shuō)明本發(fā)明而被添加。
53.在該上下文中強(qiáng)調(diào):對(duì)各個(gè)聚類的性能的解析可以通過(guò)使用相應(yīng)的所分配的聚類的數(shù)據(jù)點(diǎn)作為驗(yàn)證數(shù)據(jù)來(lái)實(shí)現(xiàn)。從這些所屬聚類的未被選擇的數(shù)據(jù)點(diǎn)的組中提取這些驗(yàn)證數(shù)據(jù)。因此,本發(fā)明具有進(jìn)一步的優(yōu)點(diǎn):通過(guò)在編排該訓(xùn)練數(shù)據(jù)集時(shí)選擇并且隨之而來(lái)地減少在這些聚類中的數(shù)據(jù)點(diǎn),可以提供大量驗(yàn)證數(shù)據(jù)。這些驗(yàn)證數(shù)據(jù)尤其可以直接被分配給每個(gè)聚類或每個(gè)場(chǎng)景。由此,可以確定上述與聚類相關(guān)的性能。因此,在故障情況下,相應(yīng)的聚類可以被定位或被找出,如在圖4中針對(duì)聚類1所示出的那樣。
54.此外,在圖5中使對(duì)與聚類相關(guān)的性能的檢查進(jìn)一步清楚,在該圖中,針對(duì)不同聚類的、即特定于聚類地所確定的性能被收集。在上述示例中,列出了九個(gè)不同的聚類,對(duì)于這些聚類來(lái)說(shuō),分別按照結(jié)合圖4所描述的方式和方法來(lái)進(jìn)行質(zhì)量檢查。在這種情況下,純示例性地說(shuō)明質(zhì)量參量:均方差mean error(第一行)、閾值超出數(shù)目number以及以百分比為單位的閾值超出。
55.圖6圖解說(shuō)明了該方法的另一方面,在該方法中示出了該訓(xùn)練數(shù)據(jù)集的進(jìn)一步改善的結(jié)果。
56.如果不滿足一個(gè)或多個(gè)聚類的質(zhì)量標(biāo)準(zhǔn),則針對(duì)這些聚類可以將附加的數(shù)據(jù)點(diǎn)添加給該訓(xùn)練數(shù)據(jù)集。因此,該訓(xùn)練數(shù)據(jù)集被修改。例如,在一個(gè)或多個(gè)聚類中按照上述性能測(cè)試來(lái)查明:視對(duì)質(zhì)量標(biāo)準(zhǔn)的限定而定,在均方差方面已經(jīng)有一次或過(guò)多次的閾值超出。
57.接著,由于失靈或故障情況可以被分派給聚類或相關(guān)聚類(例如參見圖4和5),所以可以增加這些聚類的數(shù)據(jù)點(diǎn)的數(shù)目。這可以有利地借助于正好來(lái)自這些相關(guān)聚類中的未被選擇的數(shù)據(jù)點(diǎn)來(lái)實(shí)現(xiàn)。有利地,這樣可以選擇性地改善各個(gè)聚類的性能。由此實(shí)現(xiàn)了自動(dòng)化的反饋。
58.在添加附加的數(shù)據(jù)點(diǎn)之后,可以重復(fù)地執(zhí)行對(duì)各個(gè)聚類、尤其是相關(guān)聚類的性能進(jìn)行訓(xùn)練和檢查的上述步驟,其中這里參閱上述實(shí)施方案和描述。
59.現(xiàn)在,在圖6中示出了針對(duì)特定聚類、這里是聚類9的訓(xùn)練數(shù)據(jù)集的這種改進(jìn)的結(jié)果。左側(cè)部分示例性示出了最初編排的訓(xùn)練數(shù)據(jù)集的聚類的性能測(cè)試。右側(cè)部分示出了按照上文的描述的借助于各個(gè)數(shù)據(jù)點(diǎn)來(lái)被改進(jìn)的訓(xùn)練數(shù)據(jù)集的同一聚類的性能。
60.與最初編排的聚類相比,利用再訓(xùn)練來(lái)被改進(jìn)的聚類在性能測(cè)試中表明了輸出值ann與目標(biāo)值target的更低的平均差meanerr。在此,閾值超出數(shù)目nerr尤其是被減少數(shù)倍,為此也參見在比較中通過(guò)三角形所表明的閾值超出的標(biāo)記。因此,閾值超出數(shù)目是一種用于評(píng)價(jià)性能的非常靈敏的量度。
61.對(duì)該訓(xùn)練數(shù)據(jù)集的上述修改可以依次被重復(fù),以便依次改善各個(gè)聚類的性能。尤其是,這可以一直被重復(fù),直至所有聚類都滿足所設(shè)定的質(zhì)量標(biāo)準(zhǔn)為止。由此來(lái)產(chǎn)生高性能算法。例如,可以進(jìn)行該改進(jìn),直至在性能測(cè)試中不再有聚類表明閾值超出。因此,該方法能夠?qū)崿F(xiàn)對(duì)該訓(xùn)練數(shù)據(jù)集的依次且自動(dòng)化的改善,直至經(jīng)修改的訓(xùn)練數(shù)據(jù)集滿足在所有聚類中的一個(gè)或多個(gè)質(zhì)量標(biāo)準(zhǔn)為止。該改進(jìn)循環(huán)可以自動(dòng)化地進(jìn)行,而不需要內(nèi)在干預(yù)。
62.通過(guò)所描述的方法,可以提供高性能的機(jī)器學(xué)習(xí)算法。接著,具有上述特殊性質(zhì)的該機(jī)器學(xué)習(xí)算法的輸出可以有利地在用于運(yùn)行車輛組件的方法中被使用。在此,響應(yīng)于對(duì)高性能的、按照學(xué)習(xí)方法來(lái)被訓(xùn)練的機(jī)器學(xué)習(xí)算法的輸出,控制或調(diào)節(jié)或運(yùn)行車輛組件。
63.圖7示意性示出了按照本發(fā)明的控制單元10。在此,控制單元10被設(shè)立為實(shí)施上述方法??刂茊卧?0尤其可以響應(yīng)于或基于上述機(jī)器學(xué)習(xí)算法的輸出來(lái)運(yùn)行車輛組件20??刂茊卧?0也可以是車輛組件20的一部分。在某些應(yīng)用中,車輛組件20例如可以是方向盤,其中控制單元10將機(jī)器學(xué)習(xí)算法的輸出用于轉(zhuǎn)向力矩逼近,如例如在線控轉(zhuǎn)向(steer-by-wire)系統(tǒng)中所需的那樣。在其它示例中,可以進(jìn)行對(duì)輪胎參數(shù)的逼近。然而,本發(fā)明并不限于這些示例。通過(guò)該方法形成的訓(xùn)練數(shù)據(jù)集在其不同的實(shí)施方案中提高了機(jī)器學(xué)習(xí)算法的性能。因此,該方法的方面直接引起對(duì)車輛組件20的運(yùn)行的改善。
64.附圖標(biāo)記列表10控制單元20車輛組件100車輛f1,...,fn數(shù)據(jù)點(diǎn)c1,...,cm聚類t1,...,tk第一聚類的所選擇的數(shù)據(jù)點(diǎn)r1,...,rk其余聚類的所選擇的數(shù)據(jù)點(diǎn)