本發(fā)明涉及基于數(shù)據(jù)的模型,諸如神經(jīng)網(wǎng)絡(luò),而且尤其是涉及用于提供和改進(jìn)基于數(shù)據(jù)的模型的訓(xùn)練過程的方法。
背景技術(shù):
1、對于各種復(fù)雜問題,基于數(shù)據(jù)的模型,諸如神經(jīng)網(wǎng)絡(luò)等等,優(yōu)于常規(guī)的數(shù)學(xué)或物理驅(qū)動模型。然而,基于數(shù)據(jù)的模型的模型質(zhì)量顯著取決于用來對該基于數(shù)據(jù)的模型進(jìn)行訓(xùn)練的訓(xùn)練數(shù)據(jù)集的質(zhì)量和數(shù)量。輸入數(shù)據(jù)點(diǎn)的標(biāo)記、即將所希望的輸出分配給輸入數(shù)據(jù)點(diǎn),是費(fèi)時和/或成本高的,而且因此是驅(qū)動成本因素。因此,可以減少提供足夠數(shù)量的訓(xùn)練數(shù)據(jù)集的工作量,其方式是:一方面減少充分訓(xùn)練基于數(shù)據(jù)的模型所需的訓(xùn)練數(shù)據(jù)集的數(shù)量,和/或另一方面,不標(biāo)記冗余的輸入數(shù)據(jù)點(diǎn)。
技術(shù)實(shí)現(xiàn)思路
1、按照本發(fā)明,提供了一種按照權(quán)利要求1所述的用于評估選擇函數(shù)的方法、一種按照并列獨(dú)立權(quán)利要求所述的用于訓(xùn)練基于數(shù)據(jù)的模型的方法以及相對應(yīng)的按照并列獨(dú)立權(quán)利要求所述的裝置。
2、其它的設(shè)計方案在從屬權(quán)利要求中說明。
3、按照第一方面,提供了一種用來評估用于訓(xùn)練基于數(shù)據(jù)的模型的主動學(xué)習(xí)方法的選擇函數(shù)的方法,該方法具有如下步驟:
4、-提供訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集,這些訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集分別將輸入數(shù)據(jù)點(diǎn)分配給標(biāo)記;
5、-借助于基于該選擇函數(shù)的主動學(xué)習(xí)方法,基于這些訓(xùn)練數(shù)據(jù)集,執(zhí)行對基于數(shù)據(jù)的模型的訓(xùn)練;
6、-通過對這些驗(yàn)證數(shù)據(jù)集進(jìn)行重采樣,生成測試數(shù)據(jù)集的多個評估集;
7、-基于所生成的測試數(shù)據(jù)集,基于該基于數(shù)據(jù)的模型的模型性能的統(tǒng)計評估,確定模型質(zhì)量和該模型質(zhì)量的不確定性度量;
8、-基于該模型質(zhì)量和該不確定性度量,保留或丟棄該選擇函數(shù)。
9、技術(shù)系統(tǒng)的系統(tǒng)功能可以全部或部分地借助于基于數(shù)據(jù)的模型來提供。這種基于數(shù)據(jù)的模型需要經(jīng)過訓(xùn)練。為了訓(xùn)練基于數(shù)據(jù)的模型,提供訓(xùn)練數(shù)據(jù)集,這些訓(xùn)練數(shù)據(jù)集描述系統(tǒng)行為并且給輸入數(shù)據(jù)點(diǎn)分配模型輸出。
10、對基于數(shù)據(jù)的模型的訓(xùn)練可以借助于主動學(xué)習(xí)方法被高效執(zhí)行。主動學(xué)習(xí)是一種用于訓(xùn)練基于數(shù)據(jù)的模型的有前途的策略,而且是一種用于減少對輸入數(shù)據(jù)點(diǎn)進(jìn)行標(biāo)記的工作量的方法,其方式是使對于高效訓(xùn)練所需的訓(xùn)練數(shù)據(jù)集的數(shù)量減少到最低限度。在此,借助于選擇函數(shù)(采集函數(shù)(acquisition?function)),例如從指定數(shù)量的輸入數(shù)據(jù)點(diǎn),迭代地選擇或確定一個或多個未標(biāo)記的輸入數(shù)據(jù)點(diǎn)。該選擇函數(shù)被定義為使得選擇輸入數(shù)據(jù)點(diǎn),使得在使用由一個或多個所選擇的經(jīng)過標(biāo)記的輸入數(shù)據(jù)點(diǎn)補(bǔ)充的訓(xùn)練數(shù)據(jù)集來進(jìn)行后續(xù)訓(xùn)練時,實(shí)現(xiàn)該基于數(shù)據(jù)的模型的模型質(zhì)量、即該基于數(shù)據(jù)的模型的模型精度的最大改進(jìn)。可能的選擇函數(shù)是多種多樣的,而且通常無法容易地查明哪個選擇函數(shù)會引起該基于數(shù)據(jù)的模型的盡可能快的訓(xùn)練,其中實(shí)現(xiàn)與指定任務(wù)相對應(yīng)的所希望的映射質(zhì)量。
11、驗(yàn)證數(shù)據(jù)集具有與訓(xùn)練數(shù)據(jù)集相同的格式,而且以類似的方式生成。驗(yàn)證數(shù)據(jù)集僅間接用于模型訓(xùn)練,而且被用于查明該基于數(shù)據(jù)的模型的訓(xùn)練狀態(tài)的欠擬合或過擬合。驗(yàn)證數(shù)據(jù)集可以以本身公知的方式被用于評估模型質(zhì)量并且被用于檢查該訓(xùn)練的中斷標(biāo)準(zhǔn)。
12、基于在借助于主動學(xué)習(xí)方法對所要創(chuàng)建的基于數(shù)據(jù)的模型的模型質(zhì)量的改進(jìn)方面對該選擇函數(shù)的評估,可以選擇該選擇函數(shù),該選擇函數(shù)選擇未標(biāo)記的輸入數(shù)據(jù)點(diǎn)以用于后續(xù)的標(biāo)記確定。通常,可以附加地使用驗(yàn)證數(shù)據(jù)集來評估模型質(zhì)量,該模型質(zhì)量被用于評估該選擇函數(shù)。
13、傳統(tǒng)上,通過利用驗(yàn)證數(shù)據(jù)集的集合確定借此生成的基于數(shù)據(jù)的模型的模型質(zhì)量,來評估該選擇函數(shù)。然而,如果標(biāo)記輸入數(shù)據(jù)點(diǎn)以提供驗(yàn)證數(shù)據(jù)集很費(fèi)力,則該方法是不經(jīng)濟(jì)的,因?yàn)樵摲椒ㄐ枰獢?shù)量更多的驗(yàn)證數(shù)據(jù)集。此外,對所實(shí)現(xiàn)的模型質(zhì)量的評估可能不準(zhǔn)確,因?yàn)樘貏e是在可用的驗(yàn)證數(shù)據(jù)集的數(shù)量少時,由于驗(yàn)證數(shù)據(jù)集的可能沒有代表性的分布,所確定的模型質(zhì)量是沒有代表性的。
14、借助于上述方法,通過重采樣方法、諸如自舉(bootstrapping)方法,分別從這些驗(yàn)證數(shù)據(jù)集中生成測試數(shù)據(jù)集的評估集,以便這樣來克服上述當(dāng)用于評估所實(shí)現(xiàn)的模型質(zhì)量的驗(yàn)證數(shù)據(jù)集的數(shù)量太少時的問題。在該重采樣方法中,基于來自這些驗(yàn)證數(shù)據(jù)集中的多個樣本(評估集),計算統(tǒng)計數(shù)據(jù)。
15、通過從驗(yàn)證數(shù)據(jù)集的原始集合中多次隨機(jī)選擇測試數(shù)據(jù)集(拖放),進(jìn)行重采樣,以生成測試數(shù)據(jù)集的多個評估集。這樣獲得的測試數(shù)據(jù)集的評估集可以具有與驗(yàn)證數(shù)據(jù)集的數(shù)量相同或不同的測試數(shù)據(jù)集。多個評估集允許從模型質(zhì)量創(chuàng)建統(tǒng)計數(shù)據(jù),從統(tǒng)計數(shù)據(jù)中產(chǎn)生平均模型質(zhì)量和不確定性度量,尤其是以置信區(qū)間的形式。模型性能評估模型質(zhì)量的統(tǒng)計分布。
16、通過提供測試數(shù)據(jù)集的多個評估集,可以指示模型質(zhì)量和該模型質(zhì)量的不確定性度量,該模型質(zhì)量和該不確定性度量使得能夠?yàn)槭褂弥鲃訉W(xué)習(xí)的訓(xùn)練過程進(jìn)行選擇函數(shù)的評估。尤其是,結(jié)合相對應(yīng)的不確定性度量對該模型質(zhì)量的指示使得能夠查明:所確定的選擇函數(shù)的使用如何影響基于數(shù)據(jù)的模型的改進(jìn)。
17、利用上述方法,能夠以經(jīng)改進(jìn)的方式來評估選擇函數(shù),根據(jù)該選擇函數(shù),在主動學(xué)習(xí)中選擇新的輸入數(shù)據(jù)點(diǎn),以用于對標(biāo)記(注釋)的后續(xù)確定。在此,借助于重采樣或自舉方法來計算模型質(zhì)量和不確定性度量,即相對應(yīng)的置信區(qū)間,由此,該基于數(shù)據(jù)的模型的模型質(zhì)量可以在使用主動學(xué)習(xí)方法基于指定的選擇函數(shù)進(jìn)行訓(xùn)練之后被評估,而且由此可以評估該選擇函數(shù)的適用性。
18、總體而言,上述方法使得能夠識別:針對基于數(shù)據(jù)的模型的特定模型訓(xùn)練所使用的選擇函數(shù)與使用另外的選擇函數(shù)執(zhí)行的訓(xùn)練相比是更好還是更差,或者是否只是通過測試數(shù)據(jù)集的有利選擇而隨機(jī)發(fā)生的。
19、此外,所使用的選擇函數(shù)可以根據(jù)該模型質(zhì)量和該不確定性度量來被確認(rèn)或丟棄,尤其是根據(jù)取決于該模型質(zhì)量和該不確定性度量的重要性度量,尤其是基于閾值比較。
20、該重要性度量例如可以借助于該模型質(zhì)量和該不確定性度量的加權(quán)和來被確定。
21、尤其是,所使用的選擇函數(shù)可以被用于創(chuàng)建一個或多個另外的輸入數(shù)據(jù)點(diǎn)或者被用于在主動學(xué)習(xí)訓(xùn)練過程的框架內(nèi)從所提供的輸入數(shù)據(jù)點(diǎn)中選擇一個或多個另外的輸入數(shù)據(jù)點(diǎn),其中,為這些另外的輸入數(shù)據(jù)點(diǎn)確定標(biāo)記,以便這樣生成其它訓(xùn)練數(shù)據(jù)集,其中,將這些其它訓(xùn)練數(shù)據(jù)集添加給現(xiàn)有的訓(xùn)練數(shù)據(jù)集,而且進(jìn)行對該基于數(shù)據(jù)的模型的進(jìn)一步訓(xùn)練。
22、此外,可以借助于基于該選擇函數(shù)的主動學(xué)習(xí)方法,基于這些訓(xùn)練數(shù)據(jù)集,多次執(zhí)行對基于數(shù)據(jù)的模型的訓(xùn)練。
23、按照一個實(shí)施方式,可以執(zhí)行該方法,以用于借助于第一選擇函數(shù)和與該第一選擇函數(shù)不同的第二選擇函數(shù)來訓(xùn)練第一基于數(shù)據(jù)的模型和第二基于數(shù)據(jù)的模型,其中,針對第一選擇函數(shù)和第二選擇函數(shù),分別確定所得到的模型質(zhì)量和相對應(yīng)的置信度,其中,根據(jù)基于所得到的模型質(zhì)量和相對應(yīng)的不確定性度量的比較或者根據(jù)所得到的重要性度量來選擇第一或第二選擇函數(shù),以便生成其它訓(xùn)練數(shù)據(jù)集并且相對應(yīng)地進(jìn)一步訓(xùn)練基于數(shù)據(jù)的模型。
1.一種用來評估用于訓(xùn)練基于數(shù)據(jù)的模型(21)的主動學(xué)習(xí)方法的選擇函數(shù)的計算機(jī)實(shí)現(xiàn)的方法,所述方法具有如下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其中,所使用的選擇函數(shù)根據(jù)所述模型質(zhì)量和所述不確定性度量來被確認(rèn)或丟棄,尤其是根據(jù)取決于所述模型質(zhì)量和所述不確定性度量的重要性度量,尤其是基于閾值比較。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述重要性度量借助于所述模型質(zhì)量和所述不確定性度量的加權(quán)和來被確定。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所使用的選擇函數(shù)被用于創(chuàng)建一個或多個另外的輸入數(shù)據(jù)點(diǎn)或者被用于從所提供的輸入數(shù)據(jù)點(diǎn)中選擇一個或多個另外的輸入數(shù)據(jù)點(diǎn),其中,為所述另外的輸入數(shù)據(jù)點(diǎn)確定標(biāo)記,以便確定其它訓(xùn)練數(shù)據(jù)集,其中,將所述其它訓(xùn)練數(shù)據(jù)集添加給現(xiàn)有的訓(xùn)練數(shù)據(jù)集,而且進(jìn)行對所述基于數(shù)據(jù)的模型的進(jìn)一步訓(xùn)練。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,借助于基于所述選擇函數(shù)的所述主動學(xué)習(xí)方法,基于所述訓(xùn)練數(shù)據(jù)集,多次執(zhí)行對所述基于數(shù)據(jù)的模型的訓(xùn)練。
6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其中,執(zhí)行所述方法,以用于借助于第一選擇函數(shù)和與所述第一選擇函數(shù)不同的第二選擇函數(shù)來訓(xùn)練第一基于數(shù)據(jù)的模型和第二基于數(shù)據(jù)的模型,其中,針對所述第一選擇函數(shù)和所述第二選擇函數(shù),分別確定所得到的模型質(zhì)量和相對應(yīng)的不確定性度量,其中,根據(jù)基于所得到的模型質(zhì)量和相對應(yīng)的不確定性度量的比較來選擇第一或第二選擇函數(shù),以便生成其它訓(xùn)練數(shù)據(jù)集并且相對應(yīng)地進(jìn)一步訓(xùn)練所述基于數(shù)據(jù)的模型。
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法,其中,所述驗(yàn)證數(shù)據(jù)集被用于檢查訓(xùn)練所述基于數(shù)據(jù)的模型(21)的中斷標(biāo)準(zhǔn)和/或被用于確定過擬合或欠擬合。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法,其中,經(jīng)過訓(xùn)練的基于數(shù)據(jù)的模型(21)被用于控制、調(diào)節(jié)或操作技術(shù)系統(tǒng)(1)。
9.一種裝置,其用于執(zhí)行根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法。
10.一種計算機(jī)程序產(chǎn)品,所述計算機(jī)程序產(chǎn)品包括指令,在通過至少一個數(shù)據(jù)處理裝置來執(zhí)行程序時,所述指令促使所述數(shù)據(jù)處理裝置實(shí)施根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。
11.一種機(jī)器可讀存儲介質(zhì),所述機(jī)器可讀存儲介質(zhì)包括指令,所述指令在通過至少一個數(shù)據(jù)處理裝置來執(zhí)行時促使所述數(shù)據(jù)處理裝置實(shí)施根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。