評估和選擇用于模型的主動學(xué)習(xí)的選擇函數(shù)的方法和裝置與流程

文檔序號：40401657發(fā)布日期：2024-12-20 12:25閱讀：6來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

評估和選擇用于模型的主動學(xué)習(xí)的選擇函數(shù)的方法和裝置與流程

本發(fā)明涉及基于數(shù)據(jù)的模型，諸如神經(jīng)網(wǎng)絡(luò)，而且尤其是涉及用于提供和改進(jìn)基于數(shù)據(jù)的模型的訓(xùn)練過程的方法。

背景技術(shù)：

1、對于各種復(fù)雜問題，基于數(shù)據(jù)的模型，諸如神經(jīng)網(wǎng)絡(luò)等等，優(yōu)于常規(guī)的數(shù)學(xué)或物理驅(qū)動模型。然而，基于數(shù)據(jù)的模型的模型質(zhì)量顯著取決于用來對該基于數(shù)據(jù)的模型進(jìn)行訓(xùn)練的訓(xùn)練數(shù)據(jù)集的質(zhì)量和數(shù)量。輸入數(shù)據(jù)點(diǎn)的標(biāo)記、即將所希望的輸出分配給輸入數(shù)據(jù)點(diǎn)，是費(fèi)時和/或成本高的，而且因此是驅(qū)動成本因素。因此，可以減少提供足夠數(shù)量的訓(xùn)練數(shù)據(jù)集的工作量，其方式是：一方面減少充分訓(xùn)練基于數(shù)據(jù)的模型所需的訓(xùn)練數(shù)據(jù)集的數(shù)量，和/或另一方面，不標(biāo)記冗余的輸入數(shù)據(jù)點(diǎn)。

技術(shù)實(shí)現(xiàn)思路

1、按照本發(fā)明，提供了一種按照權(quán)利要求1所述的用于評估選擇函數(shù)的方法、一種按照并列獨(dú)立權(quán)利要求所述的用于訓(xùn)練基于數(shù)據(jù)的模型的方法以及相對應(yīng)的按照并列獨(dú)立權(quán)利要求所述的裝置。

2、其它的設(shè)計方案在從屬權(quán)利要求中說明。

3、按照第一方面，提供了一種用來評估用于訓(xùn)練基于數(shù)據(jù)的模型的主動學(xué)習(xí)方法的選擇函數(shù)的方法，該方法具有如下步驟：

4、-提供訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集，這些訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集分別將輸入數(shù)據(jù)點(diǎn)分配給標(biāo)記；

5、-借助于基于該選擇函數(shù)的主動學(xué)習(xí)方法，基于這些訓(xùn)練數(shù)據(jù)集，執(zhí)行對基于數(shù)據(jù)的模型的訓(xùn)練；

6、-通過對這些驗(yàn)證數(shù)據(jù)集進(jìn)行重采樣，生成測試數(shù)據(jù)集的多個評估集；

7、-基于所生成的測試數(shù)據(jù)集，基于該基于數(shù)據(jù)的模型的模型性能的統(tǒng)計評估，確定模型質(zhì)量和該模型質(zhì)量的不確定性度量；

8、-基于該模型質(zhì)量和該不確定性度量，保留或丟棄該選擇函數(shù)。

9、技術(shù)系統(tǒng)的系統(tǒng)功能可以全部或部分地借助于基于數(shù)據(jù)的模型來提供。這種基于數(shù)據(jù)的模型需要經(jīng)過訓(xùn)練。為了訓(xùn)練基于數(shù)據(jù)的模型，提供訓(xùn)練數(shù)據(jù)集，這些訓(xùn)練數(shù)據(jù)集描述系統(tǒng)行為并且給輸入數(shù)據(jù)點(diǎn)分配模型輸出。

10、對基于數(shù)據(jù)的模型的訓(xùn)練可以借助于主動學(xué)習(xí)方法被高效執(zhí)行。主動學(xué)習(xí)是一種用于訓(xùn)練基于數(shù)據(jù)的模型的有前途的策略，而且是一種用于減少對輸入數(shù)據(jù)點(diǎn)進(jìn)行標(biāo)記的工作量的方法，其方式是使對于高效訓(xùn)練所需的訓(xùn)練數(shù)據(jù)集的數(shù)量減少到最低限度。在此，借助于選擇函數(shù)(采集函數(shù)(acquisition?function))，例如從指定數(shù)量的輸入數(shù)據(jù)點(diǎn)，迭代地選擇或確定一個或多個未標(biāo)記的輸入數(shù)據(jù)點(diǎn)。該選擇函數(shù)被定義為使得選擇輸入數(shù)據(jù)點(diǎn)，使得在使用由一個或多個所選擇的經(jīng)過標(biāo)記的輸入數(shù)據(jù)點(diǎn)補(bǔ)充的訓(xùn)練數(shù)據(jù)集來進(jìn)行后續(xù)訓(xùn)練時，實(shí)現(xiàn)該基于數(shù)據(jù)的模型的模型質(zhì)量、即該基于數(shù)據(jù)的模型的模型精度的最大改進(jìn)。可能的選擇函數(shù)是多種多樣的，而且通常無法容易地查明哪個選擇函數(shù)會引起該基于數(shù)據(jù)的模型的盡可能快的訓(xùn)練，其中實(shí)現(xiàn)與指定任務(wù)相對應(yīng)的所希望的映射質(zhì)量。

11、驗(yàn)證數(shù)據(jù)集具有與訓(xùn)練數(shù)據(jù)集相同的格式，而且以類似的方式生成。驗(yàn)證數(shù)據(jù)集僅間接用于模型訓(xùn)練，而且被用于查明該基于數(shù)據(jù)的模型的訓(xùn)練狀態(tài)的欠擬合或過擬合。驗(yàn)證數(shù)據(jù)集可以以本身公知的方式被用于評估模型質(zhì)量并且被用于檢查該訓(xùn)練的中斷標(biāo)準(zhǔn)。

12、基于在借助于主動學(xué)習(xí)方法對所要創(chuàng)建的基于數(shù)據(jù)的模型的模型質(zhì)量的改進(jìn)方面對該選擇函數(shù)的評估，可以選擇該選擇函數(shù)，該選擇函數(shù)選擇未標(biāo)記的輸入數(shù)據(jù)點(diǎn)以用于后續(xù)的標(biāo)記確定。通常，可以附加地使用驗(yàn)證數(shù)據(jù)集來評估模型質(zhì)量，該模型質(zhì)量被用于評估該選擇函數(shù)。

13、傳統(tǒng)上，通過利用驗(yàn)證數(shù)據(jù)集的集合確定借此生成的基于數(shù)據(jù)的模型的模型質(zhì)量，來評估該選擇函數(shù)。然而，如果標(biāo)記輸入數(shù)據(jù)點(diǎn)以提供驗(yàn)證數(shù)據(jù)集很費(fèi)力，則該方法是不經(jīng)濟(jì)的，因?yàn)樵摲椒ㄐ枰獢?shù)量更多的驗(yàn)證數(shù)據(jù)集。此外，對所實(shí)現(xiàn)的模型質(zhì)量的評估可能不準(zhǔn)確，因?yàn)樘貏e是在可用的驗(yàn)證數(shù)據(jù)集的數(shù)量少時，由于驗(yàn)證數(shù)據(jù)集的可能沒有代表性的分布，所確定的模型質(zhì)量是沒有代表性的。

14、借助于上述方法，通過重采樣方法、諸如自舉(bootstrapping)方法，分別從這些驗(yàn)證數(shù)據(jù)集中生成測試數(shù)據(jù)集的評估集，以便這樣來克服上述當(dāng)用于評估所實(shí)現(xiàn)的模型質(zhì)量的驗(yàn)證數(shù)據(jù)集的數(shù)量太少時的問題。在該重采樣方法中，基于來自這些驗(yàn)證數(shù)據(jù)集中的多個樣本(評估集)，計算統(tǒng)計數(shù)據(jù)。

15、通過從驗(yàn)證數(shù)據(jù)集的原始集合中多次隨機(jī)選擇測試數(shù)據(jù)集(拖放)，進(jìn)行重采樣，以生成測試數(shù)據(jù)集的多個評估集。這樣獲得的測試數(shù)據(jù)集的評估集可以具有與驗(yàn)證數(shù)據(jù)集的數(shù)量相同或不同的測試數(shù)據(jù)集。多個評估集允許從模型質(zhì)量創(chuàng)建統(tǒng)計數(shù)據(jù)，從統(tǒng)計數(shù)據(jù)中產(chǎn)生平均模型質(zhì)量和不確定性度量，尤其是以置信區(qū)間的形式。模型性能評估模型質(zhì)量的統(tǒng)計分布。

16、通過提供測試數(shù)據(jù)集的多個評估集，可以指示模型質(zhì)量和該模型質(zhì)量的不確定性度量，該模型質(zhì)量和該不確定性度量使得能夠?yàn)槭褂弥鲃訉W(xué)習(xí)的訓(xùn)練過程進(jìn)行選擇函數(shù)的評估。尤其是，結(jié)合相對應(yīng)的不確定性度量對該模型質(zhì)量的指示使得能夠查明：所確定的選擇函數(shù)的使用如何影響基于數(shù)據(jù)的模型的改進(jìn)。

17、利用上述方法，能夠以經(jīng)改進(jìn)的方式來評估選擇函數(shù)，根據(jù)該選擇函數(shù)，在主動學(xué)習(xí)中選擇新的輸入數(shù)據(jù)點(diǎn)，以用于對標(biāo)記(注釋)的后續(xù)確定。在此，借助于重采樣或自舉方法來計算模型質(zhì)量和不確定性度量，即相對應(yīng)的置信區(qū)間，由此，該基于數(shù)據(jù)的模型的模型質(zhì)量可以在使用主動學(xué)習(xí)方法基于指定的選擇函數(shù)進(jìn)行訓(xùn)練之后被評估，而且由此可以評估該選擇函數(shù)的適用性。

18、總體而言，上述方法使得能夠識別：針對基于數(shù)據(jù)的模型的特定模型訓(xùn)練所使用的選擇函數(shù)與使用另外的選擇函數(shù)執(zhí)行的訓(xùn)練相比是更好還是更差，或者是否只是通過測試數(shù)據(jù)集的有利選擇而隨機(jī)發(fā)生的。

19、此外，所使用的選擇函數(shù)可以根據(jù)該模型質(zhì)量和該不確定性度量來被確認(rèn)或丟棄，尤其是根據(jù)取決于該模型質(zhì)量和該不確定性度量的重要性度量，尤其是基于閾值比較。

20、該重要性度量例如可以借助于該模型質(zhì)量和該不確定性度量的加權(quán)和來被確定。

21、尤其是，所使用的選擇函數(shù)可以被用于創(chuàng)建一個或多個另外的輸入數(shù)據(jù)點(diǎn)或者被用于在主動學(xué)習(xí)訓(xùn)練過程的框架內(nèi)從所提供的輸入數(shù)據(jù)點(diǎn)中選擇一個或多個另外的輸入數(shù)據(jù)點(diǎn)，其中，為這些另外的輸入數(shù)據(jù)點(diǎn)確定標(biāo)記，以便這樣生成其它訓(xùn)練數(shù)據(jù)集，其中，將這些其它訓(xùn)練數(shù)據(jù)集添加給現(xiàn)有的訓(xùn)練數(shù)據(jù)集，而且進(jìn)行對該基于數(shù)據(jù)的模型的進(jìn)一步訓(xùn)練。

22、此外，可以借助于基于該選擇函數(shù)的主動學(xué)習(xí)方法，基于這些訓(xùn)練數(shù)據(jù)集，多次執(zhí)行對基于數(shù)據(jù)的模型的訓(xùn)練。

23、按照一個實(shí)施方式，可以執(zhí)行該方法，以用于借助于第一選擇函數(shù)和與該第一選擇函數(shù)不同的第二選擇函數(shù)來訓(xùn)練第一基于數(shù)據(jù)的模型和第二基于數(shù)據(jù)的模型，其中，針對第一選擇函數(shù)和第二選擇函數(shù)，分別確定所得到的模型質(zhì)量和相對應(yīng)的置信度，其中，根據(jù)基于所得到的模型質(zhì)量和相對應(yīng)的不確定性度量的比較或者根據(jù)所得到的重要性度量來選擇第一或第二選擇函數(shù)，以便生成其它訓(xùn)練數(shù)據(jù)集并且相對應(yīng)地進(jìn)一步訓(xùn)練基于數(shù)據(jù)的模型。

技術(shù)特征：

1.一種用來評估用于訓(xùn)練基于數(shù)據(jù)的模型(21)的主動學(xué)習(xí)方法的選擇函數(shù)的計算機(jī)實(shí)現(xiàn)的方法，所述方法具有如下步驟：

2.根據(jù)權(quán)利要求1所述的方法，其中，所使用的選擇函數(shù)根據(jù)所述模型質(zhì)量和所述不確定性度量來被確認(rèn)或丟棄，尤其是根據(jù)取決于所述模型質(zhì)量和所述不確定性度量的重要性度量，尤其是基于閾值比較。

3.根據(jù)權(quán)利要求2所述的方法，其中，所述重要性度量借助于所述模型質(zhì)量和所述不確定性度量的加權(quán)和來被確定。

4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法，其中，所使用的選擇函數(shù)被用于創(chuàng)建一個或多個另外的輸入數(shù)據(jù)點(diǎn)或者被用于從所提供的輸入數(shù)據(jù)點(diǎn)中選擇一個或多個另外的輸入數(shù)據(jù)點(diǎn)，其中，為所述另外的輸入數(shù)據(jù)點(diǎn)確定標(biāo)記，以便確定其它訓(xùn)練數(shù)據(jù)集，其中，將所述其它訓(xùn)練數(shù)據(jù)集添加給現(xiàn)有的訓(xùn)練數(shù)據(jù)集，而且進(jìn)行對所述基于數(shù)據(jù)的模型的進(jìn)一步訓(xùn)練。

5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法，其中，借助于基于所述選擇函數(shù)的所述主動學(xué)習(xí)方法，基于所述訓(xùn)練數(shù)據(jù)集，多次執(zhí)行對所述基于數(shù)據(jù)的模型的訓(xùn)練。

6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法，其中，執(zhí)行所述方法，以用于借助于第一選擇函數(shù)和與所述第一選擇函數(shù)不同的第二選擇函數(shù)來訓(xùn)練第一基于數(shù)據(jù)的模型和第二基于數(shù)據(jù)的模型，其中，針對所述第一選擇函數(shù)和所述第二選擇函數(shù)，分別確定所得到的模型質(zhì)量和相對應(yīng)的不確定性度量，其中，根據(jù)基于所得到的模型質(zhì)量和相對應(yīng)的不確定性度量的比較來選擇第一或第二選擇函數(shù)，以便生成其它訓(xùn)練數(shù)據(jù)集并且相對應(yīng)地進(jìn)一步訓(xùn)練所述基于數(shù)據(jù)的模型。

7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法，其中，所述驗(yàn)證數(shù)據(jù)集被用于檢查訓(xùn)練所述基于數(shù)據(jù)的模型(21)的中斷標(biāo)準(zhǔn)和/或被用于確定過擬合或欠擬合。

8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法，其中，經(jīng)過訓(xùn)練的基于數(shù)據(jù)的模型(21)被用于控制、調(diào)節(jié)或操作技術(shù)系統(tǒng)(1)。

9.一種裝置，其用于執(zhí)行根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法。

10.一種計算機(jī)程序產(chǎn)品，所述計算機(jī)程序產(chǎn)品包括指令，在通過至少一個數(shù)據(jù)處理裝置來執(zhí)行程序時，所述指令促使所述數(shù)據(jù)處理裝置實(shí)施根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。

11.一種機(jī)器可讀存儲介質(zhì)，所述機(jī)器可讀存儲介質(zhì)包括指令，所述指令在通過至少一個數(shù)據(jù)處理裝置來執(zhí)行時促使所述數(shù)據(jù)處理裝置實(shí)施根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。

技術(shù)總結(jié)
本發(fā)明涉及一種用來評估用于訓(xùn)練基于數(shù)據(jù)的模型的主動學(xué)習(xí)方法的選擇函數(shù)的方法，所述方法具有如下步驟：?提供(S1、S2；S11、S12)訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集，所述訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集分別將輸入數(shù)據(jù)點(diǎn)分配給標(biāo)記；?借助于基于所述選擇函數(shù)的主動學(xué)習(xí)方法，基于所述訓(xùn)練數(shù)據(jù)集，執(zhí)行(S3)對所述基于數(shù)據(jù)的模型(21)的訓(xùn)練；?通過從所述驗(yàn)證數(shù)據(jù)集中重采樣，生成測試數(shù)據(jù)集的多個評估集；?基于所生成的測試數(shù)據(jù)集，基于所述基于數(shù)據(jù)的模型的模型性能的統(tǒng)計評估，確定(S7)模型質(zhì)量和所述模型質(zhì)量的不確定性度量；?基于所述模型質(zhì)量和所述不確定性度量，保留(S9)或丟棄所述選擇函數(shù)。

技術(shù)研發(fā)人員：E·克羅佩伯格,K·格勞,T·斯皮克爾
受保護(hù)的技術(shù)使用者：羅伯特·博世有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：E·克羅佩伯格,K·格勞,T·斯皮克爾
技術(shù)所有人：羅伯特·博世有限公司
我是此專利的發(fā)明人

上一篇：一種連接組件及BIPV支架的制作方法
上一篇：車燈發(fā)光裝置及車輛的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

評估和選擇用于模型的主動學(xué)習(xí)的選擇函數(shù)的方法和裝置與流程