本發(fā)明一般涉及學(xué)習(xí)數(shù)據(jù),并且在特定實(shí)施例中,涉及生成分類模型的方法。
背景技術(shù):
1、計(jì)算機(jī)可以使用分類模型來根據(jù)某些特征將數(shù)據(jù)分類成類別或組。存在多種類型的分類模型。每種類型的分類模型根據(jù)要分類的數(shù)據(jù)類型具有其自身的優(yōu)點(diǎn)和缺點(diǎn)。
2、分類模型尤其包括決策樹、神經(jīng)網(wǎng)絡(luò),諸如基于k最近鄰(knn)的鄰的分類模型,以及支持向量機(jī)(svm)的分類模型。
3、分類模型可用于時(shí)序信號(hào)。時(shí)序信號(hào)是隨時(shí)間變化的數(shù)據(jù),并且包含在每個(gè)獲取時(shí)刻處的測(cè)量或觀測(cè)。
4、時(shí)序信號(hào)可以例如對(duì)應(yīng)于音頻信號(hào)、視頻信號(hào),振動(dòng)信號(hào)或生理信號(hào)。
5、具體而言,可以根據(jù)各種獲取參數(shù)獲取時(shí)序信號(hào)。例如,可以根據(jù)采樣頻率和用戶設(shè)置的數(shù)據(jù)量來獲取時(shí)序信號(hào)。
6、采樣頻率對(duì)應(yīng)于每單位時(shí)間的時(shí)序信號(hào)的數(shù)據(jù)采樣數(shù)目。相同數(shù)據(jù)量的采樣頻率越高,時(shí)域中的時(shí)序信號(hào)的分辨率越高,該分辨率對(duì)應(yīng)于采樣頻率除以數(shù)據(jù)量的值。相反,相同數(shù)據(jù)量的較低采樣頻率可能使時(shí)序信號(hào)變形。
7、數(shù)據(jù)量對(duì)應(yīng)于在獲取期間獲取的時(shí)序信號(hào)的數(shù)據(jù)量。通過指示用于獲取時(shí)序信號(hào)的獲取設(shè)備的緩沖存儲(chǔ)器大小來設(shè)置該數(shù)據(jù)量。相同采樣頻率的數(shù)據(jù)量越大,越有可能觀察到頻域中時(shí)序信號(hào)的更準(zhǔn)確的細(xì)節(jié)。
8、此外,應(yīng)根據(jù)采樣頻率設(shè)置數(shù)據(jù)量。實(shí)際上,如果采樣頻率太高并且數(shù)據(jù)量太小,則獲取時(shí)間可能太短而不能獲取時(shí)序信號(hào)中的足夠信息。
9、在給定的采樣頻率下,數(shù)據(jù)量越大,獲取時(shí)間越長(zhǎng)。這使得可以在所獲取的時(shí)間序列信號(hào)中觀察到更多的行為,但是這也導(dǎo)致更高的能量消耗,用于獲取時(shí)間序列信號(hào)的更長(zhǎng)的等待時(shí)間以及用于存儲(chǔ)所獲取的數(shù)據(jù)的存儲(chǔ)器的更大占用。
10、從所獲取的時(shí)序信號(hào)訓(xùn)練分類模型。采樣頻率和數(shù)據(jù)量對(duì)訓(xùn)練的分類模型有影響。
11、具體而言,分類模型具有可以根據(jù)采樣頻率和用于獲取被提供來訓(xùn)練該分類模型的時(shí)序信號(hào)的數(shù)據(jù)量而變化的性能。
12、對(duì)分類模型的性能進(jìn)行評(píng)估,特別是關(guān)于分類模型的準(zhǔn)確性,用于獲取要用于分類模型的時(shí)間序列信號(hào)的周期(其影響獲取的能量消耗和用于獲取時(shí)間序列信號(hào)的等待時(shí)間)以及用于獲取時(shí)間序列信號(hào)的數(shù)據(jù)集的量(其影響用于存儲(chǔ)所獲取的數(shù)據(jù)的存儲(chǔ)器的占用)。
13、因此,有利的是設(shè)置采樣頻率和數(shù)據(jù)量,使得可以獲得關(guān)于用戶需要具有最佳性能的分類模型。
14、常規(guī)地,用戶以不同的采樣頻率和不同的數(shù)據(jù)量執(zhí)行多次獲取,以便測(cè)試采樣頻率和數(shù)據(jù)量的哪種組合使得有可能獲得具有最佳性能的分類模型。
15、因此,用戶執(zhí)行試錯(cuò)搜索以確定采樣頻率和數(shù)據(jù)量的組合,使得可以獲得具有最佳性能的分類模型。
16、這種試錯(cuò)搜索要求進(jìn)行多個(gè)時(shí)間序列信號(hào)獲取。這些時(shí)序信號(hào)獲取具有耗時(shí)和昂貴的缺點(diǎn)。此外,試錯(cuò)搜索不能確保獲得具有最佳性能的分類模型。
17、因此,需要提出一種解決方案,其使得有可能促進(jìn)用于獲取用于訓(xùn)練分類模型的時(shí)序信號(hào)的獲取參數(shù)搜索。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)一個(gè)實(shí)施例,提出了一種由計(jì)算機(jī)實(shí)現(xiàn)的用于創(chuàng)建被稱為最終分類模型的分類模型的方法,該方法包括:
2、-獲得至少一組初始時(shí)序信號(hào),初始時(shí)序信號(hào)與至少一個(gè)初始獲取參數(shù)相關(guān)聯(lián),
3、-從至少一組初始時(shí)序信號(hào)創(chuàng)建至少一組模擬時(shí)序信號(hào),每個(gè)組的模擬時(shí)序信號(hào)與不同于至少一個(gè)初始獲取參數(shù)的至少一個(gè)模擬獲取參數(shù)相關(guān)聯(lián),
4、-創(chuàng)建各種測(cè)試分類模型,每個(gè)測(cè)試分類模型從至少一組初始時(shí)序信號(hào)或從至少一組模擬時(shí)序信號(hào)創(chuàng)建,每個(gè)測(cè)試分類模型與對(duì)應(yīng)于至少一個(gè)初始或模擬獲取參數(shù)的至少一個(gè)獲取參數(shù)相關(guān)聯(lián),至少一個(gè)初始或模擬獲取參數(shù)與用于創(chuàng)建該測(cè)試分類模型的初始或模擬時(shí)序信號(hào)相關(guān)聯(lián),
5、-評(píng)估每個(gè)測(cè)試分類模型的性能,性能與該測(cè)試分類模型的至少一個(gè)獲取參數(shù)相關(guān)聯(lián),然后
6、-獲得與從對(duì)每個(gè)測(cè)試分類模型的評(píng)估性能的分析中選擇的至少一個(gè)最終獲取參數(shù)相關(guān)聯(lián)的至少一組最終時(shí)序信號(hào),然后-從至少一組最終時(shí)序信號(hào)創(chuàng)建最終分類模型。
7、這種方法使得可以簡(jiǎn)化要應(yīng)用于獲取用于創(chuàng)建最終分類模型的最終時(shí)序信號(hào)的獲取參數(shù)的確定。
8、實(shí)際上,初始時(shí)序信號(hào)的獲取由諸如傳感器的獲取設(shè)備根據(jù)至少一個(gè)初始獲取參數(shù)來執(zhí)行。隨后根據(jù)初始或模擬時(shí)序信號(hào)評(píng)估測(cè)試分類模型的性能,而不是由獲取設(shè)備獲取。
9、因此,根據(jù)對(duì)與關(guān)于模擬時(shí)序信號(hào)相關(guān)聯(lián)的獲取參數(shù)的放置的性能的分析來確定要應(yīng)用于獲取最終時(shí)序信號(hào)的獲取參數(shù)。
10、具體而言,可以通過分析哪些獲取參數(shù)使得有可能獲得關(guān)于由用戶設(shè)置的性能標(biāo)準(zhǔn)的最佳性能來選擇要應(yīng)用于獲取最終時(shí)序信號(hào)的獲取參數(shù)。
11、這使得有可能避免使用各種獲取參數(shù)來執(zhí)行時(shí)序信號(hào)的獲取,以確定哪些獲取參數(shù)使得有可能創(chuàng)建具有關(guān)于由用戶設(shè)置的性能標(biāo)準(zhǔn)的最佳性能的分類模型。
12、通過簡(jiǎn)化從至少一個(gè)最終獲取參數(shù)的搜索,這樣的方法因此使得可以降低創(chuàng)建最終分類模型的總成本,因?yàn)樽罱K分類模型可以更容易和更快速地獲得。
13、在有利的實(shí)現(xiàn)方式中,至少一個(gè)初始獲取參數(shù)包括初始采樣頻率和來自初始時(shí)序信號(hào)的初始數(shù)據(jù)量的組合。
14、有利地,初始采樣頻率對(duì)應(yīng)于用于獲取初始時(shí)序信號(hào)的獲取設(shè)備所允許的最大采樣頻率。
15、在一些實(shí)施例中,初始數(shù)據(jù)量對(duì)應(yīng)于用于獲取初始時(shí)序信號(hào)的獲取設(shè)備所允許的最大數(shù)據(jù)量。
16、在有利的實(shí)現(xiàn)方式中,來自每組的模擬時(shí)序信號(hào)的至少一個(gè)模擬獲取參數(shù)包括小于或等于初始采樣頻率的模擬采樣頻率和小于或等于初始數(shù)據(jù)量的模擬數(shù)據(jù)量。
17、有利地,每組初始時(shí)序信號(hào)與在獲得初始時(shí)序信號(hào)期間指示的類別相關(guān)聯(lián)。
18、在有利的實(shí)現(xiàn)方式中,每組模擬時(shí)序信號(hào)與為初始時(shí)序信號(hào)組指示的類別相關(guān)聯(lián),從該組初始時(shí)序信號(hào)創(chuàng)建該組模擬時(shí)序信號(hào)。
19、在一些實(shí)施例中,該方法還包括提取初始和模擬時(shí)序信號(hào)的特征值,每個(gè)測(cè)試分類模型是通過分析提取的特征值和與用于創(chuàng)建該測(cè)試分類模型的每組初始時(shí)序信號(hào)或模擬時(shí)序信號(hào)相關(guān)聯(lián)的類別而創(chuàng)建的。
20、在有利的實(shí)現(xiàn)方式中,該方法還包括提取最終時(shí)序信號(hào)的特征值,每個(gè)最終分類模型是根據(jù)對(duì)所提取的特征值和與每組最終時(shí)序信號(hào)相關(guān)聯(lián)的類別的分析而創(chuàng)建的。
21、在一些實(shí)施例中,該方法還包括指示每個(gè)測(cè)試分類模型相對(duì)于與該測(cè)試分類模型相關(guān)聯(lián)的至少一個(gè)獲取參數(shù)的性能。
22、有利地,每個(gè)分類模型的性能的指示包括在屏幕上顯示包括根據(jù)至少一個(gè)相關(guān)聯(lián)的獲取參數(shù)的每個(gè)分類模型的性能的性能圖。
23、在有利的實(shí)現(xiàn)方式中,每個(gè)測(cè)試分類模型的評(píng)估性能包括準(zhǔn)確度、時(shí)序信號(hào)的獲取時(shí)間和該時(shí)序信號(hào)的獲取數(shù)據(jù)量。
24、有利地,該方法還包括創(chuàng)建包括指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)該程序由計(jì)算機(jī)執(zhí)行時(shí),導(dǎo)致計(jì)算機(jī)實(shí)現(xiàn)最終分類模型。
25、根據(jù)另一實(shí)施例,提出了一種包括指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)該程序由計(jì)算機(jī)執(zhí)行時(shí),該指令使得計(jì)算機(jī)執(zhí)行用于創(chuàng)建如前所述的分類模型的方法。
26、根據(jù)又一個(gè)實(shí)施例,提出了一種計(jì)算機(jī)系統(tǒng),該計(jì)算機(jī)系統(tǒng)包括:-包括計(jì)算機(jī)程序產(chǎn)品的存儲(chǔ)器,該計(jì)算機(jī)程序產(chǎn)品包括指令,當(dāng)該程序由計(jì)算機(jī)執(zhí)行時(shí),導(dǎo)致計(jì)算機(jī)實(shí)現(xiàn)用于創(chuàng)建諸如先前描述的分類模型的方法,
27、-處理單元,被配置為執(zhí)行該計(jì)算機(jī)程序產(chǎn)品。