本發(fā)明創(chuàng)造屬于訓(xùn)練樣本規(guī)約的,具體涉及了一種樣本的加速規(guī)約方法、裝置、介質(zhì)、設(shè)備和程序。
背景技術(shù):
1、樣本規(guī)約(也被稱為樣本約簡(jiǎn)或樣本選擇)方法[6]是統(tǒng)計(jì)機(jī)器學(xué)習(xí)中的杰出數(shù)據(jù)預(yù)處理范式。它能從有標(biāo)記訓(xùn)練集中移除冗余樣本和噪聲,從而形成約簡(jiǎn)子集。然后,樣本規(guī)約方法能用約簡(jiǎn)子集去改進(jìn)分類統(tǒng)計(jì)算法的計(jì)算效率和預(yù)測(cè)精度。
2、經(jīng)過數(shù)十年的研究,學(xué)者們提出了大量的樣本規(guī)約方法。并且,一些綜述性研究把現(xiàn)有的樣本規(guī)約方法大致地分為傳統(tǒng)樣本規(guī)約方法和基于進(jìn)化算法的樣本規(guī)約方法?,F(xiàn)有的基于進(jìn)化算法的樣本規(guī)約方法依賴于太多參數(shù),導(dǎo)致表現(xiàn)不穩(wěn)定和應(yīng)用困難,且還存在有搜索效率低下、耗時(shí)長(zhǎng)的問題。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)上述技術(shù)問題,本發(fā)明創(chuàng)造提出了一種樣本的加速規(guī)約方法、裝置、介質(zhì)、設(shè)備和程序。本申請(qǐng)通過一種樣本的加速規(guī)約方法,包括:獲取目標(biāo)樣本數(shù)據(jù)集中各個(gè)樣本在粒子群優(yōu)化算法的當(dāng)前迭代中各個(gè)粒子的當(dāng)前最優(yōu)位置。根據(jù)各個(gè)粒子的所述當(dāng)前最優(yōu)位置確定各個(gè)粒子的維度信息。根據(jù)各個(gè)粒子的所述維度信息確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,根據(jù)所述目標(biāo)維度集執(zhí)行下一次的迭代。實(shí)現(xiàn)了對(duì)樣本的加速規(guī)約,提高了搜索效率,降低了規(guī)約耗時(shí)。
2、為解決上述技術(shù)問題,本發(fā)明提供的技術(shù)方案包括五個(gè)方面。
3、第一方面,本申請(qǐng)?zhí)峁┝艘环N樣本的加速規(guī)約方法,包括:獲取目標(biāo)樣本數(shù)據(jù)集中各個(gè)樣本在粒子群優(yōu)化算法的當(dāng)前迭代中各個(gè)粒子的當(dāng)前最優(yōu)位置。根據(jù)各個(gè)粒子的所述當(dāng)前最優(yōu)位置確定各個(gè)粒子的維度信息。根據(jù)各個(gè)粒子的所述維度信息確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,根據(jù)所述目標(biāo)維度集執(zhí)行下一次的迭代。
4、在一些實(shí)施例中,所述根據(jù)各個(gè)粒子的所述維度信息確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,包括:根據(jù)各個(gè)粒子的所述維度信息確定各個(gè)維度的粒子分布數(shù)量。根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集。
5、在一些實(shí)施例中,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,包括:從當(dāng)前迭代的當(dāng)前維度集中獲取所述粒子分布數(shù)量為0的目標(biāo)維度。從所述當(dāng)前維度集中刪除所述目標(biāo)維度,得到所述樣本在下一次迭代時(shí)的目標(biāo)維度集。
6、在一些實(shí)施例中,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,還包括:從當(dāng)前迭代的當(dāng)前維度集中獲取所述粒子分布數(shù)量為粒子群數(shù)量的目標(biāo)維度;從所述當(dāng)前維度集中刪除所述目標(biāo)維度,得到所述樣本在下一次迭代時(shí)的目標(biāo)維度集;并將所述目標(biāo)維度對(duì)應(yīng)的樣本確定為規(guī)約子集的子集樣本。
7、在一些實(shí)施例中,所述方法還包括:獲取最大迭代次數(shù)和所述當(dāng)前迭代次數(shù)。當(dāng)所述當(dāng)前迭代次數(shù)大于或等于所述最大迭代次數(shù)時(shí),停止迭代,輸出粒子群中最優(yōu)粒子的最優(yōu)位置。根據(jù)所述最優(yōu)位置確定規(guī)約子集的子集樣本。
8、在一些實(shí)施例中,所述獲取目標(biāo)樣本數(shù)據(jù)集中各個(gè)樣本在粒子群優(yōu)化算法的當(dāng)前迭代中各個(gè)粒子的當(dāng)前最優(yōu)位置,包括:獲取各個(gè)樣本上一次迭代確定的目標(biāo)維度集、各個(gè)粒子的當(dāng)前最優(yōu)位置和適應(yīng)度值。根據(jù)所述目標(biāo)維度集、各個(gè)粒子的所述當(dāng)前最優(yōu)位置和所述適應(yīng)度值確定在各個(gè)粒子在當(dāng)前迭代中的當(dāng)前最優(yōu)位置。
9、第二方面,本申請(qǐng)?zhí)岢隽艘环N樣本的加速規(guī)約裝置,包括:第一獲取模塊,用于獲取目標(biāo)樣本數(shù)據(jù)集中各個(gè)樣本在粒子群優(yōu)化算法的當(dāng)前迭代中各個(gè)粒子的當(dāng)前最優(yōu)位置。第一確定模塊,用于根據(jù)各個(gè)粒子的所述當(dāng)前最優(yōu)位置確定各個(gè)粒子的維度信息。第一執(zhí)行模塊,用于根據(jù)各個(gè)粒子的所述維度信息確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,根據(jù)所述目標(biāo)維度集執(zhí)行下一次的迭代。
10、第三方面,本申請(qǐng)?zhí)岢隽艘环N計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)第一方面中任一項(xiàng)所述方法的步驟。
11、第四方面,本申請(qǐng)?zhí)岢隽艘环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面中任一項(xiàng)所述方法的步驟。
12、第五方面,本申請(qǐng)?zhí)岢隽艘环N計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面中任一項(xiàng)所述方法的步驟。
13、本發(fā)明創(chuàng)造的有益效果:本申請(qǐng)通過一種樣本的加速規(guī)約方法,包括:獲取目標(biāo)樣本數(shù)據(jù)集中各個(gè)樣本在粒子群優(yōu)化算法的當(dāng)前迭代中各個(gè)粒子的當(dāng)前最優(yōu)位置。根據(jù)各個(gè)粒子的所述當(dāng)前最優(yōu)位置確定各個(gè)粒子的維度信息。根據(jù)各個(gè)粒子的所述維度信息確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,根據(jù)所述目標(biāo)維度集執(zhí)行下一次的迭代。實(shí)現(xiàn)了對(duì)樣本的加速規(guī)約,提高了搜索效率,降低了規(guī)約耗時(shí)。
1.一種樣本的加速規(guī)約方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各個(gè)粒子的所述維度信息確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時(shí)的目標(biāo)維度集,還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取目標(biāo)樣本數(shù)據(jù)集中各個(gè)樣本在粒子群優(yōu)化算法的當(dāng)前迭代中各個(gè)粒子的當(dāng)前最優(yōu)位置,包括:
7.一種樣本的加速規(guī)約裝置,其特征在于,包括:
8.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序以實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法的步驟。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法的步驟。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法的步驟。