一種面向多源實(shí)例遷移學(xué)習(xí)的樣本篩選和權(quán)重計(jì)算方法與流程

文檔序號(hào)：11775328閱讀：1436來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明屬于人工智能，涉及一種面向多源的實(shí)例遷移學(xué)習(xí)方法。

背景技術(shù)：

遷移學(xué)習(xí)是利用一個(gè)或者幾個(gè)有充足標(biāo)簽樣本的領(lǐng)域去對(duì)一個(gè)與之相關(guān)但標(biāo)簽樣本不足的新興領(lǐng)域進(jìn)行學(xué)習(xí)的過(guò)程和方法。有充足標(biāo)簽樣本的領(lǐng)域稱為源領(lǐng)域，標(biāo)簽樣本不足的新興領(lǐng)域稱為目標(biāo)領(lǐng)域。基于實(shí)例遷移的遷移學(xué)習(xí)方法，主要就是在源領(lǐng)域數(shù)據(jù)集中尋找可以提高目標(biāo)領(lǐng)域分類器性能的樣本數(shù)據(jù)。這類算法的關(guān)鍵是利用目標(biāo)的標(biāo)簽樣本對(duì)源領(lǐng)域和目標(biāo)領(lǐng)域中每個(gè)樣本賦予權(quán)值并通過(guò)迭代方式不斷更新。然而，當(dāng)目標(biāo)領(lǐng)域中有標(biāo)記的訓(xùn)練樣本太少時(shí)，目標(biāo)領(lǐng)域少量的標(biāo)簽樣本就會(huì)淹沒(méi)在大量的源領(lǐng)域樣本中，使目標(biāo)領(lǐng)域的訓(xùn)練樣本對(duì)最終分類器的構(gòu)建的貢獻(xiàn)不能充分體現(xiàn)。同時(shí)，源領(lǐng)域可能存在與目標(biāo)領(lǐng)域中樣本差異較大的樣本，這些數(shù)據(jù)不僅會(huì)使分類的效率變低，甚至?xí)o最終分類的結(jié)果帶來(lái)負(fù)面的影響。本發(fā)明旨在充分利用目標(biāo)領(lǐng)域中無(wú)標(biāo)簽數(shù)據(jù)和有標(biāo)簽數(shù)據(jù)，并在迭代之前剔除源領(lǐng)域中與目標(biāo)領(lǐng)域有較大差異的樣本，在迭代的過(guò)程中使用特征距離作為動(dòng)態(tài)更新樣本權(quán)重的依據(jù)之一，進(jìn)一步優(yōu)化已有的遷移學(xué)習(xí)算法。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明面向多源實(shí)例遷移學(xué)習(xí)，旨在充分利用目標(biāo)領(lǐng)域中大量無(wú)標(biāo)簽數(shù)據(jù)和少量有標(biāo)簽數(shù)據(jù)，同時(shí)剔除源領(lǐng)域中與目標(biāo)領(lǐng)域不太相關(guān)的樣本。該發(fā)明提供一種在多源實(shí)例遷移學(xué)習(xí)中樣本篩選和權(quán)重計(jì)算方法。

1.面向多源實(shí)例遷移學(xué)習(xí)的樣本篩選和權(quán)重計(jì)算方法，其特征在于包括以下步驟：

步驟1：輸入在特征集x={x1,x2,……,xm}和標(biāo)簽屬性y上的n個(gè)源領(lǐng)域數(shù)據(jù)集，…，和一個(gè)目標(biāo)領(lǐng)域有標(biāo)簽數(shù)據(jù)集；和一個(gè)在特征集x={x1,x2,……,xm}上的目標(biāo)領(lǐng)域無(wú)標(biāo)簽數(shù)據(jù)集

；；

步驟2：在數(shù)據(jù)集上分別計(jì)算協(xié)方差陣，及其特征值v1={v11,v12,…,v1m}，v2={v21,v22,…,v2m}，…，vn={vn1,vn2,…,vnm}；

步驟3：將分別歸一化得到w1={w11,w12,…,w1m}，w2={w21,w22,…,w2m}，…，wn={wn1,wn2,…,wnm}；

步驟4：分別計(jì)算與的n個(gè)距離矩陣r¹,r²,…,rⁿ，

，1≤k≤n；

，表示的第i個(gè)樣本與的第j個(gè)樣本之間的距離；

步驟5：分別在r¹,r²,…,rⁿ中，用每一行i的平均距離，定義中第i個(gè)樣本與的特征距離，分別得到為，，…，，即是r^k中第i行中的平均值；分別計(jì)算中最小的p個(gè)值，并根據(jù)在中選擇對(duì)應(yīng)p個(gè)樣本得到，即在中選擇與平均距離最近的p個(gè)樣本為；

步驟6：分別計(jì)算的初始樣本權(quán)重向量，，…，，其中，將歸一化；

步驟7：使用n個(gè)源樣本到目標(biāo)的n個(gè)特征距離向量，，…，作為迭代訓(xùn)練分類器過(guò)程中，更新源樣本權(quán)重的一個(gè)指標(biāo)。

附圖說(shuō)明

圖1為利用本發(fā)明改進(jìn)之后的多源實(shí)例遷移學(xué)習(xí)流程圖，圖中陰影部分為本發(fā)明對(duì)現(xiàn)有多源實(shí)例遷移學(xué)習(xí)方法優(yōu)化與改進(jìn)的發(fā)明。

具體實(shí)施方式

結(jié)合附圖1，對(duì)依據(jù)本發(fā)明提供的具體實(shí)施方式，詳細(xì)說(shuō)明如此下。

如圖1所示，面向多源實(shí)例遷移學(xué)習(xí)的樣本篩選和權(quán)重計(jì)算方法，其特征在于首先根據(jù)如下步驟計(jì)算樣本初始權(quán)重以及完成對(duì)源樣本的刷選；

；；

步驟2：在數(shù)據(jù)集上分別計(jì)算協(xié)方差陣，及其特征值v1={v11,v12,…,v1m}，v2={v21,v22,…,v2m}，…，vn={vn1,vn2,…,vnm}；

步驟3：將分別歸一化得到w1={w11,w12,…,w1m}，w2={w21,w22,…,w2m}，…，wn={wn1,wn2,…,wnm}；

步驟4：分別計(jì)算與的n個(gè)距離矩陣r¹,r²,…,rⁿ，

，1≤k≤n；

，表示的第i個(gè)樣本與的第j個(gè)樣本之間的距離；

步驟6：分別計(jì)算的初始樣本權(quán)重向量，，…，，其中，將歸一化；

步驟7：使用n個(gè)源樣本到目標(biāo)的n個(gè)特征距離向量，，…，作為迭代訓(xùn)練分類器過(guò)程中，更新源樣本權(quán)重的一個(gè)指標(biāo)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李維華;金宸;姬晨;王順?lè)?/span>
技術(shù)所有人：云南大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種面向多源實(shí)例遷移學(xué)習(xí)的樣本篩選和權(quán)重計(jì)算方法與流程