亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚類方法

文檔序號(hào):8943437閱讀:433來(lái)源:國(guó)知局
基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,特別是涉及一種基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù) 據(jù)子空間聚類方法。
【背景技術(shù)】
[0002] 隨著科技的發(fā)展和網(wǎng)絡(luò)的日漸普及,現(xiàn)代社會(huì)數(shù)據(jù)的采集變得越來(lái)越容易,數(shù)據(jù) 量與日倶增,同時(shí)數(shù)據(jù)也變得越來(lái)越多樣化,特別是各種多模態(tài)的數(shù)據(jù)也變得越來(lái)越常見(jiàn)。 基于多模態(tài)數(shù)據(jù)的學(xué)習(xí)方法也受到了越來(lái)越多的關(guān)注和研究,相比于單模態(tài)數(shù)據(jù),多模態(tài) 數(shù)據(jù)能提供更多以及更加復(fù)雜的信息,因此基于多模態(tài)數(shù)據(jù)的學(xué)習(xí)模型通常能取得更好的 效果并具備更優(yōu)的統(tǒng)計(jì)特性。
[0003] 在多模態(tài)學(xué)習(xí)領(lǐng)域,多模態(tài)數(shù)據(jù)聚類由于其處理大規(guī)模非監(jiān)督數(shù)據(jù)的能力而受到 了廣泛的關(guān)注和發(fā)展,多模態(tài)數(shù)據(jù)聚類的目的是利用多個(gè)模態(tài)下的特征將數(shù)據(jù)更好的聚合 到它們本身的類別之中。多模態(tài)數(shù)據(jù)聚類中的一個(gè)關(guān)鍵問(wèn)題就是如何更好建立和利用不同 模態(tài)之間的關(guān)聯(lián)信息,當(dāng)前已有很多研究工作旨在解決這個(gè)問(wèn)題,包括首先利用多模態(tài)下 的特征學(xué)習(xí)出一個(gè)公共特征表述,然后在公共的特征表述而非原多模態(tài)特征上做聚類,如 基于非負(fù)矩陣分解的多模態(tài)聚類方法;以及在模型訓(xùn)練的過(guò)程中利用不同模態(tài)下的信息增 加約束項(xiàng),這些方法都可以取得不錯(cuò)的效果。此外基于譜聚類的子空間聚類方法也是最近 研究比較多的一個(gè)領(lǐng)域,該類方法通常假定相似的樣本通常具有相似的自表達(dá)系數(shù),并且 空間相近的樣本可以彼此線性重構(gòu);該類方法首先需要計(jì)算得到樣本的自表達(dá)矩陣,然后 將樣本的自表達(dá)矩陣作為輸入,利用譜聚類的方法生成最終的聚類結(jié)果,通過(guò)增加一些結(jié) 構(gòu)先驗(yàn)信息比如結(jié)構(gòu)稀疏約束和結(jié)構(gòu)低秩約束等可以獲得更加魯棒的結(jié)果。
[0004] 然而,雖然當(dāng)前的一些方法可以在一定程度上提高多模態(tài)數(shù)據(jù)的聚類性能,但是, 如何更好的挖掘和利用不同模態(tài)之間的相關(guān)性和差異性等信息仍然面臨很大的挑戰(zhàn)。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明提供的基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚類方法,可以獲 得更好的聚類性能,增強(qiáng)魯棒性。
[0006] 根據(jù)本發(fā)明的一方面,提供一種基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間 聚類方法,包括:獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣;根據(jù)所述拉普拉斯矩陣構(gòu)建多 模態(tài)數(shù)據(jù)子空間聚類模型;通過(guò)所述多模態(tài)數(shù)據(jù)聚類模型得到所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自 表達(dá)矩陣;從所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣中選取第一自表達(dá)矩陣;將所述第一自 表達(dá)矩陣進(jìn)行聚類得到聚類結(jié)果。
[0007] 本發(fā)明實(shí)施例提供的基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚類方法, 獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣,根據(jù)拉普拉斯矩陣構(gòu)建多模態(tài)數(shù)據(jù)子空間聚類模 型,通過(guò)多模態(tài)數(shù)據(jù)聚類模型得到各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣,從各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng) 的自表達(dá)矩陣中選取第一自表達(dá)矩陣,將第一自表達(dá)矩陣通過(guò)譜聚類方法進(jìn)行聚類得到聚 類結(jié)果,可以獲得更好的聚類性能,增強(qiáng)魯棒性。
【附圖說(shuō)明】
[0008] 圖1為本發(fā)明實(shí)施例提供的基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚 類方法流程圖。
【具體實(shí)施方式】
[0009] 下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例提供的基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù) 子空間聚類方法進(jìn)行詳細(xì)描述。
[0010] 圖1為本發(fā)明實(shí)施例提供的基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚 類方法流程圖。
[0011] 參照?qǐng)D1,在步驟SlOl,獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣。
[0012] 在步驟S102,根據(jù)所述拉普拉斯矩陣構(gòu)建多模態(tài)數(shù)據(jù)子空間聚類模型。
[0013] 在步驟S103,通過(guò)所述多模態(tài)數(shù)據(jù)聚類模型得到所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá) 矩陣。
[0014] 在步驟S104,從所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣中選取第一自表達(dá)矩陣。
[0015] 這里,第一自表達(dá)矩陣為各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣中最優(yōu)的自表達(dá)矩陣, 最優(yōu)的自表達(dá)矩陣可以根據(jù)數(shù)據(jù)的先驗(yàn)知識(shí)獲取,也可以通過(guò)驗(yàn)證集進(jìn)行測(cè)試,從而獲取 最優(yōu)的自表達(dá)矩陣。
[0016] 在步驟S105,將所述第一自表達(dá)矩陣進(jìn)行聚類得到聚類結(jié)果。
[0017] 進(jìn)一步地,所述獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣包括:
[0018] 利用高斯核函數(shù)分別計(jì)算所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的相似度;
[0019] 根據(jù)所述相似度獲取所述相似度對(duì)應(yīng)的相似度矩陣;
[0020] 根據(jù)所述相似度矩陣獲取所述相似度矩陣對(duì)應(yīng)的拉普拉斯矩陣。
[0021] 這里,為了提高算法的效率,構(gòu)造相似度矩陣可以采用,但不限于,具體為k近鄰 方法。具體地,利用高斯核函數(shù)分別計(jì)算各個(gè)模態(tài)數(shù)據(jù)的樣本與k近鄰樣本之間的相似度, 構(gòu)建一個(gè)相似度矩陣W 1,根據(jù)相似度矩陣W1得到其拉普拉斯矩陣L 1<3
[0022] 進(jìn)一步地,所述通過(guò)所述多模態(tài)數(shù)據(jù)聚類模型得到所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表 達(dá)矩陣包括:
[0023] 根據(jù)公式(1)計(jì)算所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣:
[0024]
[0025] 其中,Z = [Z1Z2-Zni], Z1為所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣, 為所述各個(gè)模態(tài)數(shù)據(jù)的重構(gòu)誤差,L1S所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣,
為所述各個(gè)模態(tài)數(shù)據(jù)的局部拓?fù)洳蛔冃?,I |z| L為所述各個(gè)模態(tài)數(shù)據(jù)的全 局一致性,Il z尥為正則項(xiàng),λ、β和P分別為權(quán)重參數(shù)。
[0026] 這里,將I |Ζ| |$進(jìn)行替換,具體由公式(2)可知: CN 105160357 A ~P 3/3 頁(yè)
[0027]
[0028] 通過(guò)交替迭代優(yōu)化S和Z來(lái)最小化公式(2)。
[0029] 當(dāng)各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣Z1, i = 不變時(shí),通過(guò)公式(3)更新S, 具體為:
[0030]
[0031] 當(dāng)S不變時(shí),更新各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣Z1, i = 1,.. .m,具體由公式(4) 可知:
[0032]
[0033] 將公式(4)進(jìn)行變形得到公式(5),具體為:
[0034]
[0035] 進(jìn)一步地,將所述第一自表達(dá)矩陣進(jìn)行聚類得到聚類結(jié)果包括:
[0036] 將所述第一自表達(dá)矩陣通過(guò)譜聚類方法進(jìn)行聚類得到聚類結(jié)果。
[0037] 為了進(jìn)行詳細(xì)的說(shuō)明,將本發(fā)明提出的方法應(yīng)用于五個(gè)常用的多模態(tài)聚類的數(shù) 據(jù)庫(kù)上,即 Movies617、PASCAL-VOC、WiKi Text-Image、Animal、3-Sources 數(shù)據(jù)庫(kù)。其中 Movies617數(shù)據(jù)庫(kù)包含17個(gè)類別的共617部電影,兩個(gè)模態(tài)特征分別對(duì)應(yīng)1878維關(guān)鍵詞特 征以及1398維的演員列表特征;PASCAL-V0C包含20類圖像文本對(duì),去除有多個(gè)類別屬性 的樣本,可以得到共5649個(gè)樣本,同時(shí)考慮到一些對(duì)比方法的時(shí)間代價(jià)。取前三類樣本作 為評(píng)測(cè)集,并且利用512維的Gist特征和399維的文本詞頻特征;WiKi Text-Image數(shù)據(jù) 庫(kù)由10個(gè)類別的共2866個(gè)圖像文本對(duì)構(gòu)成,從每個(gè)類別中隨機(jī)選取60個(gè)樣本組成共600 個(gè)樣本的測(cè)試集,其中文本特征利用10維的LDA特征,圖像特征利用128維的SIFT特征; Animal數(shù)據(jù)庫(kù)由30475個(gè)樣本組成,共50類,選取前十個(gè)類別并且從每個(gè)類別中隨機(jī)選取 50個(gè)樣本構(gòu)成測(cè)試集,取PyramidHOG (PHOG)、colorSIFT以及SURF特征作為三種模態(tài)下的 特征表達(dá);3-Sources數(shù)據(jù)庫(kù)包含從BBC、Reuters以及The Guardian上收集的共416條不 同的消息,它們被分為6個(gè)類別,其中169個(gè)三家機(jī)構(gòu)都有報(bào)道的消息被用來(lái)作為我們的測(cè) 試集。
[0038] 由上可知,首先計(jì)算不同模態(tài)下的拉普拉斯矩陣,然后將所有數(shù)據(jù)集的數(shù)據(jù)輸入 模型進(jìn)行訓(xùn)練得到其不同模態(tài)下的自表達(dá)矩陣,從不同模態(tài)下的自表達(dá)矩陣中選取最優(yōu)的 自表達(dá)矩陣,最后利用譜聚類方法Normalized Cut對(duì)最優(yōu)的自表達(dá)矩陣進(jìn)行聚類,從而得 到最優(yōu)的結(jié)果,并將最優(yōu)的結(jié)果作為最終的聚類結(jié)果。
[0039] 以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚類方法,其特征在于,所述 方法包括: 獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣; 根據(jù)所述拉普拉斯矩陣構(gòu)建多模態(tài)數(shù)據(jù)子空間聚類模型; 通過(guò)所述多模態(tài)數(shù)據(jù)聚類模型得到所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣; 從所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣中選取第一自表達(dá)矩陣; 將所述第一自表達(dá)矩陣進(jìn)行聚類得到聚類結(jié)果。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯 矩陣包括: 利用高斯核函數(shù)分別計(jì)算所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的相似度; 根據(jù)所述相似度獲取所述相似度對(duì)應(yīng)的相似度矩陣; 根據(jù)所述相似度矩陣獲取所述相似度矩陣對(duì)應(yīng)的拉普拉斯矩陣。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過(guò)所述多模態(tài)數(shù)據(jù)聚類模型得到 所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣包括: 根據(jù)下式計(jì)算所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣:其中,Z = [Z1Z2…ZniLZ1為所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣,為所述 各個(gè)模態(tài)數(shù)據(jù)的重構(gòu)誤差,L1為所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣為 所述各個(gè)模態(tài)數(shù)據(jù)的局部拓?fù)洳蛔冃?,I |z| L為所述各個(gè)模態(tài)數(shù)據(jù)的全局一致性,IIZ尥為 正則項(xiàng),λ、β和P分別為權(quán)重參數(shù)。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述第一自表達(dá)矩陣進(jìn)行聚類得到聚 類結(jié)果包括: 將所述第一自表達(dá)矩陣通過(guò)譜聚類方法進(jìn)行聚類得到聚類結(jié)果。
【專利摘要】本發(fā)明提供的基于全局一致性和局部拓?fù)涞亩嗄B(tài)數(shù)據(jù)子空間聚類方法,包括:獲取各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的拉普拉斯矩陣;根據(jù)所述拉普拉斯矩陣構(gòu)建多模態(tài)數(shù)據(jù)子空間聚類模型;通過(guò)所述多模態(tài)數(shù)據(jù)聚類模型得到所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣;從所述各個(gè)模態(tài)數(shù)據(jù)對(duì)應(yīng)的自表達(dá)矩陣中選取第一自表達(dá)矩陣;將所述第一自表達(dá)矩陣進(jìn)行聚類得到聚類結(jié)果。本發(fā)明可以獲得更好的聚類性能,增強(qiáng)魯棒性。
【IPC分類】G06K9/62, G06F17/30
【公開(kāi)號(hào)】CN105160357
【申請(qǐng)?zhí)枴緾N201510546959
【發(fā)明人】赫然, 胡包鋼, 樊艷波
【申請(qǐng)人】中國(guó)科學(xué)院自動(dòng)化研究所
【公開(kāi)日】2015年12月16日
【申請(qǐng)日】2015年8月31日
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1