一種大數(shù)據(jù)圖像分類方法
【專利摘要】本發(fā)明公開了一種大數(shù)據(jù)圖像分類方法,包括如下步驟:1)收集圖像樣本作為訓(xùn)練集;2)尋找大數(shù)據(jù)圖像分類最優(yōu)的投影矩陣;3)對無標(biāo)注數(shù)據(jù)進(jìn)行投影;4)對投影后的樣本采用最小距離分類器分類。利用本發(fā)明提出的方法能夠有效利用樣本分布的局部幾何信息,并提取分類的鑒別信息,減少大數(shù)據(jù)圖像分類對人工標(biāo)注樣本的依賴,有效減少訓(xùn)練過程中的存儲成本,其分類準(zhǔn)確度高于有代表性的基于線性判別分析的圖像分類方法。
【專利說明】一種大數(shù)據(jù)圖像分類方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種模式識別與人工智能【技術(shù)領(lǐng)域】中的圖像分類技術(shù),特別涉及一種大數(shù)據(jù)圖像分類方法,該方法是一種監(jiān)督學(xué)習(xí)圖像分類的方法。
【背景技術(shù)】
[0002]隨著移動互聯(lián)網(wǎng)的迅速發(fā)展,帶有數(shù)字?jǐn)z像頭智能手機(jī)、平板電腦越來越多的進(jìn)入人們的生活,很容易產(chǎn)生大量的個人數(shù)字圖像。雖然利用時間和目錄對圖像進(jìn)行管理是一種常見的方法,但是缺乏語義層面對圖片進(jìn)行有效的管理。因此利用監(jiān)督學(xué)習(xí)方法,通過學(xué)習(xí)人工標(biāo)注數(shù)據(jù),以獲得圖像分類模型,然后對沒有標(biāo)注的圖像進(jìn)行自動圖像分類。由于圖像通常的特征維數(shù)非常高,因此降維方法有助于識別性能的提高。
[0003]傳統(tǒng)的全局線性降維的方法主要是基于線性的,其中線性判別分析被廣泛地應(yīng)用在模式分類問題上。線性判別分析法主要通過最大化類間距離的同時使類內(nèi)樣本間距離最小,從而實(shí)現(xiàn)不同類別之間的可分性。但是,大數(shù)據(jù)圖像分類面臨著類別數(shù)巨大,需要分類的樣本數(shù)量巨大等困難。線性判別分析對于大數(shù)據(jù)而言,使用成本是比較高的,為了獲得一定的分類性能,它需要人工大量的標(biāo)注樣本。這使得圖像分類軟件開發(fā)成本大量增加,需要人工大量的標(biāo)注樣本。
[0004]因此,尋找一個需要標(biāo)注少量樣本即可得到滿足要求的自動圖像分類方法是非常必要的。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供一種大數(shù)據(jù)圖像分類方法,該方法只需要少量人工標(biāo)注樣本。
[0006]本發(fā)明的目的通過下述技術(shù)方案實(shí)現(xiàn):一種大數(shù)據(jù)圖像分類方法,具體實(shí)現(xiàn)方式:
[0007]I)收集圖像樣本作為訓(xùn)練集X,即Χ=[χι,χ2,…,xN] e Rdxn,樣本維數(shù)為D,樣本數(shù)量為N,每個樣本有相應(yīng)的類別標(biāo)志Ci e Z0
[0008]2)建立局部優(yōu)化目標(biāo)函數(shù):
[0009]對每一個已標(biāo)注的樣本Xi,我們可以找到類內(nèi)樣本勺,…,的Ic1近鄰和類間樣本
的 k2 近鄰來形成一個局部塊,即 A =|Λ,.Χ;,,....Χ;(—,?+1)。另
外,我們定義Ru為第j個樣本相對第i個樣本里的位置順序。我們希望每個局部塊的新的低維空間表達(dá),即:X 二^,々,…A,%,...,' ] e Rrfx(W),滿足類間樣本距離足夠大同
時類內(nèi)樣本位置順序信息盡可能的保留。
[0010]我們對類間樣本距離建立(I)式:2
[0011]
【權(quán)利要求】
1.一種大數(shù)據(jù)圖像分類方法,包括以下步驟: 1)收集圖像樣本作為訓(xùn)練集X,即:x=[Xl,X2,…,XN] e Rdxn,其中Xl,X2,…,χΝ,代表樣本,D為樣本維數(shù),N為樣本數(shù)量,每個樣本有相應(yīng)的類標(biāo)志Ci ; 2)尋找大數(shù)據(jù)圖像分類最優(yōu)的投影矩陣U; 3)通過對無標(biāo)注數(shù)據(jù)集Xu進(jìn)行投影,并獲得新的樣本特征集Yu,即=Yu=UtXu; 4)對投影后樣本特征集Yu采用最小距離分類器分類,獲得圖像分類的結(jié)果; 其特征在于,所述尋找大數(shù)據(jù)圖像分類最優(yōu)的投影矩陣,包括以下步驟: 步驟1、建立局部優(yōu)化目標(biāo)函數(shù); 步驟2、建立全局優(yōu)化目標(biāo)函數(shù); 步驟3、利用拉格朗日乘數(shù)法:將新的全局優(yōu)化目標(biāo)的問題轉(zhuǎn)換為求廣義特征值α問題,大數(shù)據(jù)圖像分類最優(yōu)的投影矩陣U由式子XLXtCi=X XXt α的前d個最小特征值對應(yīng)的d個特征向量得到。
2.根據(jù)權(quán)利要求1所述的大數(shù)據(jù)圖像分類方法,其特在在于,所述步驟I包括:對每一個已標(biāo)注的樣本xi,找到同類樣本士,…,xA的共Ic1近鄰和不同類別樣本',...,'的共k2近鄰來形成一個局部塊,即:
3.根據(jù)權(quán)利要求1所述的大數(shù)據(jù)圖像分類方法,其特征在于,所述步驟2包括:通過樣本選擇矩陣,每個局部塊的新的低維空間表達(dá)Yi的坐標(biāo)從訓(xùn)練集低維表達(dá)Y中選擇出來,即^=11?=!^, y2,…yN] e RdXN,所述低維空間表達(dá)Yi的表達(dá)式如下:
【文檔編號】G06F17/30GK103488744SQ201310432630
【公開日】2014年1月1日 申請日期:2013年9月22日 優(yōu)先權(quán)日:2013年9月22日
【發(fā)明者】金連文, 陶大鵬, 王永飛 申請人:華南理工大學(xué)