意一種實(shí)現(xiàn)方式訓(xùn)練出的K個(gè)分類(lèi)器;根據(jù) 公式
?角定所述待分類(lèi)圖像在所述K個(gè)類(lèi)別下的概率,其中,
表示所述待分類(lèi)圖像,βk表示所述K個(gè)分類(lèi)器中第k個(gè)分類(lèi) 器的模型參數(shù),f(x,z)表示X的特征向量,Z(x)表示X的隱變量z的取值范圍,k為1至K中的任意整數(shù)。
[0024] 第三方面,提供一種圖像分類(lèi)器的生成裝置,包括:第一獲取單元,用于獲取訓(xùn)練 樣本集,所述訓(xùn)練樣本集包括N個(gè)圖像樣本,所述N個(gè)圖像樣本屬于K個(gè)類(lèi)別,N、K為正整 數(shù),N大于K;第二獲取單元,用于獲取所述第一獲取單元獲取的每一個(gè)所述圖像樣本的特 征向量,其中,所述特征向量包括圖像樣本的隱變量;訓(xùn)練單元,用于基于所述第二獲取單 元獲取的所述N個(gè)圖像樣本的隱變量,通過(guò)多元邏輯回歸模型,訓(xùn)練所述K個(gè)類(lèi)別的分類(lèi) 器。
[0025] 結(jié)合第二方面,在第二方面的一種實(shí)現(xiàn)方式中,所述K個(gè)類(lèi)別的分類(lèi)器分別包括K 個(gè)模型參數(shù),所述訓(xùn)練單元具體用于獲取所述K個(gè)模型參數(shù)的初始值;獲取所述N個(gè)圖像樣 本的隱變量的初始值;基于所述N個(gè)圖像樣本的特征向量,以及所述N個(gè)圖像樣本隱變量的 初始值,通過(guò)所述多元邏輯回歸模型,訓(xùn)練所述K個(gè)類(lèi)別的分類(lèi)器,以確定所述K個(gè)模型參 數(shù)的目標(biāo)值。
[0026]結(jié)合第三方面,在第三方面的一種實(shí)現(xiàn)方式中,所述N個(gè)圖像樣本隱變量的初始 值包括:正圖像樣本隱變量的初始值和負(fù)圖像樣本隱變量的初始值,所述訓(xùn)練單元具體用 于基于所述N個(gè)圖像樣本的特征向量,以及所述N個(gè)圖像樣本隱變量的初始值,通過(guò)所述 多元邏輯回歸模型,訓(xùn)練所述K個(gè)類(lèi)別的分類(lèi)器,以確定所述K個(gè)模型參數(shù)的當(dāng)前值,當(dāng)所 述K個(gè)模型參數(shù)的當(dāng)前值滿(mǎn)足預(yù)設(shè)的收斂條件時(shí),將所述K個(gè)模型參數(shù)的當(dāng)前值確定為所 述K個(gè)模型參數(shù)的目標(biāo)值,當(dāng)所述K個(gè)模型參數(shù)的當(dāng)前值不滿(mǎn)足所述收斂條件時(shí),基于所述 N個(gè)圖像樣本的特征向量,以及所述K個(gè)模型參數(shù)的當(dāng)前值,確定所述正圖像樣本隱變量的 當(dāng)前值,并利用所述正圖像樣本隱變量的當(dāng)前值更新所述正圖像樣本隱變量的初始值,重 復(fù)執(zhí)行本步驟直到所述K個(gè)模型參數(shù)的當(dāng)前值滿(mǎn)足所述收斂條件。
[0027]結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式中,所 述訓(xùn)練單元具體用于基于所述N個(gè)圖像樣本的特征向量,以及所述N個(gè)圖像樣本隱變量的 初始值,通過(guò)所述多元邏輯回歸模型,訓(xùn)練所述K個(gè)類(lèi)別的分類(lèi)器,以確定所述K個(gè)模型參 數(shù)的迭代值,基于所述N個(gè)圖像樣本的特征向量,以及所述K個(gè)模型參數(shù)的迭代值,確定所 述負(fù)圖像樣本隱變量的迭代值,并利用所述負(fù)圖像樣本隱變量的迭代值更新所述負(fù)圖像樣 本隱變量的初始值,當(dāng)所述K個(gè)模型參數(shù)的迭代值滿(mǎn)足預(yù)設(shè)的迭代停止條件時(shí),將所述K個(gè) 模型參數(shù)的迭代值確定為所述K個(gè)模型參數(shù)的當(dāng)前值,否則,重復(fù)執(zhí)行本步驟直到所述K個(gè) 模型參數(shù)的當(dāng)前值滿(mǎn)足所述迭代停止條件。
[0028]結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式中,所 述訓(xùn)練單元具體用于根據(jù)公式
U確定所述K個(gè)模型參數(shù)的
迭代值,其中, ^表示所述N ! ? 個(gè)圖像樣本中的第i樣本,^^表示所述K個(gè)模型參數(shù)中的第1個(gè)模型參數(shù),Θ表示所述K個(gè)模型參數(shù)組成的K維變量,焉;表示Xi的類(lèi)別對(duì)應(yīng)的模型參數(shù),Z(Xi)表示Xi的隱變量Z 的取值范圍,f(Xi,z)表示X;的特征向量。
[0029] 結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式 中,所述訓(xùn)練單元具體用于根據(jù)公式
》 確定h對(duì)應(yīng)的梯度,其中,
》
表示1(θ)關(guān)于i3k的偏導(dǎo)函數(shù),心表示所述K個(gè) 模型參數(shù)中的第k個(gè)模型參數(shù),Zi(Pk)表示模型參數(shù)為時(shí)1;的隱變量的初始值,fUulWk))表示隱變量z取值Zl(i3k)時(shí)\的特征向量;基于所述i3k對(duì)應(yīng)的梯度,以 1(θ)為目標(biāo)函數(shù),采用梯度上升算法,確定所述i3k的迭代值。
[0030] 結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式中,所 述迭代停止條件為所述目標(biāo)函數(shù)值1 (θ)的變化小于預(yù)設(shè)閾值;或者,所述迭代停止條件 為迭代次數(shù)達(dá)到預(yù)設(shè)次數(shù)。
[0031] 結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三 方面的另一種實(shí)現(xiàn)方式中,所述訓(xùn)練單元具體用于根據(jù)公式
,并行計(jì)算所 述K個(gè)模型參數(shù)的迭代值,其中,ΜΘ)是對(duì)1(θ)中的對(duì)數(shù)取凹上界轉(zhuǎn)化而來(lái)的,
[0032] 結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式中,所 述訓(xùn)練單元具體用于根據(jù)公式/ ···argTUiu:.、../(、, /V/U;5::),確定所述負(fù)圖像樣本隱變量 的迭代值,其中,Xl表示所述N個(gè)圖像樣本中的第i樣本,βt表示所述K個(gè)模型參數(shù)中的 第t個(gè)模型參數(shù),且A* /(.,,爲(wèi)\表示Xi類(lèi)別對(duì)應(yīng)的模型參數(shù),Z(xj表示Xi的隱變量z的 取值范圍,f(Xi,Z)表示Xi的特征向量,表示模型參數(shù)為βt時(shí)Xi隱變量的迭代值,i為 1至N中的任意整數(shù),t為1至K中的任意整數(shù)。
[0033] 結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式中,所 述訓(xùn)練單元具體用于根據(jù)公式<^1〇^::,, <:.(:>式.//(.^)'確定所述正圖像樣本隱變量 的當(dāng)前值,其中,Xl表示所述N個(gè)圖像樣本中的第i樣本,從.表示Xl類(lèi)別對(duì)應(yīng)的模型參數(shù), Z(Xi)表示Xi的隱變量Z的取值范圍,?·(χ"Z)表示X;的特征向量,4表示模型參數(shù)為爲(wèi) 時(shí)Xi隱變量的當(dāng)前值,i為1至N中的任意整數(shù)。
[0034] 結(jié)合第三方面或其上述實(shí)現(xiàn)方式的任一種,在第三方面的另一種實(shí)現(xiàn)方式中,所 述訓(xùn)練單元具體用于根據(jù)公式Kurgmaxm」?fàn)?wèi)·/iv; ,確定每一個(gè)所述圖像樣本的 隱變量的初始值,其中,Xl表示所述N個(gè)圖像樣本中的第i樣本,βk表示所述K個(gè)模型參數(shù) 中的第k個(gè)模型參數(shù),Z(Xi)表示Xi的隱變量z的取值范圍,f(Xi,z)表示Xi的特征向量, 4表示模型參數(shù)為βk時(shí)Xi隱變量z的初始值,i為1至N中的任意整數(shù),k為1至K中的 任意整數(shù)。
[0035] 第四方面,提供一種圖像分類(lèi)裝置,包括:第一獲取單元,用于獲取待分類(lèi)圖像的 特征向量;第一確定單元,用于基于所述待分類(lèi)圖像的特征向量,利用K個(gè)分類(lèi)器,確定所 述待分類(lèi)圖像的類(lèi)別,其中,所述K個(gè)分類(lèi)器是利用第三方面或第三方面的任意一種實(shí)現(xiàn) 方式訓(xùn)練出的K個(gè)分類(lèi)器;第二確定單元,用于根據(jù)公¥
確定所 述待分類(lèi)圖像在所述K個(gè)類(lèi)別下的概率,其中,X表示所述待分 類(lèi)圖像,^^表示所述K個(gè)分類(lèi)器中第k個(gè)分類(lèi)器的模型參數(shù),f(x,z)表示X的特征向量,Z(x)表示X的隱變量z的取值范圍,k為1至K中的任意整數(shù)。
[0036] 本發(fā)明實(shí)施例中,通過(guò)多元邏輯回歸模型,以最大似然的形式同時(shí)訓(xùn)練K個(gè)分類(lèi) 器,也就是說(shuō),多元邏輯回歸模型的使用保留了K個(gè)類(lèi)別的分類(lèi)器之間的相互關(guān)聯(lián),與LVSM 將物體分類(lèi)領(lǐng)域的K類(lèi)分類(lèi)問(wèn)題轉(zhuǎn)換成相互孤立的多個(gè)二類(lèi)問(wèn)題的方式相比,訓(xùn)練結(jié)果更 加準(zhǔn)確。
【附圖說(shuō)明】
[0037] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0038] 圖1是本發(fā)明實(shí)施例的圖像分類(lèi)器的生成方法的示意性流程圖。
[0039] 圖2是利用本發(fā)明實(shí)施例訓(xùn)練出的分類(lèi)器參數(shù)對(duì)圖像分類(lèi)的示例圖。
[0040] 圖3是利用本發(fā)明實(shí)施例訓(xùn)練出的分類(lèi)器參數(shù)對(duì)圖像分類(lèi)的示例圖。
[0041] 圖4是本發(fā)明實(shí)施例的圖像分類(lèi)器的生成裝置的示意性結(jié)構(gòu)圖。
[0042] 圖5是本發(fā)明實(shí)施例的圖像分類(lèi)器的生成裝置的示意性結(jié)構(gòu)圖。
[0043] 圖6是本發(fā)明實(shí)施例的圖像分類(lèi)方法的示意性流程圖。
[0044] 圖7是本發(fā)明實(shí)施例的圖像分類(lèi)裝置的示意性框圖。
[0045] 圖8是本發(fā)明實(shí)施例的圖像分類(lèi)裝置的示意性框圖。
【具體實(shí)施方式】
[0046] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例?;诒景l(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí) 施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。
[0047] 圖1是本發(fā)明實(shí)施例的圖像分類(lèi)器的生成方法的示意性流程圖。圖1的方法包 括:
[0048] 110、獲取訓(xùn)練樣本集,訓(xùn)練樣本集包括N個(gè)圖像樣本,N個(gè)圖像樣本屬于K個(gè)類(lèi)別,N、K為正整數(shù),N大于K。
[0049] 例如,訓(xùn)練樣本集合D={(Xl,yi),...,(xN,yN)},共包含N個(gè)圖像樣本,其中,71為 圖像樣本Xl的標(biāo)簽,用于指示Xl的類(lèi)別,該類(lèi)別為上述K個(gè)類(lèi)別之一。
[0050] 120、獲取每一個(gè)圖像樣本的特征向量,其中,特征向量包括圖像樣本的隱變量。
[0051] 應(yīng)理解,圖像特征和隱變量可以根據(jù)應(yīng)用場(chǎng)景或?qū)嶋H需要選取。例如,圖像特征可 以選取(或定義為)方向梯度直方圖(HistogramofOrientedGradient,H0G),局部二值 模式(LocalBinaryPatterns,LBP),或Haar等;隱變量可以選取(或定義為)物體在圖 像中的位置,圖像中局部和主體間的相對(duì)位置,或物體的子類(lèi)別等?;谏鲜鲞x取的圖像特 征和隱變量,獲取每一個(gè)圖像樣本的特征向量,此時(shí),獲取的每個(gè)圖像的特征向量并非一個(gè) 固定值,會(huì)隨著隱變量的變化而變化,假設(shè)圖像Xl的隱變量為z,提取出的特征向量可通過(guò) f (X,z) 〇
[0052] 130、基于Ν個(gè)圖像樣本的隱變量,通過(guò)多元邏輯回歸模型,訓(xùn)練Κ個(gè)類(lèi)別的分類(lèi) 器。
[0053] 本發(fā)明實(shí)施例中,通過(guò)多元邏輯回歸模型,以最大似然的形式同時(shí)訓(xùn)練Κ個(gè)分類(lèi) 器,也就是說(shuō),多元邏輯回歸模型的使用保留了Κ個(gè)類(lèi)別的分類(lèi)器之間的相互關(guān)聯(lián),與LVSM 將物體分類(lèi)領(lǐng)域的Κ類(lèi)分類(lèi)問(wèn)題轉(zhuǎn)換成相互孤立的多個(gè)二類(lèi)問(wèn)題的方式相比,訓(xùn)練結(jié)果更 加準(zhǔn)確。
[0054] 可選地,作為一個(gè)實(shí)施例,步驟130可包括:獲取Κ個(gè)模型參數(shù)的初始值;獲取Ν個(gè) 圖像樣本的隱變量的初始值;基于Ν個(gè)圖像樣本的特征向量,以及Ν個(gè)圖像樣本隱變量的初 始值,通過(guò)多元邏輯回