1.一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,包括如下步驟:
針對(duì)視頻的訓(xùn)練數(shù)據(jù)選取視覺屬性;
將視覺屬性添加到分類器模型中進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類器;
利用訓(xùn)練好的分類器進(jìn)行視頻分類。
2.如權(quán)利要求1所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,包括如下步驟:
步驟S1:針對(duì)視頻的訓(xùn)練數(shù)據(jù)選取視覺屬性;
步驟S2:根據(jù)所述視覺屬性修改分類器模型;
步驟S3:構(gòu)建步驟S2中的修改后的分類器模型的損失函數(shù);
步驟S4:根據(jù)步驟S3中的損失函數(shù)對(duì)所述修改后的分類器模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類器;
步驟S5:利用訓(xùn)練好的分類器進(jìn)行視頻分類。
3.如權(quán)利要求2所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S1:針對(duì)視頻的訓(xùn)練數(shù)據(jù)選取視覺屬性的步驟中,包括如下步驟:
將訓(xùn)練數(shù)據(jù)表示為:datai={I,P},其中I表示視頻的常規(guī)數(shù)據(jù)信息;P表示視頻的分類和屬性的標(biāo)準(zhǔn)信息;
其中P定義為:P={C,A1,A2,...},其中C∈{0,1}c表示訓(xùn)練數(shù)據(jù)的分類信息向量,表示訓(xùn)練數(shù)據(jù)在第ai個(gè)視覺屬性的取值信息。
4.如權(quán)利要求3所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S2:根據(jù)所述視覺屬性修改分類器模型的步驟中,具體包括如下步驟:
步驟S2.1:在分類器模型的輸入層添加視覺屬性標(biāo)準(zhǔn)值;
步驟S2.2:在分類器模型的輸出層中添加視覺屬性輸出層。
5.如權(quán)利要求4所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S3:構(gòu)建步驟S2中的修改后的分類器模型的損失函數(shù)的步驟,具體包括如下步驟:
步驟S3.1:構(gòu)建分類器模型中視覺屬性輸出層的損失函數(shù);
步驟S3.2:根據(jù)所述視覺屬性輸出層的損失函數(shù)構(gòu)建分類器模型的全局損失函數(shù)。
6.如權(quán)利要求5所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S3.1中分類器模型中視覺屬性輸出層的損失函數(shù)表示為:
其中m表示訓(xùn)練數(shù)據(jù)個(gè)數(shù),k表示視覺屬性取值的范圍個(gè)數(shù),y(i∈)表示第i個(gè)訓(xùn)練數(shù)據(jù)的視覺屬性標(biāo)準(zhǔn)值,h∈(xi)表示第i個(gè)訓(xùn)練數(shù)據(jù)在輸出層第∈列的輸出。
7.如權(quán)利要求6所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S3.2中構(gòu)建的分類器模型的全局損失函數(shù)表示為:
ζT表示全局損失函數(shù)值,其中r表示視覺屬性的個(gè)數(shù),ζc表示由動(dòng)作類別產(chǎn)生的損失函數(shù)值,而表示視覺屬性p產(chǎn)生的損失函數(shù)值,表示權(quán)重。
8.如權(quán)利要求7所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述分類器模型采用卷積神經(jīng)網(wǎng)絡(luò)模型。
9.如權(quán)利要求1-8中任一項(xiàng)所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S4:根據(jù)步驟S3中的損失函數(shù)對(duì)所述修改后的分類器模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類器的步驟中,采用開源工具Caffe完成分類器模型的訓(xùn)練。