亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種屬性輔助的視頻動(dòng)作識(shí)別方法與流程

文檔序號(hào):11951834閱讀:來源:國知局

技術(shù)特征:

1.一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,包括如下步驟:

針對(duì)視頻的訓(xùn)練數(shù)據(jù)選取視覺屬性;

將視覺屬性添加到分類器模型中進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類器;

利用訓(xùn)練好的分類器進(jìn)行視頻分類。

2.如權(quán)利要求1所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,包括如下步驟:

步驟S1:針對(duì)視頻的訓(xùn)練數(shù)據(jù)選取視覺屬性;

步驟S2:根據(jù)所述視覺屬性修改分類器模型;

步驟S3:構(gòu)建步驟S2中的修改后的分類器模型的損失函數(shù);

步驟S4:根據(jù)步驟S3中的損失函數(shù)對(duì)所述修改后的分類器模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類器;

步驟S5:利用訓(xùn)練好的分類器進(jìn)行視頻分類。

3.如權(quán)利要求2所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S1:針對(duì)視頻的訓(xùn)練數(shù)據(jù)選取視覺屬性的步驟中,包括如下步驟:

將訓(xùn)練數(shù)據(jù)表示為:datai={I,P},其中I表示視頻的常規(guī)數(shù)據(jù)信息;P表示視頻的分類和屬性的標(biāo)準(zhǔn)信息;

其中P定義為:P={C,A1,A2,...},其中C∈{0,1}c表示訓(xùn)練數(shù)據(jù)的分類信息向量,表示訓(xùn)練數(shù)據(jù)在第ai個(gè)視覺屬性的取值信息。

4.如權(quán)利要求3所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S2:根據(jù)所述視覺屬性修改分類器模型的步驟中,具體包括如下步驟:

步驟S2.1:在分類器模型的輸入層添加視覺屬性標(biāo)準(zhǔn)值;

步驟S2.2:在分類器模型的輸出層中添加視覺屬性輸出層。

5.如權(quán)利要求4所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S3:構(gòu)建步驟S2中的修改后的分類器模型的損失函數(shù)的步驟,具體包括如下步驟:

步驟S3.1:構(gòu)建分類器模型中視覺屬性輸出層的損失函數(shù);

步驟S3.2:根據(jù)所述視覺屬性輸出層的損失函數(shù)構(gòu)建分類器模型的全局損失函數(shù)。

6.如權(quán)利要求5所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S3.1中分類器模型中視覺屬性輸出層的損失函數(shù)表示為:

<mrow> <mi>&zeta;</mi> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mi>m</mi> </mfrac> <mo>{</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mo>&lsqb;</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mo>&Element;</mo> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msup> <mi>y</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>&Element;</mo> <mo>)</mo> </mrow> </msup> <mo>*</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mo>&Element;</mo> </msub> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>)</mo> <mo>)</mo> </mrow> <mo>&rsqb;</mo> <mo>}</mo> </mrow>

其中m表示訓(xùn)練數(shù)據(jù)個(gè)數(shù),k表示視覺屬性取值的范圍個(gè)數(shù),y(i∈)表示第i個(gè)訓(xùn)練數(shù)據(jù)的視覺屬性標(biāo)準(zhǔn)值,h(xi)表示第i個(gè)訓(xùn)練數(shù)據(jù)在輸出層第∈列的輸出。

7.如權(quán)利要求6所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S3.2中構(gòu)建的分類器模型的全局損失函數(shù)表示為:

ζT表示全局損失函數(shù)值,其中r表示視覺屬性的個(gè)數(shù),ζc表示由動(dòng)作類別產(chǎn)生的損失函數(shù)值,而表示視覺屬性p產(chǎn)生的損失函數(shù)值,表示權(quán)重。

8.如權(quán)利要求7所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述分類器模型采用卷積神經(jīng)網(wǎng)絡(luò)模型。

9.如權(quán)利要求1-8中任一項(xiàng)所述的一種屬性輔助的視頻動(dòng)作識(shí)別方法,其特征在于,所述步驟S4:根據(jù)步驟S3中的損失函數(shù)對(duì)所述修改后的分類器模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類器的步驟中,采用開源工具Caffe完成分類器模型的訓(xùn)練。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1