亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種針對非等長視頻手勢識別的張量分解方法與流程

文檔序號:12177980閱讀:來源:國知局

技術特征:

1.一種針對非等長視頻手勢識別的張量分解方法,其特征在于,包括如下步驟:

1)將一個原始的視頻表示成一個三階張量其中I1,I2和T分別表示為一個視頻的寬度、高度和視頻幀數(shù),I1×I2表示視頻幀的大??;

2)對三階張量Α進行Tucker分解獲得維度減少的核張量

3)求解核張量,通過動態(tài)學習更新結果直到算法收斂結果達到最優(yōu);

4)重復步驟1)~步驟3)將所有的視頻表示為相同大小的核張量,即將視頻序列縮放到相同尺度;

5)實現(xiàn)非等長條件下張量分解。

2.根據(jù)權利要求1所述的一種針對非等長視頻手勢識別的張量分解方法,其特征在于,步驟2)所述的三階張量Α的核張量寫為如下形式:

<mrow> <mover> <mi>A</mi> <mo>~</mo> </mover> <mo>=</mo> <mi>A</mi> <mo>&times;</mo> <msub> <mmultiscripts> <mi>U</mi> <mprescripts/> <mn>1</mn> <none/> </mmultiscripts> <mn>1</mn> </msub> <mo>&times;</mo> <msub> <mmultiscripts> <mi>U</mi> <mprescripts/> <mn>2</mn> <none/> </mmultiscripts> <mn>2</mn> </msub> <mo>&times;</mo> <msub> <mmultiscripts> <mi>U</mi> <mprescripts/> <mn>3</mn> <none/> </mmultiscripts> <mn>3</mn> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中,U3∈RK×T,令張量F=Α×1U1×2U1,則核張量簡寫為:

<mrow> <mover> <mi>A</mi> <mo>~</mo> </mover> <mo>=</mo> <mi>F</mi> <mo>&times;</mo> <msub> <mmultiscripts> <mi>U</mi> <mprescripts/> <mn>3</mn> <none/> </mmultiscripts> <mn>3</mn> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

3.根據(jù)權利要求1所述的一種針對非等長視頻手勢識別的張量分解方法,其特征在于,步驟3)所述的求解核張量,包括:

(1)初始化:給定原始三階張量Α,隨機初始化矩陣U1及U2

(2)求解張量F:

F=Α×1U1×2U1 (3)

(3)求解U3,為了將視頻縮放到相同的尺度,對U3采用關鍵幀選擇方法,即采用稀疏編碼的方法從張量F中選取最優(yōu)的K個切片構成基,其中,K<T,再用最優(yōu)的基重構原始的視頻,對張量F按照時間域展開得到矩陣設定目標函數(shù)如下:

<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mi>min</mi> <mrow> <mi>B</mi> <mo>,</mo> <mi>S</mi> <mo>,</mo> <mi>C</mi> </mrow> </munder> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mo>-</mo> <mi>B</mi> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <mfrac> <mi>&beta;</mi> <mn>2</mn> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mo>|</mo> <mo>|</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mi>B</mi> <mo>=</mo> <msub> <mrow> <mo>&lsqb;</mo> <mi>G</mi> <mo>&CenterDot;</mo> <mi>S</mi> <mo>&rsqb;</mo> </mrow> <mrow> <msub> <mi>J</mi> <mn>1</mn> </msub> <msub> <mi>J</mi> <mn>2</mn> </msub> <mo>&times;</mo> <mi>K</mi> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

其中C為系數(shù)矩陣,為從G中選取的K列向量構成的基,定義Sij={0,1},表示去掉G·S矩陣的全零列后構成的大小為J1J2×K的矩陣;目標函數(shù)中的第二項λ||C||2,1為系數(shù)矩陣C的約束條件,保證了系數(shù)矩陣C稀疏性,第三項保證了視頻信息的差異性,即盡可能多的保留原始視頻的有效信息;

利用如下的等價關系:

<mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <mi>B</mi> <mo>(</mo> <mrow> <mi>D</mi> <mo>-</mo> <mi>W</mi> </mrow> <mo>)</mo> <msup> <mi>B</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>BLB</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

其中W為除對角線以外其余值均為1的矩陣,D為對角矩陣且對角線的值令L=D-W,則目標函數(shù)轉化為如下形式:

<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mi>min</mi> <mrow> <mi>B</mi> <mo>,</mo> <mi>S</mi> <mo>,</mo> <msub> <mi>U</mi> <mn>3</mn> </msub> </mrow> </munder> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mo>-</mo> <mi>B</mi> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <mi>&beta;</mi> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>BLB</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mi>B</mi> <mo>=</mo> <msub> <mrow> <mo>&lsqb;</mo> <mi>G</mi> <mo>&CenterDot;</mo> <mi>S</mi> <mo>&rsqb;</mo> </mrow> <mrow> <msub> <mi>J</mi> <mn>1</mn> </msub> <msub> <mi>J</mi> <mn>2</mn> </msub> <mo>&times;</mo> <mi>K</mi> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>

存在線性映射G=f(B),滿足:

A(3)=GU3=(BC+E)U3 (7)

其中E表示誤差,則:

U3=(BC+E)+A(3) (8)

其中(BC+E)+為矩陣BC+E的偽逆;

通過從中隨機選擇K列初始化基B={b1,…,bk…,bK},再次轉化目標函數(shù)為如下目標函數(shù):

<mrow> <munder> <mi>min</mi> <mrow> <mi>B</mi> <mo>,</mo> <msub> <mi>U</mi> <mn>3</mn> </msub> </mrow> </munder> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mo>-</mo> <mi>B</mi> <mi>C</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <msub> <mo>|</mo> <mrow> <mn>2</mn> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>

定義誤差函數(shù)通過如下函數(shù)尋找使得誤差函數(shù)e(bk)最小的列bp,即:

<mrow> <msub> <mi>b</mi> <mi>p</mi> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mi>min</mi> <msub> <mi>b</mi> <mi>k</mi> </msub> </munder> <mo>{</mo> <mo>|</mo> <mo>|</mo> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>b</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msub> <mo>|</mo> <mi>F</mi> </msub> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>

從基B中去掉使得誤差函數(shù)e(bk)最小的列bp得到

選擇一個向量替換掉使得誤差函數(shù)e(bk)最小的列bp,即向量滿足如下條件:

<mrow> <mover> <mi>b</mi> <mo>^</mo> </mover> <mo>=</mo> <mi>arg</mi> <munder> <mi>max</mi> <msub> <mover> <mi>b</mi> <mo>^</mo> </mover> <mi>j</mi> </msub> </munder> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mover> <mi>B</mi> <mo>~</mo> </mover> <mo>,</mo> <msub> <mover> <mi>b</mi> <mo>^</mo> </mover> <mi>j</mi> </msub> <mo>&Element;</mo> <mover> <mi>B</mi> <mo>^</mo> </mover> </mrow> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mover> <mi>b</mi> <mo>^</mo> </mover> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>

然后迭代更新計算基B、系數(shù)矩陣C和矩陣S直至算法收斂;

利用U3=B+G求得U3,從而得到核張量

4.根據(jù)權利要求1所述的一種針對非等長視頻手勢識別的張量分解方法,其特征在于,步驟5)所述的實現(xiàn)非等長條件下張量分解,是基于Tucker分解的基本形式進行如下過程:

(1)將U1及U3作為已知求解U2;

(2)將U2及U3作為已知求解U1;

(3)重復第(1)~第(2)步直至收斂。

當前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1