1.一種針對非等長視頻手勢識別的張量分解方法,其特征在于,包括如下步驟:
1)將一個原始的視頻表示成一個三階張量其中I1,I2和T分別表示為一個視頻的寬度、高度和視頻幀數(shù),I1×I2表示視頻幀的大??;
2)對三階張量Α進行Tucker分解獲得維度減少的核張量
3)求解核張量,通過動態(tài)學習更新結果直到算法收斂結果達到最優(yōu);
4)重復步驟1)~步驟3)將所有的視頻表示為相同大小的核張量,即將視頻序列縮放到相同尺度;
5)實現(xiàn)非等長條件下張量分解。
2.根據(jù)權利要求1所述的一種針對非等長視頻手勢識別的張量分解方法,其特征在于,步驟2)所述的三階張量Α的核張量寫為如下形式:
其中,U3∈RK×T,令張量F=Α×1U1×2U1,則核張量簡寫為:
3.根據(jù)權利要求1所述的一種針對非等長視頻手勢識別的張量分解方法,其特征在于,步驟3)所述的求解核張量,包括:
(1)初始化:給定原始三階張量Α,隨機初始化矩陣U1及U2;
(2)求解張量F:
F=Α×1U1×2U1 (3)
(3)求解U3,為了將視頻縮放到相同的尺度,對U3采用關鍵幀選擇方法,即采用稀疏編碼的方法從張量F中選取最優(yōu)的K個切片構成基,其中,K<T,再用最優(yōu)的基重構原始的視頻,對張量F按照時間域展開得到矩陣令設定目標函數(shù)如下:
其中C為系數(shù)矩陣,為從G中選取的K列向量構成的基,定義Sij={0,1},表示去掉G·S矩陣的全零列后構成的大小為J1J2×K的矩陣;目標函數(shù)中的第二項λ||C||2,1為系數(shù)矩陣C的約束條件,保證了系數(shù)矩陣C稀疏性,第三項保證了視頻信息的差異性,即盡可能多的保留原始視頻的有效信息;
利用如下的等價關系:
其中W為除對角線以外其余值均為1的矩陣,D為對角矩陣且對角線的值令L=D-W,則目標函數(shù)轉化為如下形式:
存在線性映射G=f(B),滿足:
A(3)=GU3=(BC+E)U3 (7)
其中E表示誤差,則:
U3=(BC+E)+A(3) (8)
其中(BC+E)+為矩陣BC+E的偽逆;
通過從中隨機選擇K列初始化基B={b1,…,bk…,bK},再次轉化目標函數(shù)為如下目標函數(shù):
定義誤差函數(shù)通過如下函數(shù)尋找使得誤差函數(shù)e(bk)最小的列bp,即:
從基B中去掉使得誤差函數(shù)e(bk)最小的列bp得到
令選擇一個向量替換掉使得誤差函數(shù)e(bk)最小的列bp,即向量滿足如下條件:
然后迭代更新計算基B、系數(shù)矩陣C和矩陣S直至算法收斂;
利用U3=B+G求得U3,從而得到核張量
4.根據(jù)權利要求1所述的一種針對非等長視頻手勢識別的張量分解方法,其特征在于,步驟5)所述的實現(xiàn)非等長條件下張量分解,是基于Tucker分解的基本形式進行如下過程:
(1)將U1及U3作為已知求解U2;
(2)將U2及U3作為已知求解U1;
(3)重復第(1)~第(2)步直至收斂。