1.一種基于距離相關(guān)系數(shù)檢驗的非高斯中性矢量判斷方法,其過程包括以下幾步驟:
1)樣本預(yù)判斷步驟:判斷矢量變量樣本是否非負(fù)并且加和為一,成立則滿足非高斯特性;
2)正態(tài)性檢驗步驟:運用正態(tài)性檢驗生成正態(tài)概率圖,并進行假設(shè)檢驗,以檢查輸入的矢量變量樣本是否服從正態(tài)分布;若不服從,則說明變量樣本具有“非高斯”特性;
3)中性特性判斷步驟:根據(jù)非高斯中性矢量滿足協(xié)方差矩陣負(fù)相關(guān)的特點,通過判斷協(xié)方差矩陣為負(fù)相關(guān),以判斷非高斯矢量變量樣本為中性向量;
4)非線性去相關(guān)步驟:運用“并行”方法,對矢量變量樣本進行非線性變換,以得到一組相互獨立的非高斯矢量;
5)置換檢驗步驟:通過檢驗所得變量之間的相互獨立,判定原矢量變量樣本滿足“中性”特性。
2.根據(jù)權(quán)利要求1所述,在樣本預(yù)判斷步驟中,對樣本矢量變量進行簡單的加和計算,根據(jù)非高斯矢量的特點,當(dāng)樣本矢量變量的和為一時,該樣本才有可能為非高斯矢量。
3.根據(jù)權(quán)利要求1所述,在正態(tài)性檢驗步驟中,對于已經(jīng)滿足變量加和為一的矢量樣本,再次進行正態(tài)性檢驗,通過生成正態(tài)概率圖,查看樣本散點與假設(shè)回歸直線呈現(xiàn)出的圖像結(jié)果,得出樣本與正態(tài)分布的關(guān)系,不服從情況下,則說明樣本有“非高斯”特性。
4.根據(jù)權(quán)利要求1所述,在中性特性判斷步驟中,通過計算樣本矢量的協(xié)方差矩陣,判斷其相關(guān)性,在矩陣負(fù)相關(guān)的情況下,樣本矢量變量才為中性向量。
5.根據(jù)權(quán)利要求1所述,在非線性去相關(guān)步驟中,得到一組相互獨立的非高斯矢量變量;假設(shè)x=[x1,x2,···,xK]T非高斯矢量變量,通過非線性變換,可以獲得K-1維的非高斯矢量變量u=[μ1,μ2,···,μK-1]T,時間復(fù)雜度為O(log2K);此步驟的具體計算過程如下:
1)從第二次迭代開始,每次迭代前對矢量變量樣本進行歸一化操作,得到一組新的滿足“非高斯”特性的矢量變量x;
2)對非高斯矢量變量進行迭代非線性變化:
以六維向量為例,首次迭代得到三個相互獨立的變量u1,u2,u3分別為:
第二次迭代得到向量u4:
最后一輪迭代得到向量u5:
u5=x1+x2+x3+x4
在六維矢量的情況下,本方法僅用三步就完成了矢量的非線性變化,有效的在時間復(fù)雜度相對小的情況下得到一組相互獨立的新的非高斯中性矢量。
6.根據(jù)權(quán)利要求1所述,在置換檢驗步驟中,相關(guān)系數(shù)可以測量兩個隨機變量或任意維度的兩個隨機向量間的統(tǒng)計獨立性,當(dāng)它等于零時說明變量之間相互獨立;基于距離相關(guān)系數(shù)判定變量之間獨立性的方法可通過置換檢驗實現(xiàn),具體步驟如下:
1)給定來自兩個不同變量的兩組樣本X=[x1,···,xN]和Y=[y1,···,yN],分別逐一計算樣本間的歐式距離
aij=||xi-xj||2和bij=||yi-yj||2
然后計算
和
上式中,表示第i行的均值,表示第j列的均值,表示整個矩陣的均值,
對和也采用同樣的計算方法;
此樣本序列的距離相關(guān)系數(shù)為:
其中,
2)保持X中樣本的順序不變。通過對從1到N的序號進行隨機置換(Random Permutation),可從Y得到新的樣本序列Y*,對于X和Y*,按照步驟一中的方法重新計算DC;
3)重復(fù)步驟二Q次(Q應(yīng)為較大的正整數(shù)),統(tǒng)計所得到的DC值小于步驟一中得到的DC的次數(shù)為P,那么P/Q即為p-value;
此檢驗的零假設(shè)(Null Hypothesis)是兩個變量統(tǒng)計上相互不獨立。當(dāng)通過計算距離相關(guān)系數(shù)得到的p-value小于顯著性閾值(如0.05)時,此零假設(shè)被拒絕,則可判定兩個變量相互獨立;K維非高斯中性矢量變量共需要計算(K-1)(K-2)/2組變量對的p-value,與K!/2相比,有效降低了計算量;
當(dāng)通過置換檢驗判斷步驟四得到的變量相互獨立后,可以確定矢量變量滿足“中性”特性,結(jié)合之前步驟,可知該矢量變量是非高斯中性矢量。