本發(fā)明涉及一種多路數(shù)據(jù)壓縮感知立方體架構
背景技術:
隨著云計算及虛擬化,呈現(xiàn)出“大規(guī)?!?、“高密度”、“高能耗”、“復雜化”等特點,建設與發(fā)展新一代數(shù)據(jù)中心,提升數(shù)據(jù)中心基礎設施管理將變得日趨重要,數(shù)據(jù)中心的基礎架構融合管理與智能將成為數(shù)據(jù)中心發(fā)展的新趨勢。超大型數(shù)據(jù)中心提供了從基礎設施到后面的數(shù)據(jù)分析、篩選、應用的整個應用服務。不僅是數(shù)據(jù)分析,還包括與公有云提供的通用化服務不同的專門服務于智能制造的云計算,以及超級運算,這就對大數(shù)據(jù)的處理能力提出了更高要求。
能夠用數(shù)據(jù)或統(tǒng)一的結構加以表示,我們稱之為結構化數(shù)據(jù),如數(shù)字、符號。傳統(tǒng)的關系數(shù)據(jù)模型、行數(shù)據(jù),存儲于數(shù)據(jù)庫,可用二維表結構表示。半結構化數(shù)據(jù),就是介于完全結構化數(shù)據(jù)(如關系型數(shù)據(jù)庫、面向對象數(shù)據(jù)庫中的數(shù)據(jù))和完全無結構的數(shù)據(jù)(如聲音、圖像文件等)之間的數(shù)據(jù),xml、html文檔就屬于半結構化數(shù)據(jù)。它一般是自描述的,數(shù)據(jù)的結構和內(nèi)容混在一起,沒有明顯的區(qū)分。非結構化數(shù)據(jù)庫是指其字段長度可變,并且每個字段的記錄又可以由可重復或不可重復的子字段構成的數(shù)據(jù)庫,用它不僅可以處理結構化數(shù)據(jù)(如數(shù)字、符號等信息)而且更適合處理非結構化數(shù)據(jù)(全文文本、圖象、聲音、影視、超媒體等信息)。
數(shù)據(jù)沿一相同方向的排列稱為一路陣列。標量是零路陣列的表示,行向量和列向量分別是數(shù)據(jù)沿水平和垂直方向排列的一路陣列,矩陣是數(shù)據(jù)沿水平和垂直兩個方向排列的二路陣列。張量是數(shù)據(jù)的多路陣列表示,它是矩陣的一種擴展。最常用的張量為三階張量。三階張量也稱三維矩陣。維數(shù)相同的正方三階張量稱為立方體。
三階張量的三路陣列不以行向量、列向量等相稱,而改稱張量纖維。纖維是只保留一個下標可變,固定其他所有下標不變而得到的一路陣列。它們分別是三階張量的水平纖維、豎直纖維和縱深纖維。高階張量也可以用矩陣的集合表示。這些矩陣形成了三階張量的水平切片、側向切片和正面切片。在張量的分析與計算中,能夠將一個三階張量(三路陣列)經(jīng)過重新組織或者排列,變成一個矩陣(二路陣列)。
矩陣有兩個相伴的向量空間:列空間和行空間。奇異值分解將這兩個向量空間正交化,并將矩陣分解為三個矩陣的乘積:左奇異矩陣、右奇異矩陣和中間對角奇異值矩陣。由于奇異值得作用往往比左和右奇異向量更加重要,所以奇異值矩陣可視為矩陣的核心矩陣。若將對角奇異值矩陣看作一個二階張量,則奇異值矩陣很自然地是二階張量的核心張量,而矩陣的三個矩陣乘積即可改為二階張量的n-模式積。
稀疏信號是指在大多數(shù)采樣時刻的取值等于零或近似等于零,只有少數(shù)采樣時刻的取值明顯不等于零的信號。許多自然信號在時域并不是稀疏信號,但是在某個變換域是稀疏的。這些變換工具包括fourier變換、短時fourier變換、小波變換和gabor變換等。對于稀疏的或可壓縮的信號,壓縮和低速率采樣構成壓縮感知。
本發(fā)明提供了一種多路數(shù)據(jù)壓縮感知立方體架構。架構的特征為,將結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)排列成三路陣列;使用高階奇異值分解,將三路陣列分解為二階張量的矩陣模式;再將矩陣模式變換到稀疏域,進行數(shù)據(jù)壓縮。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種多路數(shù)據(jù)壓縮感知立方體架構。本發(fā)明包括以下特征:
發(fā)明技術方案
1.一種多路數(shù)據(jù)壓縮感知立方體架構,架構的特征:
1)將結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)排列成三路陣列;
2)使用高階奇異值分解,將三路陣列分解為二階張量的矩陣模式;
3)再將矩陣模式變換到稀疏域,進行數(shù)據(jù)壓縮。
附圖說明
附圖1是多路數(shù)據(jù)壓縮感知立方體架構圖。
具體實施方式
這種多路數(shù)據(jù)壓縮感知立方體架構,包括如下步驟特征:
1)將結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)排列成三路陣列;
2)使用高階奇異值分解,將三路陣列分解為二階張量的矩陣模式;
3)再將矩陣模式變換到稀疏域,進行數(shù)據(jù)壓縮。