適用于三維腦組織高分辨海量圖集的數(shù)據(jù)快速歸檔方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明適用于生物醫(yī)學(xué)圖像處理領(lǐng)域,更具體的,適用于三維腦組織高分辨海量圖集的歸檔,并能從歸檔文件中快速、連續(xù)調(diào)取出感興趣數(shù)據(jù)塊,在不增加硬件投入的情況下大大提高計(jì)算機(jī)系統(tǒng)對(duì)腦科學(xué)研宄中所獲得三維海量圖像數(shù)據(jù)集的處理能力,具體涉及一種適用于三維腦組織高分辨海量圖集的數(shù)據(jù)快速歸檔方法。
【背景技術(shù)】
[0002]現(xiàn)在的腦科學(xué)研宄中,隨著成像技術(shù)的發(fā)展,一方面研宄人員可以對(duì)大范圍的腦組織進(jìn)行成像,另一方面,可以對(duì)更加精細(xì)的腦組織進(jìn)行成像,隨著成像范圍和成像精度的增加,所產(chǎn)生的圖像數(shù)據(jù)量也非常巨大,往往達(dá)到TB級(jí)。如何處理這些海量腦組織圖像數(shù)據(jù)是一個(gè)非常大的挑戰(zhàn)。通常采用兩種解決方法。第一種就是提升硬件水平,例如超級(jí)計(jì)算機(jī),但是這個(gè)投入是非常巨大。第二種方法就是對(duì)數(shù)據(jù)組織進(jìn)行優(yōu)化,最常用的方法就是采用多級(jí)分辨率技術(shù)。該技術(shù)在地理信息系統(tǒng)以及遙感圖像領(lǐng)域運(yùn)用的較多。
[0003]在中國(guó)發(fā)明專(zhuān)利說(shuō)明書(shū)CN102663140A中提出了一種用于TB級(jí)圖像的快速訪問(wèn)方法,該方法通過(guò)建立圖像索引和圖像分塊實(shí)現(xiàn),根據(jù)圖像所應(yīng)用的場(chǎng)景,建立數(shù)據(jù)索引,并將圖像轉(zhuǎn)換成小圖的方式,利用內(nèi)存緩沖池和顯存緩沖池技術(shù)實(shí)現(xiàn)數(shù)據(jù)快速訪問(wèn)。但是該方法所處理的圖像僅為二維圖像,所建立的索引適用于特定的應(yīng)用領(lǐng)域。而且,索引文件是針對(duì)每個(gè)小文件都建立,數(shù)量巨大,消耗計(jì)算資源。
[0004]在中國(guó)發(fā)明專(zhuān)利說(shuō)明書(shū)CN103440350A中,提出了一種基于八叉樹(shù)的三維數(shù)據(jù)檢索方法,該方法通過(guò)將三維數(shù)據(jù)建立八叉樹(shù)文件并建立對(duì)應(yīng)每個(gè)八叉樹(shù)節(jié)點(diǎn)數(shù)據(jù)塊索引表,通過(guò)查詢數(shù)據(jù)塊對(duì)應(yīng)的標(biāo)識(shí),來(lái)找到所對(duì)應(yīng)的數(shù)據(jù)塊。完成三維數(shù)據(jù)的檢索請(qǐng)求。該方法每次檢索的三維數(shù)據(jù)塊的最小單位為每個(gè)八叉樹(shù)數(shù)據(jù)塊的大小。
[0005]上述兩個(gè)專(zhuān)利主要面向地理遙感中產(chǎn)生的海量數(shù)據(jù),與遙感圖像相比較,三維腦組織圖像中包含許多組織結(jié)構(gòu)信息,例如血管、神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)復(fù)雜。研宄人員對(duì)腦組織中的某些結(jié)構(gòu)的位置都是采用坐標(biāo)表示,調(diào)取感興趣區(qū)域時(shí)也是通過(guò)其在整個(gè)圖像中的坐標(biāo)信息來(lái)完成調(diào)取,不適合采用索引文件。另一方面由于腦組織中多結(jié)構(gòu)的特點(diǎn),其在三維空間中具有一定的連續(xù)性,所以不能采用二維的方式來(lái)存儲(chǔ)這些連續(xù)圖像。
[0006]在腦科學(xué)研宄中廣泛使用的一些商業(yè)軟件也提出了歸檔三維海量數(shù)據(jù)的解決方案,例如Amira軟件中的Large Data Access (LDA)模塊和Open Inventor可視化開(kāi)發(fā)平臺(tái)中的Large Data Management (LDM)開(kāi)發(fā)包。無(wú)論是LDA或LDM,都將所有的數(shù)據(jù)(不同分辨率水平)歸檔在一個(gè)單一的文檔中,并不適合數(shù)百GB以上數(shù)據(jù)的存儲(chǔ)和傳輸,數(shù)據(jù)歸檔時(shí)也不易實(shí)現(xiàn)并行化。
【發(fā)明內(nèi)容】
[0007]本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種用于三維腦組織高分辨海量圖集的快速提取方法,對(duì)三維腦組織高分辨海量圖集進(jìn)行歸檔,并能從歸檔文件中快速、連續(xù)調(diào)取出感興趣數(shù)據(jù)塊,在不增加硬件投入的情況下大大提高計(jì)算機(jī)系統(tǒng)對(duì)腦科學(xué)研宄中所獲得三維海量圖像數(shù)據(jù)集的處理能力。
[0008]一種適用于三維腦組織高分辨海量圖集的數(shù)據(jù)快速歸檔方法,其特征在于包括以下步驟:
[0009]I)生成歸檔數(shù)據(jù):
[0010]將三維數(shù)據(jù)空間分割為由若干大小相等數(shù)據(jù)塊,所組成的數(shù)據(jù)集D0,每個(gè)數(shù)據(jù)塊的尺寸為X、y、z ;
[0011]將所述三維數(shù)據(jù)空間進(jìn)行等比例三維采樣,分割為由若干大小相等數(shù)據(jù)塊所組成的低分辨數(shù)據(jù)集Dl,每個(gè)數(shù)據(jù)塊的尺寸也為X、y、z ;
[0012]由此類(lèi)推,進(jìn)行η次等比例三維采樣,獲得η+1套具有不同分辨率水平的數(shù)據(jù)集D0、D1、D2、D3-Dn,組成每個(gè)數(shù)據(jù)集的數(shù)據(jù)塊的尺寸均為x、y、z ;
[0013]將所有數(shù)據(jù)塊保存為獨(dú)立數(shù)據(jù)文檔,并根據(jù)路徑自索引結(jié)構(gòu)進(jìn)行存儲(chǔ);
[0014]建立參數(shù)文件,參數(shù)文件記錄原始數(shù)據(jù)體素分辨率,每塊數(shù)據(jù)塊的尺寸,每次采樣的倍數(shù);
[0015]2)提取歸檔數(shù)據(jù):
[0016]通過(guò)參數(shù)文件所提供的體素分辨率、數(shù)據(jù)塊尺寸、采樣倍數(shù)的信息,所需感興趣區(qū)域的Χ、γ、ζ的起始坐標(biāo)和終止坐標(biāo),以及所需分辨率等級(jí)數(shù)這6組參數(shù),計(jì)算出包含所述感興趣區(qū)域所需的最少數(shù)據(jù)塊;
[0017]依次將感興趣區(qū)域所需的數(shù)據(jù)塊的獨(dú)立數(shù)據(jù)文檔讀入內(nèi)存,但僅保留感興趣區(qū)域的數(shù)據(jù)點(diǎn);
[0018]所有保留在內(nèi)存中的數(shù)據(jù)點(diǎn)與讀入內(nèi)存的數(shù)據(jù)塊的獨(dú)立數(shù)據(jù)文檔組成感興趣的數(shù)據(jù)空間。
[0019]步驟I)中所述的獨(dú)立的數(shù)據(jù)文檔所采用的格式為三維圖像存儲(chǔ)格式。
[0020]步驟I)中所述的自索引結(jié)構(gòu)為一種四層路徑結(jié)構(gòu),每一層定義為:
[0021]第一層為根目錄;
[0022]第二層為分辨率等級(jí),用文件夾名稱(chēng)區(qū)分;
[0023]第三層為Z方向,即原三維圖集軸向的塊索引號(hào),用文件夾名稱(chēng)區(qū)分;
[0024]第四層為X或Y方向的塊索引號(hào),用文件夾名稱(chēng)區(qū)分,每個(gè)文件夾中包含相關(guān)的數(shù)據(jù)塊所對(duì)應(yīng)的數(shù)據(jù)文檔,文檔名中包含X、Y和Z的塊索引編號(hào)。
[0025]本發(fā)明的主要特點(diǎn)為:可以對(duì)三維腦組織高分辨海量圖集進(jìn)行歸檔,無(wú)需索引文件便可從歸檔文件中快速、連續(xù)調(diào)取出感興趣數(shù)據(jù)塊。在存儲(chǔ)能力允許的情況下,普通臺(tái)式計(jì)算機(jī)應(yīng)用本發(fā)明,至少可實(shí)現(xiàn)1TB海量數(shù)據(jù)的處理能力。此外,本發(fā)明中建立和提取文檔的過(guò)程具有并行性,可以通過(guò)應(yīng)用并行計(jì)算作進(jìn)一步加速。
【附圖說(shuō)明】
[0026]圖1是本發(fā)明生成歸檔數(shù)據(jù)示意圖;
[0027]圖2是本發(fā)明三維小塊的自索引組織形式示意圖;
[0028]圖3是本發(fā)明調(diào)用感興趣三維區(qū)域時(shí)的示意流程圖。
【具體實(shí)施方式】
[0029]本發(fā)明一種適用于三維腦組織高分辨海量圖集的數(shù)據(jù)快速提取方法,通過(guò)對(duì)二維連續(xù)序列圖進(jìn)行多分辨率拆分為三維小塊的方式,并按照自索引方式建立文件夾組織形式和文件名命名方式,通過(guò)提供所要調(diào)用的三維塊的坐標(biāo)信息和分辨率等級(jí),調(diào)用三維小塊并計(jì)算得到該區(qū)域三維塊。從而完成三維腦組織高分辨海量圖集的數(shù)據(jù)歸檔和調(diào)用。
[0030]下面結(jié)構(gòu)附圖及實(shí)施方式對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。
[0031]如圖1所示,本實(shí)施例提供的三維腦組織高分辨海量圖集的數(shù)據(jù)歸檔方法,可以包括以下步驟:
[0032]1.生成歸檔數(shù)據(jù)。
[0033]二維圖形序列可以看成一個(gè)三維的圖像堆棧。首先將整個(gè)三維圖像堆棧拆分為多個(gè)大小為512 X 512 X 512像素的三維數(shù)據(jù)塊(簡(jiǎn)稱(chēng)三維小塊),形成數(shù)據(jù)集DO ;然后將原來(lái)的二維圖像序列每張X、Y方向各采樣2倍,每?jī)蓮垐D像抽取一張,然后再對(duì)新的圖像序列進(jìn)行拆分,獲得多個(gè)大小為512X512X512像素的三維小塊,形成數(shù)據(jù)集Dl ;以此類(lèi)推,直到X、Y、Z三個(gè)方向的大小采樣到均小于等于512像素,形成DCKDl-Dn總共η+1套不同分辨率的數(shù)據(jù)集。生成的示意圖可以參考圖1。
[0034]上述拆分成的512X512X512大小的三維小塊,保存為三維的TIFF格式,但也可以是RAW等三維矩陣格式,甚至是視頻格式。在調(diào)用數(shù)據(jù)的時(shí)