專利名稱:基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種圖像的檢索方法,特別是一種屬于醫(yī)學(xué)圖像的檢索方 法。具體涉及一種基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。
(二)
背景技術(shù):
隨著醫(yī)學(xué)影像設(shè)備的不斷發(fā)展,臨床上產(chǎn)生的多種模態(tài)的醫(yī)學(xué)影像數(shù)據(jù)越來 越多,對影像內(nèi)容的描述也變得越來越豐富,產(chǎn)生的特征數(shù)據(jù)集的維數(shù)也隨之不 斷增高。在基于內(nèi)容的醫(yī)學(xué)圖像檢索(Content-based Medical Image Retrieval, CBMIR)中,對醫(yī)學(xué)影像內(nèi)容的描述通常用特征向量的形式來表示,為了盡可 能準(zhǔn)確、全面地描述圖像信息,這些特征向量往往是從圖像中抽取出來的幾十維 甚至上百維的高維特征向量,這對數(shù)據(jù)庫的組織、索引、基于距離函數(shù)的相似性 度量以及檢索都是很大的挑戰(zhàn),即所謂的維數(shù)災(zāi)難。事實上,對于某一特定的高 維特征向量集合,以及它們所張成的高維空間,這些高維向量的重要程度是不同 的,其間仍然存在著很大的冗余。因此,通過降維技術(shù)去除次要信息的特征向量 以及相關(guān)性較強的特征向量,并保持其內(nèi)在結(jié)構(gòu)是CBMIR研究的關(guān)鍵問題之一。
流形學(xué)習(xí)是一種非線性的維數(shù)縮減方法,它的本質(zhì)是將高維空間中的數(shù)據(jù)映 射到一個低維的非線性子空間(即低維流形),從而實現(xiàn)降維。局部線性嵌入 (locally linear embedding, LLE)算法是S.T.Roweis和L.K.Saul.在2000年提出的 一種非線性流形降維方法,其用于醫(yī)學(xué)圖像特征降維的基本思想是利用局部線性 重建反映高維數(shù)據(jù)空間中的非線性結(jié)果,使降維后的數(shù)據(jù)保持原始空間的拓撲結(jié) 構(gòu)。傳統(tǒng)局部線性嵌入-LLE算法中最核心的問題是求取使重建誤差最小的近鄰 局部重建權(quán)值矩陣。然而,該算法是針對局部數(shù)據(jù)進行操作,而大多數(shù)的研究者 都采用與歐氏距離有關(guān)的變量來定義該權(quán)值矩陣,默認距離近的點相互影響大而 距離遠的點間影響小,這使得該算法對樣本中的噪音很敏感,此外該算法收斂速 度不夠快。
量子遺傳算法(Quantum Genetic Algorithm, QGA)是量子計算(Quantum Computing)與遺傳算法(Genetic Algorithm, GA)相結(jié)合的產(chǎn)物。以量子計算的概念和理論為基礎(chǔ),用量子位編碼表征染色體,通過量子門旋轉(zhuǎn)更新來完成進 化搜索,能夠表示出解的線性疊加態(tài),獲得更好的種群多樣性、更快的收斂速度 和全局尋優(yōu)的能力。但到目前為止,還沒有人將該算法應(yīng)用于局部線性嵌入降維 的優(yōu)化方面。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種可以降低噪聲點對樣本數(shù)據(jù)的影響,提高運行速 度的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。 本發(fā)明的目的是這樣實現(xiàn)的
1、 提出査詢請求首先由用戶通過査詢接口向醫(yī)學(xué)圖像數(shù)據(jù)庫提出査詢目 標(biāo)圖像的查詢請求,所述的醫(yī)學(xué)圖像數(shù)據(jù)庫是圖像入庫時,將各序列的關(guān)鍵圖像 統(tǒng)一轉(zhuǎn)換為512X512大小的JPG格式圖像構(gòu)成醫(yī)學(xué)圖像數(shù)據(jù)庫;
2、 提取高維醫(yī)學(xué)圖像特征查詢處理模塊根據(jù)請求提取目標(biāo)圖像和醫(yī)學(xué)圖 像數(shù)據(jù)庫中每幅圖像的72維灰度特征和48維紋理特征,將這些高維特征以向量 的形式存入高維特征向量庫;
3、 基于量子遺傳優(yōu)化的降維對描述圖像內(nèi)容的高維特征進行基于量子遺 傳優(yōu)化的降維,得到32維低維特征子集;
4、 相似性度量通過相似性度量將檢索結(jié)果返回給用戶。 本發(fā)明還可以包括
1、所述的基于量子遺傳優(yōu)化的降維的方法為
(1) 醫(yī)學(xué)圖像特征向量高維空間/^中的W個Z)維隨機向量",X2,…;cJ, x^iT,通過降維把它們映射到低維空間^中,得到降維后的輸出向量乂 ,
e [1, W] , d《Z);
計算每一個樣本點即特征向量jc,的;t個最近鄰點;對高維空間中的樣本點;c,, 計算該點與其他W-1個樣本點之間的距離,將距離排序,選擇前A:個與x,最近 的點作為其鄰近點;
(2) 由每個樣本點的近鄰點計算出該樣本點的局部重建權(quán)值矩陣『;用每 個特征向量的近鄰點對該特征向量進行重建,求取使重建誤差最小的近鄰局部重 建權(quán)值矩陣^。
G)保持上步求取的權(quán)值『不變,求Xi在低維嵌入空間的輸出特征向量y,;為了使輸出數(shù)據(jù)在低維空間保持高維空間原有的拓撲結(jié)構(gòu)需構(gòu)造一個代價函數(shù), 映射過程中必須使代價函數(shù)值達到最小,該函數(shù)形式為
'=1 7 = 1
其中,y,是x,的輸出向量,乂, 01,2,…,"是》,,的A個近鄰點; 為使低維重構(gòu)誤差最小化同樣也要滿足兩個約束條件 1) Y,是一個平移不變量,即^.=0;
2 )為了避免產(chǎn)生退化解需使= / ,其中N是數(shù)據(jù)點的個數(shù),/是"xd 的單位矩陣;
對e(r)進行求解,求取的最優(yōu)解^可以使得代價函數(shù)sO0達到最小值;
構(gòu)造一個WxW的稀疏矩陣『,W,(:1,2,…,7V)可以存儲在其中,當(dāng)、是;c,的
近鄰點時,R;=W .,否則,^,,=0。 此時誤差代價函數(shù)式可改寫為
其中,M—M,.,)是一個WxW的對稱矩陣,其表達式為
似=(/一『/(/一『)
利用Lagrange乘子法轉(zhuǎn)化為在丄^X =/條件下的特征值和特征向量的問
題(M-八)77'=0,艮卩Ma"";
要最小化代價函數(shù),則取M的最小d個特征值對應(yīng)的向量為列向量組成矩
陣y,則r的列向量即為"維空間的降維向量表示。
2、所述的求取使重建誤差最小的近鄰局部重建權(quán)值矩陣的方法為
1) 初始化種群初始化醫(yī)學(xué)圖像特征高維向量中包含7V個個體的種群
其中《C/、l,2,…A0為種群中第f代的第J個個體,種群中
全部染色體的所有基因a、 e都被初始化為1/W,這意味著一個染色體所表達 的是其全部可能狀態(tài)的等概率疊加;
2) 對種群中的個體進行測量對初始種群中的個體進行一次測量以獲得一組確定的解尸。={",其中《(_/ = l,...,AO是第f代種群中的第j個
個體的測量值,其表現(xiàn)形式為量子為數(shù)目即染色體長度為附的二進制字符串; 其中每-"位為0或1是根據(jù)量子比特的概率| ,(|2或|/ /|2 (/ = 1,...,附)測量得到的;
具體實現(xiàn)方法為隨機產(chǎn)生[o,i]上的一個數(shù)e,若^>|";|2,則"中相應(yīng)的位取
值為1,否則取值為0;
3) 評價二進制染色體種群p(r)并保留最優(yōu)解用適應(yīng)度評價函數(shù)評價種群
尸(r)中每個染色體,并保留此代中的最優(yōu)解;如算法獲得滿意解,算法停止; 否則,轉(zhuǎn)入步驟4)繼續(xù)進行;
4) 量子遺傳操作使用量子旋轉(zhuǎn)門f/②更新P(r);
5) 改變進化代數(shù)進化代數(shù)加1,如仍未滿足最大進化代數(shù)rm^,算法轉(zhuǎn)
至歩驟2)繼續(xù)進行。
3、 所述的相似性度量的方法為直方圖的交,
假設(shè)/和2是兩個含有W個biri的顏色直方圖,則它們之間的相交距離用下 式表示
|>11(/" 2》
產(chǎn)l
直方圖的相交是指兩個直方圖在每個bin中共有的像素數(shù)量;有時,該值還 可以通過除以其中一個直方圖中所有的像素數(shù)量來實現(xiàn)標(biāo)準(zhǔn)化,從而使其值處于的值域范圍,如下式所示
s(/,e)《min(/^)/i:;x
4、 所述的相似性度量的方法為余弦距離法-
s(/,e)=/7'*2/(imi*iieii)
其中,I和Q分別表示查詢圖像和數(shù)據(jù)庫中圖像的特征向量,ih哮示向量范數(shù),
計算得到的相似性度量值在[o, l]之間,該值越大,表示圖像越相似。
5、 所述的相似性度量的方法,對于組合特征,相似性度量定義為各個特征 相似性度量的加權(quán)和,其公式為<formula>formula see original document page 10</formula>表示由m個特征組合而成,其中^表示第7'個 特征的權(quán)重系數(shù),它表示第y個特征的重要性, 一般取各,相等,又S,(/,0表
示第/個特征的相似性度量函數(shù)值。
本發(fā)明將量子遺傳算法應(yīng)用于局部線性嵌入降維的優(yōu)化。 局部線性嵌入(LLE)方法
LLE算法有一個前提假設(shè)采樣數(shù)據(jù)所在的低維流形在局部是線性的,即每 個采樣點可以用它的近鄰點線性表示。
該算法的學(xué)習(xí)目標(biāo)是在低維空間中保持每個鄰域中的權(quán)值不變,即假設(shè)嵌 入映射在局部是線性的條件下,最小化重構(gòu)誤差。
設(shè)有高維空間i D中的TV個D維隨機向量",X2,…xJ ,通過降維把它們映射 到低維空間W中,得到降維后的輸出向量乂, , = 1,2,…,W, "<<Z)。通常希望能 夠用顯示的映射F來表示,但當(dāng)U》是非線性結(jié)構(gòu)時,求出顯示映射P相當(dāng)困難。 基于流形學(xué)習(xí)的原理,可以將非線性結(jié)構(gòu)的局部用線性結(jié)構(gòu)來近似,即可以將非 線性結(jié)構(gòu)的降維分解為局部的線性降維。這就是LLE算法的基本原理,該算法 的主要步驟如下。
(1) 計算每一個樣本點(特征向量)x,的k個最近鄰點。對高維空間中的樣本 點x,,計算該點與其他TV- 1個樣本點之間的距離,將距離排序,選擇前A:個與x,
最近的點作為其鄰近點。
(2) 由每個樣本點的近鄰點計算出該樣本點的局部重建權(quán)值矩陣『。用每個特 征向量的近鄰點對該特征向量進行重建,求取使重建誤差最小的近鄰局部重建權(quán) 值矩陣。
定義重建擬合誤差函數(shù)如下
<formula>formula see original document page 10</formula>
其中,s(y",2,…,的為;c,的第7個近鄰點,、是x,與x(,之間的權(quán)值在滿足以下
兩個約束條件時,通過最小化誤差函數(shù)得到局部重建權(quán)值矩陣,即由樣本點的近 鄰點,構(gòu)造出最優(yōu)『矩陣使誤差函數(shù)值達到最小。
a)每一個數(shù)據(jù)點《都只能由它的鄰近點來表示,若x,不是近鄰點,則w7 = 0 ;b)權(quán)值矩陣的每一行的和為1,即滿足歸一化約束1^=1。
片1
G)保持權(quán)值『不變,求;c,在低維嵌入空間的輸出特征向量y,。為了使輸出數(shù)
據(jù)在低維空間保持高維空間原有的拓撲結(jié)構(gòu)需構(gòu)造一個代價函數(shù),映射過程中必 須使代價函數(shù)值達到最小。該函數(shù)形式為-
i>,& ii2
'=1 y=l
其中,y,是 的輸出向量,A(X,2,…力是y,的A個近鄰點。 為使低維重構(gòu)誤差最小化同樣也要滿足兩個約束條件
a) y,是一個平移不變量,即!>,.=0;
b) 為了避免產(chǎn)生退化解需使^f凡少/ = / ,其中W是數(shù)據(jù)點的個數(shù),/ 是dxd的單位矩陣。
此時,對s(J0進行求解,求取的最優(yōu)解y,可以使得代價函數(shù)sOO達到最小值。
構(gòu)造一個WxW的稀疏矩陣ff , ;(, = 1,2,一^)可以存儲在其中,當(dāng)x,是;c,的近鄰 點時,R, =w ,否則,K,,=0。 此時誤差代價函數(shù)式可改寫為
/=1 乂=1
其中,似=(似,:,)是一個7^^的對稱矩陣,其表達式為
Af = (/ —『/■(/ —『)
利用Lagmnge乘子法可轉(zhuǎn)化為在丄fx =/條件下的特征值和特征向量的
問題(M-A)yr=0,艮卩Mor"or。
要最小化代價函數(shù),則取M的最小c/個特征值對應(yīng)的向量為列向量組成矩 陣y,則F的列向量即為J維空間的降維向量表示。
量子遺傳智能優(yōu)化算法
傳統(tǒng)局部線性嵌入-LLE算法中最核心的問題是求取使重建誤差最小的近鄰 局部重建權(quán)值矩陣,然而,該算法是針對局部進行操作,大多數(shù)的研究者都采用與歐氏距離有關(guān)的變量來定義該權(quán)值矩陣,默認距離近的點相互影響大而距離遠 的點間影響小,這使得該算法對樣本中的噪音很敏感,此外該算法收斂速度不夠 快。量子遺傳智能優(yōu)化算法建立在量子態(tài)矢量表述基礎(chǔ)上,將量子比特的幾率幅 表示應(yīng)用于染色體的編碼,使得一條染色體可以表達多個態(tài)的疊加,并利用量子 旋轉(zhuǎn)門實現(xiàn)染色體的更新操作,從而實現(xiàn)了目標(biāo)的優(yōu)化求解。所以,本發(fā)明利用 量子遺傳算法從數(shù)據(jù)間的本征特性出發(fā),尋找使醫(yī)學(xué)圖像特征向量降維重建誤差 最小的權(quán)重值,從而達到符合使誤差函數(shù)最小的目的。
本發(fā)明將LLE算法中樣本點與其臨近點的重建權(quán)值集合構(gòu)造為量子遺傳算 法的量子染色體,然后量子遺傳中的個體在尋優(yōu)的過程中找到最優(yōu)位置,最終得 到近鄰局部重建權(quán)值矩陣。 (1)量子比特編碼
在量子遺傳算法中,染色體用量子比特來表示,或者說是用隨機概率方式表 示。量子比特是一個雙態(tài)量子系統(tǒng),與經(jīng)典位的不同之處在于, 一個量子比特除 了處于量子位的兩個基本態(tài)0態(tài)或1態(tài)外,還可以同時處在O, l兩個本征態(tài)的迭加 狀態(tài), 一個量子比特狀態(tài)可以表示為-
其中,"和"表示相應(yīng)態(tài)出現(xiàn)的概率幅。對量子比特測量時得到O的概率為
1 |2,得到l的概率為l-l2。 二者滿足歸一化條件1"12+1/3|2=1。所以,在QGA中,/ 個量子比特的概率幅可表示為
《,=
卜"2、
〃2…-,
則w個/位基因構(gòu)成的一個染色體可以表示為
仏'=
"12a21"22a2, m2、
/ 21A2A,
其中,z表示此染色體的編號,z表示此染色體當(dāng)前進化的代數(shù),w表示染色體 基因的個數(shù),/表示基因里量子比特的個數(shù)。因此,如果存在一個具有w個量子比
特位的系統(tǒng),則該系統(tǒng)能同時表達2"個狀態(tài)。 (2)量子旋轉(zhuǎn)門在量子遺傳算法中,遺傳操作主要是將構(gòu)造的量子門c/("作用于量子疊加態(tài)
或糾纏的基態(tài),使其相互干涉,相位發(fā)生改變,從而改變各基態(tài)的概率幅。在本 發(fā)明中,量子門主要采用量子旋轉(zhuǎn)門,通過量子旋轉(zhuǎn)門可以實現(xiàn)染色體的調(diào)整, 其調(diào)整操作如下
在
cos《 —sin《 sin《 cos《
式中(",,a)為第/個量子比特,a為旋轉(zhuǎn)角,其幅度影響收斂速度,但是如果其
幅度太大,會導(dǎo)致早熟,因此,《的大小和方向本文根據(jù)通用的、與問題無關(guān) 的調(diào)整策略確定。
(3)適應(yīng)度評價函數(shù) 適應(yīng)度評價函數(shù)是衡量個體優(yōu)劣的標(biāo)志,其作用類似于度量自然界中生物適 應(yīng)環(huán)境的能力。本發(fā)明根據(jù)醫(yī)學(xué)圖像特征向量作為個體模型的特殊性,所采用的 適應(yīng)度評價函數(shù)為-
乂=1
式中,M^.表示種群中第i代的第y個個體,iV表示種群中個體的數(shù)量。
本發(fā)明對醫(yī)學(xué)圖像檢索中高維特征向量的降維情況進行了研究,采用基于量 子遺傳優(yōu)化的流形降維方法實現(xiàn)了醫(yī)學(xué)圖像的有效檢索。
量子遺傳算法比傳統(tǒng)遺傳算法擁有更好的種群多樣性和更少的種群規(guī)模,并 且,由于其采用量子比特編碼也可以獲得較好的收斂性。因而,本發(fā)明利用量子
遺傳算法從數(shù)據(jù)間的本征特性出發(fā),尋找在醫(yī)學(xué)圖像特征向量降維中使重建誤差 最小的權(quán)重值,從而使得醫(yī)學(xué)圖像檢索在保證精度的條件下達到較快的檢索速
為了更好的發(fā)現(xiàn)醫(yī)學(xué)圖像檢索中基于流形的非線性降維方法的本征維數(shù),并 尋找使誤差函數(shù)最小的權(quán)值矩陣,本發(fā)明提出了基于量子遺傳優(yōu)化的流形降維醫(yī) 學(xué)圖像檢索方法。在本發(fā)明中,對LLE非線性降維方法進行了改進,引入量子 遺傳優(yōu)化局部重建權(quán)值矩陣,降低了噪聲點對樣本數(shù)據(jù)的影響,提高了算法收斂 速度,提高了醫(yī)學(xué)圖像檢索速度和精度。(四)
圖1.量子遺傳優(yōu)化算法流程圖; 圖2.醫(yī)學(xué)圖像檢索系統(tǒng)原理圖。
(五)
具體實施例方式
下面結(jié)合附圖舉例對本發(fā)明做更詳細地描述
本發(fā)明針對不同解剖部位及各類不同疾病的多模態(tài)醫(yī)學(xué)影像進行檢索研究, 選取2種模態(tài)(CT與MR), 3種解剖部位(腦、胸、腹),6種疾病(血腫、垂 體瘤、乳腺癌、肺癌、胰腺癌、膀胱癌)共約800個病例的影像資信與正?;蚱?他非正常資料共約IOOO例來構(gòu)成研究數(shù)據(jù)庫。圖像入庫時,各序列的關(guān)鍵圖像 統(tǒng)一轉(zhuǎn)換為512X512大小的JPG格式圖像。首先由用戶通過査詢接口提出査詢 請求(目標(biāo)圖像),查詢處理模塊根據(jù)請求提取目標(biāo)圖像和圖像數(shù)據(jù)庫中每幅圖像 的72維灰度特征和48維紋理特征,這些高維特征以向量的形式存入高維特征向 量庫;然后,對描述圖像內(nèi)容的高維特征進行基于量子遺傳優(yōu)化的降維,得到 32維低維特征子集;通過相似性度量將檢索結(jié)果返回給用戶。系統(tǒng)結(jié)構(gòu)框圖如 圖2所示,具體實施方法如下-
1. 提取高維醫(yī)學(xué)圖像特征
對醫(yī)學(xué)圖像進行檢索,首先要自動抽取圖像特征,建立特征索引庫。灰度特 征相對幾何體特征而言,具有一定的穩(wěn)定性,對大小,方向都不敏感,表現(xiàn)出相 當(dāng)強的魯棒性,因此是醫(yī)學(xué)圖像檢索最常用的特征之一。由于人體各器官組織的 紋理結(jié)構(gòu)具有一定的區(qū)別,并且,同一器官組織的紋結(jié)構(gòu)相當(dāng)明顯,因此,對醫(yī)
學(xué)圖像進行檢索也常選取紋理特征。
本發(fā)明提取醫(yī)學(xué)圖像的灰度和紋理特征,其中,提取的HSV顏色(灰度) 特征為72維,Gabor紋理特征為48維,因此檢索的聯(lián)合特征向量為72+48=120 維。
2. 基于量子遺傳優(yōu)化的特征向量的流形降維
(1)設(shè)醫(yī)學(xué)圖像特征向量高維空間/^中的iV個D維隨機向量k,x,,…;cj,
;c,.ei^,通過降維把它們映射到低維空間i "中,得到降維后的輸出向量y,, 計算每一個樣本點(特征向量)x,的A個最近鄰點。對高維空間中的樣本點x,,計算該點與其他iV- 1個樣本點之間的距離,將距離排序,選擇前/t個與x,最 近的點作為其鄰近點。
(2)由每個樣本點的近鄰點計算出該樣本點的局部重建權(quán)值矩陣『。用每個特 征向量的近鄰點對該特征向量進行重建,求取使重建誤差最小的近鄰局部重建權(quán) 值矩陣。
定義重建擬合誤差函數(shù)如下
s,)=iik,i>,~.ii2
其中,x,01,2,…,/t)為x,的j個近鄰點,^,是^與^之間的權(quán)值。
在滿足以下兩個約束條件時,通過最小化誤差函數(shù)得到局部重建權(quán)值矩陣, 即由樣本點的近鄰點,構(gòu)造出最優(yōu)『矩陣使誤差函數(shù)值達到最小。
1 )每一個數(shù)據(jù)點x,都只能由它的鄰近點來表示,若X,不是近鄰點,則w, = 0 ;
2)權(quán)值矩陣的每一行的和為1,即滿足歸一化約束gw,, = 1 。
在求取最優(yōu)『矩陣的過程中本發(fā)明將LLE算法中樣本點與其臨近點的重建 權(quán)值向量集合構(gòu)造為量子遺傳算法的量子染色體,然后量子遺傳中的個體在尋優(yōu) 的過程中找到最優(yōu)位置,最終得到近鄰局部重建權(quán)值矩陣。
1) 初始化種群初始化醫(yī)學(xué)圖像特征高維向量中包含W個個體的種群 2(r) = W,其中《(j、l,2,…A0為種群中第,代的第y個個體。種群中 全部染色體的所有基因a、 e都被初始化為1/A,這意味著一個染色體所表達 的是其全部可能狀態(tài)的等概率疊加。
2) 對種群中的個體進行測量對初始種群中的個體進行一次測量以獲得一 組確定的解戶。=沐,其中《0:1,…,7V)是第,代種群中的第y個
個體的測量值,其表現(xiàn)形式為量子為數(shù)目即染色體長度為W的二進制字符串。
其中每一位為o或i是根據(jù)量子比特的概率Kf或l/ /f ( / = l,...,w )觀糧得到的。
具體實現(xiàn)方法為隨機產(chǎn)生
上的一個數(shù)e,若6>卜,'|2,則"中相應(yīng)的位取 值為1,否則取值為0;3) 評價二進制染色體種群p(r)并保留最優(yōu)解用適應(yīng)度評價函數(shù)評價種群 尸(r)中每個染色體,并保留此代中的最優(yōu)解。如算法獲得滿意解,算法停止;
否則,轉(zhuǎn)入歩驟4)繼續(xù)進行;
4) 量子遺傳操作使用量子旋轉(zhuǎn)門W"更新尸(r);
5) 改變進化代數(shù)進化代數(shù)加1,如仍未滿足最大進化代數(shù)rm^,算法轉(zhuǎn)
至步驟2)繼續(xù)進行。
按照以上步驟即可求取最優(yōu)近鄰局部重建權(quán)值矩陣『。
(3)保持上步求取的權(quán)值『不變,求X,在低維嵌入空間的輸出特征向量y,。為
了使輸出數(shù)據(jù)在低維空間保持高維空間原有的拓撲結(jié)構(gòu)需構(gòu)造一個代價函數(shù),映 射過程中必須使代價函數(shù)值達到最小。該函數(shù)形式為<formula>formula see original document page 16</formula>其中,y,是、的輸出向量,力01,2,…,/t)是x的/l個近鄰點。 為使低維重構(gòu)誤差最小化同樣也要滿足兩個約束條件
1) y,是一個平移不變量,即|;々=0;
2) 為了避免產(chǎn)生退化解需使<formula>formula see original document page 16</formula>,其中N是數(shù)據(jù)點的個數(shù),/是dxd 的單位矩陣。
此時,對s(r)進行求解,求取的最優(yōu)解;;,可以使得代價函數(shù)S(10達到最小值。 構(gòu)造一個WxW的稀疏矩陣『,A(,、1,2,…,W)可以存儲在其中,當(dāng)x,是;c,的近鄰 點時,^ ,=,,否則,Wj = 0 。
此時誤差代價函數(shù)式可改寫為<formula>formula see original document page 16</formula>
其中,M—M,》是一個WxW的對稱矩陣,其表達式為<formula>formula see original document page 16</formula>利用Lagrange乘子法可轉(zhuǎn)化為在1^X =/條件下的特征值和特征向量的
問題0W —A)"'=0,艮卩Mo^/la。
要最小化代價函數(shù),則取M的最小d個特征值對應(yīng)的向量為列向量組成矩 陣r,則r的列向量即為"維空間的降維向量表示。
3. 相似性度量
對醫(yī)學(xué)圖像數(shù)據(jù)庫中的圖像和待檢索圖像進行特征向量降維后就可以用該 低維特征向量來表征對應(yīng)的圖像,然后需要對待檢索圖像和數(shù)據(jù)庫中圖像進行相 似度測量,本發(fā)明采用如下相似測度方法
(1) 直方圖的交
假設(shè)/和g是兩個含有iV個bin的顏色直方圖,則它們之間的相交距離用下 式表示
直方圖的相交是指兩個直方圖在每個bin中共有的像素數(shù)量。有時,該值還 可以通過除以其中一個直方圖中所有的像素數(shù)量來實現(xiàn)標(biāo)準(zhǔn)化,從而使其值處于
的值域范圍,如下式所示
豐e)《m《e》/2:》
(2) 余弦距離法
5(/,2)=/、/(||/||*||冊
其中,I和Q分別表示査詢圖像和數(shù)據(jù)庫中圖像的特征向量,1HI表示向量范數(shù)。 計算得到的相似性度量值在[O, l]之間,該值越大,表示圖像越相似。
對于組合特征,相似性度量定義為各個特征相似性度量的加權(quán)和。其公式為: S(/,2) = Z:%*^(/,0,表示由w個特征組合而成,其中w,表示第j'個
特征的權(quán)重系數(shù),它表示第j'個特征的重要性, 一般取各w,相等。又^(/,2)表
示第_/個特征的相似性度量函數(shù)值。
4. 算法的性能評價本發(fā)明采用MPEG-7推薦的檢索性能評價公式來評價本系統(tǒng)的檢索性能,設(shè) 尸w為返回的前W個結(jié)果中的正確率,又設(shè)W為某一具有特定語義含義的圖像集
合?,F(xiàn)給出示例圖像A, G' = l,2,…,M), M為測試系統(tǒng)檢索性能而預(yù)先設(shè)定的 示例圖像個數(shù),存在《e/ ,在對《的一次檢索中系統(tǒng)返回的前7V個結(jié)果為 A,)二1,2,…,A^,那么正確率/ w說)定義如下式所示
前iV個結(jié)果的査全率~(仏)可以用下式表示
硫n
其中,IWII表示圖像集R所含的圖像數(shù)。
査準(zhǔn)率和査全率越高,表明該檢索系統(tǒng)的效果越好。 一般地,査準(zhǔn)率和查全 率是一對矛盾體,當(dāng)要求精度較高時,査全率較低,反之亦然。因此, 一般的檢 索系統(tǒng)只要求在這兩者之間達到一個最優(yōu)的平衡點,就認為達到了較好的檢索性
權(quán)利要求
1、一種基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是(1)提出查詢請求首先由用戶通過查詢接口向醫(yī)學(xué)圖像數(shù)據(jù)庫提出查詢目標(biāo)圖像的查詢請求,所述的醫(yī)學(xué)圖像數(shù)據(jù)庫是圖像入庫時,將各序列的關(guān)鍵圖像統(tǒng)一轉(zhuǎn)換為512×512大小的JPG格式圖像構(gòu)成醫(yī)學(xué)圖像數(shù)據(jù)庫;(2)提取高維醫(yī)學(xué)圖像特征查詢處理模塊根據(jù)請求提取目標(biāo)圖像和醫(yī)學(xué)圖像數(shù)據(jù)庫中每幅圖像的72維灰度特征和48維紋理特征,將這些高維特征以向量的形式存入高維特征向量庫;(3)基于量子遺傳優(yōu)化的降維對描述圖像內(nèi)容的高維特征進行基于量子遺傳優(yōu)化的降維,得到32維低維特征子集;(4)相似性度量通過相似性度量將檢索結(jié)果返回給用戶。
2、 根據(jù)權(quán)利要求1所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是所述的基于量子遺傳優(yōu)化的降維的方法為(1) 醫(yī)學(xué)圖像特征向量高維空間i D中的iV個D維隨機向量^,X2,…JcJ,X,ei 通過降維把它們映射到低維空間/^中,得到降維后的輸出向量乂 ,計算每一個樣本點即特征向量X,的個最近鄰點;對高維空間中的樣本點X,, 計算該點與其他iV-l個樣本點之間的距離,將距離排序,選擇前A個與X,最近 的點作為其鄰近點;(2) 由每個樣本點的近鄰點計算出該樣本點的局部重建權(quán)值矩陣『;用每 個特征向量的近鄰點對該特征向量進行重建,求取使重建誤差最小的近鄰局部重 建權(quán)值矩陣『;G)保持上步求取的權(quán)值『不變,求x,在低維嵌入空間的輸出特征向量y,;為了使輸出數(shù)據(jù)在低維空間保持高維空間原有的拓撲結(jié)構(gòu)需構(gòu)造一個代價函 數(shù),映射過程中必須使代價函數(shù)值達到最小,該函數(shù)形式為<formula>formula see original document page 2</formula>其中,y,是;c,的輸出向量,7,,(7 = 1,2,...,*)是^的*個近鄰點;為使低維重構(gòu)誤差最小化同樣也要滿足兩個約束條件 1) y,是一個平移不變量,即|>,.=0;2)為了避免產(chǎn)生退化解需使=/ ,其中N是數(shù)據(jù)點的個數(shù),/是"的單位矩陣;對^(y)進行求解,求取的最優(yōu)解y,可以使得代價函數(shù)f()O達到最小值; 構(gòu)造一個WxW的稀疏矩陣『,0、1,2,…,W)可以存儲在其中,當(dāng)x,是;c,的近鄰點時,R,;,否則,K,o; 此時誤差代價函數(shù)式可改寫為=結(jié)^力,="歴7.) 其中,似=(似,,)是一個^><^的對稱矩陣,其表達式為M =(/-『)7'(/-『)利用Lagrange乘子法轉(zhuǎn)化為在丄^>,乂 =/條件下的特征值和特征向量的 問題(M—A)f7'=0,艮卩Mq^Aq;;要最小化代價函數(shù),則取M的最小t/個特征值對應(yīng)的向量為列向量組成矩陣r,則r的列向量即為c/維空間的降維向量表示。
3、根據(jù)權(quán)利要求2所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法, 其特征是所述的求取使重建誤差最小的近鄰局部重建權(quán)值矩陣的方法為1) 初始化種群初始化醫(yī)學(xué)圖像特征高維向量中包含iV個個體的種群2(r) = WU(,...,A},其中《C/、1,2,…A0為種群中第M戈的第J個個體,種群中全部染色體的所有基因a 、 e都被初始化為i/v^,這意味著一個染色體所表達的是其全部可能狀態(tài)的等概率疊加;2) 對種群中的個體進行測量對初始種群中的個體進行一次測量以獲得一組確定的解尸(r)—",其中《O一l,...,AO是第H戈種群中的第乂個 個體的測量值,其表現(xiàn)形式為量子為數(shù)目即染色體長度為W的二進制字符串;其中每一位為O或l是根據(jù)量子比特的概率hl或|《| (/ = l,...,m)測量得到的;具體實現(xiàn)方法為隨機產(chǎn)生[O,1]上的一個數(shù)0,若6>>| ,'|2,則《中相應(yīng)的 位取值為1,否則取值為O;3) 評價二進制染色體種群尸(:r)并保留最優(yōu)解用適應(yīng)度評價函數(shù)評價種群尸(r)中每個染色體,并保留此代中的最優(yōu)解;如算法獲得滿意解,算法停止; 否則,轉(zhuǎn)入歩驟4)繼續(xù)進行;4) 量子遺傳操作使用量子旋轉(zhuǎn)門w"更新戶(:r);5) 改變進化代數(shù)進化代數(shù)加l,如仍未滿足最大進化代數(shù)rm^,算法轉(zhuǎn)至步驟2)繼續(xù)進行。
4、根據(jù)權(quán)利要求3所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方 法,其特征是所述的相似性度量的方法為直方圖的交,/和g是兩個含有W個bin的顏色直方圖,它們之間的相交距離用下式表直方圖的相交是指兩個直方圖在每個bin中共有的像素數(shù)量;有時,該值還可以通過除以其中一個直方圖中所有的像素數(shù)量來實現(xiàn)標(biāo)準(zhǔn)化,從而使其值處于[O, l]的值域范圍,如下式所示
5、根據(jù)權(quán)利要求3所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是所述的相似性度量的方法為余弦距離法其中,I和Q分別表示查詢圖像和數(shù)據(jù)庫中圖像的特征向量,IH哮示向量范數(shù), 計算得到的相似性度量值在[O, l]之間,該值越大,表示圖像越相似。
6、根據(jù)權(quán)利要求3所述的基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法,其特征是所述的相似性度量的方法,對于組合特征,相似性度量定義為各個特征相似性度量的加權(quán)和,其公式為s(/,2)=/"e/(imi*.s(/,0 = Z:%*^(/,g),表示由附個特征組合而成,其中^表示第y個特征的權(quán)重系數(shù),它表示第J'個特征的重要性, 一般取各w,相等,又S,(/,g) 表示第/個特征的相似性度量函數(shù)值。
全文摘要
本發(fā)明提供的是一種基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。首先由用戶通過查詢接口向醫(yī)學(xué)圖像數(shù)據(jù)庫提出查詢目標(biāo)圖像的查詢請求;查詢處理模塊根據(jù)請求提取目標(biāo)圖像和醫(yī)學(xué)圖像數(shù)據(jù)庫中每幅圖像的72維灰度特征和48維紋理特征,將這些高維特征以向量的形式存入高維特征向量庫;對描述圖像內(nèi)容的高維特征進行基于量子遺傳優(yōu)化的降維,得到32維低維特征子集;通過相似性度量將檢索結(jié)果返回給用戶。本發(fā)明提出了基于量子遺傳優(yōu)化的流形降維醫(yī)學(xué)圖像檢索方法。在本發(fā)明中,對LLE非線性降維方法進行了改進,引入量子遺傳優(yōu)化局部重建權(quán)值矩陣,降低了噪聲點對樣本數(shù)據(jù)的影響,提高了算法收斂速度,提高了醫(yī)學(xué)圖像檢索速度和精度。
文檔編號G06F17/30GK101546332SQ20091007196
公開日2009年9月30日 申請日期2009年5月7日 優(yōu)先權(quán)日2009年5月7日
發(fā)明者望 叢, 馮耀宇, 呂美超, 金 李, 楊廣達, 洪 梁, 湯連志, 磊 王, 胡文廣 申請人:哈爾濱工程大學(xué)