專利名稱:最大化平均查準率均值的距離測度優(yōu)化方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于提高圖像檢索性能的距離測度優(yōu)化方法,具體來說涉及一種 最大化平均查準率均值的距離測度優(yōu)化方法。
背景技術(shù):
基于內(nèi)容的圖像檢索(Content-Based Image Retrieval, CBIR)的基本思想是對 圖像的視覺特征進行提取,以視覺特征作為索引來實現(xiàn)較高層次的圖像檢索。CB^技術(shù)可 以為管理圖像數(shù)據(jù)、臨床診斷、醫(yī)學教學等提供支持和幫助。特別地,醫(yī)學圖像中相似病灶 的檢索,可提高臨床診斷的可靠性和相關(guān)信息的完整性。
一般地,CBIR系統(tǒng)為了能讓查詢結(jié)果按照相似度從大到小的順序返回,需在圖像 特征空間中定義一個距離測度或相似性度量來衡量數(shù)據(jù)庫中待查詢圖像與查詢圖像間的 差別,返回結(jié)果時,待查詢圖像按照差別大小的排序。常用的距離測度有歐氏距離、馬氏距 離、柯西距離等。CB^系統(tǒng)的檢索性能很大程度上取決于兩方面1.用于表達圖像內(nèi)容和 語義概念的視覺特征;2.在特征空間中定義的距離測度或相似性度量。CB^系統(tǒng)中通常采 用低層視覺特征,如顏色、紋理、形狀、邊緣等描述圖像內(nèi)容。然而低層視覺特征的描述能力 有限,表達圖像時信息會有損失,因而低層視覺特征一般不能直接表達或反映圖像的高層 語義。這樣,在低層特征空間中,我們難以用上述一般性的距離測度定義一個與語義概念緊 密關(guān)聯(lián)的相似性度量,即存在所謂的“語義鴻溝”,使得CB^系統(tǒng)的檢索性能與實際需求有 一定距離。
關(guān)聯(lián)反饋(Relevance Feedback)禾口足巨離測度學習(Distance Metric Learning) 方法可以用于減小語義鴻溝,提高CB^的檢索性能。關(guān)聯(lián)反饋中用于學習的數(shù)據(jù)難以獲 取,系統(tǒng)需要多次調(diào)整才能達到滿意效果,用戶使用不是非常方便。距離測度學習方法可 依據(jù)事先標注的圖像樣本,建立低層圖像特征和高層語義之間的映射,從而定義反映語義 差別的距離測度,提高檢索性能?,F(xiàn)有的距離測度學習方法,多針對聚類或k近鄰分類問 題設計,其學習目標是為了提高聚類或k近鄰分類的準確率。然而,CB^系統(tǒng)的檢索精度 指標與分類準確率有很大的不同,如平均查準率均值(Mean Average Precision, MAP), NDCG(Normalized DiscountedCumulative Gain),都與數(shù)據(jù)庫中待查詢圖像的排序有關(guān) 系,使用優(yōu)化針對聚類或分類問題設計的目標函數(shù)進行距離測度學習,不一定能得到檢索 性能最佳的距離測度。而且,由于檢索精度指標不是連續(xù)可微的,對其進行優(yōu)化存在一定困 難。發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種最大化平均查準率均值的距離測度優(yōu)化方法,本方法 具有優(yōu)化過程和目標直接,優(yōu)化得到的距離測度能反映圖像的語義差別,用本方法得到的 距離測度可達到更好的圖像檢索性能。
本發(fā)明的目的可通過以下的技術(shù)措施來實現(xiàn)
一種最大化平均查準率均值的距離測度優(yōu)化方法,包括以下步驟
(1)獲取包含查詢圖像-待查詢圖像對集合的圖像數(shù)據(jù)庫;
(2)采用平滑函數(shù)對MAP進行逼近,將其轉(zhuǎn)換為目標函數(shù)并添加正則化項,使得目 標函數(shù)是連續(xù)可微的;
(3)使用圖像數(shù)據(jù)庫中的查詢圖像-待查詢圖像對,對目標函數(shù)采用基于梯度下 降的方法進行優(yōu)化,并重復優(yōu)化過程,取使MAP最大的解作為最優(yōu)的線性變換矩陣;
(4)圖像間距離測度的獲取,包括兩種方式用步驟C3)中的最優(yōu)線性變換矩陣對 圖像數(shù)據(jù)庫中的圖像特征先進行變換,再用變換特征的歐氏距離定義圖像間的距離測度; 或者是用步驟(3)中的最優(yōu)線性變換矩陣定義馬氏距離作為圖像間的距離測度。
所述步驟⑴中的圖像數(shù)據(jù)庫由圖像或圖像區(qū)域特征、圖像類別構(gòu)成。
所述步驟(1)中依據(jù)是否包含相同解剖結(jié)構(gòu)、相同類型病灶等確定圖像對是否相 關(guān),對查詢-待查詢圖像對進行標注。
所述步驟( 中對MAP進行逼近的過程為對給定的查詢圖像,任一待查詢圖像的 排序序號使用Sigmoid型函數(shù)進行平滑逼近,進而得到MAP的平滑逼近。
所述待查詢圖像的排序序號由該待查詢圖像和其他所有待查詢圖像與查詢圖像 之間的距離進行比較確定。
所述步驟(3)中變換矩陣的初始解可為一隨機矩陣或由其他方法得到的變換矩 陣。
所述步驟(3)中采用隨機梯度下降算法來優(yōu)化目標函數(shù)。
本發(fā)明方法相對于現(xiàn)有技術(shù)來說,具有以下的有益效果
1、本方法涉及圖像檢索、統(tǒng)計學習和數(shù)值優(yōu)化等技術(shù),通過統(tǒng)計學習直接優(yōu)化平 均查準率均值(Mean Average Precision, MAP),可用于圖像檢索、聚類分析、數(shù)據(jù)約減等。 本方法主要對標注的圖像數(shù)據(jù)進行統(tǒng)計學習,得到一個線性變換矩陣,將原始特征空間映 射至一個新的更具鑒別力的特征空間,在新的特征空間中以歐氏距離作為圖像相似性度量 進行檢索,達到較高的MAP。
2、本發(fā)明方法直接解線性變換矩陣,無需使用費時的半正定規(guī)劃算法進行求解, 并可通過直接調(diào)整變換矩陣的維數(shù)對原始特征進行維數(shù)約減,而不是對半正定矩陣的秩進 行約束或間接地調(diào)節(jié)正則化參數(shù)實現(xiàn)維數(shù)約減。該方法以檢索精度指標MAP的平滑逼近為 目標函數(shù),相對于其他一些距離測度學習方法,優(yōu)化過程和目標更為直接,映射后的低層圖 像特征與高層語義特征聯(lián)系更為緊密,檢索性能更優(yōu)。在基于內(nèi)容的醫(yī)學圖像檢索應用中, 本發(fā)明比其他一些距離測度學習方法得到的距離測度可達到更好的檢索性能。
3、由于對所有查詢圖像-待查詢圖像對計算目標函數(shù)及梯度的計算量非常大,因 此,本方法中采用隨機梯度下降算法進行優(yōu)化,可減小對計算機內(nèi)存的需求、加快算法收斂 速度;此外,由于目標函數(shù)非凸,解空間中存在很多局部極值點,為避免解陷入局部極值點, 通過其他較快速的距離測度學習方法估計一個較接近最優(yōu)解的初始解,然后多次重復優(yōu)化 過程取最優(yōu)解。
圖1是本發(fā)明的最大化平均查準率均值的距離測度優(yōu)化方法的流程圖2是本發(fā)明優(yōu)化檢索精度指標MAP過程中MAP隨優(yōu)化算法迭代次數(shù)的收斂情況 示意圖3是本發(fā)明與其他距離測度優(yōu)化方法得到的距離測度用于檢索的查全-查準率 曲線;
圖4是四種距離測度在返回圖像為50幅時的查準率均值曲線圖5是使用本發(fā)明優(yōu)化得到的距離測度用于腦部腫瘤Tl加權(quán)增強MRI圖像病檢 索的示例具體實施方式
圖1示出了本發(fā)明的最大化平均查準率均值的距離測度優(yōu)化方法的具體流程,包 括以下步驟
(1)獲取包含人工標注的查詢圖像-待查詢圖像對的集合的圖像數(shù)據(jù)庫;圖像數(shù) 據(jù)庫由圖像或圖像區(qū)域特征、圖像類別構(gòu)成。
(2)采用平滑函數(shù)對MAP進行逼近,將其轉(zhuǎn)換為目標函數(shù)并添加正則化項,使得目 標函數(shù)是連續(xù)可微的;變換矩陣初始解可取一個隨機矩陣或由其他較快速的距離測度學習 方法估計的變換矩陣。對MAP進行逼近的過程為對給定的查詢圖像,任一待查詢圖像的排 序序號使用Sigmoid型函數(shù)進行平滑逼近,進而得到MAP的平滑逼近。
待查詢圖像的排序序號由該待查詢圖像和其他所有待查詢圖像與查詢圖像之間 的距離進行比較確定。
(3)使用圖像數(shù)據(jù)庫中的查詢圖像-待查詢圖像并采用隨機梯度下降算法來優(yōu)化 目標函數(shù),重復優(yōu)化過程,取使MAP最大的解作為最優(yōu)的線性變換矩陣;
(4)圖像間的距離測度用于對圖像進行檢索,步驟(3)中的最優(yōu)線性變換矩陣的 使用方式包括兩種一種是用線性變換矩陣對圖像數(shù)據(jù)庫中的圖像特征先進行變換,再用 變換特征的歐氏距離定義圖像間的距離測度,從而進行圖像查詢;另一種是用線性變換矩 陣定義馬氏距離作為圖像的距離測度進行圖像查詢。
下面結(jié)合腦部Tl加權(quán)增強MRI圖像檢索問題,闡述本發(fā)明的工作原理和步驟。
步驟1,從圖像數(shù)據(jù)庫讀取MRI圖像、圖中腫瘤的病理類型和醫(yī)生手工勾畫的病灶 輪廓,提取病灶區(qū)域灰度、紋理、形狀和邊緣等特征,特征向量表示為Xi。定義包含相同類型 腫瘤的圖像為相關(guān)圖像,否則為不相關(guān)圖像。圖像檢索的任務是將數(shù)據(jù)庫中與查詢圖像中 病灶區(qū)域病理類型相同的圖像返回給用戶。
步驟2,由于MAP與待查詢圖像的排序有關(guān),首先依據(jù)查詢圖像與待查詢圖像之間 的距離確定和逼近每一待查詢圖像的排序序號。設L為一 dXD(dSD)實數(shù)矩陣,半正定 矩陣W = LTL,則之間的馬氏距離(平方)為
Clij = I Lxi-Lxj I2 = (Xi-Xj) tLtL (Xi-Xj) = (X1-Xj)tW (Xi-Xj),
這里工表示矩陣的轉(zhuǎn)置操作。設查詢特征向量為、,查詢-待查詢對為Ov Ixi, i =1,2,. . .,N}),這里N為待查詢圖像總數(shù),待查詢特征向量Xi的排序序號可表達為
權(quán)利要求
1.一種最大化平均查準率均值的距離測度優(yōu)化方法,包括以下步驟(1)獲取包含查詢圖像-待查詢圖像對集合的圖像數(shù)據(jù)庫;(2)采用平滑函數(shù)對MAP進行逼近,將其轉(zhuǎn)換為目標函數(shù)并添加正則化項,使得目標函 數(shù)是連續(xù)可微的;(3)使用圖像數(shù)據(jù)庫中的查詢圖像-待查詢圖像對,對目標函數(shù)采用基于梯度下降的 方法進行優(yōu)化,并重復優(yōu)化過程,取使MAP最大的解作為最優(yōu)的線性變換矩陣;(4)圖像間距離測度的獲取,包括兩種方式用步驟C3)中的最優(yōu)線性變換矩陣對圖像 數(shù)據(jù)庫中的圖像特征先進行變換,再用變換特征的歐氏距離定義圖像間的距離測度;或者 用步驟(3)中的最優(yōu)線性變換矩陣定義馬氏距離作為圖像間的距離測度。
2.根據(jù)權(quán)利要求1所述的最大化平均查準率均值的距離測度優(yōu)化方法,其特征在于 所述步驟(1)中的圖像數(shù)據(jù)庫由圖像或圖像區(qū)域特征、圖像類別構(gòu)成。
3.根據(jù)權(quán)利要求1所述的最大化平均查準率均值的距離測度優(yōu)化方法,其特征在于 所述步驟(1)中的查詢-待查詢圖像對的集合是依據(jù)是否包含相同解剖結(jié)構(gòu)、相同類型病 灶確定圖像對是否相似,進行標注的。
4.根據(jù)權(quán)利要求1所述的最大化平均查準率均值的距離測度優(yōu)化方法,其特征在于 所述步驟O)中以隨機矩陣或其他距離測度學習方法得到的變換矩陣作為線性變換矩陣 的初始解。
5.根據(jù)權(quán)利要求1所述的最大化平均查準率均值的距離測度優(yōu)化方法,其特征在于 所述步驟( 中對MAP進行逼近的過程為對給定的查詢圖像,任一待查詢圖像的排序序號 使用Sigmoid型函數(shù)進行平滑逼近,進而得到MAP的平滑逼近。
6.根據(jù)權(quán)利要求1所述的最大化平均查準率均值的距離測度優(yōu)化方法,其特征在于 所述步驟(3)中采用隨機梯度下降算法來優(yōu)化目標函數(shù)。
全文摘要
本發(fā)明公開了一種最大化平均查準率均值(MAP)的距離測度優(yōu)化方法,包括以下步驟(1)獲取包含查詢圖像-待查詢圖像對集合的圖像數(shù)據(jù)庫;(2)采用平滑函數(shù)對MAP進行逼近,將其轉(zhuǎn)換為目標函數(shù)并添加正則化項,使得目標函數(shù)是連續(xù)可微的;(3)使用圖像數(shù)據(jù)庫中的查詢圖像-待查詢圖像對,采用基于梯度下降的優(yōu)化技術(shù)對目標函數(shù)進行優(yōu)化,并重復優(yōu)化過程,取使MAP最大的解作為最優(yōu)的線性變換矩陣;(4)獲得由最優(yōu)線性變換矩陣定義的距離測度。本方法的具有優(yōu)化過程和目標直接的特點,用本方法得到的距離測度可達到更好的圖像檢索性能。
文檔編號G06F17/30GK102033933SQ20101059454
公開日2011年4月27日 申請日期2010年12月17日 優(yōu)先權(quán)日2010年12月17日
發(fā)明者馮前進, 盧振泰, 陽維, 陳武凡 申請人:南方醫(yī)科大學