本發(fā)明屬于圖像處理領(lǐng)域,具體涉及多核函數(shù)融合的哈希學(xué)習(xí)實(shí)現(xiàn)大規(guī)模醫(yī)學(xué)圖像檢索。
背景技術(shù):
圖像檢索技術(shù)指的根據(jù)輸入圖像從圖像數(shù)據(jù)庫中檢索出相匹配的圖像或者同類圖像。已有的技術(shù)主要有三個方面:基于文本的圖像檢索技術(shù)、基于內(nèi)容的圖像檢索技術(shù)、以及文本和圖像相結(jié)合的檢索技術(shù)。基于文本的技術(shù)主要局限在于文本標(biāo)注時(shí)的主觀傾向和語義的局限性。
基于內(nèi)容的圖像檢索技術(shù)是當(dāng)前研究的主流技術(shù),但存在一些技術(shù)難點(diǎn):(1)沒有一種普遍適用的方法可以應(yīng)用于圖像檢索的各個領(lǐng)域;(2)圖像越來越大,維度越來越高,如何解決維度過高而導(dǎo)致計(jì)算量過大的問題仍需大量的研究;(3)相似性度量方法各種各樣,選擇一個合適的度量方法能夠很好的改善檢索結(jié)果,而該度量方法的選擇具有不確定性;(4)對于大規(guī)模的醫(yī)學(xué)圖像數(shù)據(jù),能否在人們可接受的范圍內(nèi)進(jìn)行快速的響應(yīng)。(5)對于大規(guī)模的醫(yī)學(xué)圖像數(shù)據(jù),如何解決存儲空間不足問題。
針對上述五個問題,雖然很多學(xué)者投入了大量的時(shí)間和精力去改善,但是這些方面的改善空間依然很大,仍需努力。核函數(shù)的原理,可以解決維度過高,計(jì)算復(fù)雜等問題;而哈希技術(shù)的出現(xiàn),對于解決大規(guī)模圖像檢索的速度問題和存儲問題提供了良好的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明基于圖像維度過高,計(jì)算復(fù)雜,容易引起“維數(shù)災(zāi)難”問題;圖像規(guī)模大,檢索速度低,存儲量大等問題,提出了一種基于多核哈希學(xué)習(xí)的大規(guī)模醫(yī)學(xué)圖像檢索方法。本發(fā)明運(yùn)用核思想可以解決高維度數(shù)據(jù)的線性不可分問題,避免了“維數(shù)災(zāi)難”問題,大大減少了計(jì)算量,從而節(jié)省了計(jì)算機(jī)資源;使用哈希技術(shù)能夠極大的提高檢索速度,大大減少存儲空間;使用相關(guān)反饋技術(shù)能夠更好的提高檢索精度。
為了實(shí)現(xiàn)上述目的本發(fā)明采用如下技術(shù)方案:
一種基于多核哈希學(xué)習(xí)的大規(guī)模醫(yī)學(xué)圖像檢索方法,包括以下步驟:
步驟一:對圖像庫中的所有圖像進(jìn)行二值化處理,得到預(yù)處理圖像。
步驟二:利用融合的核函數(shù)求出所述預(yù)處理圖像的多核矩陣,所述融合的核函數(shù)為其中n代表核函數(shù)的個數(shù),α代表每個核函數(shù)所占的比重,x,y分別表示圖像庫中的任意兩張醫(yī)學(xué)圖像,K代表融合后的多核矩陣。融合的核函數(shù)是將線性核函數(shù),多項(xiàng)式核函數(shù),高斯核函數(shù),拉普拉斯核函數(shù),指數(shù)核函數(shù),Sigmoid核函數(shù),Cauchy核函數(shù)進(jìn)行線性組合的。
步驟三,用學(xué)習(xí)到的哈希函數(shù)對多核矩陣進(jìn)行統(tǒng)一的哈希編碼,并將編碼后的哈希碼進(jìn)行壓縮存儲到多核矩陣對應(yīng)的哈希碼庫中,學(xué)習(xí)到的哈希函數(shù)為h(x)=sign(K*W),其中K代表融合后的多核矩陣,W表示權(quán)重矩陣,權(quán)重矩陣由服從高斯分布的核矩陣中的t(其中50≤t≤300)個點(diǎn)構(gòu)成,sign表示符號函數(shù),h(x)表示最終生成的二進(jìn)制哈希碼(長度為d)。
在所述哈希編碼過程中,利用符號函數(shù)將大于0的值賦為1,小于等于0的值賦為0,每一張圖像就可以直接由0,1二進(jìn)制串表示,并將這些編碼后的二進(jìn)制碼每8位壓縮為一個值,進(jìn)行存儲,達(dá)到節(jié)省存儲空間的目的。
步驟四,對待檢索圖像進(jìn)行進(jìn)行步驟一、步驟二和步驟三的處理,生成哈希碼并壓縮存儲。
步驟五,使用漢明距離度量方法計(jì)算步驟四的哈希碼與哈希碼庫中存放的哈希碼之間的距離并升序排序,將距離最小的m張圖像返回給用戶,m為大于等于1的整數(shù)。所述漢明距離度量的公式如下:
d(x,y)表示醫(yī)學(xué)圖像x與y的漢明距離,n代表每一張醫(yī)學(xué)圖像的維度,x與y分別表示圖像庫中不同的醫(yī)學(xué)圖像。
在上述方案中,進(jìn)一步包括用戶根據(jù)返回的m張圖像,對返回的每張圖像賦予權(quán)重,重新優(yōu)化排序,輸出圖像的步驟。在對返回的每張圖像賦予權(quán)重的過程中,對返回的每張圖像賦予一定的權(quán)重,權(quán)重區(qū)間為[0,1],其中相似的圖像或者滿足要求的圖像給與的權(quán)重大(比如0.8,0.9,1等),不相似或者不滿足要求的圖像給與的權(quán)重小(比如0,0.1,0.2等)。對于這些獲得權(quán)重的圖像再重新優(yōu)化排序,直到滿足用戶要求為止。
綜上所述,本發(fā)明具有以下有益技術(shù)效果:
1、采用融合的核函數(shù)可以解決圖像維度過高而線性不可分的問題,避免了“維數(shù)災(zāi)難”問題,解決了高維空間中計(jì)算量大,計(jì)算復(fù)雜問題。
2、使用哈希技術(shù)對求出的核矩陣進(jìn)行哈希編碼并壓縮可以解決檢索速度低,存儲量大等問題。
3、效率高,檢索速度快,存儲量小,檢索精度高。有助于醫(yī)生的醫(yī)學(xué)診斷,減少醫(yī)生的工作量,提高工作效率。
4、使用升序排序方法將距離最小的m(本發(fā)明中m取10)張圖像返回給用戶,最后用戶使用相關(guān)反饋技術(shù)對返回的m張圖像進(jìn)行賦權(quán),再重新優(yōu)化排序,直到滿足用戶需求為止,相關(guān)反饋技術(shù),可以改善檢索結(jié)果。
附圖說明
圖1是本發(fā)明的操作流程圖;
圖2是本發(fā)明的系統(tǒng)流程圖;
圖3是本發(fā)明中CT圖像的頭部檢索結(jié)果圖;
圖4是本發(fā)明中CT圖像的肺部檢索結(jié)果圖;
圖5是本發(fā)明中CT圖像的手部檢索結(jié)果圖。
具體實(shí)施方式
在本發(fā)明中,選取合適的核函數(shù)進(jìn)行組合,將數(shù)據(jù)映射到高維的數(shù)據(jù)空間中,解決線性不可分的問題,利用核技術(shù)解決高維特征空間運(yùn)算時(shí)存在的“維數(shù)災(zāi)難”問題。
不同的核函數(shù)有自己優(yōu)勢和不足,不同的核函數(shù)所表現(xiàn)出的特點(diǎn)也各不相同,由它們所構(gòu)成的組合核函數(shù)性能也會有所差別。
核函數(shù)主要分為全局核函數(shù)和局部核函數(shù)。全局核函數(shù)(例如線性核函數(shù))具有全局特性,允許相距很遠(yuǎn)的數(shù)據(jù)點(diǎn)都可以對核函數(shù)的值有影響,而局部核函數(shù)(如高斯核函數(shù))具有局部性,只允許相距很近的數(shù)據(jù)點(diǎn)對核函數(shù)的值有影響。結(jié)合不同核函數(shù)各自優(yōu)勢,本發(fā)明提出了以下一種新的融合的核函數(shù)(其中n代表核函數(shù)的個數(shù),α代表每個核函數(shù)所占的比重,x,y分別表示圖像庫中的任意兩張醫(yī)學(xué)圖像)。通過該式求出核函數(shù),利用從K中選出的t個服從高斯分布的點(diǎn)求出權(quán)重矩陣W。
對于大規(guī)模圖像檢索問題,需要處理的圖像往往是海量并且具有很高的維度,快速地從海量的高維圖像數(shù)據(jù)庫中找到與某幅圖像最相似的一幅或多幅圖像成為了一個難點(diǎn)和熱點(diǎn)問題,因此迫切需要新技術(shù)使得大規(guī)模圖像檢索具有較小的存儲代價(jià)和高效的檢索效率。
而哈希學(xué)習(xí)方法就是最近廣泛研究與應(yīng)用的技術(shù),通過哈希編碼使得相似的圖像具有相似或相同的編碼,并將編碼后的數(shù)據(jù)進(jìn)行壓縮從而獲得較低的存儲代價(jià),同時(shí)通過哈希索引能顯著加快近似近鄰圖像的檢索效率,利用h(x)=sign(K*W)求出哈希碼。然后利用漢明距離計(jì)算方法求出待檢索圖像和圖像庫中圖像的距離,按照升序方式排序。最終將前m(在本實(shí)施例中m取10)個相似圖像返回給用戶,用戶根據(jù)返回的圖像給圖像賦權(quán)重,直到滿足用戶需求為止。
下面詳細(xì)結(jié)合圖1和圖2詳細(xì)說明本發(fā)明的技術(shù)方案:
步驟一:圖像預(yù)處理
為了消除圖像中的無關(guān)信息,恢復(fù)有用的真實(shí)信息,需要對圖像進(jìn)行二值化處理。為了方便后面對圖像的處理和計(jì)算,將圖像大小統(tǒng)一為200*200px。
步驟二:構(gòu)造多核矩陣
使用線性核函數(shù),多項(xiàng)式核函數(shù),高斯核函數(shù),拉普拉斯核函數(shù),指數(shù)核函數(shù),Sigmoid核函數(shù),Cauchy核函數(shù)構(gòu)造處理后的圖像的多核矩陣。使用融合的核函數(shù)求出圖像的多核矩陣(其中n代表核函數(shù)的個數(shù),α代表每個核函數(shù)所占的比重,K代表融合后的多核矩陣,x,y分別表示圖像庫中的任意兩張醫(yī)學(xué)圖像)。
步驟三:哈希編碼
用學(xué)習(xí)到的哈希函數(shù)h(x)=sign(K*W)(其中K由步驟二求得,權(quán)重矩陣W的求解是服從高斯分布的核矩陣中的t(本實(shí)施例中t取50)個點(diǎn)構(gòu)成的矩陣,sign為符號函數(shù))對多核矩陣進(jìn)行統(tǒng)一的哈希編碼,并將編碼后的哈希碼進(jìn)行壓縮存放到多核矩陣對應(yīng)的哈希碼庫中。即利用符號函數(shù)將大于0的值賦為1,小于等于0的值賦為0,每一張圖像就可以直接由0,1二進(jìn)制串表示,并將這些編碼后的二進(jìn)制碼每8位壓縮為一個值,達(dá)到節(jié)省存儲空間的目的。
步驟四:通過步驟一、二、三將待檢索的圖像生成哈希碼并壓縮存儲。
步驟五:返回待檢索圖像的m(在本實(shí)施例中中m取10)張近鄰圖
使用漢明距離度量方法計(jì)算樣本之間的距離并升序排序,將距離最小的m張圖像返回給用戶。
步驟六:使用相關(guān)反饋技術(shù),用戶根據(jù)返回的圖像對其賦予權(quán)重,重新檢索,直到滿足用戶的要求為止。
采用上述方法進(jìn)行檢索的結(jié)果分別參見圖3、圖4和圖5。
顯然,以上所述為本發(fā)明的較佳實(shí)例,并不用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的原則之內(nèi),任何熟悉本領(lǐng)域的技術(shù)人員作出的修改、同等替換和改進(jìn),都應(yīng)視為包含在本發(fā)明的保護(hù)范圍內(nèi)。