專利名稱:凝膠電泳圖像的分割和數(shù)據(jù)挖掘的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供了一種對(duì)基于圖像的信息進(jìn)行自動(dòng)分析和管理的系統(tǒng)和方法。提供了創(chuàng)新的圖像分析(分割)、圖像數(shù)據(jù)挖掘、情境(context)多源數(shù)據(jù)管理方法,這些方法集合起來提供了一種有效的圖像發(fā)現(xiàn)平臺(tái)。
背景技術(shù):
在許多領(lǐng)域尤其是在其中現(xiàn)在要求公司和個(gè)人處理巨量數(shù)字圖像和各種其它類型的數(shù)字?jǐn)?shù)據(jù)的生物制藥學(xué)和生物醫(yī)學(xué)工業(yè)領(lǐng)域,圖像分析和多源數(shù)據(jù)管理正日益成為問題。隨著人類基因組計(jì)劃以及最近的人類蛋白質(zhì)組計(jì)劃的出現(xiàn)以及藥物發(fā)現(xiàn)的領(lǐng)域上的主要進(jìn)步,信息量持續(xù)高速增長(zhǎng)。隨著全自動(dòng)系統(tǒng)被引入高吞吐量圖像分析情境中,該增長(zhǎng)進(jìn)一步成為一個(gè)障礙。比以前更需要用于對(duì)這樣廣闊范圍的數(shù)據(jù)進(jìn)行分析和管理的有效系統(tǒng)。盡管在提供分析和管理方法兩者上已經(jīng)存在許多嘗試,但是很少曾經(jīng)或者設(shè)法將這兩種技術(shù)集成在一個(gè)有效且統(tǒng)一的系統(tǒng)中。與統(tǒng)一發(fā)現(xiàn)平臺(tái)研發(fā)相關(guān)聯(lián)的主要問題主要在三個(gè)方面1)開發(fā)魯棒、自動(dòng)的圖像分割方法上的困難,2)在成像領(lǐng)域缺少有效的知識(shí)管理方法以及不存在情境知識(shí)關(guān)聯(lián)方法,以及3)確實(shí)基于對(duì)象的數(shù)據(jù)挖掘方法的研發(fā)。
本發(fā)明同時(shí)解決了這些問題并且提出了一種獨(dú)一無二的發(fā)現(xiàn)平臺(tái)。與標(biāo)準(zhǔn)圖像分割和分析方法相反,這里所描述的2D凝膠電泳圖像分析描述了一種允許圖像光點(diǎn)(spot)的完全魯棒且自動(dòng)分割的新方法?;谠摲指罘椒?,還描述了基于對(duì)象的數(shù)據(jù)挖掘和分類方法。該主系統(tǒng)提供了用于將這些分割和數(shù)據(jù)挖掘方法結(jié)合地集成為有效的情境多源數(shù)據(jù)集成和管理的手段。
以前已經(jīng)研發(fā)了一些基本方法用于2D圖像內(nèi)的光點(diǎn)分割(4,592,089),但是沒有提供自動(dòng)方法并且因而不能消除由手動(dòng)分割引入的錯(cuò)誤和易變性。諸多公司已經(jīng)研發(fā)了最近的軟件應(yīng)用程序用于2D凝膠電泳圖像的分析,這些軟件應(yīng)用程序確實(shí)提供了某種程度的自動(dòng)性(例如,Phoretix)。但是,這些軟件并沒有適當(dāng)?shù)亟鉀Q低表現(xiàn)光點(diǎn)、光點(diǎn)聚合、圖像假象(artifact)這些關(guān)鍵問題。在沒有適當(dāng)考慮這些問題的情況下,所提供的軟件產(chǎn)生了有偏差且不精確的結(jié)果,這相當(dāng)大地削弱了這些方法的有用性。
在提供圖像數(shù)據(jù)挖掘的方法上也做出了一些嘗試(5,983,237;6,567,551;6,563,959)。然而,這些方法排他地基于特征,這意味著圖像的搜索是通過尋找具有相似的全局特征(諸如紋理、一般邊緣、顏色)的圖像來實(shí)現(xiàn)的。然而,這類圖像內(nèi)容數(shù)據(jù)挖掘沒有提供用于從下述標(biāo)準(zhǔn)檢索圖像的任何方法,所述標(biāo)準(zhǔn)基于感興趣的被確切識(shí)別的精確形態(tài)學(xué)(morphological)或語義特征。
本文所公開的發(fā)明可以涉及和引用受讓人先前所提交的專利申請(qǐng),其公開了關(guān)于計(jì)算機(jī)控制的圖形用戶界面的發(fā)明,用于使用嵌入式圖形對(duì)象(embedded graphical object,EGO)網(wǎng)絡(luò)來歸檔和導(dǎo)航3D圖像。該提交的專利申請(qǐng)具有下述標(biāo)題METHOD AND APPARATUS FOR INTEGRATIVE MULTISCALE3D IMAGE DOCUMENTATION AND NAVIGATION BY MEANS OF AN ASSOCIATIVENETWORK OF MULTIMEDIA EMBEDDED GRAPHICAL OBJECT。
發(fā)明內(nèi)容
在本發(fā)明的一個(gè)實(shí)施例中,本發(fā)明的第一方面是一種新穎的分割方法,被提供來對(duì)2D圖像中類似光點(diǎn)這樣的結(jié)構(gòu)進(jìn)行自動(dòng)分割從而允許基于多個(gè)標(biāo)準(zhǔn)對(duì)所述結(jié)構(gòu)和所述圖像進(jìn)行精確量化和分類,并且還允許自動(dòng)標(biāo)識(shí)一個(gè)或多個(gè)圖像中存在的基于多光點(diǎn)的模式。在優(yōu)選實(shí)施例中,本發(fā)明用于2D凝膠電泳圖像分析,目的是量化蛋白質(zhì)表達(dá),以及用于允許復(fù)雜的基于多蛋白質(zhì)模式的圖像數(shù)據(jù)挖掘以及圖像匹配、注冊(cè)以及自動(dòng)分類。盡管本發(fā)明描述了對(duì)2D圖像自動(dòng)分割的實(shí)施例,應(yīng)該理解本發(fā)明的圖像分析方面還可以應(yīng)用于多維圖像。
本發(fā)明的另一方面是情境多源數(shù)據(jù)集成和管理。該方法提供了在其中稀疏且多種類型的數(shù)據(jù)需要彼此關(guān)聯(lián)并且其中圖像仍為焦點(diǎn)中心點(diǎn)的情境下有效的知識(shí)和數(shù)據(jù)管理。
在優(yōu)選實(shí)施例中,本發(fā)明的每個(gè)方面用在生物醫(yī)學(xué)情況下諸如用在保健、藥物或生物工藝學(xué)工業(yè)情況下。
將結(jié)合某些附圖描述本發(fā)明,這些附圖僅用于說明而非用于限制本發(fā)明優(yōu)選和替代性實(shí)施例的目的,在所述附圖中圖1顯示了總體圖像光點(diǎn)分析和分割方法的流程。
圖2顯示了在圖像分析和情境數(shù)據(jù)集成的處理中操作的基本順序。
圖3圖示了數(shù)據(jù)挖掘和基于對(duì)象的圖像發(fā)現(xiàn)處理所需的操作的基本順序。
圖4圖示了標(biāo)準(zhǔn)多源數(shù)據(jù)集成的示例。
圖5圖示了如當(dāng)前發(fā)明中所描述的情境多源數(shù)據(jù)集成的實(shí)施例。
圖6是交互ROI選擇的簡(jiǎn)圖。
圖7圖示了可視地指示情境數(shù)據(jù)集成的另一手段。
圖8顯示了用于自動(dòng)光點(diǎn)拾取的光點(diǎn)參數(shù)提取中所涉及的基本操作。
圖9顯示了情境數(shù)據(jù)關(guān)聯(lián)中所需的操作的一般流程。
圖10圖示了基本圖像分析操作流程。
圖11圖示了數(shù)據(jù)挖掘結(jié)果顯示的實(shí)施例。
圖12圖示了數(shù)據(jù)挖掘結(jié)果顯示的另一實(shí)施例。
圖13圖示了與真實(shí)對(duì)象比較的仿真光點(diǎn)對(duì)象的表面圖示。
圖14是多光點(diǎn)模式的示例。
圖15圖示了圖像匹配處理中所使用的示例源和目標(biāo)模式。
圖16圖示了隱藏光點(diǎn)的雙親圖。
圖17a-17c圖示了噪聲和光點(diǎn)的兩種尺度的能量簡(jiǎn)圖(profile)。
圖18圖示了基于基本神經(jīng)網(wǎng)絡(luò)的分類器。
圖19圖示了光點(diǎn)置信屬性處理中所涉及的步驟。
圖20圖示了條帶(smear)以及假象檢測(cè)處理中所涉及的步驟。
圖21圖示了隱藏光點(diǎn)標(biāo)識(shí)處理中所涉及的基本步驟。
圖22a顯示了原(raw)圖。
圖22b顯示了疊置的區(qū)域化。
圖22c顯示了示例的隱藏光點(diǎn)標(biāo)識(shí)。
圖23顯示了多尺度事件樹的側(cè)面視圖。
圖24顯示了光點(diǎn)的多尺度事件樹的3D視圖。
圖25顯示了不同級(jí)別的多尺度圖像。
圖26顯示了包括噪聲和假象的典型圖像變體。
圖27顯示了光點(diǎn)標(biāo)識(shí)處理中所涉及的總體步驟。
附圖中所包含的標(biāo)號(hào)在詳細(xì)描述中以括號(hào)提及,例如(2)。
具體實(shí)施例方式
主系統(tǒng)組件主系統(tǒng)組件管理全局系統(tǒng)工作流。在一個(gè)實(shí)施例中,主系統(tǒng)包括5個(gè)組件1.顯示管理器管理信息的圖形顯示;2.圖像分析管理器加載適當(dāng)?shù)膱D像分析模塊以允許自動(dòng)圖像分割;3.圖像信息管理器管理圖像及其相關(guān)聯(lián)的信息的歸檔和存儲(chǔ);4.數(shù)據(jù)集成管理器管理情境多源數(shù)據(jù)集成;5.數(shù)據(jù)挖掘機(jī)允許復(fù)雜的基于對(duì)象的圖像數(shù)據(jù)挖掘。
參考圖10,在第一步中,可以由系統(tǒng)從多個(gè)存儲(chǔ)介質(zhì)或倉(cāng)庫(kù)(例如但不限于數(shù)字計(jì)算機(jī)硬盤驅(qū)動(dòng)器、CDROM或DVDROM)加載數(shù)字圖像。系統(tǒng)還可以使用通信接口以從遠(yuǎn)程或本地?cái)?shù)據(jù)庫(kù)讀取數(shù)字?jǐn)?shù)據(jù)。圖像加載可以是用戶驅(qū)動(dòng)的操作或者是完全自動(dòng)的(2)。一旦數(shù)字圖像被加載到存儲(chǔ)器中,顯示管理器可以向用戶顯示圖像(4)。下面的步驟通常在于通過圖像分析管理器利用專門的自動(dòng)分割方法來分析所考慮的圖像(6)。在特定實(shí)施例中,用戶交互式地指示系統(tǒng)分析當(dāng)前圖像。在另一實(shí)施例中,系統(tǒng)自動(dòng)地分析所加載的圖像,而無需用戶干涉。在圖像的自動(dòng)分析之后,圖像信息管理自動(dòng)地將自動(dòng)分析方法所生成的信息保存在一個(gè)或多個(gè)倉(cāng)庫(kù)(例如但不限于關(guān)系數(shù)據(jù)庫(kù))中(8)。這里所描述的系統(tǒng)提供了特定模塊(插件)的自動(dòng)集成,從而允許動(dòng)態(tài)地加載并使用精確的模塊。這樣的模塊可以用于自動(dòng)圖像分析,其中特定的模塊可以被專門化用于特定的問題或應(yīng)用程序(10)。另一類型模塊可以用于專門的數(shù)據(jù)挖掘功能體。
跟隨這些基本步驟,下面的操作成為可能顯示圖像內(nèi)的相關(guān)情境信息、使多源數(shù)據(jù)關(guān)聯(lián)到圖像內(nèi)特定對(duì)象(或者整個(gè)圖像)并且進(jìn)行高級(jí)的數(shù)據(jù)挖掘操作。
一旦所考慮的圖像被自動(dòng)分割,則顯示管理器可以以多種方式顯示經(jīng)分割的圖像從而在圖像內(nèi)強(qiáng)調(diào)它們,例如但不限于以區(qū)別性顏色渲染對(duì)象輪廓或表面。另一類型的情境顯示信息是可視標(biāo)記表示,其可被置于圖像內(nèi)的特定位置,以便可視地標(biāo)識(shí)對(duì)象或?qū)ο蠼M以及指示用于(或者關(guān)聯(lián)到)一個(gè)或多個(gè)所考慮對(duì)象的某些其它數(shù)據(jù)是可得的。
數(shù)據(jù)集成管理器允許用戶(或者系統(tǒng)本身)動(dòng)態(tài)地將所存儲(chǔ)在一個(gè)或多個(gè)本地或遠(yuǎn)程倉(cāng)庫(kù)中的多源數(shù)據(jù)關(guān)聯(lián)到一個(gè)或多個(gè)所考慮圖像中感興趣的對(duì)象。在圖像內(nèi)或者在圖像附近使用情境可視標(biāo)記可視地描繪外部數(shù)據(jù)到所考慮圖像的關(guān)聯(lián)。
數(shù)據(jù)挖掘機(jī)允許基于定性和定量信息(例如分別為用戶文本描述和復(fù)雜形態(tài)學(xué)參數(shù))對(duì)圖像進(jìn)行高級(jí)的基于對(duì)象的數(shù)據(jù)挖掘。與數(shù)據(jù)集成管理器和顯示管理器相結(jié)合,系統(tǒng)提供對(duì)圖像情境中結(jié)果的有效且直觀探察和驗(yàn)證。
情境多源數(shù)據(jù)集成情境多源數(shù)據(jù)集成提供了新穎且有效的知識(shí)管理機(jī)制。該子系統(tǒng)提供了用于的手段將數(shù)據(jù)和知識(shí)關(guān)聯(lián)到圖像內(nèi)的精確情境,諸如關(guān)聯(lián)到其中所包含的感興趣的一個(gè)或多個(gè)對(duì)象,以及可視地標(biāo)識(shí)該關(guān)聯(lián)和情境位置。該情境集成的第一方面允許有效的數(shù)據(jù)分析和數(shù)據(jù)挖掘。一個(gè)或多個(gè)數(shù)據(jù)與一個(gè)或多個(gè)圖像對(duì)象之間的顯式關(guān)聯(lián)提供了目標(biāo)明確的分析和挖掘情境。該子系統(tǒng)的另一方面是有效的多源數(shù)據(jù)歸檔,從而提供關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)和情境數(shù)據(jù)審閱。與其中例如整個(gè)圖像將關(guān)聯(lián)到外部數(shù)據(jù)的傳統(tǒng)多源數(shù)據(jù)集成方法形成對(duì)比,當(dāng)前的子系統(tǒng)允許用戶容易地標(biāo)識(shí)該數(shù)據(jù)涉及什么具體情境并且因而提供高級(jí)別的知識(shí)。例如,在外部數(shù)據(jù)涉及包含大量經(jīng)分割的或未經(jīng)分割的對(duì)象的圖像內(nèi)三個(gè)具體對(duì)象的情況下,該情境關(guān)聯(lián)允許用戶立即查看數(shù)據(jù)涉及哪個(gè)對(duì)象并且因而可視地理解在關(guān)聯(lián)中的這兩個(gè)內(nèi)容。如果沒有此可能性,則外部多源數(shù)據(jù)的集成基本上變得沒有用處。
圖4圖示了其中沒有提供情境數(shù)據(jù)關(guān)聯(lián)的情況,其圖示了這種情況引起的困難和問題,這是因?yàn)槠洳豢赡軜?biāo)識(shí)數(shù)據(jù)涉及到圖像中的哪個(gè)對(duì)象。
參考圖2,在一個(gè)實(shí)施例中,當(dāng)前子系統(tǒng)(關(guān)聯(lián)到數(shù)據(jù)集成管理器)包括下述步驟選擇一個(gè)或多個(gè)感興趣區(qū)域;可視情境標(biāo)識(shí);數(shù)據(jù)選擇;
情境數(shù)據(jù)關(guān)聯(lián);信息歸檔。
選擇感興趣區(qū)域。該第一步驟在于在一個(gè)或多個(gè)所考慮的源圖像中標(biāo)識(shí)一個(gè)或多個(gè)感興趣區(qū)域。該一個(gè)或多個(gè)所考慮的源圖像是可視信息和外部數(shù)據(jù)可以關(guān)聯(lián)到其的感興趣的初始點(diǎn)。感興趣區(qū)域的標(biāo)識(shí)和產(chǎn)生既可以使用專門化方法自動(dòng)地獲得也可以通過用戶交互手動(dòng)地獲得。在第一種情況下,自動(dòng)標(biāo)識(shí)和產(chǎn)生是使用自動(dòng)圖像分析和分割方法實(shí)現(xiàn)的。在一個(gè)實(shí)施例中,感興趣區(qū)域是象光點(diǎn)那樣(spot-like)的結(jié)構(gòu)并且是使用這里所定義的圖像分析和分割方法來標(biāo)識(shí)與分割的。在這樣的情況下,在所標(biāo)識(shí)的感興趣區(qū)域(對(duì)象)池中,基于所指定的標(biāo)準(zhǔn)同樣以自動(dòng)的方式選擇一個(gè)或多個(gè)特定對(duì)象是可能的。例如,該方法可以選擇具有超過指定閾值的表面面積的每個(gè)對(duì)象并且定義后者為感興趣區(qū)域。另一方面,感興趣區(qū)域的交互式選擇可以通過許多方式實(shí)現(xiàn)。在一個(gè)實(shí)施例中,在自動(dòng)圖像分割處理之后,用戶交互式地選擇感興趣的特定區(qū)域。這可以通過在經(jīng)分割對(duì)象所位于的、并且要將其定義為感興趣區(qū)域的圖像區(qū)域中點(diǎn)擊來實(shí)現(xiàn)。該選擇處理使用了拾取方法,其中系統(tǒng)讀取用戶點(diǎn)擊處的坐標(biāo)并且驗(yàn)證該坐標(biāo)是否包含于經(jīng)分割對(duì)象區(qū)域中。該系統(tǒng)可以然后使用不同的渲染顏色或者紋理強(qiáng)調(diào)所選擇的對(duì)象。參考圖6,用于交互式選擇感興趣區(qū)域的另一方法在于手動(dòng)定義圖像內(nèi)的輪廓(12)。用戶使用控制設(shè)備諸如鼠標(biāo)來通過在監(jiān)視器上直接畫而交互式地定義輪廓。系統(tǒng)然后獲取所畫的輪廓的坐標(biāo)并且選擇該輪廓的邊界內(nèi)所包含的圖像中的每個(gè)像素(14)。所選擇的像素成為感興趣區(qū)域。當(dāng)沒有提供或使用自動(dòng)分割方法時(shí)使用該方法。
可視情境標(biāo)記。參考圖5,可視情境標(biāo)記步驟在于顯示圖像情境自身中以及圖像附近的圖形標(biāo)記或?qū)ο?。這提供了有關(guān)什么是圖像內(nèi)所選擇的感興趣區(qū)域以及是否存在關(guān)聯(lián)到該特定感興趣區(qū)域的任何信息/數(shù)據(jù)的可視指示。利用該機(jī)制,用戶可以容易地查看外部數(shù)據(jù)涉及哪些特定區(qū)域。圖形標(biāo)記和對(duì)象可以屬于許多類型,諸如位于感興趣區(qū)域上或附近的圖形圖標(biāo)(16),或者其可以是使用上色的輪廓或區(qū)域顯示的區(qū)域的實(shí)際圖形重點(diǎn)(18)。標(biāo)記處理僅需要系統(tǒng)取得先前所選擇的感興趣區(qū)域的坐標(biāo)并且根據(jù)這些坐標(biāo)顯示圖形標(biāo)記。除了可視地標(biāo)識(shí)圖像內(nèi)的感興趣區(qū)域,該標(biāo)記還允許這些區(qū)域與相關(guān)聯(lián)的外部數(shù)據(jù)的直接且可視的關(guān)聯(lián)。在一個(gè)實(shí)施例中,在顯示器的一部分顯示部分或全部外部數(shù)據(jù)(20),并且在數(shù)據(jù)與其特定相關(guān)聯(lián)的感興趣區(qū)域之間顯示圖形鏈接(22)。參考圖7,在另一實(shí)施例中,圖形標(biāo)記具有以下圖形指示,其在不顯示到區(qū)域的相關(guān)聯(lián)數(shù)據(jù)或鏈接的情況下,允許用戶看出該區(qū)域具有關(guān)聯(lián)到其的某些外部數(shù)據(jù)(24)。在這樣的情況下,用戶可以通過激活該標(biāo)記諸如通過使用控制設(shè)備在其上點(diǎn)擊而選擇查看所關(guān)聯(lián)的數(shù)據(jù)。圖形標(biāo)記可以手動(dòng)或自動(dòng)放置。當(dāng)進(jìn)行了感興趣區(qū)域的自動(dòng)標(biāo)識(shí)和選擇時(shí),系統(tǒng)可以進(jìn)一步自動(dòng)創(chuàng)建并顯示在區(qū)域附近的圖形標(biāo)記,從而允許最后的數(shù)據(jù)關(guān)聯(lián)。在另一實(shí)施例中,當(dāng)用戶通過在顯示器上交互地畫輪廓而選擇感興趣區(qū)域時(shí),系統(tǒng)其后自動(dòng)地創(chuàng)建并顯示在該新近定義區(qū)域附近的圖形標(biāo)記。在另一實(shí)施例中,用戶選擇某選項(xiàng)并且在所選取的圖像情境中交互地放置圖形標(biāo)記。
數(shù)據(jù)選擇。在先前所定義的步驟之后,現(xiàn)在可以將外部數(shù)據(jù)關(guān)聯(lián)到該圖像整體以及關(guān)聯(lián)到特定感興趣區(qū)域。在優(yōu)選實(shí)施例中,系統(tǒng)提供用戶界面用于交互地選擇感興趣的外部數(shù)據(jù)。該界面提供了在各種媒體諸如文件夾庫(kù)或數(shù)據(jù)庫(kù)中選擇數(shù)據(jù)的可能性。
情境數(shù)據(jù)關(guān)聯(lián)。在優(yōu)選實(shí)施例中,用戶交互地選取一個(gè)或多個(gè)所選數(shù)據(jù),以關(guān)聯(lián)到一個(gè)或多個(gè)所選擇的感興趣區(qū)域。該關(guān)聯(lián)例如可以通過點(diǎn)擊鼠標(biāo)并且將鼠標(biāo)從圖形標(biāo)記拖到所考慮的數(shù)據(jù)而完成。在該特定實(shí)施例中,將外部數(shù)據(jù)顯示在監(jiān)控器中,由此用戶創(chuàng)建關(guān)聯(lián)的鏈接。該關(guān)聯(lián)處理創(chuàng)建并且保存直接將感興趣區(qū)域或圖形標(biāo)記關(guān)聯(lián)到所考慮的外部數(shù)據(jù)的數(shù)據(jù)字段。該數(shù)據(jù)字段例如可以是源和外部數(shù)據(jù)兩者的位置,從而當(dāng)用戶返回集成關(guān)聯(lián)信息的項(xiàng)目時(shí),觀看外部數(shù)據(jù)和可視關(guān)聯(lián)兩者將是可能的。在一個(gè)實(shí)施例中,使用從標(biāo)記到數(shù)據(jù)的圖形鏈接顯示可視關(guān)聯(lián)。在另一實(shí)施例中,通過特定圖形標(biāo)記圖示該關(guān)聯(lián),而無需可視地標(biāo)識(shí)到外部數(shù)據(jù)的關(guān)聯(lián)。在這種情況下,需要激活該標(biāo)記以查看關(guān)聯(lián)到其的某些或全部信息。在特定實(shí)施例中,將外部數(shù)據(jù)嵌入圖形標(biāo)記中,所述標(biāo)記形成具有圖形表示的數(shù)據(jù)結(jié)構(gòu),在這種情況下數(shù)據(jù)被存儲(chǔ)在標(biāo)記數(shù)據(jù)庫(kù)中,其中每個(gè)條目是特定標(biāo)記。情境數(shù)據(jù)關(guān)聯(lián)機(jī)制也可以應(yīng)用于源和外部數(shù)據(jù)兩者,即,關(guān)聯(lián)到特定感興趣區(qū)域的外部數(shù)據(jù)本身可以是另一圖像內(nèi)的感興趣區(qū)域或數(shù)據(jù)。為了如此做,這里所描述的情境多源數(shù)據(jù)集成子系統(tǒng)可以直接應(yīng)用于外部信息。參考圖9,總體情境數(shù)據(jù)關(guān)聯(lián)處理要求選擇感興趣區(qū)域(26),其后放置圖形標(biāo)記到圖像內(nèi)感興趣區(qū)域或?qū)ο?28)。在該點(diǎn)處,可以選擇(30)外部數(shù)據(jù)并且將該外部數(shù)據(jù)關(guān)聯(lián)(32)到圖形標(biāo)記。步驟30和32可以在步驟26之前或之后進(jìn)行。最后的步驟在于保存信息(34)。
信息歸檔。最后的步驟在于將信息和元信息存儲(chǔ)在倉(cāng)庫(kù)中。為了允許返回到該信息和所有相關(guān)聯(lián)的多源數(shù)據(jù),系統(tǒng)自動(dòng)保存為重新加載數(shù)據(jù)和顯示每個(gè)圖形元素所需的每個(gè)元信息。在優(yōu)選實(shí)施例中,元數(shù)據(jù)被結(jié)構(gòu)化、表達(dá)并保存為XML格式。元信息包括但不限于下述描述一個(gè)或多個(gè)源圖像、外部數(shù)據(jù)、感興趣區(qū)域、圖形標(biāo)記、關(guān)聯(lián)信息。
圖像分析和數(shù)據(jù)挖掘關(guān)于先前所定義的一般系統(tǒng)架構(gòu)更具體地關(guān)于圖像分析管理器和數(shù)據(jù)挖掘機(jī)描述下面的方法。但是,無需關(guān)聯(lián)到這里所描述的主系統(tǒng),這些方法本身是新穎的。
在2D凝膠電泳圖像分析的優(yōu)選實(shí)施例中,提供下面的方法用于圖像內(nèi)的光點(diǎn)檢測(cè)以及用于圖像數(shù)據(jù)挖掘和分類。
光點(diǎn)檢測(cè)本系統(tǒng)的第一方面是自動(dòng)光點(diǎn)檢測(cè)。該組件考慮了多個(gè)機(jī)制,包括但不限于-噪聲表示-光點(diǎn)表示-尺度標(biāo)識(shí)-噪聲特征刻畫-對(duì)象特征刻畫-無偏區(qū)域化-光點(diǎn)標(biāo)識(shí)為了智能地分析圖像,必須全面理解其本性和性質(zhì)。在特定實(shí)施例中,所考慮的圖像是2D電泳凝膠的數(shù)字表示。這些圖像被特征刻畫為包含例如下面實(shí)體的累積(圖26)-可變大小和幅度的蛋白質(zhì)光點(diǎn)-孤立的光點(diǎn)
-成組的光點(diǎn)-假象(灰塵、指紋、氣泡、裂縫、毛發(fā)…)-條帶線(smear line)-背景噪聲通過對(duì)可能存在于圖像中的噪聲精確地建模,在后續(xù)的分析中區(qū)分感興趣的真實(shí)對(duì)象和噪聲聚合成為可能。盡管噪聲分布和模式可能隨圖像而變化,但是依據(jù)所考慮的圖像類型根據(jù)特定分布對(duì)其建模是可能的。在考慮2D凝膠電泳圖像的實(shí)施例中,可以用泊松分布(公式1)精確地表示噪聲。
類似于噪聲的表示,可以根據(jù)模擬產(chǎn)生光點(diǎn)的物理過程或者可視地對(duì)應(yīng)于所考慮對(duì)象的各種公式對(duì)光點(diǎn)建模。在大多數(shù)情況下,2D光點(diǎn)可以表示為2D高斯分布或者其變型。為了對(duì)光點(diǎn)精確建模,可能需要引入更復(fù)雜的高斯表示,從而允許對(duì)各種強(qiáng)度的各向同性和各向異性的光點(diǎn)建模。在特定實(shí)施例中,這是使用公式2來實(shí)現(xiàn)的。
參考圖27,光點(diǎn)檢測(cè)操作流程包括下述步驟1.圖像輸入(36)2.最優(yōu)多尺度級(jí)別標(biāo)識(shí)(38)3.多尺度圖像表示(40)4.噪聲特征刻畫和統(tǒng)計(jì)分析(42)5.區(qū)域分析(44)6.光點(diǎn)標(biāo)識(shí)(46)圖像輸入組件可以使用標(biāo)準(zhǔn)I/O操作以從各種存儲(chǔ)媒體例如但不限于數(shù)字計(jì)算機(jī)硬盤驅(qū)動(dòng)器、CDROM或DVDROM讀取數(shù)字?jǐn)?shù)據(jù)。該組件還可以使用通信接口以從遠(yuǎn)程或本地?cái)?shù)據(jù)庫(kù)讀取數(shù)字?jǐn)?shù)據(jù)。
一旦由系統(tǒng)輸入了數(shù)字圖像,則第一步驟在于標(biāo)識(shí)圖像分析組件應(yīng)該使用的最優(yōu)多尺度級(jí)別,其中所述級(jí)別對(duì)應(yīng)于噪聲開始聚合的級(jí)別。為了標(biāo)識(shí)該級(jí)別,將圖像劃分為不同的區(qū)域并且在不同多尺度級(jí)別接連重復(fù)該過程。圖像的多尺度表示可以通過用漸增的高斯核大小接連平滑后者來獲得,其中在每個(gè)平滑級(jí)別將圖像區(qū)域化。其后可以跟蹤從一個(gè)級(jí)別到另一級(jí)別的區(qū)域合并事件的數(shù)目,這指示聚合行為。在該處合并數(shù)目穩(wěn)定的級(jí)別被稱作感興趣的級(jí)別。圖像的區(qū)域化可以使用諸如分水嶺變換(Watershed)算法的方法來實(shí)現(xiàn)。圖25圖示了使用分水嶺變換算法在不同的多尺度級(jí)別所區(qū)域化的圖像。
一旦標(biāo)識(shí)了該級(jí)別,則將圖像的多尺度表示連同其經(jīng)區(qū)域化的副本一起保存在存儲(chǔ)器中。從該處,系統(tǒng)可以利用諸如噪聲功率譜(Noise PowerSpectrum)的功能來繼續(xù)噪聲的特征刻畫。NPS可以使用拉普拉斯金字塔(Laplacien pyramid)的前兩種級(jí)別來計(jì)算。從該功能,可以獲得圖像的統(tǒng)計(jì)特性,例如但不限于其泊松分布。之后,生成多尺度合成噪聲圖像以便量化噪聲聚合行為。如先前所描述的,多尺度噪聲圖像通過利用漸增大小直到先前所標(biāo)識(shí)級(jí)別的高斯核接連平滑合成圖像而獲得。在該最后的級(jí)別,利用分水嶺變換算法區(qū)域化該多尺度噪聲圖像。該模擬的信息之后可以用于標(biāo)識(shí)光點(diǎn)圖像中類似的噪聲聚合行為并且因而將噪聲聚合與感興趣對(duì)象區(qū)分開。
下面的步驟在于分析多尺度區(qū)域化后的圖像中的每個(gè)區(qū)域,以便檢測(cè)光點(diǎn)并且消除噪聲聚合區(qū)域。目標(biāo)主要是標(biāo)識(shí)不是噪聲聚合的感興趣區(qū)域。光點(diǎn)標(biāo)識(shí)可以使用多種方法來實(shí)現(xiàn),這些方法中的一些在下面描述。這些方法是基于簽名(signature)概念的;其中簽名被定義為唯一地將感興趣對(duì)象與其它結(jié)構(gòu)識(shí)別開的一組參數(shù)或信息。這樣的簽名可以是例如基于形態(tài)學(xué)特征或多尺度事件模式的。
圖1中圖示了總體圖像分析和光點(diǎn)分割方法流程。
多尺度事件樹多尺度事件樹是在圖像的多尺度表示中所遇到的合并和劃分事件的圖形表示。特定尺度的對(duì)象將傾向于與更大尺度的附近對(duì)象合并,從而形成合并事件。可以通過在雙親(parent)區(qū)域和其潛在的孩子區(qū)域之間遞歸地創(chuàng)建鏈接來構(gòu)造樹。在這種情況下所使用的數(shù)據(jù)結(jié)構(gòu)的優(yōu)選類型是N叉樹。圖23圖示了多尺度事件樹。圖24進(jìn)一步圖示了光點(diǎn)區(qū)域的多尺度事件樹。從該樹中,多個(gè)標(biāo)準(zhǔn)可以用于評(píng)估關(guān)聯(lián)區(qū)域是否是感興趣對(duì)象。由于噪聲特征在于其在多尺度空間中相對(duì)低的持久性以及其聚合行為,所以可以基于其多尺度樹容易地標(biāo)識(shí)噪聲區(qū)域。例如,將不存在持久的主樹路徑(“主干”)?;诙喑叨葮涞暮灻梢园绲幌抻谙率鲂畔?相對(duì)于在級(jí)別N表達(dá)的樹根的最小平均距離-相對(duì)于樹根的距離的方差-在每個(gè)尺度級(jí)別的合并事件數(shù)目
-沿主樹路徑每個(gè)區(qū)域表面上的方差-沿主樹路徑區(qū)域的體積分類從光點(diǎn)的基于簽名的特征刻畫的視點(diǎn)看,利用各種分類方法來適當(dāng)?shù)貥?biāo)識(shí)感興趣對(duì)象成為可能。利用先前提到的簽名變量,可以形成信息向量,該信息向量可以直接輸入到各種神經(jīng)網(wǎng)絡(luò)或其它分類和學(xué)習(xí)方法。在特定實(shí)施例中,分類是使用多層感知器神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的。參考圖18,可能的網(wǎng)絡(luò)配置可以包括5個(gè)神經(jīng)元輸入,其直接映射到關(guān)聯(lián)到上述簽名的5個(gè)元素向量。神經(jīng)網(wǎng)絡(luò)的輸出可以是利用單個(gè)神經(jīng)元的二值本性,其中分類屬于本性“光點(diǎn)”/“非光點(diǎn)”。另一種配置可以在輸出部分中包括多個(gè)神經(jīng)元,以獲得多個(gè)可能類別之中的簽名分類。
兩尺度能量幅度我們基于多尺度圖事件概念開發(fā)的用于在其它結(jié)構(gòu)中標(biāo)識(shí)光點(diǎn)的另一方法在于評(píng)估在兩個(gè)不同多尺度級(jí)別即級(jí)別1和級(jí)別N(圖17)表達(dá)的區(qū)域的歸一化能量幅度差別。通過根據(jù)最大能量的對(duì)象歸一化對(duì)象的能量差別,構(gòu)造了比較基礎(chǔ),從而允許感興趣對(duì)象的后續(xù)標(biāo)識(shí)。利用該信息以及從噪聲或假象出現(xiàn)的對(duì)象具有大能量差別的先驗(yàn)知識(shí),可以清楚地標(biāo)識(shí)與大多數(shù)情況下通常表示為空間中的脈沖的噪聲區(qū)域(圖17b)形成對(duì)比的具有固有的擴(kuò)散表達(dá)的感興趣對(duì)象(光點(diǎn))(圖17c)。
隱藏光點(diǎn)標(biāo)識(shí)由于光點(diǎn)強(qiáng)度飽和以及多個(gè)光點(diǎn)的聚合,包含光點(diǎn)的某些感興趣區(qū)域可能被識(shí)別錯(cuò)。該現(xiàn)象基于下述原理在飽和區(qū)域不能標(biāo)識(shí)任何最小部分,因而不能識(shí)別任何對(duì)象,以及在飽和聚合光點(diǎn)的區(qū)域中通常將僅標(biāo)識(shí)單個(gè)最小部分。為了克服這些困難,系統(tǒng)集成了專門設(shè)計(jì)用于檢測(cè)包含飽和光點(diǎn)或光點(diǎn)聚合的區(qū)域的組件。在2D凝膠電泳圖像的優(yōu)選實(shí)施例中,凝膠上的蛋白質(zhì)表達(dá)特征在于累積過程,其中每個(gè)蛋白質(zhì)均具有其自身的表達(dá)級(jí)別,這總體轉(zhuǎn)化為下述事實(shí),在該組之中僅單個(gè)蛋白質(zhì)將具有表達(dá)最大值。該積累過程將生成具有多個(gè)隱藏光點(diǎn)的蛋白質(zhì)集群(cluster)。
參考圖21,隱藏光點(diǎn)標(biāo)識(shí)過程在于首先利用分水嶺變換算法將圖像區(qū)域化(48)以及其后應(yīng)用根據(jù)最佳梯度表示的第2基于分水嶺變換的方法(50)。該最優(yōu)梯度表示在大多數(shù)情況下將允許聚合光點(diǎn)的有效分離。下一步驟在于評(píng)估兩種區(qū)域化方法獲得的區(qū)域的并發(fā)(52)。包含在基本分水嶺變換區(qū)域中的、由梯度方法獲得的區(qū)域具有是隱藏光點(diǎn)的可能性。圖22圖示了并發(fā)區(qū)域化和隱藏光點(diǎn)標(biāo)識(shí)。
隱藏光點(diǎn)分析在尺度級(jí)別N的光點(diǎn)區(qū)域的分析在某些情況下可能產(chǎn)生所謂的偽(false)隱藏光點(diǎn)。偽隱藏光點(diǎn)是真實(shí)光點(diǎn),其在尺度級(jí)別N與鄰近光點(diǎn)熔合從而導(dǎo)致最初的真實(shí)光點(diǎn)失去了其在級(jí)別N的極值(extremum)表達(dá)。當(dāng)這樣的光點(diǎn)不再具有可標(biāo)識(shí)的極值時(shí),使用例如分水嶺變換算法的區(qū)域化處理不能獨(dú)立地區(qū)域化該光點(diǎn)。因而該光點(diǎn)被與其鄰區(qū)聚合在一起,從而導(dǎo)致其被這里所述的算法標(biāo)識(shí)為隱藏光點(diǎn)。為了越過這個(gè)問題,我們引入了一種多尺度自頂而下(top-down)方法,其檢測(cè)隱藏光點(diǎn)是否實(shí)際上在下級(jí)的尺度級(jí)別中具有可標(biāo)識(shí)的極值。該方法包括下述步驟對(duì)于包含一個(gè)或多個(gè)隱藏光點(diǎn)的每個(gè)光點(diǎn)區(qū)域,首先在其每個(gè)區(qū)域隱藏光點(diǎn)的級(jí)別N的區(qū)域內(nèi)接近極限位置,然后重復(fù)地轉(zhuǎn)到較低尺度級(jí)別以驗(yàn)證在所接近位置的附近是否存在可標(biāo)識(shí)的極值,如果存在匹配,則強(qiáng)迫級(jí)別N具有該極值,并且最終重新計(jì)算頂部區(qū)域的分水嶺區(qū)域化以生成對(duì)于先前隱藏的光點(diǎn)的獨(dú)立區(qū)域。該機(jī)制允許我們自動(dòng)定義先前所隱藏的光點(diǎn)的光點(diǎn)區(qū)域并且因而允許該光點(diǎn)的精確量化。
有組織的結(jié)構(gòu)檢測(cè)總體系統(tǒng)中的第二主組件在于圖像中有組織的結(jié)構(gòu)的檢測(cè)。在2D凝膠圖像分析的實(shí)施例中,這些結(jié)構(gòu)包括條帶線、刮痕、裂縫、毛發(fā)等等。參考圖20,該組件的操作流程的第一步是使用分水嶺變換方法對(duì)反置了強(qiáng)度的圖像的多尺度標(biāo)識(shí)的級(jí)別N進(jìn)行區(qū)域化(54)。目標(biāo)是基于圖像的脊(ridge)創(chuàng)建區(qū)域。第二步驟在于再次使用分水嶺變換算法在多尺度級(jí)別N-1對(duì)梯度圖像進(jìn)行區(qū)域化(56)。一旦已經(jīng)計(jì)算了這兩個(gè)區(qū)域化,接下來的步驟是基于它們的連通性構(gòu)建區(qū)域的關(guān)系圖(58),其中每個(gè)區(qū)域關(guān)聯(lián)到一個(gè)節(jié)點(diǎn)。最后的步驟在于檢測(cè)具有預(yù)定方位和連通度、拓?fù)?、語義表示的圖形段(graph segment)。例如,交叉的垂直和水平直線結(jié)構(gòu)可以對(duì)應(yīng)于條帶線,而彎曲的孤立結(jié)構(gòu)可以關(guān)聯(lián)到圖像中的毛發(fā)或者裂痕。
置信屬性隨著光點(diǎn)、隱藏光點(diǎn)、有組織的結(jié)構(gòu)檢測(cè)處理,手頭有了足夠的信息以供系統(tǒng)智能地在所檢測(cè)的光點(diǎn)上賦予置信級(jí)別屬性。這樣的級(jí)別指定了系統(tǒng)相信所檢測(cè)的對(duì)象確實(shí)是光點(diǎn)而不是假象或噪聲聚合對(duì)象的置信程度。一方面,通過依據(jù)圖像中噪聲的統(tǒng)計(jì)分析,可以精確地標(biāo)識(shí)具有與噪聲聚合相似的統(tǒng)計(jì)簡(jiǎn)圖和分布的對(duì)象,并且因而如果這些對(duì)象還沒有被系統(tǒng)消除的話則賦予這些對(duì)象低置信級(jí)別屬性。例如,如果對(duì)象被標(biāo)識(shí)為光點(diǎn)但是具有與噪聲聚合非常相似的能量幅度差別,則該對(duì)象可以被賦予低置信級(jí)別屬性。此外,有組織的結(jié)構(gòu)檢測(cè)處理帶來了額外的信息并且提供了賦予置信級(jí)別屬性的更魯棒途徑。這樣的額外信息是關(guān)鍵的,這是因?yàn)樵谀承┣闆r下存在某些對(duì)象,其具有與光點(diǎn)相似的分布和行為,但是實(shí)際上來源于例如假象和條帶線。在2D凝膠圖像分析的實(shí)施例中,存在引人注意的行為,其中垂直和水平條帶線的交叉產(chǎn)生了假(artificial)光點(diǎn)。通過先前檢測(cè)圖像中的條帶線,我們能夠標(biāo)識(shí)重疊條帶并且因而標(biāo)識(shí)假光點(diǎn)。利用同樣的方式,在假象和條帶線附近的光點(diǎn)可以被賦予較低的置信度屬性,這是因?yàn)樗鼈兊暮灻赡芤呀?jīng)被其它對(duì)象的存在而修改,這意味著假象的強(qiáng)度分布可以導(dǎo)致噪聲聚合對(duì)象具有與真實(shí)光點(diǎn)類似的表達(dá)。此外,隨著隱藏光點(diǎn)檢測(cè)處理,可以相對(duì)于包含在相同區(qū)域中的光點(diǎn)而構(gòu)建隱藏光點(diǎn)的雙親圖。該雙親圖可以用于為隱藏光點(diǎn)分配與已經(jīng)被賦予置信度屬性的其雙親光點(diǎn)成比例的置信級(jí)別(圖16)??偠灾?,置信屬性組件基于所計(jì)算的統(tǒng)計(jì)信息及其附近所檢測(cè)到的結(jié)構(gòu)精確地為每個(gè)光點(diǎn)賦予某級(jí)別屬性。圖19中圖示了該總體處理。
光點(diǎn)量化在2D凝膠電泳實(shí)施例中,其它實(shí)施例也可能是這樣的情況,光點(diǎn)形成的物理處理可能引入光點(diǎn)部分重疊的區(qū)域。該區(qū)域重疊導(dǎo)致光點(diǎn)可能被過度量化,這是因?yàn)槠鋸?qiáng)度值可能由于其它光點(diǎn)的貢獻(xiàn)而受到影響。為反擊此效應(yīng),當(dāng)前的發(fā)明提供了用于對(duì)該累積效應(yīng)建模以便精確地量化獨(dú)立光點(diǎn)對(duì)象的方法。該方法在于利用擴(kuò)散函數(shù)諸如2D高斯對(duì)光點(diǎn)對(duì)象建模,以及其后發(fā)現(xiàn)在光點(diǎn)上函數(shù)的最佳擬合。對(duì)每個(gè)光點(diǎn),步驟包括-計(jì)算擬合的第一逼近擴(kuò)散函數(shù)-使用擬合函數(shù)諸如最小二乘法找到最佳參數(shù)一旦函數(shù)被最佳擬合,則系統(tǒng)通過將代表重疊光點(diǎn)的每個(gè)函數(shù)的部分相加來仿真累積效應(yīng)。如果該仿真的累積處理類似于圖像簡(jiǎn)圖,則函數(shù)的每個(gè)正確地量化了它們相關(guān)聯(lián)的光點(diǎn)對(duì)象。然后可以通過簡(jiǎn)單地分解所相加的函數(shù)來對(duì)這些光點(diǎn)以它們沒有累積效應(yīng)的真實(shí)值來精確量化并且量化獨(dú)立的函數(shù)。
在該方法中,擴(kuò)散函數(shù)的高度對(duì)應(yīng)于圖像中相應(yīng)像素的強(qiáng)度值,因?yàn)檫@些強(qiáng)度可以視為構(gòu)建圖像的3D表面的投影值。圖13圖示了對(duì)應(yīng)于相關(guān)聯(lián)的光點(diǎn)對(duì)象的圖像表面(70)的模擬擴(kuò)散函數(shù)(72)。這些擴(kuò)散函數(shù)其后可以用于精確地量化光點(diǎn)對(duì)象,諸如它們的密度和體積。函數(shù)的寬度和高度提供了為量化光點(diǎn)對(duì)象所需的信息。該方法在其中精確魯棒的蛋白質(zhì)量化非常重要的2D凝膠電泳分析的實(shí)施例中具有巨大的價(jià)值。
光點(diǎn)拾取參考圖8,2D凝膠電泳分析實(shí)施例中系統(tǒng)的另一方面涉及凝膠基質(zhì)(gelmatrix)中蛋白質(zhì)的自動(dòng)切除。這里所描述的圖像分析方法提供用于自動(dòng)定義應(yīng)該使用機(jī)器人光點(diǎn)拾取(robotic spot picking)系統(tǒng)拾取的蛋白質(zhì)的空間坐標(biāo)的手段。隨著在一個(gè)或多個(gè)圖像中光點(diǎn)結(jié)構(gòu)的分割,系統(tǒng)生成了參數(shù)集合。對(duì)于每個(gè)光點(diǎn)這些參數(shù)可以包括但不限于質(zhì)心(質(zhì)量的中心)坐標(biāo)、平均半徑、最大半徑、最小半徑。可以將該信息直接保存在數(shù)據(jù)庫(kù)中或者保存在標(biāo)準(zhǔn)化的文件格式中。在一個(gè)實(shí)施例中,使用XML保存該信息。通過以意義自明的標(biāo)準(zhǔn)格式提供較廣范圍的參數(shù),我們的系統(tǒng)可以被任意類型的機(jī)器人裝備使用。此外,基于這里所描述的光點(diǎn)置信屬性,該系統(tǒng)提供了選擇對(duì)于光點(diǎn)拾取優(yōu)選的置信度的可能性。利用此途徑,可以僅拾取具有高于某級(jí)別(例如高于50%)的置信級(jí)別的蛋白質(zhì)。光點(diǎn)拾取處理中所需的總體步驟為1.圖像的自動(dòng)分割;2.參數(shù)的自動(dòng)提??;3.參數(shù)的自動(dòng)存儲(chǔ)。
多光點(diǎn)處理多光點(diǎn)處理提出了基于對(duì)象的圖像分析和處理的概念。在本文所描述的發(fā)明中,術(shù)語多光點(diǎn)處理指的是基于光點(diǎn)(對(duì)象)的圖像處理操作,其中這些操作可以是各種性質(zhì)的,包括但不限于,使用多個(gè)光點(diǎn)以及合并模式用于自動(dòng)且精確的基于對(duì)象的圖像匹配和以一對(duì)一或一對(duì)多方式的注冊(cè)。本發(fā)明明確提及的另一種類型的操作是進(jìn)行基于對(duì)象的圖像數(shù)據(jù)挖掘和分類(也稱作基于對(duì)象的圖像發(fā)現(xiàn))的可能性。與當(dāng)前基于內(nèi)容的圖像數(shù)據(jù)挖掘方法(其簡(jiǎn)單地提取基本的圖像特征諸如邊和脊用于后續(xù)數(shù)據(jù)挖掘)形成對(duì)比,本發(fā)明提供了一種用于基于拓?fù)浜?或語義的基于對(duì)象的信息挖掘多個(gè)圖像的手段。這樣的信息可以是圖像中多個(gè)所標(biāo)識(shí)的光點(diǎn)的拓?fù)浜驼Z義關(guān)系,從而形成了富集(enrich)的光點(diǎn)模式。
圖像匹配在2D凝膠電泳圖像分析的優(yōu)選實(shí)施例中,圖像匹配是頭等重要的。本文所描述的方法提供了使用一種手段,用于利用對(duì)象中心方法以自動(dòng)方式將一個(gè)或多個(gè)目標(biāo)圖像與參考圖像相匹配。該匹配方法包括下述步驟1.自動(dòng)光點(diǎn)標(biāo)識(shí)和分割2.參考圖像模式創(chuàng)建3.一個(gè)或多個(gè)目標(biāo)圖像模式標(biāo)識(shí)4.光點(diǎn)對(duì)光點(diǎn)匹配自動(dòng)光點(diǎn)標(biāo)識(shí)和分割是使用本發(fā)明中所描述的光點(diǎn)標(biāo)識(shí)方法實(shí)現(xiàn)的。第一步在總體圖像匹配處理中是關(guān)鍵的,這是因?yàn)楣恻c(diǎn)標(biāo)識(shí)的魯棒性決定了匹配的質(zhì)量。光點(diǎn)標(biāo)識(shí)錯(cuò)誤將導(dǎo)致匹配處理中的多個(gè)錯(cuò)誤匹配。參考圖15,下面的步驟在于在參考圖像中創(chuàng)建光點(diǎn)模式。這里,目標(biāo)是通過創(chuàng)建拓?fù)鋱D形(模式)刻畫參考圖像中每單個(gè)標(biāo)識(shí)光點(diǎn)的特征,其中的思路基于下述事實(shí),即光點(diǎn)可以由其鄰近光點(diǎn)的相對(duì)位置來標(biāo)識(shí)。因而,對(duì)于參考圖像中每個(gè)所標(biāo)識(shí)的光點(diǎn),可被視為諸如星座的拓?fù)淠J降耐負(fù)鋱D被構(gòu)建并且保存在存儲(chǔ)器中。光點(diǎn)模式由節(jié)點(diǎn)、弧和中心節(jié)點(diǎn)構(gòu)成。中心節(jié)點(diǎn)對(duì)應(yīng)于感興趣的光點(diǎn)(60),節(jié)點(diǎn)對(duì)應(yīng)于鄰近光點(diǎn)(62),弧是連接中心點(diǎn)到鄰近節(jié)點(diǎn)的線段(64)。該圖特征在于其包含的節(jié)點(diǎn)數(shù)目、每條弧的長(zhǎng)度、每條弧的方位。一旦在參考圖像中為每個(gè)感興趣光點(diǎn)創(chuàng)建了該類型的圖,下一步在于標(biāo)識(shí)一個(gè)或多個(gè)目標(biāo)圖像中的對(duì)應(yīng)模式(66)以及它們的相似度值,目標(biāo)是標(biāo)識(shí)先前在參考圖像中所標(biāo)識(shí)的感興趣光點(diǎn)的存在與否。該目標(biāo)圖像模式標(biāo)識(shí)步驟首先需要定義分析窗口,其限制了目標(biāo)圖像中的分析空間。因?yàn)槟繕?biāo)圖像中的對(duì)應(yīng)光點(diǎn)將大致具有與當(dāng)時(shí)參考圖像中相似的位置,則定義分析窗口大小為mW×mW(其中,W是參考模式的邊界框?qū)挾龋琺是尺度因子,其中m>1)是合理的。一旦在目標(biāo)圖像中定義了窗口,則利用所包含的光點(diǎn)構(gòu)造各種模式配置,其中,對(duì)于每種配置,計(jì)算相對(duì)于參考模式的相似度值。如果目標(biāo)配置具有大于指定閾值的相似度值,則認(rèn)為目標(biāo)光點(diǎn)與參考光點(diǎn)相匹配。該相似度值可以根據(jù)圖的線段(弧)的大小和方位上的差別來計(jì)算。最終,最后的步驟僅包括將參考圖像與目標(biāo)圖像之間的光點(diǎn)對(duì)光點(diǎn)的對(duì)應(yīng)保存在存儲(chǔ)器中。
圖像數(shù)據(jù)挖掘一旦手邊有了如本發(fā)明所述的魯棒且完全自動(dòng)的光點(diǎn)標(biāo)識(shí)和匹配方法,則進(jìn)行復(fù)雜的對(duì)象中心的圖像內(nèi)容數(shù)據(jù)挖掘(或基于對(duì)象的圖像發(fā)現(xiàn))成為可能,這為分析家提供了額外的價(jià)值和知識(shí)。
本發(fā)明包括用于自動(dòng)或交互式基于對(duì)象的圖像數(shù)據(jù)挖掘的方法,從而使得能夠發(fā)現(xiàn)多個(gè)圖像中反復(fù)出現(xiàn)的“光點(diǎn)模式”以及使得能夠基于對(duì)象發(fā)現(xiàn)包含特定對(duì)象屬性(形態(tài)、密度、面積…)的圖像。參考圖3,該方法的一般操作流程如下1.第一圖像的自動(dòng)光點(diǎn)檢測(cè)。
2.數(shù)據(jù)挖掘標(biāo)準(zhǔn)定義3.多個(gè)圖像之中的數(shù)據(jù)挖掘4.結(jié)果表示在特定實(shí)施例中,自動(dòng)光點(diǎn)檢測(cè)的第一步驟是利用本發(fā)明中所描述的方法實(shí)現(xiàn)的。第二步驟在于定義將用于發(fā)現(xiàn)處理的標(biāo)準(zhǔn)(68)。標(biāo)準(zhǔn)可以是例如用戶感興趣的特定光點(diǎn)模式,其中該用戶需要標(biāo)識(shí)可能包含類似模式的其它圖像。另一標(biāo)準(zhǔn)可以是圖像中可標(biāo)識(shí)光點(diǎn)的數(shù)目或者任意其它可量化的對(duì)象性質(zhì)。在特定實(shí)施例中,用戶通過選擇多個(gè)先前標(biāo)識(shí)并分割的光點(diǎn)以及通過定義圖形式的拓?fù)潢P(guān)系來交互地定義感興趣的模式(圖14)。在另一實(shí)施例中,該圖由系統(tǒng)利用諸如前面部分(圖像匹配)中所定義的方法來自動(dòng)定義。在交互的或自動(dòng)的標(biāo)準(zhǔn)定義之后,下一步驟在于圖像的實(shí)際數(shù)據(jù)挖掘。數(shù)據(jù)挖掘可以在先前所分割的圖像或者以前從未分割過的圖像上進(jìn)行。當(dāng)處理未分割過的圖像時(shí),系統(tǒng)需要在進(jìn)行數(shù)據(jù)挖掘之前分析這些圖像。這可以例如以逐個(gè)圖像為基礎(chǔ)來進(jìn)行,其中系統(tǒng)接連讀取數(shù)字圖像并且標(biāo)識(shí)其中的光點(diǎn),進(jìn)行數(shù)據(jù)挖掘,然后在N個(gè)其它圖像上重復(fù)相同的過程。
在特定實(shí)施例中,本發(fā)明包括一個(gè)或多個(gè)本地和/或遠(yuǎn)程數(shù)據(jù)庫(kù)以及至少一個(gè)通信接口。數(shù)據(jù)庫(kù)可以用于圖像、分割結(jié)果、對(duì)象性質(zhì)或圖像標(biāo)識(shí)符的存儲(chǔ)。通信接口用于通過通信網(wǎng)絡(luò)諸如因特網(wǎng)或企業(yè)內(nèi)部互聯(lián)網(wǎng)與計(jì)算機(jī)化的裝備通信,以便讀取和寫入例如數(shù)據(jù)庫(kù)中或遠(yuǎn)程計(jì)算機(jī)上的數(shù)據(jù)。通信可以使用TCP/IP協(xié)議實(shí)現(xiàn)。在優(yōu)選實(shí)施例中,系統(tǒng)與兩個(gè)截然不同的數(shù)據(jù)庫(kù)通信第一數(shù)據(jù)庫(kù)用于存儲(chǔ)數(shù)字圖像,而第二數(shù)據(jù)庫(kù)用于存儲(chǔ)由圖像分析過程諸如光點(diǎn)標(biāo)識(shí)和分割產(chǎn)生的信息和數(shù)據(jù)。該第二數(shù)據(jù)庫(kù)至少包含關(guān)于源圖像的信息諸如名字、唯一的標(biāo)識(shí)符、位置、所標(biāo)識(shí)光點(diǎn)的數(shù)目,以及關(guān)于所標(biāo)識(shí)和分割的光點(diǎn)的物理性質(zhì)的數(shù)據(jù)。后者至少包括光點(diǎn)空間坐標(biāo)(x-y坐標(biāo))、光點(diǎn)表面面積、光點(diǎn)密度數(shù)據(jù)。這兩個(gè)數(shù)據(jù)庫(kù)可以是本地或遠(yuǎn)程的。
在另一實(shí)施例中,系統(tǒng)可以在其上安裝該系統(tǒng)的計(jì)算機(jī)空閑時(shí)或者在用戶請(qǐng)求時(shí)在數(shù)據(jù)庫(kù)或存儲(chǔ)介質(zhì)中所包含的多個(gè)圖像上進(jìn)行自動(dòng)光點(diǎn)標(biāo)識(shí)和分割。對(duì)于每個(gè)經(jīng)處理的圖像,作為結(jié)果的信息被存儲(chǔ)在數(shù)據(jù)庫(kù)中,如上所述。這樣的自動(dòng)后臺(tái)處理允許有效的隨后的數(shù)據(jù)挖掘。
圖像數(shù)據(jù)挖掘處理因而可以包括對(duì)象拓?fù)浜蛯?duì)象性質(zhì)信息,用于根據(jù)各種標(biāo)準(zhǔn)精確且有效地發(fā)現(xiàn)多個(gè)圖像之間的關(guān)系。在特定實(shí)施例中,用戶在第一圖像上啟動(dòng)自動(dòng)光點(diǎn)標(biāo)識(shí)方法并且向系統(tǒng)規(guī)定包含在數(shù)據(jù)庫(kù)中的、具有至少一個(gè)類似光點(diǎn)拓?fù)淠J降乃衅渌鼒D像都應(yīng)該被發(fā)現(xiàn)。
數(shù)據(jù)挖掘處理中的最終步驟是發(fā)現(xiàn)結(jié)果的表示。在優(yōu)選實(shí)施例中,構(gòu)造該結(jié)果并且將其如圖12所示呈現(xiàn)給用戶,其中使用可視鏈接直接顯示基于模式搜索所發(fā)現(xiàn)的圖像的列表。
語義圖像分類利用先前所描述的光點(diǎn)標(biāo)識(shí)方法和結(jié)合專家知識(shí)的基于內(nèi)容的圖像數(shù)據(jù)挖掘,系統(tǒng)提供了基于語義或定量標(biāo)準(zhǔn)對(duì)一組數(shù)字圖像自動(dòng)分類的可能性。在特定實(shí)施例中,語義分類標(biāo)準(zhǔn)是特定病理學(xué)固有的蛋白質(zhì)模式(簽名)。在這種意義上,包含與預(yù)先定義的病理學(xué)簽名類似的蛋白質(zhì)模式的圖像被肯定地歸類于該特定病理學(xué)類別中。該方法包括5個(gè)主要步驟1.自動(dòng)光點(diǎn)標(biāo)識(shí)2.病理學(xué)簽名定義3.模式匹配4.圖像歸類5.結(jié)果表示使用本文所描述的方法實(shí)現(xiàn)第一步的自動(dòng)光點(diǎn)標(biāo)識(shí)。第二步在于定義并且關(guān)聯(lián)蛋白質(zhì)模式到特定病理學(xué)。正是該拓?fù)淠J降綄?shí)際病理學(xué)的關(guān)聯(lián)定義了分類的語義級(jí)別。病理學(xué)簽名的定義典型地由具有關(guān)于多蛋白質(zhì)簽名存在的明確知識(shí)的專家用戶來定義。該用戶因而使用如圖像匹配部分中所定義的交互式工具而定義拓?fù)鋱D,但是進(jìn)一步將所構(gòu)造的圖關(guān)聯(lián)到病理學(xué)名稱。該系統(tǒng)之后在持久性存儲(chǔ)部件中記錄該圖(具有相對(duì)坐標(biāo)的圖節(jié)點(diǎn)以及弧)以及其相關(guān)聯(lián)的語義名字。所存儲(chǔ)的信息然后用于在任意時(shí)刻進(jìn)行圖像分類以及用于建造簽名庫(kù)。該簽名庫(kù)保存了用戶可以在任意時(shí)刻用來進(jìn)行分類或語義圖像發(fā)現(xiàn)的一組簽名。處理中的下一步在于通過首先選擇適當(dāng)?shù)暮灻鸵罁?jù)的參考圖像而進(jìn)行圖像匹配。用戶然后選擇存儲(chǔ)器、圖像倉(cāng)庫(kù)或者圖像數(shù)據(jù)庫(kù)中的一組圖像,在該組圖像上將迭代地進(jìn)行圖像匹配。最后,用戶可以選擇定義匹配算法的敏感度的相似度閾值。例如,用戶可以指定肯定匹配對(duì)應(yīng)于與參考簽名的相似度為90%或更多的簽名。在圖像匹配處理期間,將每個(gè)被肯定地匹配的圖像歸類于期望的類別中。一旦每個(gè)所考慮的圖像都已經(jīng)被分類,則需要給出結(jié)果。這可以通過許多方式實(shí)現(xiàn),例如但不限于以圖12中所圖示的方式。參考圖11,也可以以信息的類似電子數(shù)據(jù)表的視圖呈現(xiàn)結(jié)果。該電子數(shù)據(jù)表可以保存關(guān)于被肯定地分類的圖像的名稱和位置以及用于圖像快速顯示的鏈接的信息。
作為部分實(shí)施例的描述在考慮了為可視化、分析、管理圖像信息所需的各種步驟的主系統(tǒng)的情境下,下面描述了2D凝膠電泳圖像分析和管理的實(shí)施例。在該實(shí)施例中,具有高吞吐量自動(dòng)分析和管理以及交互式用戶驅(qū)動(dòng)的分析和管理的可能。下文描述了這兩者。
用戶驅(qū)動(dòng)在用戶驅(qū)動(dòng)的情景下,第一步驟需要用戶選擇待分析的圖像。用戶可以使用圖像加載對(duì)話框在標(biāo)準(zhǔn)倉(cāng)庫(kù)中和在數(shù)據(jù)庫(kù)中瀏覽圖像,其后用戶通過點(diǎn)擊適當(dāng)?shù)膱D像名字來選擇期望的圖像。在該步驟之后,系統(tǒng)使用圖像加載器加載所選取的圖像。圖像加載器可以從計(jì)算機(jī)系統(tǒng)的硬盤驅(qū)動(dòng)器和數(shù)據(jù)庫(kù)(系統(tǒng)本地或遠(yuǎn)程)讀取數(shù)字圖像。系統(tǒng)可以使用通信接口通過通信網(wǎng)絡(luò)諸如因特網(wǎng)從遠(yuǎn)程位置加載圖像。一旦加載了圖像,則系統(tǒng)將其保存在存儲(chǔ)器以供后續(xù)使用。系統(tǒng)的顯示管理器然后從存儲(chǔ)器讀取圖像并且將其顯示在監(jiān)控器上。用戶然后激活圖像分析插件。圖像分析管理器加載所考慮的插件模塊并且將其啟動(dòng)。該模塊然后可以自動(dòng)地分析并且分割圖像(所考慮的插件是本文所描述的分析和分割方法)。一旦完成了分割,則由圖像信息管理器將結(jié)果和量化參數(shù)與其源圖像相關(guān)聯(lián)地保存在數(shù)據(jù)庫(kù)或倉(cāng)庫(kù)中。顯示管理器然后通過使用一種或幾種不同顏色渲染經(jīng)分割的對(duì)象的輪廓而顯示圖像分割結(jié)果。所顯示的結(jié)果被渲染為圖像上的新層。在自動(dòng)分析之后,用戶可以選擇待關(guān)聯(lián)到圖像的部分、圖像自身或者感興趣的特定對(duì)象的某外部數(shù)據(jù)。在該實(shí)施例中,外部數(shù)據(jù)可以是,例如但不限于,到用于特定蛋白質(zhì)注釋的網(wǎng)頁(yè)的鏈接、質(zhì)譜數(shù)據(jù)、顯微鏡或者其它類型的圖像、音頻和視頻信息、文檔、報(bào)告、結(jié)構(gòu)分子信息。在這種情況下,用戶通過下述操作選擇該信息的任意一種并且將其關(guān)聯(lián)到期望的區(qū)域或者感興趣對(duì)象首先根據(jù)所考慮的對(duì)象或區(qū)域獲取圖形標(biāo)記并且關(guān)聯(lián)且放置該圖形標(biāo)記,其后交互式地將該標(biāo)記與所考慮的外部數(shù)據(jù)相關(guān)聯(lián)。由于感興趣對(duì)象或區(qū)域是先前由分割模塊精確地分割的,所以它們到標(biāo)記的關(guān)聯(lián)是直接的、精確的系統(tǒng)自動(dòng)檢測(cè)用戶所選擇的區(qū)域或?qū)ο蟛⑶覍⑺紤]的像素值關(guān)聯(lián)到標(biāo)記。在外部數(shù)據(jù)關(guān)聯(lián)處理中,用戶定義該數(shù)據(jù)是應(yīng)該被嵌入標(biāo)記中還是相反通過關(guān)聯(lián)鏈接被關(guān)聯(lián)到標(biāo)記。
用戶還具有使用數(shù)據(jù)挖掘模塊發(fā)現(xiàn)圖像和模式的可能性。這是通過向系統(tǒng)指定數(shù)據(jù)挖掘標(biāo)準(zhǔn)來實(shí)現(xiàn)的,該標(biāo)準(zhǔn)可以是各種性質(zhì)的,諸如但不限于使用參數(shù)諸如表面面積和直徑來在圖像內(nèi)搜索特定對(duì)象形態(tài)、搜索特定密度的對(duì)象、搜索包含特定數(shù)目對(duì)象的圖像、搜索對(duì)象拓?fù)淠J?對(duì)象星座)、甚至使用描述圖像本性的語義標(biāo)準(zhǔn)(例如病理學(xué))來搜索。例如,用戶挖掘具有特定對(duì)象拓?fù)淠J降膱D像。系統(tǒng)然后在監(jiān)控器中將結(jié)果顯示給用戶。用戶可以選擇特定圖像并且在所發(fā)現(xiàn)模式的情境下使其可視化。顯示管理器通過下述操作強(qiáng)調(diào)所發(fā)現(xiàn)的圖像模式以不同顏色渲染所考慮的對(duì)象或者在該模式的情境下創(chuàng)建并且放置圖形標(biāo)記。結(jié)果可以保存在當(dāng)前項(xiàng)目中以供以后察看。用戶還可以使用一個(gè)或多個(gè)所提到的標(biāo)準(zhǔn)對(duì)一組圖像進(jìn)行分類。
用戶然后可以保存當(dāng)前項(xiàng)目以及其相關(guān)聯(lián)的信息。圖像、分割結(jié)果、圖形標(biāo)識(shí)符以及到多源外部數(shù)據(jù)的關(guān)聯(lián)都可以保存在當(dāng)前項(xiàng)目中。這允許用戶重新打開進(jìn)行中或者已經(jīng)完成的項(xiàng)目并且察看所包含的信息。
高吞吐量在高吞吐量分析的情境下,系統(tǒng)提供了用于有效管理整個(gè)工作流程的手段。作為第一步,用戶必須選擇系統(tǒng)可從其加載圖像的多個(gè)文件夾、倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)或者特定源。在特定實(shí)施例中,將源于數(shù)字成像系統(tǒng)的圖像自動(dòng)地且不斷地輸入系統(tǒng),在這種情況下,系統(tǒng)包括臨時(shí)存儲(chǔ)進(jìn)入數(shù)字圖像的圖像緩沖器。系統(tǒng)然后一次一個(gè)地讀取該緩沖器中的每個(gè)圖像以進(jìn)行分析。一旦圖像被系統(tǒng)加載并且放入存儲(chǔ)器中,則如前面用戶驅(qū)動(dòng)說明中所提到的,圖像由圖像分析模塊自動(dòng)分析。然后計(jì)算得到的圖像信息自動(dòng)保存于存儲(chǔ)介質(zhì)中。為了由機(jī)器人系統(tǒng)進(jìn)行光點(diǎn)拾取,以標(biāo)準(zhǔn)格式導(dǎo)出每個(gè)所檢測(cè)光點(diǎn)的坐標(biāo)和參數(shù)從而允許機(jī)器人系統(tǒng)物理地提取2D凝膠上的每個(gè)蛋白質(zhì)。光點(diǎn)拾取器然后可以讀取該光點(diǎn)參數(shù)并且隨后物理地提取凝膠基質(zhì)中的相應(yīng)蛋白質(zhì)。對(duì)輸入到系統(tǒng)的每個(gè)圖像重復(fù)該處理。在本實(shí)施例中,當(dāng)前發(fā)明可以提供為集成系統(tǒng),首先提供成像設(shè)備以從物理2D凝膠創(chuàng)建數(shù)字圖像,然后提供圖像輸入/輸出設(shè)備以輸出數(shù)字化的凝膠圖像并且將后者輸入到所提供的圖像分析軟件中。該軟件然后控制機(jī)器人裝備以便優(yōu)化該吞吐量并且促進(jìn)光點(diǎn)拾取操作。例如,軟件可以基于由圖像分析軟件輸出的光點(diǎn)參數(shù)直接與光點(diǎn)拾取器控制器設(shè)備交互。此外,利用所提供的置信度屬性方法(其中每個(gè)所檢測(cè)的蛋白質(zhì)具有置信級(jí)別),通過指定應(yīng)考慮的特定置信級(jí)別來控制自動(dòng)處理成為可能。在這種意義上,光點(diǎn)拾取器例如可以僅提取具有大于70%的置信級(jí)別的蛋白質(zhì)光點(diǎn)??傊?,本文所描述的發(fā)明提供了用于圖像加載、圖像分析和分割、自動(dòng)圖像和數(shù)據(jù)管理的全自動(dòng)軟件方法。
這些上面的以及許多其它實(shí)施例,即使背離所述的任意其它實(shí)施例,但并不背離所附權(quán)利要求所闡明的本發(fā)明。
權(quán)利要求
1.一種圖像和數(shù)據(jù)管理系統(tǒng),包括下述步驟顯示圖像;在所述圖像的至少一種情境下,產(chǎn)生、顯示并且放置至少一個(gè)圖形標(biāo)記;選擇待關(guān)聯(lián)到所述圖形標(biāo)記的至少一個(gè)的至少一個(gè)外部數(shù)據(jù),其中所述外部數(shù)據(jù)是在一個(gè)或多個(gè)本地或遠(yuǎn)程倉(cāng)庫(kù)中選擇的;將所述外部數(shù)據(jù)的至少一個(gè)關(guān)聯(lián)到所述圖形標(biāo)記的至少一個(gè)并且顯示所述關(guān)聯(lián)的可視指示;將信息保存在一個(gè)或多個(gè)本地或遠(yuǎn)程倉(cāng)庫(kù)中,所述信息至少包括定義所述關(guān)聯(lián)的數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其中所述情境是感興趣區(qū)域,所述感興趣區(qū)域是由像素值組成的用戶定義區(qū)域。
3.如權(quán)利要求2所述的方法,其中定義感興趣區(qū)域包括下述步驟向用戶提供用于定義所述感興趣區(qū)域的工具;使用所述工具在所述圖像內(nèi)交互地定義所述感興趣區(qū)域的輪廓,所述輪廓被顯示在所述圖像中;以及自動(dòng)將所述用戶定義區(qū)域的所述像素值關(guān)聯(lián)到所述圖形標(biāo)記。
4.如權(quán)利要求1所述的方法,其中所述情境是感興趣區(qū)域,所述感興趣區(qū)域是利用自動(dòng)分割方法自動(dòng)定義的由像素值組成的區(qū)域。
5.如權(quán)利要求4所述的方法,還包括自動(dòng)將所述圖形標(biāo)記關(guān)聯(lián)到所述自動(dòng)定義區(qū)域的所述像素值。
6.如權(quán)利要求1所述的方法,還包括用于顯示所述外部數(shù)據(jù)的至少一個(gè)的手段。
7.如權(quán)利要求1所述的方法,其中,所述產(chǎn)生、顯示、放置所述圖形標(biāo)記的所述步驟是利用程序自動(dòng)實(shí)現(xiàn)的。
8.一種用于分析和管理圖像信息的系統(tǒng),包括用于輸入圖像的圖像輸入手段;用于自動(dòng)標(biāo)識(shí)和量化所述圖像內(nèi)感興趣對(duì)象的圖像分析程序,所述程序產(chǎn)生圖像信息;用于將多源信息關(guān)聯(lián)到所述圖像和所述感興趣對(duì)象的關(guān)聯(lián)程序,所述關(guān)聯(lián)步驟產(chǎn)生關(guān)聯(lián)信息;用于顯示所述圖像,至少所述多源信息中的一些,以及用于在所述圖像的所述感興趣對(duì)象的情境下產(chǎn)生和顯示圖形信息的顯示程序;以及用于將所述圖像、所述圖像信息、所述圖形信息、所述關(guān)聯(lián)信息存儲(chǔ)在本地或遠(yuǎn)程倉(cāng)庫(kù)中的存儲(chǔ)手段和程序。
9.如權(quán)利要求8所述的方法,還包括下述步驟自動(dòng)對(duì)一個(gè)或多個(gè)所述倉(cāng)庫(kù)進(jìn)行搜索以尋找滿足一個(gè)或多個(gè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)的圖像,所述數(shù)據(jù)挖掘標(biāo)準(zhǔn)是手動(dòng)或自動(dòng)定義的;自動(dòng)產(chǎn)生和顯示搜索結(jié)果,所述搜索結(jié)果至少包括所找到圖像的列表;通過激活所述列表的至少一個(gè)元素從所述挖掘結(jié)果選擇并顯示所述圖像的至少一個(gè),其中所述顯示包括強(qiáng)調(diào)所述所選擇圖形的所述感興趣對(duì)象。
10.一種提供基于對(duì)象的圖像發(fā)現(xiàn)的方法,包括用于輸入圖像的圖像輸入手段;用于自動(dòng)標(biāo)識(shí)和量化所述圖像內(nèi)感興趣對(duì)象的圖像分析程序,所述程序產(chǎn)生圖像信息,所述圖像和所述圖像信息存儲(chǔ)在至少一個(gè)倉(cāng)庫(kù)中;用于輸入發(fā)現(xiàn)標(biāo)準(zhǔn)的用戶輸入手段;用于在所述倉(cāng)庫(kù)內(nèi)搜索滿足所述發(fā)現(xiàn)標(biāo)準(zhǔn)的搜索程序;用于顯示搜索結(jié)果和所述圖像的顯示裝置。
11.一種數(shù)字圖像中的自動(dòng)光點(diǎn)檢測(cè)的方法,包括下述步驟讀取圖像;計(jì)算所述圖像中噪聲信息的統(tǒng)計(jì)分布;根據(jù)所述統(tǒng)計(jì)分布計(jì)算多尺度分析級(jí)別N;計(jì)算所述圖像的多尺度圖像直到所述級(jí)別N,并且生成所述多尺度圖像的至少一種類型的區(qū)域化;與所述多尺度圖像和所述區(qū)域化相對(duì)應(yīng)地標(biāo)識(shí)所述圖像中的感興趣對(duì)象;標(biāo)識(shí)所述圖像中的有組織的結(jié)構(gòu),所述有組織的結(jié)構(gòu)不是感興趣對(duì)象;以及對(duì)所述感興趣對(duì)象進(jìn)行特征刻畫并分類。
12.一種用于為數(shù)字圖像中的一個(gè)或多個(gè)光點(diǎn)對(duì)象自動(dòng)賦予置信級(jí)別屬性的方法,包括下述步驟讀取圖像;自動(dòng)標(biāo)識(shí)所述圖像中的光點(diǎn)對(duì)象;計(jì)算所述光點(diǎn)對(duì)象的置信級(jí)別;顯示對(duì)于所述光點(diǎn)對(duì)象的至少一個(gè)的置信級(jí)別。
13.一種用于對(duì)圖像中的光點(diǎn)對(duì)象進(jìn)行特征刻畫的方法,包括用于計(jì)算所述圖像的多尺度表示直到級(jí)別N的手段,其中所述計(jì)算步驟提供多尺度圖像;用于在所述多尺度圖像的所述級(jí)別的每個(gè)上標(biāo)識(shí)并且定義光點(diǎn)對(duì)象區(qū)域的手段;用于鏈接在所述多尺度圖像的所述級(jí)別的每個(gè)上所標(biāo)識(shí)的所述光點(diǎn)對(duì)象區(qū)域的手段,所述鏈接創(chuàng)建多尺度事件樹,所述多尺度事件樹提供了用于對(duì)所述光點(diǎn)對(duì)象進(jìn)行特征刻畫和分類的信息。
14.如權(quán)利要求11所述的方法,其中,所述特征刻畫的步驟是利用權(quán)利要求13的手段實(shí)現(xiàn)的。
15.如權(quán)利要求11所述的方法,其中,所述分類的步驟是利用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的。
16.如權(quán)利要求11所述的方法,其中,所述有組織的結(jié)構(gòu)是條帶線。
17.如權(quán)利要求11所述的方法,其中,所述有組織的結(jié)構(gòu)是圖像假象,所述圖像假象包括氣泡、毛發(fā)、裂縫、劃痕。
18.如權(quán)利要求13所述的方法,其中,所述光點(diǎn)對(duì)象區(qū)域是分水嶺區(qū)域。
19.如權(quán)利要求4所述的方法,其中,所述自動(dòng)分割方法是由權(quán)利要求11所述的方法提供的。
20.如權(quán)利要求8和10所述的方法,其中,所述圖像分析程序是權(quán)利要求11所述的方法。
21.如權(quán)利要求12所述的方法,其中,所述自動(dòng)標(biāo)識(shí)的步驟是利用權(quán)利要求11的方法實(shí)現(xiàn)的。
22.一種用于量化所標(biāo)識(shí)的光點(diǎn)對(duì)象的方法,包括下述步驟計(jì)算一個(gè)或多個(gè)2D擴(kuò)散函數(shù);通過改變所述擴(kuò)散函數(shù)的參數(shù)以便優(yōu)化下述擬合來使所述擴(kuò)散函數(shù)擬合到所述所標(biāo)識(shí)的光點(diǎn)對(duì)象,所述參數(shù)提供了所述擴(kuò)散函數(shù)的方差、寬度、高度;利用所述擴(kuò)散函數(shù)仿真并且計(jì)算所述所標(biāo)識(shí)的光點(diǎn)對(duì)象的累積效應(yīng);以及利用所述擴(kuò)散函數(shù)量化沒有所述累積效應(yīng)的所述所標(biāo)識(shí)的光點(diǎn)對(duì)象。
全文摘要
提供了一種分割方法,用于將光點(diǎn)結(jié)構(gòu)自動(dòng)分割為D圖像,從而允許基于多個(gè)標(biāo)準(zhǔn)對(duì)所述結(jié)構(gòu)和所述圖像進(jìn)行精確量化和分類,還允許自動(dòng)標(biāo)識(shí)一個(gè)或多個(gè)圖像中存在的基于多光點(diǎn)的模式。在優(yōu)選實(shí)施例中,本發(fā)明用于2D凝膠電泳圖像的分析,目標(biāo)是量化蛋白質(zhì)表達(dá)以及用于允許復(fù)雜的基于多蛋白模式的圖像數(shù)據(jù)挖掘,以及圖像匹配,注冊(cè)和自動(dòng)分類。
文檔編號(hào)G06T7/00GK1830004SQ200480021630
公開日2006年9月6日 申請(qǐng)日期2004年6月16日 優(yōu)先權(quán)日2003年6月16日
發(fā)明者亞歷山大·J·布德羅, 帕特里克·杜布, 克勞德·考夫曼, 卡爾杜恩·Z·埃爾阿比戴恩 申請(qǐng)人:戴納皮克斯智能成像股份有限公司