專利名稱:用形狀描述符匹配圖像的制作方法
技術領域:
4^>開一般地涉及圖#^述符。
背景技術:
由于數(shù)碼相機、圖像編輯軟件以及其他相關技術、裝置或兩者的廣泛 使用,使用者不得不管理和操作數(shù)字圖像。數(shù)字圖像裝置、應用軟件或二 者的一個重要方面是為使用者提供有效且高效地管理、檢索、操作和使用 圖像的能力。因此,努力開發(fā)用于從存儲裝置檢索圖像的高效且簡單的方
法。例如,在圖像處理領域中,運動圖像專家組(MPEG)已經(jīng)開發(fā)了幾 種類型的圖傳檢索應用軟件。
典型的圖H^r索應用軟件可以產(chǎn)生圖像的描述符以索引和檢索圖像。 圖像的形狀在描述圖像的使用中是有用的特征。形狀可以僅以地理形式 (geographical form)描述圖像而不需要包括例如顏色、紋理等圖像的其 他特征。例如,MPEG釆用包括那些公知的如曲率尺度空間(CSS)描述 符和角徑向變換(art)描述符的一些描述符。
CSS描述符基于關于圖像的一條或多條輪廓線的信息而提取圖像的 特征。另一方面,art描述符不直接使用關于一條或多條輪廓線的信息 而是利用關于圖像的區(qū)域特定信息,例如隨著圖像中像素的位置的變化而 變化的像素值的角分量和徑向分量。art因此可以更一般地應用到各種 圖像而不論該圖像中輪廓線的數(shù)量如何。
然而,傳統(tǒng)的art描述符具有局限性。例如,對于具有相對筒單的 特征的圖像,例如具有一條輪廓線的圖像,art描述符可能無法獲得描 述圖像形狀所期望的精確度等級。這是因為,為了獲得精確的art描述 符,需要提取關于圖像的多個方面的信息。此外,art描述符依賴于相 對復雜的數(shù)值算法,該數(shù)值算法需要大量的計算資源。因此,需要增強 art描述符的精確度從而使圖像可以更有效和高效的方式被描述、索引 和檢索,同時還降低描述符相關的算法的復雜度。
圖l示出了才艮據(jù)一個實施例的圖傳驗索系統(tǒng)的示意性框圖2是根據(jù)一個實施例的圖^^r索系統(tǒng)的圖像匹配裝置的示意性框
圖3是示出了根據(jù)一個實施例的距離變換(DT)的應用的示意圖4是示出了根據(jù)一個實施例用以將二進制圖像轉換為中間圖像的 距離變換的應用的示意圖5示出了說明根據(jù)一個實施例的DT的結果的示例性圖4象;
圖6示出了用在一個實施例中的ART的基本功能的示例;
圖7是說明了根據(jù)一個實施例用以產(chǎn)生描述符的方法的流程圖8是說明了根據(jù)一個實施例用以使用描述符檢索圖像的方法的流 程圖9是比較地說明了由牛眼性能(Bull's Eye Performance, BEP)測 量的、在根據(jù)依據(jù)4^>開的設備和方法的一個實施例的GART(支變角徑 向變換)描述符和傳統(tǒng)的ART描述符之間的數(shù)據(jù)庫搜索性能的圖表。
發(fā)明內(nèi)容
在一個實施例中,使用距離變換(DT)單元以生成中間圖像,該中 間圖像提供針對輸入的查詢圖像的附加特征(例如,描述符參數(shù))的。 DT單元可以將輸入的查詢圖像變換為具有多種基于圖像中的像素的位置 的像素值的中間圖像。在中間圖像中生成的多種像素值被用作附加的圖像 屬性或描述符參數(shù),該附加的圖像屬性或描述符M可以用于更有效和高 效地生成用于查詢圖像的圖傳^述符。圖傳濕述符生成設備可以在中間圖 像上應用ART描述符生成算法,由此生成輸入的查詢圖像的描述符。
在另一個實施例中,圖像檢索系統(tǒng)包括圖像錄入單元、描述符確定單 元、圖像比較單元和檢索單元。該圖像錄入單元被配置為接收作為輸入的 圖像。該描述符確定單元用于接收圖像并使用DT單元將圖像變換為中間 圖像以生成圖像的描述符。圖像比較單元被配置為將圖像與存儲在數(shù)據(jù)庫 中的一個或多個圖像進行比較,例如,通過比較查詢圖像的描述符與存儲 在數(shù)據(jù)庫中的圖像的描述符。最后,檢索單元被配置為檢索一個或多個候選圖像,該候選圖像基于描述符的比較而與輸入的圖像緊密匹配或相類 似。
本發(fā)明內(nèi)^^皮提供為以筒化的形式引入一系列概念,這些概念將在以 下詳細的說明書中進一步說明。本發(fā)明內(nèi)容不旨在確定要求保護的主題的 關鍵特征或本質(zhì)特征,也不旨在用于限制要求保護的主題的范圍。
具體實施例方式
容易理解的是,如此處在附圖中一般性描述和說明的,;^/>開的組件 可以以多種不同的配置進行布置和設計。因此,以下對如附圖中所示的根 據(jù)4^〉開的設備和方法的實施例的更詳細的說明,如所聲明的,其目的不 在于限制本公開要求保護的范圍,而僅是代表根據(jù)本公開當前設想的實施
例的特定示例。當前所述的實施例可以通過參考附圖加以理解,其中相似 的部件通篇由相似的標記來表示。
參考圖1,示出了圖^^r索系統(tǒng)100的一個實施例。圖^Wr索系統(tǒng)100 可以包括控制器110、圖像錄入單元120、圖像匹配單元140、作為存儲 裝置的數(shù)據(jù)庫(DB; 160)以及顯示器180。每個組件110、 120、 140、 160和180可以基于期望的實現(xiàn)而被提供為單個單元或裝置,或被提供為 一個或多個單元或裝置。例如,圖像匹配單元140和DB160可以與圖像 錄入單元120實現(xiàn)為單個集成設備??商鎿Q地,圖像匹配單元140和DB 160可以相對于圖像錄入單元120獨立地并且遠程地實現(xiàn)。
實踐中,用戶可以選擇圖像以使用圖像錄入單元120輸入到圖#^索 系統(tǒng)IOO。圖像錄入單元120可以包括多種類型的輸入裝置,所述輸入裝 置包括但不限于小鍵盤、鍵盤、鼠標、觸摸板、觸摸屏、定點設備、軌跡 球、光筆、操縱桿、語音識別裝置、觸針裝置、眼睛和頭部移動跟蹤器、 數(shù)字化寫字板、條形碼閱讀器等,各個裝置均可以向用戶提供接口以錄入 期望的查詢圖像。然后,圖像錄入單元120可以將錄入的圖像傳送到由控 制器110配置或編程的圖像匹配單元140。
在所選擇的、圖像匹配單元140安裝在與圖像錄入單元120分離的遠 程裝置或服務器上的實施例中,輸入的圖像可以從圖像錄入單元120經(jīng)由 有線或無線通信協(xié)議而發(fā)送到圖像匹配單元140。例如,通信協(xié)議(有線 或無線)可以通過釆用例如串行端口、并行端口、 PS/2端口、通用串行 總線(USB)鏈路、火線(firewire)或IEEE 1394鏈路的數(shù)字接口協(xié)議實現(xiàn),或通過使用例如紅外接口、藍牙、紫蜂(ZigBee)、高清晰度多媒 體接口 (HDMI)、高帶寬數(shù)字內(nèi)容發(fā)射(HDCP)、無線保真(Wi-Fi) 等無線接口連接實現(xiàn)??商鎿Q地,圖像可以通過移動通信系統(tǒng)M送到圖 像匹配單元140,所述移動通信系統(tǒng)例如為全球移動通信系統(tǒng)(GSM)、 全球定位系統(tǒng)(GPS)、數(shù)字移動多媒體(DMB)、碼分多址(CDMA)、 高速下行鏈#入(HSDPA )、 Wi-Bro無線寬帶等。
圖像匹配單元140可以接收圖像(例如查詢圖像)并確定所接收的圖 像是否包括用于識別或匹配圖像的描述符。如果圖像匹配單元140未能檢 測到描述符,則圖像匹配單元140可以通過將描述符生成算法應用到查詢 圖像來開始獲取用于查詢圖像的描述符的處理。圖像匹配單元140將查詢 圖泉的描述符與存儲在DB 160中的候選圖像的描述符進行比較以選擇至 少一個匹配的圖像。所匹配的圖傳被傳送到顯示器180,以例如用于用戶 的參考。
圖2示出圖像匹配單元140的一個實施例。在一些實施例中,圖像匹 配單元140可以包括描述符生成單元280和相似性比較單元260。如圖2 所示,描述符生成單元280可以包括距離變換單元(DT單元)220和角 徑向變換單元(ART單元)240。圖像匹配單元140從圖像錄入單元120 接收查詢圖像210并且執(zhí)行處理以使查詢圖像210與存儲在DB 160中的 候選圖4I^目匹配。例如,圖像匹配單元140可以通過將查詢圖像210的描 述符與候選圖像的描述符進行比較而使查詢圖像210與候選圖^^目匹配。 圖像匹配單元140將匹配的圖像270傳送到顯示器180。
在所選擇的實施例中,當描述符生成單元280接收到查詢圖像210 時,描述符生成單元280中的DT單元220將查詢圖像210變換為中間圖 像并且將該中間圖像傳送到ART單元240。例如,DT單元220可以將輸 入的查詢圖像修改為形狀對應于該輸入圖像的形狀的二進制圖像并且將 該二進制圖像變換為中間圖像,該中間圖像具有取決于相對二進制圖像的 邊界的像素位置的各種像素值。ART單元240可以對中間圖像執(zhí)行ART 描述符生成算法,由此生成輸入的查詢圖像210的描述符以最終與存儲在 數(shù)據(jù)庫中的圖傳湘比較和匹配。ART單元240可以使用中間圖像的寬范 圍的像素值作為附加特征或參數(shù)以生成用于原始輸入圖像(即查詢圖像 210)的描述符。ART單元240將描述符和查詢圖像210傳送到相似性比 較單元260。相似性比較單元260于是可以通過將查詢圖像210的描述符 與存儲在DB 160中的圖像的描述符進行比較而從DB 160搜索和檢索最類似于查詢圖像210的候選圖像。候選圖像的描述符可以與候選圖像一起 事先存儲在DB 160中??商鎿Q地,圖像匹配單元140可以隨M選擇候 選圖像中的一個或使用附著到存儲在DB 160中的候選圖像的序列號選擇 候選圖像中的一個。圖像匹配單元140應用與用于生成查詢圖像210的描 述符相同的處理來生成候選圖像的描述符。這樣,圖像匹配單元140可以 在查詢圖像與候選圖像進行比較時(或大約此時)獲得候選圖像的描述符。 在任一種情況下,相似性比較單元260均可以在對查詢圖像210的描述符 與候選圖像的描述符比較之后檢索最緊密匹配或類似于查詢圖像210的 候選圖像。
在相似性比較單元260比較了查詢圖像210的圖像描述符和存儲在 DB 160中的圖像描述符的全部或一些后,相似性比較單元260從DB 160 檢索與查詢圖像210最類似的至少一個圖像(即匹配的圖像270)并且將 檢索到的一個或多個圖像輸出到顯示器180。作為示例,相似性比較單元 260可以確定輸入的查詢圖像210的描述符和候選圖像的描述符之間的距 離以確定具有最短距離的匹配的圖像270。相似性比較單元260可以將輸 入的查詢圖像210與用于描述該輸入圖像210的描述符一起存儲在DB 160中。相似性比較單元260將所匹配的圖4象傳送到顯示器180。
在一些實施例中,描述符生成單元280可以最初從圖像錄入單元120 通過包括直接連接或通信協(xié)議等多種方法來接收查詢圖像210。然后描述 符生成單元280中的DT單元220可以將查詢圖像210變換為中間圖像以 向原始查詢圖像210提供除從原始查詢圖 <象210的 一個或多個邊界或輪廓 線中直接提取的參數(shù)或特征以外的更多的參數(shù)或特征。例如,描述符生成 單元280將查詢圖像210變換為二進制圖像。DT單元210可以將二進制 圖像變換為具有灰階的中間圖像。換句話說,DT單元210將原始查詢圖 像210變換為具有取決于距二進制圖像的輪廓線的距離而漸變的邊界。 DT單元220可以將輸入的查詢圖像210變換為中間圖像,該中間圖像具 有取決于像素位置(或基于像素距外邊界或輪廓線的距離)的^JL像素值 (從純白到純黑)。這樣,DT單元220可以對查詢圖像210的^lt或特 征提供附加W:或特征以生成中間圖像,例如灰階圖像。雖然為便于說明 將中間圖像描述為灰階圖像,但中間圖像可以包括具有對查詢圖像210 的附加特征的任意變換后的圖像,例如具有漸變邊界的圖像、增加顏色的 圖像和增加亮度的圖像,只要這些特征(例如灰階、顏色、亮度等)隨圖 像中的像素的位置而變化。例如,不同的深淺、亮度或顏色強度可以取決 于距圖像邊界的距離而被分配^r個像素值。一旦如上所述產(chǎn)生中間圖像,則該中間圖傳Jl傳送到ART單元240, 該ART單元240在中間圖像上執(zhí)行算法,由此生成用于中間圖像的ART 描述符。這種ART描述符可以被稱作用于描述查詢圖像210的GART(灰 度角徑向變換)描述符。GART描述符和原始查詢圖像210被轉發(fā)到相似 性比較單元260。相似性比較單元260將查詢圖〗象210的GART描述符與 存儲在DB160中的一個或多個候選圖像的一個或多個描述符相比較。相 似性比較單元260由此可以確定存儲在DB 160中的可能最佳(或最緊密) 匹配查詢圖像210的一個或多個候選圖4象。例如,相似性比較單元260 可以確定查詢圖像210的描述符和候選圖像的描述符之間的距離以確定 具有它們之間的最短距離差的匹配的圖像270。相似性比較單元260通過 各種方法將匹配的圖1象270 (即被確定為最類似于或相對最接近于查詢圖 像210的一個或多個候選圖像)傳送到顯示器180,所述多種方法包括直 接連接或由控制器110編程或配置的通信協(xié)議。
在所選擇的實施例中,顯示器180被安裝在與圖像匹配單元140分離 的遠程裝置上。所匹配的圖像或幾個最佳候選圖像可以通過有線或無線通 信協(xié)議的方式被發(fā)送到顯示器180。在可替換的實施例中,圖像錄入單元 120和顯示器180可以在例如蜂窩電話、PDA、無線終端等具有通信能力 的單個裝置中實現(xiàn)。
參照圖3,說明了由DT單元220使用的距離變換(DT)的概念或應 用。圖3示出了輸入的查詢圖像210的二進制圖像(在左側)和執(zhí)行DT 應用后的中間圖像(在右側)。如圖3所示,查詢圖像210可以表示為二 進制形式,其中查詢圖像210中的形狀的邊界像素M示為"0"〗象素值 而其余像素M示為"1"像素值。在所選擇的實施例中,DT單元220 可以以二進制查詢圖像210中的各個像素具有對應于二進制圖像的邊界 與該像素之間的距離的值的方式將二進制形式的查詢圖像210變換為灰 度圖像(即中間圖像)。DT單元220可以輸出如圖3中的右側所示的灰 階圖像?;译A圖像的像素值對應于距圖像中的形狀邊界的距離,從而^J 巨 形狀中心最近的4象素具有最大的4象素值(在此示例中為"3")。這樣,原 始的二進制查詢圖像可以被變換為具有取決于像素與邊界的距離而修改 的像素值的灰階圖像。
圖4示出了說明應用距離變換(DT)將二進制圖像轉換為中間圖像 (例如灰階圖像)的另一個示例。左側表示的二進制圖像在沿圖像的邊界 的像素處具有第一像素值"A"并且在其余像素處具有第二像素值"B"。DT單元220可以基于邊界和各個對應像素的位置之間的距離而變換各個 像素值,因此DT后的中間圖像(在右側)在直接鄰近邊界的像素處具有 第一像素值"A"而在不直接鄰近邊界的其余像素處具有多種其他像素值。 例如,二進制圖像可以被變換為中間圖像以具有隨像素的位置而變化的像 素值,從而使應用DT后的圖像中的像素在對角上鄰近邊界的像素(這些 像素僅其頂部(vertex)鄰近邊界)處具有第二值"B",在位于直接鄰近 具有值"A"的像素的像素處具有第三像素值"C",并且在位于直接鄰近 具有值"C"的像素的像素處具有第四像素值"D"。這樣,應用DT后的 圖像(中間圖像)可以具有從"A" - "D"范圍內(nèi)的附加像素值并且各 種像素值可以表示像素的位置,從而使圖像的幾何分量,例如像素的角和 徑向分量,可以具有更高的分辨率以便由此更精確地描述圖像。
參照圖5,根據(jù)4^>開的一個實施例說明了應用DT后的結果。圖5 示出了具有對二進制查詢圖像中的各個形狀應用DT前(左)和應用DT 后(右)的形狀的圖像。如圖5所示,應用DT后的圖像(右側所示的中 間圖像)的圖像中形狀的邊界具有平滑的漸變,這可以為查詢圖^4I:供附 加的幾何分量。這樣,中間圖像可以具有比查詢圖像或多種類型的圖像更 寬范圍的像素值。這種寬范圍的像素值可以提供附加參數(shù)或屬性以便更精 確地描述查詢圖像。因此,應用DT后的圖像可以在各個像素值處具有附 加級別的參數(shù)或屬性,從而自應用DT后的圖像獲得的ART描述符可以 更精確地描述原始圖像。在一些實施例中,左側的圖像的形狀表示為黑色 和白色,并且能夠從圖像的像素所提取的信息可以基于黑和白之間的顏色 改變表示形狀的邊界存在的位置。從圖5右側的應用DT后的圖像可見, 圖像的邊界被分級,由此提供了關于圖像的附加信息,例如輪廓線、中軸 線、基干(skeleton)等。例如,由于當像素的位置距查詢圖像的邊界更 遠時,應用DT后的圖像具有更大的像素值,因此具有最大值的像素可以 對應于圖像的中軸線。這樣,描述符生成單元280可以更準確地表征圖像, 因此圖傳驗索系統(tǒng)100可以通過使用更精確的描述符來更精確地檢索圖 像。
在特定的實施例中,ART單元240執(zhí)行算法以產(chǎn)生用于應用DT后 的圖像的ART描述符,由此獲得用于查詢圖像210的GART描述符。例 如,ART單元240可以通過使用極坐標()而將灰階圖像表示為 /(p,0)。通過使用ARTM函數(shù)F^(a60,灰階圖像的特征系數(shù)F皿可 以在極坐標系統(tǒng)中按如下所定義的來表示<formula>formula see original document page 13</formula>其中ART基礎函數(shù)r,(yo,60可以如下計算
并且ART基礎函數(shù)K, (p,。中的每個元素被計算或定義為
2冗 [2cos(那)
其中n表示一個角度級別,并且m表示一個半徑級別。
例如,如圖6所示,在11 = 0,1,2;并且m-O,l,...,ll的情況下,可以產(chǎn)生 總共36個基礎函數(shù)。通過使用基礎函數(shù),在以上等式(l)中對于m和n (n = 0,1,2;并且m = O,l,...,ll)獲得的特征系數(shù)的振幅ai被收集以形成如 下的第j個圖像的GART描述符!■=1
相似性比較單元260可以選擇與查詢圖像具有最小距離(例如,距離向量
的長度)的候選圖像作為匹配的圖像??商鎿Q地,相似性比較單元260
可以選擇具有小于閾值距離的距離的候選圖像并且確定所選擇的圖像中
的全部或部分作為匹配的圖像。相似性比較單元260可以將任何匹配的圖
l象發(fā)送到顯示器270以允許用戶看到。
參照圖7并同時參考圖1,說明了根據(jù)4^>開的一個實施例的用于生 成圖像的GART描述符的方法。在步驟710,用戶可以通過使用圖像錄入 單元120初始輸入圖像到圖像檢索系統(tǒng)100。用戶可以使用多種輸入裝置, 例如鍵區(qū)、鍵盤、鼠標等來將所期望的圖像錄入到圖傳檢索系統(tǒng)100中。 可選地,用戶可以將所期望的圖像發(fā)送到遠程系統(tǒng)以檢索存儲在遠程系統(tǒng) 的數(shù)據(jù)庫中的一個或多個圖像。在此情況下,所期望的圖像可以被錄入便 攜裝置中,例如蜂窩電話、PDA等,并且然后使用無線或有線通信協(xié)議 發(fā)送到圖^^r索系統(tǒng)200。
圖像錄入單元120可以將查詢圖像210發(fā)送到圖像匹配單元140。在 步驟720, DT單元220 (可以在圖4象匹配單元140中實現(xiàn))可以在查詢 圖像210上執(zhí)行距離變換(DT)以產(chǎn)生中間圖像。例如,當查詢圖像是 二進制圖像時,DT單元210可以將該二進制圖像變換為灰階圖像。DT 單元220可以通過使用硬件實現(xiàn)、軟件實現(xiàn)或兩者的組合而采用任意適合 的方法而來執(zhí)行DT。在步驟730, ART單元240接收應用DT后的圖像 并在應用DT后的圖像(例如灰階圖像)上執(zhí)行ART描述符生成算法。
在步驟740, ART單元240可以獲得應用DT后的圖像的ART描述 符,由此獲得用于查詢圖像的GART描述符。在所選擇的實施例中,ART 單元240可以通過使用極坐標系統(tǒng)來表示應用DT后的圖像。ART單元 240可以在應用DT后的圖像的極坐標表示上執(zhí)行數(shù)值操作。例如,如以 上等式(1)所給出的,ART單元240可以將應用DT后的圖像的極坐標 表示乘以基礎函數(shù)中的一個以獲得乘法函數(shù)并且然后對該乘法函數(shù)積分
以計算GART系數(shù)中的一個。對不同的^J函數(shù)中的每一個執(zhí)行這種操 作以獲得一個或多個GART系數(shù)。在操作750中,ART單元240基于所 述系數(shù)確定用于查詢圖像210的描述符。換句話說,ART單元240可以
14收集GART系數(shù)以形成由以上等式(2)所給出的用于查詢圖像210的向 量形式的GART描述符。
參照圖8,說明了根據(jù)>$^>開的一個實施例的用于使用GART描述 符檢索圖像的方法。最初,在步驟810,用戶可以錄入查詢圖像210到圖 像檢索系統(tǒng)100的圖像錄入單元120。圖像錄入單元120通過包括例如直 接連接或通信協(xié)議的多種方式將查詢圖像發(fā)送到圖像匹配單元140。在步 驟820,圖像匹配單元140中的描述符生成單元280確定查詢圖像210的 描述符。DT單元220執(zhí)行查詢圖像210的DT變換以生成中間圖像。例 如,當查詢圖像是二進制圖像時,DT單元210可以將該二進制圖像變換 為灰階圖像(例如,圖5所示)。ART單元240用灰階圖像執(zhí)行ART描 述符生成算法以生成用于查詢圖像210的GART描述符。
在步驟830,相似性比較單元260然后可以將查詢圖像210的GART 描述符與存儲在DB160中的候選圖像的描述符進行比較。這種操作可以 通過測量查詢圖像210的GART描述符和候選圖像的GART描述符之間 的距離來完成。例如,為了測量該距離,如以上等式(3)所示,相似性 比較單元260計算兩個GART描述符的向量表示之間的歐幾里得 (Euclidian)距離。這種處理可以持續(xù)直至相似性比較單元260在候選圖 像中找到最接近的匹配(即產(chǎn)生足夠小距離的圖像)。在步驟840,用戶 然后可以基于操作830中提供的結果而檢索最接近的匹配的圖像270。該 圖像可以被傳送到圖傳檢索系統(tǒng)100的顯示器180以允許用戶在視覺上識 別圖像270并釆取進一步的后續(xù)動作。
在某個實施例中,顯示器180可以在便攜裝置(例如蜂窩電話或PDA) 中實現(xiàn)。在這種實施例中,圖像匹配單元140可以通過例如藍牙、紫蜂、 GSM、 CDMA等通信協(xié)議將匹配的圖像270發(fā)送到例如個人計算機、膝 上型計算機或蜂窩電話的便攜裝置。為了估計GART描述符的數(shù)據(jù)庫搜 索性能,使用由MPEG-7當前使用的數(shù)據(jù)庫進行數(shù)據(jù)庫搜索測試。所使 用的數(shù)據(jù)庫包括1300個圖像,該1300個圖像被分類為4層、包括8個頂 級類別和102個低級別或"葉子"類別的分級結構。MPEG-7所4吏用的牛 眼性能(BEP)被應用作為性能估計測量。較高的BEP分數(shù)意味著較高 效的性能。
圖9比較用于26個圖像的一個實施例中的GART描述符和傳統(tǒng)的 ART描述符之間的搜索性能。如圖8明確顯示,由BEP測量的GART 描述符的性能優(yōu)于傳統(tǒng)的ART描述符(在該特定示例中在相似性上超過約為3% )。
鑒于^L/^開,本領域技術人員將理解此處所述的系統(tǒng)、設備和方法可 以在硬件、軟件、固件、中間件或其組合中實現(xiàn)并且在系統(tǒng)、子系統(tǒng)、組 件或其子組件中使用。例如,以軟件實現(xiàn)的方法可以包括計算機編碼以執(zhí) 行所述方法的操作。這種計算機編碼可以存儲在機器可讀介質(zhì)中,例如處 理器可讀介質(zhì)或計算機程序產(chǎn)品,或者通過傳輸介質(zhì)或通信鏈路作為包含 在載波中的計算機數(shù)據(jù)信號或由栽波調(diào)制的信號而發(fā)送。機器可讀介質(zhì)或 處理器可讀介質(zhì)可以包括能夠存儲或傳輸具有可讀形式并可由機器(例如 通過處理器、計算機等)執(zhí)行的信息的任意介質(zhì)。
本公開可以在不背離其基本特點或本質(zhì)特征的情況下以其他具體形 式來實現(xiàn)。因此,所描述的實施例在各個方面僅^L視為示例性的,而不具 有限制性。因此,本公開的范圍由所附權利要求指出而不是由之前的說明 書指出。在權利要求的等價的意義和范圍內(nèi)的全部改變均包含在所述權利 要求的范圍內(nèi)。
權利要求
1.一種圖像檢索系統(tǒng),包括圖像錄入單元,所述圖像錄入單元被配置為接收作為輸入的圖像;描述符確定單元,所述描述符確定單元被配置為將所述圖像變換為中間圖像以生成所述圖像的描述符;圖像比較單元,所述圖像比較單元被配置為通過比較所述圖像的描述符與一個或多個候選圖像的描述符而將所述圖像與所述一個或多個候選圖像進行比較;以及檢索單元,所述檢索單元被配置為基于所述圖像與所述一個或多個候選圖像的描述符的比較而檢索類似于所述圖像的所述一個或多個候選圖像中的至少一個。
2. 根據(jù)權利要求l所述的圖#^索系統(tǒng),其中所述描述符確定單元 包括第一變換單元和第二變換單元。
3. 根據(jù)權利要求l所述的圖^^r索系統(tǒng),還包括顯示器,所述顯示 器被配置為顯示類似于輸入圖像的所述一個或多個候選圖像中的所述至 少一個。
4. 根據(jù)權利要求l所述的圖^^r索系統(tǒng),還包括數(shù)據(jù)庫,所述數(shù)據(jù) 庫用于存儲所述多個候選圖像。
5. 根據(jù)權利要求l所述的圖^^r索系統(tǒng),其中所述圖像比較單元被 配置為測量所述圖像的描述符和所述候選圖像的描述符之間的距離以將 所述圖像與所述多個候選圖像進行比較。
6. 根據(jù)權利要求5所述的圖#^索系統(tǒng),其中所述檢索單元被配置 為檢索具有到所述圖像的最短距離的所述一個或多個候選圖像中的至少 一個。
7. 根據(jù)權利要求2所述的圖像檢索系統(tǒng),其中所述第一變換單元對 所述圖4象執(zhí)行距離變換(DT )。
8. 根據(jù)權利要求7所述的圖#^索系統(tǒng),其中所述第一變換單元被 配置為生成所述圖像的附加特征。
9. 根據(jù)權利要求8所述的圖#^索系統(tǒng),其中所述圖像的附加特征 包括所述圖〗象的形狀的輪廓線、中間線和基干中的至少一個。
10. 根據(jù)權利要求2所述的圖#^索系統(tǒng),其中所述笫二變換單元被 配置為對由所述第 一 變換單元處理后的圖像執(zhí)行角徑向變換(ART )。
11. 一種用于生成與圖^N目關聯(lián)的描述符的設備,所述設備包括輸入單元,所述輸入單元被配置為輸入圖像;第一變換單元,所述笫一變換單元被配置為將所述圖4象變換為中間圖 像;以及第二變換單元,所述第二變換單元被配置為對所述中間圖像進行操作 以生成所述圖像的描述符。
12. 根據(jù)權利要求11所述的設備,其中所述中間圖像是灰階圖像。
13. 根據(jù)權利要求11所述的設備,其中所述第一變換單元被配置為 對所述圖像執(zhí)行距離變換(DT )。
14. 根據(jù)權利要求13所述的設備,其中所述第一變換單元被配置為 生成所述圖像的附加特征。
15. 根據(jù)權利要求14所述的設備,其中所述圖像的附加特征包括所 述圖像的形狀的輪廓線、中軸線和基干中的至少一個。
16. 根據(jù)權利要求11所述的設備,其中所述第二變換單元被配置為 對由所述第一變換單元處理后的圖像執(zhí)行角徑向變換(ART)。
17. 根據(jù)權利要求11所述的設備,其中所述第二變換單元被配置為 將所述中間圖像變換為表示所述中間圖像的特征的一個或多個系數(shù)。
18. 根據(jù)權利要求17所述的設備,其中所述第二變換單元被配置為 收集所述一個或多個系數(shù)以生成所述圖像的描述符。
19. 根據(jù)權利要求11所述的設備,其中所述設備是便攜裝置。
20. —種圖像匹配設備,包括變換單元,所述變換單元被配置為將圖像變換為中間圖像;描述符生成單元,所述描述符生成單元被配置為從所述中間圖像生成 所述圖像的描述符;以及匹配單元,所述匹配單元被配置為將所述圖像的描述符與一個或多個 候選圖像的描述符進行比較。
21. 根據(jù)權利要求20所述的圖像匹配設備,還包括存儲裝置,所述存儲裝置被配置為存儲所述一個或多個候選圖像。
22. 根據(jù)權利要求20所述的圖像匹配設備,其中所述匹配單元進一 步被配置為測量所述圖像的描述符和所述一個或多個候選圖像的描述符 之間的多巨離。
23. 根據(jù)權利要求20所述的圖像匹配設備,其中所述變換單元被配 置為對所述圖像執(zhí)行距離變換(DT)以生成所述中間圖《象。
24. 根據(jù)權利要求20所述的圖像匹配設備,其中所述描述符生成單 元被配置為對由所述變換單元處理后的圖像執(zhí)行角徑向變換(ART )。
25. —種用于生成圖像的描述符的方法,所述方法包括 接收作為輸入的圖像; 將所述圖像變換為中間圖像;以及基于所述中間圖像生成所述圖像的描述符。
26. 根據(jù)權利要求25所述的方法,其中變換所述圖像包括對該圖像 執(zhí)4亍多巨離變換(DT)。
27. 根據(jù)權利要求25所述的方法,其中生成所述描述符包括執(zhí)行角 徑向變換(ART)。
28. —種圖像檢索方法,包括 將圖像變換為中間圖像;基于所述中間圖像的特征生成所述圖像的描述符;通過比較所述圖像的描述符與候選圖像的描述符而將所述圖像與一 個或多個候選圖像進行比較;以及基于所述描述符的比較而檢索類似于所述圖像的所述一個或多個候 選圖像中的至少一個。
29. 根據(jù)權利要求28所述的圖像檢索系統(tǒng),其中比較所述圖像包括 測量所述圖像的描述符和所述候選圖像的描述符之間的距離以將所述圖 像與所述多個候選圖像進行比較。
30. 根據(jù)權利要求29所述的圖#^索系統(tǒng),其中檢索一個或多個候 選圖像包括檢索具有到所述圖像的最短距離的所述候選圖像中的至少一 個。
31. —種存儲指令的計算機可讀介質(zhì),當由計算機執(zhí)行所述指令時, 使得計算機執(zhí)行用于生成圖像的描述符的方法,所述方法包括將圖像變換為中間圖〗象;以及基于所述中間圖像生成所述圖像的描述符。
32. —種存儲指令的計算機可讀介質(zhì),當由計算機執(zhí)行所述指令時, 使得計算機執(zhí)行用于檢索圖像的方法,所述方法包括將圖像變換為中間圖像;基于所述中間圖像的特征生成所述圖像的描述符;通過比較所述圖像的描述符與候選圖像的描述符而將所述圖像與多 個候選圖像進行比較;以及基于所述描述符的比較而檢索類似于所述圖像的一個或多個候選圖像。
33. —種包括指令的計算機程序,當由計算機執(zhí)行所述計算M序時, 使得計算機執(zhí)行用于生成圖像的描述符的方法,所述方法包括接收輸入圖像;將所述圖像變換為中間圖像;以及 基于所述中間圖像生成所述圖像的描述符。
34. —種包括指令的計算機程序,當由計算機執(zhí)行所述計算積艱序時, 使得計算機執(zhí)行用于檢索圖像的方法,所述方法包括將輸入圖像變換為中間圖像;基于所述中間圖像的特征生成所述圖像的描述符;通過比較所述圖像的描述符與候選圖像的描述符而將所述圖像與多 個候選圖像進行比較;以及基于所述描述符的比較而檢索類似于所述圖像的一個或多個候選圖像。
全文摘要
一種圖像檢索系統(tǒng),包括圖像錄入單元,該圖像錄入單元被配置為輸入圖像。描述符確定單元接收圖像并將該圖像變換為中間圖像以生成該圖像的描述符,例如,使用距離變換(DT)應用。圖像比較單元通過比較該圖像的描述符與多個候選圖像的描述符而將該圖像與多個候選圖像進行比較。最后,檢索單元基于其描述符的比較而檢索類似于輸入圖像的一個或多個候選圖像。
文檔編號G06F17/30GK101669117SQ200880000306
公開日2010年3月10日 申請日期2008年5月9日 優(yōu)先權日2008年5月9日
發(fā)明者尹逸東 申請人:韓國外國語大學校研究產(chǎn)學協(xié)力團