專利名稱:一種保持物體幾何形狀信息的圖像檢索系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像檢索領(lǐng)域,特別涉及一種保持物體幾何形狀信息的圖像檢索系統(tǒng)及方法。
背景技術(shù):
圖像檢索通常被定義為以特定的檢索項(xiàng),如關(guān)鍵詞,語音,圖像等,在已有圖像庫中檢索符合檢索項(xiàng)要求的圖片。
在信息檢索的一開始,圖像檢索已經(jīng)吸引了大量用戶的參與。圖像檢索的目標(biāo)為如何根據(jù)檢索項(xiàng),快速返回需要檢索的圖片。根據(jù)檢索項(xiàng)的不同,主流的圖片檢索技術(shù)主要有基于關(guān)鍵詞和基于圖像的圖像檢索技術(shù)?,F(xiàn)有的基于關(guān)鍵詞的圖像檢索技術(shù)發(fā)展相對成熟,主要有Google、Baidu和Bing等大型搜索網(wǎng)站推出的圖像檢索技術(shù);
相比之下,基于圖像的圖像檢索是剛剛起步的新興領(lǐng)域,但其可觀的應(yīng)用前景引發(fā)了國內(nèi)外的研究熱潮,并取得了一定的研究成果。主要包括IBM的QBIC、VIRAGE的VIR和Excalibur的RetrievalWare等一批具備一定實(shí)用價值的圖像檢索系統(tǒng)?;趫D像的圖像檢索技術(shù)與基于關(guān)鍵詞的圖像檢索技術(shù)具有較大差別。基于圖像的圖像檢索技術(shù)一般沒有為圖像打標(biāo)簽這個步驟,而是直接依據(jù)視覺特征或語義特征等圖像本身具備的內(nèi)容進(jìn)行檢索。為了保證檢索的精度,北京工業(yè)大學(xué)、浙江大學(xué)、西北工業(yè)大學(xué)和三星電子等高校和企業(yè)已經(jīng)開展相關(guān)研究工作,一些可行的圖像檢索方法被相應(yīng)提出?,F(xiàn)有基于圖像的圖像檢索系統(tǒng)主要存在一下幾個方面的不足:A)、局限于局部特征信息,缺乏對物體形狀信息的描述。雖然大部分圖像檢索系統(tǒng)都采用了顏色直方圖、SIFT特征或SURF特征等各種特征描述,但是這些特征都是圖片信息的孤立描述,缺乏有效的整合,尤其是缺乏對圖片中各個特征的相對位置的描述。B)、在大規(guī)模數(shù)據(jù)庫上的可用性弱。海量圖像數(shù)據(jù)面臨存儲空間的有效利用和管理等問題,同時隨著數(shù)據(jù)規(guī)模的日益膨脹,檢索速度存在瓶頸。C)、缺乏有效索引機(jī)制。當(dāng)前基于視覺特征的圖像檢索系統(tǒng)大多在提取的顏色、紋理、形狀的基礎(chǔ)上直接建立索引。對于這些高維的底層特征,傳統(tǒng)的索引機(jī)制不再有效,性能急劇下降,甚至不如順序掃描或窮舉搜索,有維度災(zāi)難的危險。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種保持物體幾何形狀信息的圖像檢索系統(tǒng)及方法。提供一種更為有效和完整的圖像描述方法;使得檢索精度更高,系統(tǒng)性能更好,實(shí)用性更強(qiáng)。為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為
一種保持物體幾何信息的圖像檢索系統(tǒng),包括
圖像導(dǎo)入接口,用于將圖像批量插入;圖像檢索客戶端,用于接收用戶的圖像檢索查詢請求和呈現(xiàn)查詢結(jié)果;提供Web在線瀏覽、檢索和客戶端程序等多種渠道,對用戶需求進(jìn)行分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫的提問;
管理員接口,用于接收管理員提交的系統(tǒng)管理命令,還包括管理員設(shè)置的參數(shù)等; 系統(tǒng)管理模塊,用于執(zhí)行管理員接口接收到的請求,依據(jù)命令對系統(tǒng)進(jìn)行一些設(shè)置操
作;
基于帶權(quán)圖的圖像建模模塊,用于將圖像抽象為帶權(quán)圖的圖結(jié)構(gòu)表示為后續(xù)的模式挖掘做準(zhǔn)備;
圖像頻繁模式挖掘模塊,用于挖掘圖結(jié)構(gòu)數(shù)據(jù)集范圍內(nèi)的頻繁模式,識別具有顯著語義特性的視覺模式;
圖像檢索模塊,用于將檢索項(xiàng)與預(yù)先建立數(shù)據(jù)庫中的記錄進(jìn)行比對和匹配;獲取查詢 圖像的圖結(jié)構(gòu)表示,并以此作為索引檢索數(shù)據(jù)庫中的項(xiàng),根據(jù)預(yù)先建立好的相似性度量方法得到每一項(xiàng)相對于檢索項(xiàng)的相似度,最后按照相似度降序排列各項(xiàng),并返回結(jié)果至圖像檢索客戶端;
基于HBase圖像數(shù)據(jù)庫的數(shù)據(jù)存儲、訪問和管理服務(wù)模塊,用于接收以查詢圖像為目的的數(shù)據(jù)庫操作和存儲圖片。所述基于帶權(quán)圖的圖像建模模塊分別與圖像導(dǎo)入接口和圖像檢索客戶端發(fā)生交互。由于帶權(quán)圖是索引和匹配的基本單位。圖像導(dǎo)入接口接收的是即將被檢索的項(xiàng),而圖像檢索客戶端接收的則是查詢圖像原型,即檢索的依據(jù)。換言之,用戶提交的示例圖像和預(yù)先建立的圖像數(shù)據(jù)庫中的圖像都需要用帶權(quán)圖模型加以描述,才能執(zhí)行下一步的操作。所述基于帶權(quán)圖的圖像建模模塊以圖像提取的Surf特征點(diǎn)為圖像的頂點(diǎn);對Surf特征點(diǎn)進(jìn)行量化和聚類得到的視覺單詞作為頂點(diǎn)的標(biāo)號;采用k近鄰法建立每個頂點(diǎn)與其k個近鄰間的無向邊,再根據(jù)兩點(diǎn)之間的歐式距離為邊分配權(quán)值。所述頂點(diǎn)的標(biāo)號為頂點(diǎn)的分類號,是計算頂點(diǎn)頻度的依據(jù);而連接頂點(diǎn)的無向邊表示Surf特征點(diǎn)之間的空間幾何關(guān)系;邊的權(quán)值等于歐式距離的倒數(shù)的向上取整,即權(quán)值與歐式距離成反比,這是因?yàn)橄嗑嘣浇狞c(diǎn)被認(rèn)為屬于同一視覺模式的可能性越大,在檢索匹配時往往作為一個整體被優(yōu)先考慮。所述圖像檢索模塊的操作對象為基于帶權(quán)圖的圖像建模模塊抽象得到的帶權(quán)圖;圖像檢索模塊采用基于圖編輯距離的相似度量方法對查詢圖和檢索圖進(jìn)行匹配,即圖像檢索模塊的主要的操作是在查詢圖與檢索圖之間進(jìn)行匹配,為了減少噪聲和形變給匹配帶來的負(fù)面影響,使用基于圖編輯距離的相似度量方法提高容錯性。所述圖像頻繁模式挖掘模塊根據(jù)頂點(diǎn)特征描述識別出在圖結(jié)構(gòu)數(shù)據(jù)集范圍內(nèi)頻繁出現(xiàn)的模式,所述頻繁是指出現(xiàn)次數(shù)不小于最小支持度閾值。圖結(jié)構(gòu)數(shù)據(jù)集范圍內(nèi)頻繁出現(xiàn)的模式是一組公共子圖結(jié)構(gòu),與圖像本身及其分散的特征點(diǎn)相比,表達(dá)上較緊湊且語義層次較高。所述檢基于HBase圖像數(shù)據(jù)庫的數(shù)據(jù)存儲、訪問和管理服務(wù)模塊包括面向HBase圖像數(shù)據(jù)庫的圖像查詢接口和基于HBase云存儲平臺的圖像數(shù)據(jù)庫;
面向HBase圖像數(shù)據(jù)庫的圖像查詢接口,用于接收以查詢圖像為目的的數(shù)據(jù)庫操作;支持使用布隆過濾器進(jìn)行快速查詢預(yù)篩選和利用頻繁子圖對帶權(quán)圖進(jìn)行索引;基于HBase云存儲平臺的圖像數(shù)據(jù)庫,用于存儲圖片,另外整合并提供了快速存取、有效索引等機(jī)制。本發(fā)明的另一目的是提出一種用于圖像檢索系統(tǒng)的圖像檢索方法,包括以下步驟
51)通過圖像導(dǎo)入接口將圖像數(shù)據(jù)批量導(dǎo)入;
52)利用基于帶權(quán)圖的圖像建模模塊將導(dǎo)入的圖像分別抽象化為圖結(jié)構(gòu)表示;
53)利用圖像頻繁模式挖掘模塊挖掘圖結(jié)構(gòu)表示數(shù)據(jù)范圍內(nèi)的頻繁模式;
54)根據(jù)頻繁模式建立索引結(jié)構(gòu);
55)通過圖像檢索客戶端讀取用戶提交的查詢圖像;
56)利用基于帶權(quán)圖的圖像建模模塊將查詢圖像分別抽象為帶權(quán) 57)將查詢圖像的帶權(quán)圖與索引結(jié)構(gòu)中的索引項(xiàng)匹配,得到查詢圖像中含有的若干頻繁模式,從而獲得含有這些頻繁模式的原圖像列表;根據(jù)與索引結(jié)構(gòu)的相似性排序圖像得到圖像列表;
58)返回已被排序的圖像列表到圖像客戶端供用戶直接查看;
步驟S3)包括以下步驟
531)圖像頻繁模式挖掘模塊掃描圖集;根據(jù)頂點(diǎn)分類號計算頂點(diǎn)的支持度,忽略支持度小于最小支持度閾值的頂點(diǎn);所述支持度不小于最小支持度閾值的頂點(diǎn)為頻繁點(diǎn),將兩個頻繁點(diǎn)和一條邊組成的頻繁一邊圖作為初始子 532)將包含k條邊的頻繁子圖作為種子圖,添加一條邊對其進(jìn)行擴(kuò)展,生成包含k++條邊的候選子圖,計算候選子圖的支持度,若候選子圖的支持度小于最小支持度閾值,將該候選子圖舍棄;否則將候選子圖作為含k++條邊的頻繁子圖插入頻繁子圖集中;
533)將步驟S32)挖掘所得的含k++條邊的頻繁子圖作為新的種子圖,重復(fù)步驟S32);
534)若由k條邊頻繁子圖擴(kuò)展所得的所有k++條邊候選子圖均被考慮過,回溯到其它k條邊的頻繁子圖繼續(xù)擴(kuò)展;
535)重復(fù)步驟S32)、S33)、S34),直到?jīng)]有新的頻繁子圖被發(fā)現(xiàn)為止。保持物體幾何信息的圖像建模能有效把握各種物體特征間的幾何相對位置信息,系統(tǒng)的查全率和查準(zhǔn)率均比現(xiàn)有的模型有較大提升;結(jié)合HBase的布隆過濾器的使用,頻繁子圖索引技術(shù)提高了系統(tǒng)的響應(yīng)速度,支持海量圖片的在線查找。使用本發(fā)明的圖像檢索系統(tǒng)及方法,具有以下幾個方面的優(yōu)點(diǎn)
I)提供了一種更為有效和完整的圖像描述方法。以Surf特征為基礎(chǔ)建立起來的帶權(quán)圖相比于其他傳統(tǒng)圖像表示模型具有更強(qiáng)的表達(dá)能力,避免了特征點(diǎn)之間空間幾何關(guān)系的丟失。2)系統(tǒng)性能高、實(shí)用性強(qiáng)。HBase的布隆過濾器和頻繁子圖索引技術(shù)“雙管齊下”提高了系統(tǒng)的響應(yīng)速度,削弱了大規(guī)模數(shù)據(jù)庫所帶來的壓力,增強(qiáng)了系統(tǒng)的可用性,擴(kuò)大了應(yīng)用范圍。3)檢索的精確性更高?;趲?quán)圖的相似性檢測依賴圖的結(jié)構(gòu)化在度量相似度時加入了對物體幾何形狀信息的考慮,使得匹配時具有一定的容錯性,提高了檢索精度。
圖I為本發(fā)明的保持物體幾何信息的圖像檢索系統(tǒng)架構(gòu) 圖2為本發(fā)明的保持物體幾何信息的圖像檢索方法的流程 圖3為本發(fā)明的基于帶權(quán)圖的圖像建模步驟的實(shí)現(xiàn)原理 圖4為本發(fā)明的圖像頻繁模式挖掘步驟的實(shí)現(xiàn)原理 圖5為本發(fā)明的圖像檢索步驟的實(shí)現(xiàn)原理圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明進(jìn)一步詳細(xì)說明。圖I示出了本發(fā)明的保持物體幾何信息的圖像檢索系統(tǒng)架構(gòu)圖。參照圖1,本發(fā)明的圖像檢索系統(tǒng)包括圖像導(dǎo)入接口、圖像檢索客戶端、基于帶權(quán)圖的圖像建模模塊、圖像頻繁模式挖掘模塊、圖像檢索模塊、系統(tǒng)管理模塊、管理員接口、面向HBase圖像數(shù)據(jù)庫的圖像查詢接口和基于HBase云存儲平臺的圖像數(shù)據(jù)庫。其中
圖像導(dǎo)入接口,將圖像批量插入,實(shí)現(xiàn)海量數(shù)據(jù)的快速導(dǎo)入。圖像檢索客戶端,主要將用戶提交的查詢圖像傳遞給基于帶權(quán)圖的圖像建模模塊。另外,將用戶通過該平臺設(shè)置的其它相關(guān)參數(shù),如希望檢索得到的圖像個數(shù)和檢索結(jié)果的顯示方式等傳遞給圖像檢索模塊,以使查詢的結(jié)果更符合用戶的需求?;趲?quán)圖的圖像建模模塊,對來自于圖像檢索客戶端和圖像導(dǎo)入接口的圖像進(jìn)行Surf特征提取。兩個不同來源的建模結(jié)果去向不一致,前者直接作為檢索圖像數(shù)據(jù)庫時的輸入。后者要插入一個圖集中,以送入圖像頻繁模式挖掘模塊進(jìn)行進(jìn)一步的挖掘。圖像頻繁模式挖掘模塊,將基于帶權(quán)圖的圖像建模模塊生成的圖集作為挖掘的基礎(chǔ)。具體是從最簡單的頻繁子結(jié)構(gòu)——頻繁點(diǎn)開始,以不斷添加頻繁邊的方式擴(kuò)展出其它更為復(fù)雜的頻繁子結(jié)構(gòu)。將這些子結(jié)構(gòu)的頻度與用戶預(yù)先設(shè)定好的最小支持度閾值,如10%,進(jìn)行比較,不小于最小支持度即所需要識別的頻繁模式,將其作為索引項(xiàng)插入到圖像數(shù)據(jù)庫中。圖像檢索模塊,以查詢圖像的帶權(quán)圖為根據(jù)去檢索圖像數(shù)據(jù)庫,并以用戶希望的方式將檢索所得的圖像列表呈現(xiàn)在圖像檢索客戶端上。管理員接口,與系統(tǒng)管理員發(fā)生直接交互的模塊,系統(tǒng)管理員通過它可以向系統(tǒng)發(fā)送管理命令。系統(tǒng)管理模塊,執(zhí)行來自管理員接口的命令。面向HBase圖像數(shù)據(jù)庫的圖像查詢接口,接收并執(zhí)行來自其它功能模塊的數(shù)據(jù)庫操作,包括來自圖像頻繁模式挖掘模塊的插入請求、來自基于帶權(quán)圖的圖像建模模塊和圖像檢索模塊的查詢請求等。該模塊根據(jù)這些請求對基于HBase云存儲平臺的圖像數(shù)據(jù)庫執(zhí)行相應(yīng)的操作。圖2為本發(fā)明的保持物體幾何信息的圖像檢索方法的流程圖。參照圖2,圖像檢索方法包括以下步驟
51)通過圖像導(dǎo)入接口將圖像數(shù)據(jù)批量導(dǎo)入;
52)利用基于帶權(quán)圖的圖像建模模塊將導(dǎo)入的圖像分別抽象化為圖結(jié)構(gòu)表示模型;
53)利用圖像頻繁模式挖掘模塊挖掘圖表示模型的頻繁模式;54)將頻繁模式作為索引項(xiàng)建立倒排索引結(jié)構(gòu);
55)通過圖像檢索客戶端讀取用戶提交的查詢圖像;
56)利用基于帶權(quán)圖的圖像建模模塊將查詢圖像分別抽象為帶權(quán)圖的表示模型;
57)將查詢圖像的帶權(quán)圖與索引結(jié)構(gòu)中的索引項(xiàng)匹配,得到查詢圖像中含有的若干頻繁模式,從而獲得含有這些頻繁模式的原圖像列表;根據(jù)與索引結(jié)構(gòu)的相似性排序圖像得到圖像列表;
58)返回已被排序的圖像列表到圖像客戶端供用戶直接查看。步驟S2)的步驟包括
521)檢測區(qū)域確定Surf特征點(diǎn)的坐標(biāo),以之建立圖的頂點(diǎn);
522)所有Surf特征向量集合在一起,利用聚類算法分類并給每一類構(gòu)造一個視覺詞匯。采用該法即相當(dāng)于給每個Surf特征點(diǎn)分配了一個視覺詞匯,即在建模時也給每個頂點(diǎn)分配一個標(biāo)號。S23)在頂點(diǎn)之間建立無向邊,必須為每個點(diǎn)找出k個與它距離最近的點(diǎn)。相距越近的點(diǎn)被認(rèn)為相關(guān)性越大,因此被賦予的權(quán)值也越大。步驟S3)包括以下步驟
531)圖像頻繁模式挖掘模塊掃描圖集;根據(jù)頂點(diǎn)分類號計算頂點(diǎn)的支持度,忽略支持度小于最小支持度閾值的頂點(diǎn);所述支持度不小于最小支持度閾值的頂點(diǎn)為頻繁點(diǎn),將兩個頻繁點(diǎn)和一條邊組成的頻繁一邊圖作為初始子 532)將包含k條邊的頻繁子圖作為種子圖,添加一條邊對其進(jìn)行擴(kuò)展,生成包含k++條邊的候選子圖,計算候選子圖的支持度,若候選子圖的支持度小于最小支持度閾值,將該候選子圖舍棄;否則將候選子圖作為含k++條邊的頻繁子圖插入頻繁子圖集中;
533)將步驟S32)挖掘所得的含k++條邊的頻繁子圖作為新的種子圖,重復(fù)步驟S32);
534)若由k條邊頻繁子圖擴(kuò)展所得的所有k++條邊候選子圖均被考慮過,回溯到其它k條邊的頻繁子圖繼續(xù)擴(kuò)展;
535)重復(fù)步驟S32)、S33)、S34),直到?jīng)]有新的頻繁子圖被發(fā)現(xiàn)為止。本發(fā)明的圖像檢索方法主要包括圖像建模、頻繁模式挖掘和圖像檢索。圖3是圖像建模的實(shí)現(xiàn)原理圖;圖4是圖像頻繁模式挖掘的實(shí)現(xiàn)原理圖;圖5是圖像檢索的實(shí)現(xiàn)原理圖。參照圖3,圖像建模,從圖像導(dǎo)入接口和圖像客戶端兩個渠道獲取用于建模的原圖像數(shù)據(jù),具體的建模過程則由基于帶權(quán)圖的圖像建模模塊完成。建模后的結(jié)果要作為檢索項(xiàng)插入圖像數(shù)據(jù)庫中。參照圖4,頻繁模式挖掘,其挖掘的對象是圖結(jié)構(gòu)表示數(shù)據(jù)而不是原圖像數(shù)據(jù),挖掘的范圍是整個圖集。首先是利用基于帶權(quán)圖的圖像建模模塊將來自圖像導(dǎo)入接口的圖像轉(zhuǎn)換成圖結(jié)構(gòu)并集合成圖集;再調(diào)用頻繁模式挖掘算法得到頻繁模式集,將它們插入到圖像數(shù)據(jù)庫中,作為其中的索引項(xiàng)。參照圖5,圖像檢索的依據(jù)來自于從圖像客戶端送入圖像建模模塊處理后得到的帶權(quán)圖,檢索的對象來自于圖像數(shù)據(jù)庫。以上所述的具體實(shí)施例,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實(shí)施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保 護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種保持物體幾何信息的圖像檢索系統(tǒng),其特征在于包括 圖像導(dǎo)入接口,用于將圖像批量插入; 圖像檢索客戶端,用于接收用戶的圖像檢索查詢請求和呈現(xiàn)查詢結(jié)果; 管理員接口,用于接收管理員提交的系統(tǒng)管理命令; 系統(tǒng)管理模塊,用于執(zhí)行管理員接口接收到的請求; 基于帶權(quán)圖的圖像建模模塊,用于將圖像抽象為帶權(quán)圖的圖結(jié)構(gòu)表示; 圖像頻繁模式挖掘模塊,用于挖掘圖結(jié)構(gòu)數(shù)據(jù)集范圍內(nèi)的頻繁模式,識別具有顯著語義特性的視覺模式; 圖像檢索模塊,用于將檢索項(xiàng)與預(yù)先建立數(shù)據(jù)庫中的記錄進(jìn)行比對和匹配; 基于HBase圖像數(shù)據(jù)庫的數(shù)據(jù)存儲、訪問和管理服務(wù)模塊,用于接收以查詢圖像為目的的數(shù)據(jù)庫操作和存儲圖片。
2.根據(jù)權(quán)利要求I所述保持物體幾何信息的圖像檢索系統(tǒng),其特征在于所述基于帶權(quán)圖的圖像建模模塊分別與圖像導(dǎo)入接口和圖像檢索客戶端發(fā)生交互。
3.根據(jù)權(quán)利要求2所述保持物體幾何信息的圖像檢索系統(tǒng),其特征在于所述基于帶權(quán)圖的圖像建模模塊以圖像提取的Surf特征點(diǎn)為圖像的頂點(diǎn);對Surf特征點(diǎn)進(jìn)行量化和聚類得到的視覺單詞作為頂點(diǎn)的標(biāo)號;采用k近鄰法建立每個頂點(diǎn)與其k個近鄰間的無向邊,再根據(jù)兩點(diǎn)之間的歐式距離為邊分配權(quán)值。
4.根據(jù)權(quán)利要求3所述保持物體幾何信息的圖像檢索系統(tǒng),其特征在于所述頂點(diǎn)的標(biāo)號為頂點(diǎn)的分類號,是計算頂點(diǎn)頻度的依據(jù);連接頂點(diǎn)的無向邊表示Surf特征點(diǎn)之間的空間幾何關(guān)系;邊的權(quán)值等于歐式距離的倒數(shù)的向上取整。
5.根據(jù)權(quán)利要求I所述保持物體幾何信息的圖像檢索系統(tǒng),其特征在于所述圖像檢索模塊的操作對象為基于帶權(quán)圖的圖像建模模塊抽象得到的帶權(quán)圖;圖像檢索模塊采用基于圖編輯距離的相似度量方法對查詢圖和檢索圖進(jìn)行匹配。
6.根據(jù)權(quán)利要求I所述保持物體幾何信息的圖像檢索系統(tǒng),其特征在于所述圖像頻繁模式挖掘模塊根據(jù)頂點(diǎn)描述特征識別出在圖結(jié)構(gòu)數(shù)據(jù)集范圍內(nèi)頻繁出現(xiàn)的模式,所述頻繁是指出現(xiàn)次數(shù)不小于最小支持度閾值。
7.根據(jù)權(quán)利要求I所述保持物體幾何信息的圖像檢索系統(tǒng),其特征在于所述檢基于HBase圖像數(shù)據(jù)庫的數(shù)據(jù)存儲、訪問和管理服務(wù)模塊包括面向HBase圖像數(shù)據(jù)庫的圖像查詢接口和基于HBase云存儲平臺的圖像數(shù)據(jù)庫; 面向HBase圖像數(shù)據(jù)庫的圖像查詢接口,用于接收以查詢圖像為目的的數(shù)據(jù)庫操作; 基于HBase云存儲平臺的圖像數(shù)據(jù)庫,用于存儲圖片。
8.一種用于權(quán)利要求I至7所述任一項(xiàng)的圖像檢索系統(tǒng)的圖像檢索方法,其特征在于包括以下步驟 51)通過圖像導(dǎo)入接口將圖像數(shù)據(jù)批量導(dǎo)入; 52)利用基于帶權(quán)圖的圖像建模模塊將導(dǎo)入的圖像分別抽象化為圖結(jié)構(gòu)表示; 53)利用圖像頻繁模式挖掘模塊挖掘圖結(jié)構(gòu)表示數(shù)據(jù)范圍內(nèi)的頻繁模式; 54)根據(jù)頻繁模式建立索引結(jié)構(gòu); 55)通過圖像檢索客戶端讀取用戶提交的查詢圖像; 56)利用基于帶權(quán)圖的圖像建模模塊將查詢圖像分別抽象為帶權(quán)圖;57)將查詢圖像的帶權(quán)圖與索引結(jié)構(gòu)中的索引項(xiàng)匹配,得到查詢圖像中含有的若干頻繁模式,從而獲得含有這些頻繁模式的原圖像列表;根據(jù)與索引結(jié)構(gòu)的相似性排序圖像得到圖像列表; 58)返回已被排序的圖像列表到圖像客戶端供用戶直接查看。
9.根據(jù)權(quán)利要求I所述圖像檢索方法,其特征在于步驟S3)包括以下步驟 531)圖像頻繁模式挖掘模塊掃描圖集;根據(jù)頂點(diǎn)分類號計算頂點(diǎn)的支持度,忽略支持度小于最小支持度閾值的頂點(diǎn);所述支持度不小于最小支持度閾值的頂點(diǎn)為頻繁點(diǎn),將兩個頻繁點(diǎn)和一條邊組成的頻繁一邊圖作為初始子圖; 532)將包含k條邊的頻繁子圖作為種子圖,添加一條邊對其進(jìn)行擴(kuò)展,生成包含k++條邊的候選子圖,計算候選子圖的支持度,若候選子圖的支持度小于最小支持度閾值,將該候選子圖舍棄;否則將候選子圖作為含k++條邊的頻繁子圖插入頻繁子圖集中; 533)將步驟S32)挖掘所得的含k++條邊的頻繁子圖作為新的種子圖,重復(fù)步驟S32); 534)若由k條邊頻繁子圖擴(kuò)展所得的所有k++條邊候選子圖均被考慮過,回溯到其它k條邊的頻繁子圖繼續(xù)擴(kuò)展; 535)重復(fù)步驟S32)、S33)、S34),直到?jīng)]有新的頻繁子圖被發(fā)現(xiàn)為止。
全文摘要
本發(fā)明公開了一種保持物體幾何形狀信息的圖像檢索系統(tǒng)及方法,該系統(tǒng)包括圖像導(dǎo)入接口、圖像檢索客戶端、接收系統(tǒng)管理命令的管理員接口、執(zhí)行管理員請求的系統(tǒng)管理模塊、將圖像抽象為帶權(quán)圖的圖像建模模塊、挖掘視覺模式的圖像頻繁模式挖掘模塊、將檢索項(xiàng)與記錄進(jìn)行比對和匹配的圖像檢索模塊和基于HBase圖像數(shù)據(jù)庫的數(shù)據(jù)存儲、訪問和管理服務(wù)模塊。保持物體幾何信息的圖像建模能有效把握各種物體特征間的幾何相對位置信息,使系統(tǒng)的查全率和查準(zhǔn)率均比現(xiàn)有的模型有較大提升;結(jié)合HBase的布隆過濾器和頻繁子圖索引技術(shù)的使用提高了系統(tǒng)的響應(yīng)速度,支持海量圖片的在線查找。
文檔編號G06F17/30GK102831216SQ20121029377
公開日2012年12月19日 申請日期2012年8月17日 優(yōu)先權(quán)日2012年8月17日
發(fā)明者蔡瑞初, 郝志峰, 曾燕妮, 溫雯 申請人:廣東工業(yè)大學(xué)