用于視覺(jué)搜索的緊致描述符的系統(tǒng)和方法
【專(zhuān)利摘要】用于處理圖像的一種方法和一種設(shè)備,使用線性嵌入算子根據(jù)所述圖像的第一特征點(diǎn)集合生成第二特征點(diǎn)集合,這樣,所述第一特征點(diǎn)集合中的成對(duì)最近鄰(NN)拓?fù)潢P(guān)系便被保留在所述第二特征點(diǎn)集合中。所述線性嵌入算子由密切模型確定,所述密切模型包括第一密切參數(shù)、第二密切參數(shù)和密切矩陣,其中所述密切矩陣的稀疏度由所述第一密切參數(shù)和所述第二密切參數(shù)來(lái)控制。
【專(zhuān)利說(shuō)明】用于視覺(jué)搜索的緊致描述符的系統(tǒng)和方法
[0001]本發(fā)明要求2011年12月29日提交的發(fā)明名稱(chēng)為“用于視覺(jué)搜索的緊致描述符的系統(tǒng)和方法(System and Method for Compact Descriptor for Visual Search)” 的第61/340,327號(hào)美國(guó)非臨時(shí)申請(qǐng)案的在先申請(qǐng)優(yōu)先權(quán),該申請(qǐng)案要求2011年7月11日提交的發(fā)明名稱(chēng)為“作為視覺(jué)搜索中緊致描述符的拉普拉斯SURF所用的系統(tǒng)和方法(System and Method for Laplacian SURF as Compact Descriptor for Visual Search),,第61/506,615號(hào)美國(guó)臨時(shí)申請(qǐng)案的在先申請(qǐng)優(yōu)先權(quán),這兩個(gè)在先申請(qǐng)的內(nèi)容以全文引入的方式并入本文本中。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及圖像處理方法和系統(tǒng),并且在特定實(shí)施例中,涉及用于視覺(jué)搜索應(yīng)用下圖像的視覺(jué)描述符中緊湊表示的系統(tǒng)和方法。
【背景技術(shù)】
[0003]現(xiàn)代的移動(dòng)電話、手機(jī)、平板計(jì)算機(jī)、移動(dòng)終端、移動(dòng)裝置或用戶(hù)設(shè)備已發(fā)展為有效的圖像和視頻處理裝置,該圖像和視頻處理裝置配備有高分辨率相機(jī)、彩色顯示器,和硬件加速圖形。隨著像androicUiPhone之類(lèi)的移動(dòng)裝置迅速發(fā)展,基于移動(dòng)的多媒體視覺(jué)服務(wù)正經(jīng)歷著激烈的變革及開(kāi)發(fā)。移動(dòng)視覺(jué)搜索服務(wù)的應(yīng)用場(chǎng)景可以是基于位置的服務(wù)、圖標(biāo)搜索等等,其中從移動(dòng)裝置中發(fā)送的一個(gè)圖像或多媒體與存儲(chǔ)在數(shù)據(jù)庫(kù)或圖像存儲(chǔ)庫(kù)中的另一圖像或多媒體相匹配。移動(dòng)視覺(jué)搜索系統(tǒng)的第一部署應(yīng)用包括谷歌的Goggles、諾基亞的 Point and Find、Kooaba 和 Snaptell。
[0004]移動(dòng)裝置經(jīng)由無(wú)線網(wǎng)絡(luò)而發(fā)送的圖像查詢(xún)通常在計(jì)算上開(kāi)銷(xiāo)很大,需要相當(dāng)高的通信成本,而且無(wú)法支持實(shí)時(shí)操作。在受歡迎的應(yīng)用程序中,其中移動(dòng)裝置捕獲某些對(duì)象的圖片,并經(jīng)由無(wú)線網(wǎng)絡(luò)將這一圖片作為查詢(xún)而發(fā)送以搜索較大的存儲(chǔ)庫(kù),降低位速率同時(shí)保持匹配準(zhǔn)確度是在MPEG下進(jìn)行標(biāo)準(zhǔn)化努力所面臨的主要問(wèn)題和主要重點(diǎn)。
[0005]視覺(jué)描述符或圖像描述符是對(duì)產(chǎn)生此類(lèi)描述的圖像和視頻中的內(nèi)容的視覺(jué)特征點(diǎn)的描述。這些描述符描述了形狀、顏色、紋理或動(dòng)作等基本特性,以及其他基本特性,并且這些描述使得可以更快速更有效地來(lái)搜索音頻-視頻內(nèi)容。處理音頻-視頻描述符的標(biāo)準(zhǔn)化組織是運(yùn)動(dòng)圖像專(zhuān)家組-7 (MPEG-7)。
[0006]然而,對(duì)于移動(dòng)裝置來(lái)說(shuō),視覺(jué)描述符通常還是非常多,這是因?yàn)樗鼈冇蓴?shù)百個(gè)具有尺度與旋轉(zhuǎn)不變性的特征點(diǎn)及其位置組成。有時(shí)這些尺度不變特征點(diǎn)可能比圖像本身還要大。尺度不變特征變換(SIFT)的一個(gè)實(shí)例特征點(diǎn)由具有2048位的128維組成??焖亵敯籼卣?SURF)的另一實(shí)例特征點(diǎn)由具有1024位的64維組成。
[0007]因此,需要去找到一種模型,使得能夠縮減圖像特征點(diǎn)表示的尺寸,同時(shí)保留匹配性能以用于由所縮減的特征點(diǎn)表示組成的查詢(xún)。
【發(fā)明內(nèi)容】
[0008]隨著互聯(lián)網(wǎng)中視覺(jué)內(nèi)容存儲(chǔ)庫(kù)的飛速發(fā)展,可以在無(wú)線鏈路上支持通過(guò)捕獲進(jìn)行的查詢(xún)的視覺(jué)描述符方案在多種應(yīng)用中都存在著很大的吸引力。在本發(fā)明中,提出了基于圖譜嵌入模型的壓縮方案,用于將圖像的視覺(jué)描述符中的高維特征點(diǎn)縮減到較低維的表示。該壓縮方案在所需用于在網(wǎng)絡(luò)中傳輸視覺(jué)描述符中特征點(diǎn)的查詢(xún)準(zhǔn)確度以及位速率方面實(shí)現(xiàn)了良好的擴(kuò)展性。
[0009]根據(jù)一項(xiàng)實(shí)例實(shí)施例,提供了一種用于處理圖像的方法。所述方法使用可以為矩陣形式的線性嵌入算子,根據(jù)所述圖像的第一特征點(diǎn)集合而生成了第二特征點(diǎn)集合,這樣,所述第一特征點(diǎn)集合中的成對(duì)最近鄰(NN)拓?fù)潢P(guān)系便被保留在所述第二特征點(diǎn)集合中,其中特征點(diǎn)為用一組數(shù)字來(lái)表示的一個(gè)點(diǎn)。
[0010]根據(jù)一項(xiàng)實(shí)例實(shí)施例,提供了一種用于處理圖像的設(shè)備。所述設(shè)備可以位于用戶(hù)設(shè)備中或位于基站中。所述設(shè)備可以包括:一個(gè)接收器,其用于接收所述圖像的第一特征點(diǎn)集合;一個(gè)線性嵌入單元,其用于使用可以為矩陣形式的線性嵌入算子,根據(jù)所述第一特征點(diǎn)集合生成第二特征點(diǎn)集合,其中所述第一特征點(diǎn)集合中的成對(duì)最近鄰(NN)拓?fù)潢P(guān)系保留在所述第二特征點(diǎn)集合中。
[0011]根據(jù)一項(xiàng)實(shí)例實(shí)施例,提供了一種用于處理圖像的設(shè)備。所述設(shè)備可以包括:一個(gè)圖像存儲(chǔ)庫(kù),其中所述圖像存儲(chǔ)庫(kù)中的圖像用一特征點(diǎn)集合來(lái)表示;一個(gè)接收器,其用于接收第一圖像的一組壓縮特征點(diǎn);以及一個(gè)搜索單元,其用于將所述存儲(chǔ)庫(kù)中所存儲(chǔ)的圖像特征點(diǎn)與所述第一圖像的所接收壓縮特征點(diǎn)集合相匹配,其中所述壓縮特征點(diǎn)由線性嵌入算子生成,所述線性嵌入算子由密切模型確定,所述密切模型包括第一密切參數(shù)、第二密切參數(shù)和密切矩陣,其中所述密切矩陣的稀疏度由所述第一密切參數(shù)和所述第二密切參數(shù)來(lái)控制。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0012]為了更完整地理解本發(fā)明及其優(yōu)點(diǎn),現(xiàn)在參考以下結(jié)合附圖進(jìn)行的描述,其中:
[0013]圖1 (a)和圖1 (b)所示為具有移動(dòng)終端的內(nèi)容分布網(wǎng)絡(luò)和視覺(jué)搜索系統(tǒng)的一個(gè)實(shí)例;
[0014]圖2 (a)和圖2 (b)所示為對(duì)圖像執(zhí)行以用一組壓縮特征點(diǎn)表示出圖像的操作序列;
[0015]圖3所示為尋找用于特征點(diǎn)壓縮的嵌入矩陣的過(guò)程;
[0016]圖4所示為尋找用于特征點(diǎn)壓縮的密切矩陣以及密切模型的過(guò)程;
[0017]圖5所示為用于特征點(diǎn)壓縮的設(shè)備;以及
[0018]圖6所示為所述方法的一項(xiàng)實(shí)例實(shí)施形式。
【具體實(shí)施方式】
[0019]下文詳細(xì)論述當(dāng)前優(yōu)選實(shí)施例的制作和使用。然而,應(yīng)了解,本發(fā)明提供可在廣泛多種具體上下文中體現(xiàn)的許多適用發(fā)明性概念。所論述的具體實(shí)施例僅僅說(shuō)明用以制作和使用本發(fā)明的具體方式,而并不限制本發(fā)明的范圍。
[0020]如在下文更詳細(xì)說(shuō)明,將揭示一種特征點(diǎn)的壓縮系統(tǒng),其也稱(chēng)為線性嵌入系統(tǒng)。所述系統(tǒng)使得表示圖像特征點(diǎn)所需的位數(shù)變少,且同時(shí)保持了所述特征點(diǎn)中的成對(duì)最近鄰(NN)拓?fù)潢P(guān)系,其中所述特征點(diǎn)為圖像的表示。
[0021]圖1 (a)圖示了視覺(jué)搜索系統(tǒng)100的實(shí)例實(shí)施例,其中移動(dòng)裝置或用戶(hù)設(shè)備(UE)UEllOl或UE2103經(jīng)由基站105和內(nèi)容分布網(wǎng)絡(luò)(⑶N)107發(fā)送多媒體查詢(xún)111或113。以可互換的方式使用術(shù)語(yǔ)移動(dòng)電話、手機(jī)、平板計(jì)算機(jī)、移動(dòng)終端、移動(dòng)裝置或用戶(hù)設(shè)備。查詢(xún)
111、113由服務(wù)器129內(nèi)的接收器121接收為查詢(xún)117,其中該查詢(xún)117由搜索單元119用來(lái)搜索圖像存儲(chǔ)庫(kù)109。UEllOU UE2103或基站eNB105可以統(tǒng)稱(chēng)為客戶(hù)端,并且包括接收器121、搜索單元119及圖像存儲(chǔ)庫(kù)109的服務(wù)器129可以統(tǒng)稱(chēng)為服務(wù)器129。
[0022]視覺(jué)搜索系統(tǒng)100可以是基于位置的服務(wù)、圖標(biāo)搜索等等。UElOl和103可以通過(guò)無(wú)線通信信道連接到基站eNB IO 5。UEIOI和IO 3可以是移動(dòng)電話、用戶(hù)終端、移動(dòng)臺(tái)、i PHONE或任何其他類(lèi)似的裝置??梢源嬖诓煌瑪?shù)目的UE連接到基站eNB105。UElOl或103可以將多個(gè)查詢(xún)111、113發(fā)送到基站105。
[0023]UE101、103、基站105和CDN107可以是以下系統(tǒng)的一部分:長(zhǎng)期演進(jìn)(LTE)無(wú)線系統(tǒng)、長(zhǎng)期演進(jìn)高級(jí)(LTE-A)系統(tǒng)、IEEE802.16m系統(tǒng),或任何其他種類(lèi)的無(wú)線系統(tǒng)。圖1 (a)所示的視覺(jué)搜索系統(tǒng)100可以按照其他方式來(lái)實(shí)施,并且可以表示為圖1 (b)中所示的抽象級(jí)別(abstract level),其中UEllOl連接到圖像存儲(chǔ)庫(kù)109,并且UEllOl將服務(wù)器內(nèi)的接收器121所接收的查詢(xún)111作為查詢(xún)117進(jìn)行發(fā)送,該查詢(xún)用于搜索圖像存儲(chǔ)庫(kù)109。
[0024]查詢(xún)111或113從UElOl或103發(fā)送到基站105。在一些實(shí)施例中,基站105可以直接將查詢(xún)111或113傳送到服務(wù)器129,并以查詢(xún)117的形式被服務(wù)器129接收?;?05可以對(duì)查詢(xún)111或113執(zhí)行某些操作以生成另外的查詢(xún)115,然后經(jīng)由⑶N107發(fā)送查詢(xún)115,該查詢(xún)從而由服務(wù)器129接收為經(jīng)接收的查詢(xún)117。
[0025]如果從UElOl中發(fā)送的查詢(xún)111以及經(jīng)接收的查詢(xún)117是一個(gè)圖像,那么圖像查詢(xún)可以用以搜索存儲(chǔ)在數(shù)據(jù)庫(kù)或圖像存儲(chǔ)庫(kù)109中的圖像并與之匹配。通常,該操作是使用允許快速訪問(wèn)圖像列表的特殊索引結(jié)構(gòu)來(lái)完成的?;趫D像的查詢(xún)111或117通常在計(jì)算上開(kāi)銷(xiāo)很大,需要額外的相當(dāng)高的通信成本,并且無(wú)法支持CDN應(yīng)用程序所需的實(shí)時(shí)操作。
[0026]查詢(xún)111或查詢(xún)117可以是視覺(jué)描述符。視覺(jué)描述符或圖像描述符是對(duì)產(chǎn)生此類(lèi)描述的圖像和視頻中的內(nèi)容的視覺(jué)特征的描述。這些描述符描述了形狀、顏色、紋理或動(dòng)作等基本特性,以及其他基本特性,并且這些描述使得可以快速有效地來(lái)搜索音頻-視頻內(nèi)容。視覺(jué)描述符可以劃分為兩個(gè)主要群組。通用信息描述符含有低級(jí)別描述符,這種描述符給出了關(guān)于形狀、顏色、區(qū)域、紋理或運(yùn)動(dòng)的描述。特定域信息描述符給出了關(guān)于場(chǎng)景中對(duì)象和事件的描述。一個(gè)具體的實(shí)例可以是面部識(shí)別。其他高區(qū)分力的描述符包括快速魯棒特征(SURF)和尺度不變特征變換(SIFT),這些是魯棒圖像(robust image)檢測(cè)符和描述符。在視覺(jué)搜索應(yīng)用程序中,查詢(xún)圖像的描述符與數(shù)據(jù)庫(kù)圖像的描述符之間的匹配能力對(duì)于成功匹配來(lái)說(shuō)很關(guān)鍵。
[0027]視覺(jué)描述符可以將視覺(jué)對(duì)象及興趣點(diǎn)表示為一個(gè)特征點(diǎn)集合,該特征點(diǎn)集合可以具有尺度與旋轉(zhuǎn)不變性或任何其他性質(zhì)。在一項(xiàng)實(shí)施例中,當(dāng)視覺(jué)描述符用以匹配圖像時(shí),經(jīng)接收的查詢(xún)117可以是從圖像中提取的特征點(diǎn)集合。這些特征點(diǎn)以及它們的拓?fù)湫畔⒌募辖o出了對(duì)尺度、旋轉(zhuǎn)以及某種程度視角變化均不變的某些對(duì)象的唯一表示。匹配兩個(gè)圖像等于匹配圖像中的兩個(gè)特征點(diǎn)集合,并且經(jīng)匹配的特征的數(shù)目作用于匹配的指示符。[0028]根據(jù)一項(xiàng)實(shí)施例,特征點(diǎn)Fj為Rnj中的點(diǎn),其中nj為特征點(diǎn)Fj的維數(shù),并且特征點(diǎn)Fj的特征維數(shù)i e Rnj具有用pi位表示的pi位精度。這可以被稱(chēng)為特征點(diǎn)在維數(shù)i下的分辨率。對(duì)于特征點(diǎn)集合來(lái)說(shuō),該集合中的特征點(diǎn)的維數(shù)可以相同也可以不同。
[0029]圖2(a)所示為根據(jù)一項(xiàng)實(shí)施例的可以在使用視覺(jué)描述符的特征點(diǎn)來(lái)執(zhí)行視覺(jué)搜索的時(shí)候使用的操作流程圖。圖2 (a)中所示的操作可以由移動(dòng)終端來(lái)執(zhí)行,或者由移動(dòng)終端和基站的組合,或網(wǎng)絡(luò)中的任何其他組件來(lái)執(zhí)行。
[0030]作為一項(xiàng)實(shí)例實(shí)施例,在步驟201處,提供圖像。在步驟203處,可以使用由移動(dòng)終端或基站執(zhí)行的重復(fù)特征提取器來(lái)選擇特征點(diǎn)。當(dāng)對(duì)例如SURF和SIFT特征點(diǎn)的具有尺度與旋轉(zhuǎn)不變性的特征點(diǎn)進(jìn)行收集所得的集合用作視覺(jué)描述符時(shí),通過(guò)多個(gè)尺度的邊緣檢測(cè)而在視覺(jué)對(duì)象中找到這些特征點(diǎn)。在一項(xiàng)實(shí)施例中,僅僅將具有尺度一致的強(qiáng)邊緣信息的那些點(diǎn)選擇為特征點(diǎn)。旋轉(zhuǎn)不變性是由描述邊緣定向的描述符來(lái)實(shí)現(xiàn)。特征點(diǎn)集合可以由數(shù)百個(gè)具有尺寸與旋轉(zhuǎn)不變性的特征點(diǎn),以及這些特征點(diǎn)在原始圖像中的位置組成。也可以提取其他視覺(jué)描述符特征點(diǎn)來(lái)代替SURF或SIFT。SURF和SIFT的使用僅僅是出于說(shuō)明的目的,并非是限制性的。
[0031]在一項(xiàng)實(shí)施例中,例如,在步驟205處,表示出特征點(diǎn)。例如SURF或SIFT特征點(diǎn)的各種特征點(diǎn)以不同方式表示出。例如,SURF的每個(gè)特征點(diǎn)為具有2048位的128維。另一方面,SIFT的特征點(diǎn)具有1024位的64維。由于典型的索引方案在使用高維數(shù)時(shí)會(huì)出現(xiàn)故障,因此特征點(diǎn)的高維度會(huì)使得大尺度視覺(jué)對(duì)象和興趣點(diǎn)存儲(chǔ)庫(kù)搜索無(wú)效。
[0032]因此,可能需要對(duì)特征點(diǎn)進(jìn)行壓縮,以降低位速率。作為一項(xiàng)實(shí)施實(shí)施例,在步驟207處,執(zhí)行特征點(diǎn)壓縮操作,例如,可以對(duì)任何特征點(diǎn)或一些特征點(diǎn)執(zhí)行所述特征點(diǎn)壓縮操作,從而縮減表示尺寸,同時(shí)仍保持匹配性能。該壓縮操作也可以稱(chēng)為線性嵌入。根據(jù)一項(xiàng)實(shí)施例,該壓縮操作可以由特征點(diǎn)壓縮單元來(lái)執(zhí)行。特征點(diǎn)壓縮單元可以位于終端上,或位于基站上。經(jīng)壓縮的特征點(diǎn)被傳輸?shù)椒?wù)器端,該服務(wù)器端將會(huì)處理搜索并把結(jié)果發(fā)回到移動(dòng)終端。
[0033]在步驟207中可以存在多種途徑來(lái)縮減特征點(diǎn)尺寸,例如由單元2071執(zhí)行的維數(shù)縮減、由單元2072執(zhí)行的散列/量化,或由單元2073執(zhí)行的自適應(yīng)量化。在另一項(xiàng)實(shí)施例中,可以將這些不同的方法組合,從而對(duì)同一特征點(diǎn)集合執(zhí)行該組合方法,以實(shí)現(xiàn)進(jìn)一步縮減。
[0034]維數(shù)縮減方法使用維數(shù)縮減途徑,在保留某些信息的同時(shí)縮減特征點(diǎn)維數(shù)。例如,散列方法嘗試為每個(gè)特征點(diǎn)使用一個(gè)索引。在某些條件下,輸入特征點(diǎn)被映射在分辨率較小的某個(gè)存儲(chǔ)桶(bucket)中。存儲(chǔ)桶中所有的點(diǎn)都被視為匹配。位置敏感散列、譜散列及矢量量化均屬于這一類(lèi)別。這些方法因散列而具有快速匹配的優(yōu)勢(shì),但是它們?nèi)鄙贉?zhǔn)確性,因?yàn)橥淮鎯?chǔ)桶中的點(diǎn)對(duì)于輸入特征點(diǎn)而言可能并非是真正的匹配。自適應(yīng)量化進(jìn)一步將每個(gè)特征點(diǎn)映射到不同的分辨率。例如,特征點(diǎn)具有針對(duì)第一維數(shù)的第一精度以及針對(duì)第二維數(shù)的第二精度。該自適應(yīng)量化可以基于例如特征點(diǎn)方差的某一標(biāo)準(zhǔn)而進(jìn)行。在一些實(shí)施例中,特征點(diǎn)具有針對(duì)第一維數(shù)的第一精度和針對(duì)第二維數(shù)的第二精度,其中針對(duì)特征點(diǎn)方差較大的第一維數(shù)的第一精度大于針對(duì)特征點(diǎn)方差較小的第二維數(shù)的第二精度。
[0035]圖2(b)所示為用于壓縮特征點(diǎn)的更詳細(xì)的操作流程圖。在步驟201提供圖像。在步驟203處,從圖像中提取一個(gè)特征點(diǎn)集合,例如,{Fk|k=l,...,η},其中每個(gè)特征點(diǎn)Fk位于根據(jù)一項(xiàng)實(shí)施例的圖像位置{xk,yk}。該集合可以由數(shù)百個(gè)(例如242個(gè))特征點(diǎn)構(gòu)成。在步驟205處,將特征點(diǎn)表示為d-維空間Rd中的一個(gè)點(diǎn)。例如,對(duì)于SIFT特征點(diǎn)而言,d=128 ;對(duì)于SURF特征點(diǎn)而言,d=64。在步驟207中,使用線性嵌入矩陣A將特征點(diǎn)集合{Fk}映射或投射到Rp中的較小空間{fk},其中P小于山同時(shí)仍然保留匹配準(zhǔn)確度損失最小的成對(duì)最近鄰fk=AFk關(guān)系。因?yàn)槭褂昧司€性嵌入矩陣來(lái)執(zhí)行對(duì)特征點(diǎn)的壓縮,因此,壓縮方案也可以稱(chēng)作線性嵌入。
[0036]根據(jù)一項(xiàng)實(shí)施例,可以存在線性嵌入矩陣A的多種選擇。更為緊致的特征點(diǎn)表示可以通過(guò)保留特征空間幾何位置構(gòu)建出,確切地說(shuō),是保留特征點(diǎn)之間的最近鄰(NN)拓?fù)潢P(guān)系。保留最近鄰(NN)拓?fù)潢P(guān)系對(duì)視覺(jué)搜索應(yīng)用程序更具關(guān)鍵性。在一些實(shí)施例中,所得的緊致特征點(diǎn)可以實(shí)現(xiàn)具有8維度且每個(gè)維度為6位的高匹配準(zhǔn)確度,其每個(gè)特征點(diǎn)共有48位。
[0037]圖3所示為如何找到線性嵌入矩陣A的一項(xiàng)實(shí)施例。線性嵌入矩陣A由密切模型確定,所述密切模型包括第一密切參數(shù)Clmax、第二密切參數(shù)a和尺寸為n*n的密切矩陣W=(wJ;k),其中所述密切矩陣W=(^k)的稀疏度由所述第一密切參數(shù)和所述第二密切參數(shù)來(lái)控制,η為特征點(diǎn)的個(gè)數(shù)。密切矩陣W=(^k)反映出待保留的成對(duì)特征點(diǎn)密切關(guān)系。線性嵌
入矩陣A為目標(biāo)方程
【權(quán)利要求】
1.一種用于處理圖像的方法,所述方法包括: 使用線性嵌入算子,根據(jù)所述圖像的第一特征點(diǎn)集合而生成了第二特征點(diǎn)集合,其中所述第一特征點(diǎn)集合中的成對(duì)最近鄰(NN)拓?fù)潢P(guān)系便被保留在所述第二特征點(diǎn)集合中,特征點(diǎn)為用一組數(shù)字來(lái)表示的一個(gè)點(diǎn)。
2.根據(jù)權(quán)利要求1所述的方法,其中所述第一特征點(diǎn)集合中的特征點(diǎn)具有用第一數(shù)字量表示的第一維度,并且所述第二特征點(diǎn)集合中的特征點(diǎn)具有用第二數(shù)字量表示的第二維度,所述第二維度小于所述第一維度。
3.根據(jù)權(quán)利要求2所述的方法,其中所述第二特征點(diǎn)集合中的一個(gè)特征點(diǎn)具有八維度,并且其每個(gè)維度的個(gè)數(shù)用六位表示。
4.根據(jù)權(quán)利要求1所述的方法,其中所述第二特征點(diǎn)集合用于視覺(jué)搜索以識(shí)別圖像儲(chǔ)存庫(kù)中的圖像。
5.根據(jù)權(quán)利要求1所述的方法,其中所述第一特征點(diǎn)集合與所述第二特征點(diǎn)集合具有的特征點(diǎn)數(shù)目相同。
6.根據(jù)權(quán)利要求1所述的方法,其中所述第一特征點(diǎn)集合為所述圖像的尺度不變特征變換(SIFT)特征點(diǎn),或者為所述圖像的快速魯棒特征(SURF)特征點(diǎn)。
7.根據(jù)權(quán)利要求1所述的方法,其中所述線性嵌入算子由密切模型確定,所述密切模型包括第一密切參數(shù)dmax、第二密切參數(shù)a和尺寸為n*n的密切矩陣W=(Wj,k),其中所述密切矩陣W=(^k)的稀疏度由所述第一密切參數(shù)和所述第二密切參數(shù)來(lái)控制,η為所述第一特征點(diǎn)集合中的特征點(diǎn)的個(gè)數(shù)。
8.根據(jù)權(quán)利要求7所述的方法,其中所述線性嵌入算子為目標(biāo)方程
9.根據(jù)權(quán)利要求7所述的方法,其中所述線性嵌入算子為根據(jù)A=eigenValue(L)計(jì)算出的矩陣Α,其中所述矩陣
10.根據(jù)權(quán)利要求7所述的方法,其中所述密切矩陣由所述第一密切參數(shù)dmax與所述第如果二密切參數(shù)a確定為
11.根據(jù)權(quán)利要求7所述的方法,其中所述第一密切參數(shù)dmax為包括多個(gè)特征點(diǎn)的樣本特征點(diǎn)存儲(chǔ)庫(kù)的已排序成對(duì)距離函數(shù)的第一零梯度。
12.根據(jù)權(quán)利要求7所述的方法,其中所述第二密切參數(shù)a經(jīng)選擇使得所述密切矩陣W=(wJ;k)為稀疏的。
13.根據(jù)權(quán)利要求12所述的方法,其中所述第二密切參數(shù)a值根據(jù)方程二= 0.25獲得。
14.根據(jù)權(quán)利要求1所述的方法,其中所述第二特征點(diǎn)集合中的/i中特征點(diǎn)匕具有針對(duì)第一維度的第一精度以及針對(duì)第二維度的第二精度。
15.根據(jù)權(quán)利要求14所述的方法,其中所述第一維度的所述第一精度對(duì)于所述特征點(diǎn)Fj方差較大,所述第二維度的所述第二精度對(duì)于所述特征點(diǎn)匕方差較小,所述第一精度大于所述第二精度。
16.一種用于處理圖像的設(shè)備,所述設(shè)備包括: 接收器,其用于接收所述圖像的第一特征點(diǎn)集合;以及 線性嵌入單元,其用于使用線性嵌入算子,根據(jù)所述第一特征點(diǎn)集合生成第二特征點(diǎn)集合,其中所述第一特征點(diǎn)集合中的成對(duì)最近鄰(NN)拓?fù)潢P(guān)系便被保留在所述第二特征點(diǎn)集合中,特征點(diǎn)為用一組數(shù)字來(lái)表示的一個(gè)點(diǎn)。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其進(jìn)一步包括: 密切單元,其用于生成密切模型,所述密切模型用于確定線性嵌入算子,其中所述密切模型包括第一密切參數(shù)Clmax、第二密切參數(shù)a和大小為n*n的密切矩陣W=(^k),η為所述第一特征點(diǎn)集合中的特征點(diǎn)個(gè)數(shù),其中所述密切矩陣W=(^k)的稀疏度由所述第一密切參數(shù)和所述第二密切參數(shù)來(lái)控制。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中所述密切矩陣由所述第一密切參數(shù)dmax與所述
第二密切參數(shù)a確定為
19.根據(jù)權(quán)利要求17所述的設(shè)備,其中所述設(shè)備位于用戶(hù)設(shè)備中或位于基站中。
20.一種用于處理圖像的設(shè)備,所述設(shè)備包括: 圖像存儲(chǔ)庫(kù),其中所述圖像存儲(chǔ)庫(kù)中的圖像用一個(gè)特征點(diǎn)集合來(lái)表示; 接收器,其用于接收第一圖像的壓縮特征點(diǎn)集合;以及 搜索單元,其用于將所述存儲(chǔ)庫(kù)中所存儲(chǔ)的圖像的所述特征點(diǎn)與所述第一圖像的所接收壓縮特征點(diǎn)集合相匹配,并且 其中所述壓縮特征點(diǎn)由線性嵌入算子生成,所述線性嵌入算子由密切模型確定,所述密切模型包括第一密切參數(shù)、第二密切參數(shù)和密切矩陣,其中所述密切矩陣的稀疏度由所述第一密切參數(shù)和所述第二密切參數(shù)來(lái)控制。
【文檔編號(hào)】G06K9/46GK103999097SQ201280034727
【公開(kāi)日】2014年8月20日 申請(qǐng)日期:2012年1月4日 優(yōu)先權(quán)日:2011年7月11日
【發(fā)明者】辛欣, 朱理, 安杰洛斯·K·凱特薩杰羅斯 申請(qǐng)人:華為技術(shù)有限公司