專利名稱:基于分布式和哈希映射的室外海量物體識(shí)別方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于移動(dòng)增強(qiáng)現(xiàn)實(shí)技術(shù)領(lǐng)域,具體涉及一種基于分布式處理和暴力匹配的室外大規(guī)模物體識(shí)別方法。
背景技術(shù):
圖像識(shí)別的是基于內(nèi)容的信息檢索研究的熱門(mén)話題,在遙感圖像處理、醫(yī)學(xué)圖像處理和計(jì)算機(jī)視覺(jué)等領(lǐng)域有著廣泛的應(yīng)用。隨著互聯(lián)網(wǎng)的發(fā)展,人類正在步入一個(gè)信息化的社會(huì),互聯(lián)網(wǎng)已經(jīng)成為人類發(fā)布、獲取、交換信息的重要平臺(tái)。互聯(lián)網(wǎng)上信息量的指數(shù)級(jí)增長(zhǎng),使得如何讓用戶能夠快速準(zhǔn)確地在海量的數(shù)據(jù)中找到其所需信息成為了一個(gè)重要的課題。近些年來(lái),隨著數(shù)字?jǐn)z影和存儲(chǔ)設(shè)備的進(jìn)步和普及,室外的圖像數(shù)量在互聯(lián)網(wǎng)上的飛速增長(zhǎng),也已經(jīng)達(dá)到成千上萬(wàn)了。如 何有效的利用這些數(shù)據(jù)信息,給當(dāng)前處于相同位置的用戶提供這些已有的信息,是商業(yè)界和學(xué)術(shù)界的一個(gè)重要研究方向。然而,隨著圖像庫(kù)規(guī)模的極大增長(zhǎng),要保證圖像搜索的實(shí)時(shí)性,相應(yīng)的數(shù)據(jù)庫(kù)索引技術(shù)和圖像檢索技術(shù)也必須做相應(yīng)的調(diào)整或加速。同時(shí)計(jì)算機(jī)軟、硬件技術(shù)的迅猛發(fā)展,為增強(qiáng)現(xiàn)實(shí)技術(shù)走出室內(nèi)應(yīng)用進(jìn)而支持復(fù)雜的分析、決策和管理打下了堅(jiān)實(shí)的基礎(chǔ)。一些移動(dòng)終端設(shè)備(像PDA、智能手機(jī)等)的功能也越來(lái)越豐富,并且擁有了嵌入式操作系統(tǒng)、觸摸屏、GPS定位、視頻攝像頭等功能,同時(shí)也具備了較強(qiáng)的計(jì)算和處理能力。這些功能的集成為開(kāi)發(fā)基于移動(dòng)終端的增強(qiáng)現(xiàn)實(shí)系統(tǒng)奠定了基礎(chǔ)。據(jù)有關(guān)資料,截止到2010年我國(guó)移動(dòng)電話用戶可達(dá)7. 4億,其中擁有智能手機(jī)的用戶占了相當(dāng)?shù)谋戎?,智能手機(jī)作為增強(qiáng)現(xiàn)實(shí)的應(yīng)用平臺(tái)將具有很大的應(yīng)用潛力。3G網(wǎng)的逐步開(kāi)通、運(yùn)行,意味著移動(dòng)增值業(yè)務(wù)全新時(shí)代的開(kāi)始,增強(qiáng)現(xiàn)實(shí)技術(shù)和LBS相結(jié)合可以實(shí)現(xiàn)信息的實(shí)時(shí)交互、三維動(dòng)態(tài)顯示,可使人機(jī)界面更加友好和具有智能性。基于上述分析,結(jié)合具有攝像頭的終端以及服務(wù)器端的圖像識(shí)別和匹配技術(shù),可以將場(chǎng)景之類的大規(guī)模物體的在線識(shí)別變?yōu)榭赡堋H欢郧暗脑S多圖像識(shí)別的研究工作都是在單機(jī)環(huán)境下考慮圖像檢索問(wèn)題,許多方法也不能推廣到更大規(guī)模的圖像識(shí)別問(wèn)題,系統(tǒng)性能和能夠處理的數(shù)據(jù)規(guī)模存在局限性。當(dāng)城市級(jí)規(guī)模的數(shù)據(jù),以百萬(wàn)為單位時(shí),圖像識(shí)別系統(tǒng)需要海量的存儲(chǔ)空間和海量數(shù)據(jù)的計(jì)算能力。因?yàn)閳D像庫(kù)本身需要很大的空間存儲(chǔ),從圖像提取的各種特征描述向量也需要大量的空間存儲(chǔ)。同時(shí),在圖像識(shí)別和匹配過(guò)程中對(duì)描述符索引、匹配也需要強(qiáng)大計(jì)算能力。所以,用哈希函數(shù)的散列表示,只需要幾十位就代表高維的描述向量,節(jié)省了存儲(chǔ)空間,為大規(guī)模的存儲(chǔ)數(shù)據(jù)提供了可行性。分布式文件系統(tǒng)和分布式計(jì)算為海量描述符的索引和描述符的并行匹配計(jì)算能力,為海量圖像的識(shí)別提供支撐條件。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種基于分布式處理和哈希映射的室外海量物體識(shí)別方案,能夠?qū)崿F(xiàn)在線海量物體的識(shí)別,而且減少了數(shù)據(jù)存儲(chǔ)量,提高了圖像識(shí)別和檢索的速度。該方案是這樣實(shí)現(xiàn)的一種基于分布式處理和哈希映射的室外海量物體識(shí)別方法,預(yù)先獲取帶GPS信息的樣本圖像,提取每幅樣本圖像的局部特征并轉(zhuǎn)化為描述符特征向量,再對(duì)描述符特征向量進(jìn)行Hash映射,得到Hash位串稱為樣本位串;將樣本圖像的GPS信息、樣本圖像信息、樣本位串對(duì)應(yīng)存儲(chǔ)到樣本文件系統(tǒng)中;所述的識(shí)別方法包括 如下步驟步驟I :終端采集當(dāng)前場(chǎng)景的待識(shí)別圖像以及GPS信息;步驟2 :提取所述待識(shí)別圖像的局部特征,并轉(zhuǎn)化為描述符特征向量;步驟3 :將待識(shí)別圖像的GPS信息以及描述符特征向量打包成一個(gè)描述符文件,發(fā)送給分布式處理系統(tǒng);步驟4:分布式處理系統(tǒng)中設(shè)有調(diào)度處理集群、多個(gè)計(jì)算節(jié)點(diǎn)和所述樣本文件系統(tǒng);調(diào)度處理集群接收到所述描述符文件后,從該描述符文件中提取GPS信息,查詢當(dāng)前正在處理的匹配任務(wù)中是否存在與提取的GPS信息相同的匹配任務(wù),如果是,說(shuō)明已經(jīng)將與待識(shí)別圖像相關(guān)的樣本位串加載到各計(jì)算節(jié)點(diǎn)中,則將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn),然后執(zhí)行步驟6 ;否則,執(zhí)行步驟5 ;所述匹配任務(wù)的查詢標(biāo)準(zhǔn)為如果當(dāng)前正在處理的匹配任務(wù)對(duì)應(yīng)的GPS信息與待識(shí)別圖像的GPS信息一致或者相差一個(gè)預(yù)設(shè)閾值,則認(rèn)為存在相同的匹配任務(wù);步驟5 :調(diào)度處理集群為待識(shí)別圖像加載相關(guān)的樣本特征向量以待識(shí)別圖像的GPS信息為圓心,按照預(yù)先設(shè)定的篩選半徑確定一個(gè)圓形區(qū)域,從樣本文件系統(tǒng)中篩選出GPS信息在所述圓形區(qū)域內(nèi)的樣本位串,將篩選出的樣本位串分?jǐn)偧虞d到各個(gè)計(jì)算節(jié)點(diǎn)中;同時(shí),調(diào)度處理集群還將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn)。步驟6 :每個(gè)計(jì)算節(jié)點(diǎn)從描述符文件中解析出待匹配描述符特征向量,并進(jìn)行Hash映射,得到待匹配Hash位串;將待識(shí)別圖像的待匹配Hash位串與已加載的與該識(shí)別圖像相關(guān)的樣本位串進(jìn)行逐個(gè)進(jìn)行漢明比較,將匹配結(jié)果匯總到調(diào)度處理集群;步驟7 :調(diào)度處理集群統(tǒng)計(jì)各個(gè)計(jì)算節(jié)點(diǎn)的匹配結(jié)果,選出匹配比率最高的樣本圖像作為匹配圖像,將匹配圖像的信息返回給所述終端。優(yōu)選地,步驟2中,在提取所述待識(shí)別圖像的局部特征之前,進(jìn)一步對(duì)所述待識(shí)別圖像進(jìn)行降采樣處理,以降低圖像分辨率。本發(fā)明還提供了一種基于分布式處理和暴力匹配的室外大規(guī)模物體識(shí)別系統(tǒng),包括分布式處理系統(tǒng)、無(wú)線網(wǎng)絡(luò)和具有圖像采集和GPS定位功能的終端;分布式處理系統(tǒng)包括交換設(shè)備、調(diào)度處理集群、至少2個(gè)計(jì)算節(jié)點(diǎn)和樣本文件系統(tǒng);調(diào)度處理集群通過(guò)交換設(shè)備接入無(wú)線網(wǎng)絡(luò),并且與樣本文件系統(tǒng)、所有的計(jì)算節(jié)點(diǎn)連接;所述樣本文件系統(tǒng),用于存儲(chǔ)各類場(chǎng)景的樣本圖像、每個(gè)場(chǎng)景的GPS信息以及每幅樣本圖像對(duì)應(yīng)的Hash位串,樣本圖像對(duì)應(yīng)的Hash位串是對(duì)樣本圖像提取描述符特征向量,再對(duì)描述符特征向量進(jìn)行Hash映射得到的,稱為樣本位串;樣本圖像的GPS信息、樣本圖像信息和樣本位串對(duì)應(yīng)存儲(chǔ);所述終端,用于采集當(dāng)前場(chǎng)景的待識(shí)別圖像以及GPS信息,提取所述待識(shí)別圖像的局部特征,并轉(zhuǎn)換為描述符特征向量;將待識(shí)別圖像的GPS信息以及描述符特征向量打包成一個(gè)描述符文件,發(fā)送給分布式處理系統(tǒng);所述調(diào)度處理集群,用于在接收到所述描述符文件后,從該描述符文件中提取GPS信息,查詢當(dāng)前正在處理的匹配任務(wù)中是否存在與提取的GPS信息相同的匹配任務(wù),如果是,說(shuō)明已經(jīng)將與待識(shí)別圖像相關(guān)的樣本特征向量加載到各計(jì)算節(jié)點(diǎn)中,則將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn);否則,為待識(shí)別圖像加載相關(guān)的樣本位串;其中,所述匹配任務(wù)的查詢標(biāo)準(zhǔn)為如果當(dāng)前正在處理的匹配任務(wù)對(duì)應(yīng)的GPS信息與待識(shí)別圖像的GPS信息一致或者相差一個(gè)預(yù)設(shè)閾值,則認(rèn)為存在相同的匹配任務(wù);所述為待識(shí)別圖像加載相關(guān)的樣本位串為以待識(shí)別圖像的GPS信息為圓心,按照預(yù)先設(shè)定的篩選半徑確定一個(gè)圓形區(qū)域,從樣本文件系統(tǒng)中篩選出GPS信息在所述圓形區(qū)域內(nèi)的樣本位串,將篩選出的樣本位串分?jǐn)偧虞d到各個(gè)計(jì)算節(jié)點(diǎn)中;同時(shí),調(diào)度處理集群還將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn);所述計(jì)算節(jié)點(diǎn),用于從描述符文件中解析出待匹配描述符特征向量,并進(jìn)行Hash映射,得到待匹配Hash位串;將待識(shí)別圖像的待匹配Hash位串與已加載的與該待識(shí)別圖像 相關(guān)的樣本位串進(jìn)行逐個(gè)進(jìn)行漢明比較,將匹配結(jié)果匯總到調(diào)度處理集群;所述調(diào)度處理集群進(jìn)一步用于,統(tǒng)計(jì)各個(gè)計(jì)算節(jié)點(diǎn)的匹配結(jié)果,選出匹配比率最高的樣本圖像作為匹配圖像,將匹配圖像的信息返回給所述終端。有益效果本發(fā)明使用智能設(shè)備的攝像頭對(duì)當(dāng)前場(chǎng)景進(jìn)行圖像采集,并利用分布式處理技術(shù)與計(jì)算機(jī)視覺(jué)技術(shù),對(duì)被采集室外場(chǎng)景進(jìn)行識(shí)別,依靠互聯(lián)網(wǎng)或其它通信手段,提供被識(shí)別物體的各種信息,還可以在這些信息上附加進(jìn)一步的各種應(yīng)用,從而為使用者獲取該物品的相關(guān)信息提供一種更為便利的手段。而且,本發(fā)明用哈希散列表示描述符,可以大大減少數(shù)據(jù)存儲(chǔ)量。其次,本發(fā)明在為當(dāng)前任務(wù)加載樣本位串時(shí),根據(jù)GPS信息判斷是否已經(jīng)由類似或相同的任務(wù),如果有,不需要再次加載,直接采用已經(jīng)加載的樣本位串即可,節(jié)省了加載數(shù)據(jù)的時(shí)間。此外,本發(fā)明在記載樣本位串時(shí),只加載一定范圍內(nèi)的樣本特征向量,這樣可以進(jìn)
一步縮小運(yùn)算量。本發(fā)明可以擴(kuò)展智能終端的交互式應(yīng)用,滿足了旅游、導(dǎo)航、交通、酒店服務(wù)等在智能終端上的擴(kuò)展應(yīng)用,使網(wǎng)絡(luò)運(yùn)營(yíng)商和內(nèi)容提供商能夠利用其豐富的服務(wù)器資源和優(yōu)越的服務(wù)器性能發(fā)展其業(yè)務(wù)。
圖I為本發(fā)明基于分布式系統(tǒng)與哈希映射的室外海量物體識(shí)別原理圖;圖2 Ca)為非結(jié)構(gòu)化存儲(chǔ)的示意圖;圖2 (b)為結(jié)構(gòu)化存儲(chǔ)的示意圖;圖3為本發(fā)明識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合附圖對(duì)本發(fā)明的物體識(shí)別分析方法做詳細(xì)描述。
圖I示出了本發(fā)明的基于分布式系統(tǒng)和Hash映射的增強(qiáng)現(xiàn)實(shí)(AR)物體識(shí)別方法的原理圖。如圖I所示,實(shí)現(xiàn)該方法的系統(tǒng)包括分布式處理系統(tǒng)、無(wú)線網(wǎng)絡(luò)、具有圖像采集和GPS定位功能的終端。終端和分布式處理系統(tǒng)通過(guò)無(wú)線網(wǎng)絡(luò)互通。分布式處理系統(tǒng)具體包括交換設(shè)備(網(wǎng)關(guān))、調(diào)度處理集群(Master)、多個(gè)計(jì)算節(jié)點(diǎn)和樣本文件系統(tǒng)。調(diào)度處理集群通過(guò)網(wǎng)關(guān)接入無(wú)線網(wǎng)絡(luò),并且與樣本文件系統(tǒng)、所有的計(jì)算節(jié)點(diǎn)連接。基于上述系統(tǒng),本發(fā)明的具體實(shí)現(xiàn)流程如下識(shí)別之前的準(zhǔn)備工作預(yù)先獲取帶GPS信息的樣本圖像,一般來(lái)說(shuō)可以按場(chǎng)景獲取圖像,例如從網(wǎng)絡(luò)或?qū)嵉嘏臄z,每個(gè)場(chǎng)景從不同角度獲取幾幅樣本圖像,場(chǎng)景的GPS信息就是樣本圖像的GPS信息。提取每幅樣本圖像的局部特征并轉(zhuǎn)換為描述符特征向量,然后采用預(yù)先確定的Hash函數(shù)將描述符特征向量映射為Hash位串,稱為樣本位串;然后,將樣本圖像的GPS信息、樣本圖像信息與樣本位串對(duì)應(yīng)存儲(chǔ)到樣本文件系統(tǒng)中。識(shí)別過(guò)程如下步驟I :用戶打開(kāi)終端的拍攝設(shè)備,終端采集當(dāng)前場(chǎng)景的待識(shí)別圖像;再調(diào)用終端 的GPS傳感器接口,獲取當(dāng)前位置的GPS信息。步驟2 :為了降低運(yùn)算量,終端對(duì)采集到的待識(shí)別圖像進(jìn)行降采樣處理(即降低分辨率),以降低圖像分辨率;然后再采用局部特征檢測(cè)算法(SIFT、SURF或0RB)進(jìn)行特征點(diǎn)檢測(cè),以提取所述場(chǎng)景圖像的局部特征,再用特征向量的形式表現(xiàn),從而轉(zhuǎn)化為描述符特征向量。一幅圖像可能有上百個(gè)描述符特征向量。步驟3 :將待識(shí)別圖像的GPS信息以及全部描述符特征向量以及特征向量個(gè)數(shù)打包成一個(gè)描述符文件,GPS信息和特征向量個(gè)數(shù)放在文件的開(kāi)頭,特征向量個(gè)數(shù)便于接收端判斷一個(gè)描述符文件是否接收完畢。然后將描述符文件通過(guò)無(wú)線網(wǎng)絡(luò)發(fā)送給分布式處理系統(tǒng)。步驟4:分布式處理系統(tǒng)中的調(diào)度處理集群通過(guò)網(wǎng)關(guān)接收到描述符文件后,從該描述符文件中提取GPS信息,在調(diào)度處理集群內(nèi)查詢當(dāng)前正在處理的匹配任務(wù)中是否存在與提取的GPS信息相同的匹配任務(wù),如果是,說(shuō)明已經(jīng)將與待識(shí)別圖像相關(guān)的樣本位串加載到各計(jì)算節(jié)點(diǎn)中,則將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn),然后執(zhí)行步驟6 ;否則,執(zhí)行步驟5。匹配任務(wù)的查詢標(biāo)準(zhǔn)為如果當(dāng)前正在處理的匹配任務(wù)對(duì)應(yīng)的圖像GPS信息與待識(shí)別圖像的GPS信息一致或者相差一個(gè)預(yù)設(shè)閾值,則認(rèn)為存在相同的匹配任務(wù)。其中,當(dāng)前正在處理的匹配任務(wù)可以緩存在一個(gè)調(diào)度列表中以便查詢。步驟5 :調(diào)度處理集群為待識(shí)別圖像加載相關(guān)的樣本位串。具體為以待識(shí)別圖像的GPS信息為圓心,按照預(yù)先設(shè)定的篩選半徑確定一個(gè)圓形區(qū)域,從樣本文件系統(tǒng)中篩選出GPS信息在所述圓形區(qū)域內(nèi)的樣本位串,將篩選出的樣本位串以樣本圖像為單位分?jǐn)偧虞d到各個(gè)計(jì)算節(jié)點(diǎn)中;同時(shí),調(diào)度處理集群還將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn)。其中,篩選范圍可以為10米、20米、30米、40米或50米。步驟6 :每個(gè)計(jì)算節(jié)點(diǎn)將從描述符文件中解析出的待匹配描述符特征向量,采用與前面相同的Hash函數(shù)進(jìn)行Hash映射,得到待匹配Hash位串,再將待識(shí)別圖像的待匹配Hash位串與已經(jīng)載入的與待識(shí)別圖像相關(guān)的樣本位串進(jìn)行逐個(gè)漢明比較也就是常說(shuō)的暴力匹配,將匹配結(jié)果匯總到調(diào)度處理集群。
其中,這里所述的“與該待識(shí)別圖像相關(guān)的已加載樣本位串”就是GPS信息在圓形區(qū)域內(nèi)的樣本位串,它們參與待識(shí)別圖像的漢明比較。對(duì)于在步驟4中找到相同匹配任務(wù)的待識(shí)別圖像,哪些樣本位串參與其漢明比較可以由計(jì)算節(jié)點(diǎn)根據(jù)已加載樣本位串的GPS信息再次判斷,其判斷計(jì)算量很小,不會(huì)影響計(jì)算速度;當(dāng)然,也可以由調(diào)度處理集群告知計(jì)算節(jié)點(diǎn)哪些樣本位串參與本任務(wù)的漢明比較。Hash映射是通過(guò)設(shè)計(jì)一個(gè)散列函數(shù),將高維的特征描述符映射成較少的位串,通常高維向量SIFT、SURF需要80-100位表示,用漢明距離來(lái)判斷映射后的Hash位串是否相似??紤]到圖像特征向量需要非常精確的匹配,Hash函數(shù)要求盡可能的將相近的特征描述向量映射到同一位串,將不相近的特征向量映射到漢明距離較遠(yuǎn)的位串,這也是Hash函數(shù)設(shè)計(jì)的時(shí)候通常要考慮的問(wèn)題,是本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)的。通常映射函數(shù)用公式(I)的 表示形式
權(quán)利要求
1.一種基于分布式處理和哈希映射的室外海量物體識(shí)別方法,其特征在于,預(yù)先獲取帶GPS信息的樣本圖像,提取每幅樣本圖像的局部特征并轉(zhuǎn)化為描述符特征向量,再對(duì)描述符特征向量進(jìn)行Hash映射,得到Hash位串稱為樣本位串;將樣本圖像的GPS信息、樣本圖像信息、樣本位串對(duì)應(yīng)存儲(chǔ)到樣本文件系統(tǒng)中; 所述的識(shí)別方法包括如下步驟 步驟I :終端采集當(dāng)前場(chǎng)景的待識(shí)別圖像以及GPS信息; 步驟2 :提取所述待識(shí)別圖像的局部特征,并轉(zhuǎn)化為描述符特征向量; 步驟3 :將待識(shí)別圖像的GPS信息以及描述符特征向量打包成一個(gè)描述符文件,發(fā)送給分布式處理系統(tǒng); 步驟4 :分布式處理系統(tǒng)中設(shè)有調(diào)度處理集群、多個(gè)計(jì)算節(jié)點(diǎn)和所述樣本文件系統(tǒng);調(diào)度處理集群接收到所述描述符文件后,從該描述符文件中提取GPS信息,查詢當(dāng)前正在處理的匹配任務(wù)中是否存在與提取的GPS信息相同的匹配任務(wù),如果是,說(shuō)明已經(jīng)將與待識(shí)別圖像相關(guān)的樣本位串加載到各計(jì)算節(jié)點(diǎn)中,則將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn),然后執(zhí)行步驟6;否則,執(zhí)行步驟5; 所述匹配任務(wù)的查詢標(biāo)準(zhǔn)為如果當(dāng)前正在處理的匹配任務(wù)對(duì)應(yīng)的GPS信息與待識(shí)別圖像的GPS信息一致或者相差一個(gè)預(yù)設(shè)閾值,則認(rèn)為存在相同的匹配任務(wù); 步驟5 :調(diào)度處理集群為待識(shí)別圖像加載相關(guān)的樣本特征向量 以待識(shí)別圖像的GPS信息為圓心,按照預(yù)先設(shè)定的篩選半徑確定一個(gè)圓形區(qū)域,從樣本文件系統(tǒng)中篩選出GPS信息在所述圓形區(qū)域內(nèi)的樣本位串,將篩選出的樣本位串分?jǐn)偧虞d到各個(gè)計(jì)算節(jié)點(diǎn)中;同時(shí),調(diào)度處理集群還將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn)。
步驟6 :每個(gè)計(jì)算節(jié)點(diǎn)從描述符文件中解析出待匹配描述符特征向量,并進(jìn)行Hash映射,得到待匹配Hash位串;將待識(shí)別圖像的待匹配Hash位串與已加載的與該識(shí)別圖像相關(guān)的樣本位串進(jìn)行逐個(gè)進(jìn)行漢明比較,將匹配結(jié)果匯總到調(diào)度處理集群; 步驟7:調(diào)度處理集群統(tǒng)計(jì)各個(gè)計(jì)算節(jié)點(diǎn)的匹配結(jié)果,選出匹配比率最高的樣本圖像作為匹配圖像,將匹配圖像的信息返回給所述終端。
2.如權(quán)利要求I所述的方法,其特征在于,步驟2中,在提取所述待識(shí)別圖像的局部特征之前,進(jìn)一步對(duì)所述待識(shí)別圖像進(jìn)行降采樣處理,以降低圖像分辨率。
3.如權(quán)利要求I所述的方法,其特征在于,所述步驟6和步驟7具體為 ①計(jì)算節(jié)點(diǎn)從描述符文件中解析出待匹配描述符特征向量,并進(jìn)行Hash映射,得到待匹配Hash位串;各計(jì)算節(jié)點(diǎn)找同一個(gè)待匹配Hash位串x與加載到自身的所有樣本位串逐一進(jìn)行漢明比較,找到漢明距離最短的樣本位串A,并匯總到調(diào)度處理集群進(jìn)行整體排序,調(diào)度處理集群根據(jù)匯總數(shù)據(jù)找到與待匹配Hash位串X漢明距離最短的樣本位串A’,如果樣本位串A’與待匹配位串X的漢明距離小于或等于預(yù)設(shè)的全局閾值,則將該樣本位串A’記為一個(gè)匹配點(diǎn); ②針對(duì)每個(gè)待匹配Hash位串均進(jìn)行上述操作,然后調(diào)度處理集群針對(duì)每個(gè)樣本圖像,計(jì)算匹配點(diǎn)占該樣本圖像的樣本位串的比例,比例最高的樣本圖像就是匹配圖像; ③將匹配圖像的信息返回給所述終端。
4.如權(quán)利要求I所述的方法,其特征在于,所述步驟6和步驟7具體為 ①每個(gè)計(jì)算節(jié)點(diǎn)從描述符文件中解析出待匹配描述符特征向量,并進(jìn)行Hash映射,得到待匹配Hash位串;以樣本圖像為單位,用待匹配Hash位串逐個(gè)與單個(gè)樣本圖像的所有樣本位串進(jìn)行漢明比較,統(tǒng)計(jì)匹配率,即匹配成功的樣本位串占單個(gè)樣本圖像的所有樣本位串的比例,將匹配率匯總到調(diào)度處理集群; ②調(diào)度處理集群從所有計(jì)算節(jié)點(diǎn)反饋的匹配率中的尋找最大匹配率,最大匹配率對(duì)應(yīng)的樣本圖像就是匹配圖像; ③將匹配圖像的信息返回給所述終端。
5.如權(quán)利要求I或3所述的方法,其特征在于,采用結(jié)構(gòu)化存儲(chǔ)方式存儲(chǔ)樣本位串,每個(gè)樣本位串對(duì)應(yīng)一條記錄;每個(gè)記錄的字段包括索引ID、樣本圖像ID、GPS信息、樣本位串序號(hào)、樣本位串; 進(jìn)一步在樣本文件系統(tǒng)中存儲(chǔ)索引表,該索引表記載了 GPS信息與記錄存儲(chǔ)位置的索引關(guān)系; 所述步驟5中為待識(shí)別圖像加載相關(guān)的樣本位串時(shí),根據(jù)GPS信息查找根據(jù)索引表,將GPS信息在所述圓形區(qū)域內(nèi)的記錄內(nèi)容加載到各個(gè)計(jì)算節(jié)點(diǎn)中。
6.如權(quán)利要求I所述的方法,其特征在于,每個(gè)計(jì)算節(jié)點(diǎn)中開(kāi)辟多個(gè)并行計(jì)算線程,每個(gè)線程承擔(dān)相同的任務(wù)量。
7.一種基于分布式處理和哈希映射的室外大規(guī)模物體識(shí)別系統(tǒng),其特征在于,包括分布式處理系統(tǒng)、無(wú)線網(wǎng)絡(luò)和具有圖像采集和GPS定位功能的終端;分布式處理系統(tǒng)包括交換設(shè)備、調(diào)度處理集群、至少2個(gè)計(jì)算節(jié)點(diǎn)和樣本文件系統(tǒng);調(diào)度處理集群通過(guò)交換設(shè)備接入無(wú)線網(wǎng)絡(luò),并且與樣本文件系統(tǒng)、所有的計(jì)算節(jié)點(diǎn)連接; 所述樣本文件系統(tǒng),用于存儲(chǔ)各類場(chǎng)景的樣本圖像、每個(gè)場(chǎng)景的GPS信息以及每幅樣本圖像對(duì)應(yīng)的Hash位串,樣本圖像對(duì)應(yīng)的Hash位串是對(duì)樣本圖像提取描述符特征向量,再對(duì)描述符特征向量進(jìn)行Hash映射得到的,稱為樣本位串;樣本圖像的GPS信息、樣本圖像信息和樣本位串對(duì)應(yīng)存儲(chǔ); 所述終端,用于采集當(dāng)前場(chǎng)景的待識(shí)別圖像以及GPS信息,提取所述待識(shí)別圖像的局部特征,并轉(zhuǎn)換為描述符特征向量;將待識(shí)別圖像的GPS信息以及描述符特征向量打包成一個(gè)描述符文件,發(fā)送給分布式處理系統(tǒng); 所述調(diào)度處理集群,用于在接收到所述描述符文件后,從該描述符文件中提取GPS信息,查詢當(dāng)前正在處理的匹配任務(wù)中是否存在與提取的GPS信息相同的匹配任務(wù),如果是,說(shuō)明已經(jīng)將與待識(shí)別圖像相關(guān)的樣本特征向量加載到各計(jì)算節(jié)點(diǎn)中,則將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn);否則,為待識(shí)別圖像加載相關(guān)的樣本位串; 其中,所述匹配任務(wù)的查詢標(biāo)準(zhǔn)為如果當(dāng)前正在處理的匹配任務(wù)對(duì)應(yīng)的GPS信息與待識(shí)別圖像的GPS信息一致或者相差一個(gè)預(yù)設(shè)閾值,則認(rèn)為存在相同的匹配任務(wù); 所述為待識(shí)別圖像加載相關(guān)的樣本位串為以待識(shí)別圖像的GPS信息為圓心,按照預(yù)先設(shè)定的篩選半徑確定一個(gè)圓形區(qū)域,從樣本文件系統(tǒng)中篩選出GPS信息在所述圓形區(qū)域內(nèi)的樣本位串,將篩選出的樣本位串分?jǐn)偧虞d到各個(gè)計(jì)算節(jié)點(diǎn)中;同時(shí),調(diào)度處理集群還將描述符文件發(fā)送給每個(gè)計(jì)算節(jié)點(diǎn); 所述計(jì)算節(jié)點(diǎn),用于從描述符文件中解析出待匹配描述符特征向量,并進(jìn)行Hash映射,得到待匹配Hash位串;將待識(shí)別圖像的待匹配Hash位串與已加載的與該待識(shí)別圖像相關(guān)的樣本位串進(jìn)行逐個(gè)進(jìn)行漢明比較,將匹配結(jié)果匯總到調(diào)度處理集群;所述調(diào)度處理集群進(jìn)一步用于,統(tǒng)計(jì)各個(gè)計(jì)算節(jié)點(diǎn)的匹配結(jié)果,選出匹配比率最高的樣本圖像作為匹配圖像,將匹配圖像的信息返回給所述終端。
8.如權(quán)利要求7所述的物體識(shí)別系統(tǒng),其特征在于,所述終端進(jìn)一步用于,在提取所述待識(shí)別圖像的局部特征之前,進(jìn)一步對(duì)所述待識(shí)別圖像進(jìn)行降采樣處理,以降低圖像分辨率。
全文摘要
本發(fā)明公開(kāi)了一種基于分布式處理和哈希映射的室外海量物體識(shí)別方法和系統(tǒng),終端采集待識(shí)別圖像以及GPS信息,提取待識(shí)別圖像的描述符特征向量,將待識(shí)別圖像的GPS信息以及描述符特征向量打包成一個(gè)描述符文件,發(fā)送給分布式處理系統(tǒng);分布式處理系統(tǒng)將描述符文件中的描述符特征向量映射為Hash位串,并且根據(jù)GPS信息查詢當(dāng)前正在處理的匹配任務(wù)中是否已經(jīng)存在相同的匹配任務(wù),如果沒(méi)有則在數(shù)據(jù)庫(kù)中搜索與待識(shí)別圖像相關(guān)的樣本圖像的樣本位串,分?jǐn)偧虞d到多個(gè)計(jì)算節(jié)點(diǎn)中并進(jìn)行匹配,匹配率最高樣本圖像就是匹配圖像反饋給終端。使用本發(fā)明能夠?qū)崿F(xiàn)智能終端的大規(guī)模圖像識(shí)別和檢索,而且減少了數(shù)據(jù)運(yùn)算量,數(shù)據(jù)存儲(chǔ)量,提高了圖像識(shí)別和檢索的速度。
文檔編號(hào)G06F17/30GK102880854SQ20121029237
公開(kāi)日2013年1月16日 申請(qǐng)日期2012年8月16日 優(yōu)先權(quán)日2012年8月16日
發(fā)明者劉越, 桂振文, 王涌天, 陳靖 申請(qǐng)人:北京理工大學(xué)