專利名稱:基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明公開一種基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng)。尤其是本發(fā)明 數(shù)字圖像的識別是基于二值位圖、基元和像素基礎(chǔ)建立,索引數(shù)字圖像特征準確,其數(shù)據(jù)量 很小,識別和檢索速度快捷。依據(jù)從用戶終端得到的數(shù)字圖像基元特征、像素數(shù)據(jù),同定位 電子地圖中的實景數(shù)字圖像進行識別、檢索、比對、分析,并得到相似數(shù)字圖像;再結(jié)合用戶 發(fā)送的所處地理位置描述文字信息,甄別符合定位地理信息的數(shù)字圖像及相關(guān)位置文字數(shù) 據(jù),獲得最符合用戶終端發(fā)送的數(shù)字圖像相關(guān)聯(lián)的位置定位信息,并將相關(guān)定位數(shù)據(jù)和位 置信息發(fā)送給用戶終端。本發(fā)明對用戶發(fā)送的數(shù)字圖像和文字進行分析、識別和檢索,不依賴通信運營商 提供的位置定位服務和技術(shù),終端用戶也無須同通信運營商提前簽署位置定位服務業(yè)務技 術(shù)許可及相關(guān)業(yè)務協(xié)議;因而,本發(fā)明在接收來自用戶移動終端和通信網(wǎng)絡的數(shù)字圖像和 文字信息前提下,本發(fā)明的方法和系統(tǒng)應用服務于所有通信網(wǎng)絡終端用戶。本發(fā)明建立數(shù)字圖像的二值位圖序列轉(zhuǎn)換,其用于分析、索引、識別和檢索的數(shù)字 圖像的數(shù)據(jù)量很小、網(wǎng)絡計算和傳輸快捷,適用于移動通信網(wǎng)絡及互聯(lián)網(wǎng)數(shù)字圖像搜索、比 對、識別、管理和檢索。本發(fā)明數(shù)字圖像識別和檢索是基于圖形學(graphics)和影像學(imaging)技術(shù) 方法在計算科學(computational science)方面的應用,側(cè)重于利用計算機圖形學來創(chuàng)建 視覺圖像,從而幫助人們理解那些采取錯綜復雜而又往往規(guī)模龐大的數(shù)字呈現(xiàn)形式的數(shù)字 影像,應用于通信網(wǎng)絡中的數(shù)字圖像采集、分析、索引、識別、計算、分類、存儲和檢索。
背景技術(shù):
關(guān)于涉及本發(fā)明的背景技術(shù)從以下兩個方面闡述第一方面數(shù)字圖像的識別和檢索目前,公知的網(wǎng)絡數(shù)字圖像識別和檢索方法基本依據(jù)兩大方向來對網(wǎng)絡數(shù)字圖像 進行識別和檢索。方向一,在網(wǎng)絡數(shù)字圖像中提取的圖像特征,圖像相應的注釋文字是圖像特征的 重要組成部分,繼而標識具有相似圖像特征的其它圖像,以形成圖像的一個或多個圖像特 征結(jié)合,接著從網(wǎng)絡頁面獲取與所述所有圖像相關(guān)聯(lián)的文本,并在所獲取的文本中標識相 交關(guān)鍵字,最后利用相交關(guān)鍵字來注釋圖像。如,通過文字檢索“美洲豹”,得到美洲豹的圖像。方向二,從數(shù)字圖像中提取圖像特征,通過數(shù)字圖像中顏色、色調(diào)、色相、飽和度、 亮度等等生成顏色直方圖、方向直方圖;使用離散余弦變換(DCT)技術(shù)、使用主成份分析 (PCA)技術(shù)等等眾多計算機視覺技術(shù)為整幅數(shù)字圖像做索引,在檢索時根據(jù)圖像的總體顏 色返回結(jié)果。如,通過檢索美洲豹皮毛花紋圖片,得到美洲豹的圖像;甚至,美洲豹有9個亞 種并且每種身上都有一個鮮明的點狀圖案,圖片搜索通過整幅圖像總體顏色的檢索可以識 別其中的差異,并只返回特定花紋亞種美洲豹的結(jié)果。
對以上公知的兩種數(shù)字圖像識別和檢索方法簡單扼要理解為,關(guān)鍵文字和圖片色 彩索引識別和檢索,也有網(wǎng)絡圖像搜索工具將以上兩種方法或更多類似方法合在一起混合 使用。但是以上公知的網(wǎng)絡數(shù)字圖像的識別和檢索方法,在實際網(wǎng)絡使用中存在很大的 缺陷。關(guān)鍵文字索引檢索圖像方法,其存在的前提是在計算科學算法原理中有多個重要的 假設(shè)即所有的圖像都有一個牢固的鏈接圖,每個圖像能從其他網(wǎng)頁圖像、文字的超鏈接達 到;每個圖像都有其基于網(wǎng)頁的文字注釋或相應文章介紹;每個圖像通過網(wǎng)絡網(wǎng)頁或其它 形式同多個圖像有關(guān)聯(lián)。但是在現(xiàn)實通信網(wǎng)絡中,并不完全是這樣的情況。當一個圖像沒 有鏈接的時候,它就不能同網(wǎng)絡中其他圖像關(guān)聯(lián)。同樣道理,當一個圖像沒有文字標識時, 它也沒有可以同其他文本相交的文字。關(guān)鍵文字索引圖像方法就存在缺陷。圖片色彩索引識別檢索圖像方法,面對通信網(wǎng)絡中超過百億的、數(shù)量巨大的數(shù)字 圖像,且隨著網(wǎng)絡信息的爆炸式增長,數(shù)據(jù)還在不斷增長。要對如此龐大的數(shù)據(jù)進行逐一整 幅圖像索引更新需要耗費大量時間和數(shù)據(jù)存儲空間,即便是能滿足時間和空間的需求,應 對數(shù)以百萬計的檢索和查詢需求,這也將是一場噩夢!況且這不僅僅是軟件技術(shù)能解決的 問題,還要依賴存儲設(shè)備及其技術(shù)的發(fā)展。以上公知的數(shù)字圖像識別和檢索方法,還要面對通訊網(wǎng)絡數(shù)據(jù)堵塞、數(shù)據(jù)傳輸損 耗、終端運算速度、終端顯示能力等諸多難題。這一切給通訊網(wǎng)絡的數(shù)字圖像識別和檢索造 成困難,容易出現(xiàn)錯誤的結(jié)果。第二方面無線定位目前,公知的無線定位方法和系統(tǒng)基本是基于位置業(yè)務(LBS—Location Based Service)開展的,是通過移動通信網(wǎng)絡獲取移動終端用戶的位置信息(經(jīng)緯度坐標),在電 子地圖平臺的支持下,為用戶提供相應服務的一種增值業(yè)務。隨著移動電話成為我們的生 活中不可或缺的一部分,移動定位服務的重要性逐漸凸顯出來。同通信運營商協(xié)議并開通 了基于位置的業(yè)務,終端用戶就可以方便地獲知自己或他人目前所處的位置,并用終端查 詢附近各種場所的信息我在哪里、離我最近的醫(yī)院在哪兒、我周圍有哪些銀行、從這里到 某地怎么走、我的好朋友現(xiàn)在的位置、緊急救助、老人跟蹤、車隊管理……基于位置業(yè)務的 巨大魅力在于能在正確的時間、正確的地點、把正確的信息發(fā)送給正確的人?;谖恢玫臉I(yè)務所支持的定位技術(shù)多種多樣,包括 傳統(tǒng)的GPS定位技術(shù)只有GPS定位模塊,定位數(shù)據(jù)必須通過定位儀器本身搭配 電子地圖顯示或有線方式讀取后再通過電子地圖解析。 無線網(wǎng)絡協(xié)助GPS定位技術(shù)終端必須有GPS定位模塊和CDMA通訊模塊,前者 負責與衛(wèi)星通信定位,后者負責將定位數(shù)據(jù)無線傳輸?shù)椒掌鞫恕?基站定位只依靠無線通信網(wǎng)絡本身的資源進行定位,即通過計算附近三個基 站到達終端之間的距離計算后得到終端的位置,復雜的定位運算由基站定位平臺來完成, 無需GPS定位模塊,定位算法有Cell-ID、增強型Cell-ID,EOTD等。 混合型定位技術(shù)衛(wèi)星定位結(jié)合基站定位gpsOne = A_GPS+AFLT+Cell_ID對以上公知的通信網(wǎng)絡無線定位方法和系統(tǒng)簡要理解為,通過移動通信網(wǎng)絡獲取 移動終端用戶的位置信息(經(jīng)緯度坐標),在電子地圖平臺的支持下,為用戶提供相應服務 的一種增值業(yè)務。通信運營商雖然具備了相關(guān)定位技術(shù)和業(yè)務服務,能實現(xiàn)對任何用戶進行定位的能力,但是,通信運營商對用戶的行蹤和位置的任意定位行為是侵犯用戶合法隱 私權(quán)益的。為了避免對用戶隱私權(quán)益的侵害,通信運營商的定位技術(shù)和位置業(yè)務實施的前 提是,得到用戶書面或電子形式的許可;這樣的限制使定位技術(shù)和位置服務廣泛地應用受 到很大程度影響和制約。目前公知的定位技術(shù)是集成高精度GPS的混合定位技術(shù)A-GPS,這是位置業(yè)務LBS 發(fā)展的主流技術(shù)方向;在LBS與GPS產(chǎn)業(yè)競合的過程中,LBS將會逐步對后者產(chǎn)生極大的替 代效應。但是,這些技術(shù)前提是用戶終端必須擁有GPS定位模塊或網(wǎng)絡連接通信數(shù)據(jù)傳輸 模塊(終端能實時進行網(wǎng)絡數(shù)據(jù)傳輸),并且這些模塊還必須在GPS定位信號覆蓋范圍內(nèi)或 網(wǎng)絡數(shù)據(jù)連接傳輸狀況良好的前提下才能正常運行。定位技術(shù)和位置服務綜合個人隱私法律和定位技術(shù)相關(guān)技術(shù)的限制,并不能靈 活、便捷地為需要它的社會大眾服務,在實際網(wǎng)絡使用中存在很大的缺陷。
發(fā)明內(nèi)容
為了克服現(xiàn)有公知數(shù)字圖像識別檢索的不足,以及現(xiàn)有公知位置定位技術(shù)服務的 缺陷,本發(fā)明公開一種基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng)。本發(fā)明功能簡單、 快速地索引用戶終端傳輸?shù)臄?shù)字圖像和文字,提取基于數(shù)字圖像二值位圖序列的多個基元 (基元,指圖像中不同于像素的要素,如線段、曲線、封閉圖形、紋理等)特征的前提下,提取 原始數(shù)字圖像同基元相關(guān)周邊范圍的像素色彩數(shù)據(jù)特征,并將索引數(shù)字圖像的數(shù)據(jù)量減少 到非常小的數(shù)據(jù)量范圍。本發(fā)明對每個數(shù)字圖像建立二值位圖序列,并提取多個甚至眾多 的基元,這些基元之間存在差異性,也存在相似性,甚至同一性;這就形成了眾多獨立基元 集合的基元特征系統(tǒng),依據(jù)基元周邊范圍提取原始數(shù)字圖像的像素色彩數(shù)據(jù)特征,基元特 征系統(tǒng)中的眾多獨立基元和相關(guān)像素數(shù)據(jù)通過不同規(guī)則、不同組合、不同計算,從而同定位 電子地圖系統(tǒng)中的實景圖片數(shù)據(jù)庫比對、識別,獲得相似的實景圖片和定位位置信息。這就 好像是用DNA來解釋細胞的構(gòu)成,用不同DNA的組合來區(qū)分不同有機生物體是一個道理。依據(jù)基元特征和像素數(shù)據(jù)對數(shù)字圖像識別檢索,以及同定位電子地圖系統(tǒng)中的實 景圖片比對、識別和檢索結(jié)果,結(jié)合用戶發(fā)送的所處地理位置描述文字信息;對用戶終端進 行位置定位,并將相關(guān)定位信息及周邊地理信息發(fā)送給用戶終端;在接收來自用戶移動終 端和通信網(wǎng)絡的數(shù)字圖像和文字信息前提下,本方法和系統(tǒng)應用服務于所有通信網(wǎng)絡終端 用戶。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是本發(fā)明公開一種基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng),解決其技術(shù)問 題所采用的技術(shù)方案是用戶通過移動終端設(shè)備拍攝所處地理環(huán)境數(shù)字圖像、撰寫所處地理位置描述文字 傳送給本發(fā)明系統(tǒng)。本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)對用戶終端傳輸?shù)臄?shù)字圖像進行計算處理,依 據(jù)數(shù)字圖像建立二值位圖序列。位圖(Bitmap),又稱光柵圖(Raster Graphics),是使用像 素陣列來表示的圖像,每個像素的顏色信息由RGB組合或者灰度值表示。根據(jù)顏色信息所 需的數(shù)據(jù)位分為1、4、8、16、24及32位等,位數(shù)越高顏色越豐富,相應的數(shù)據(jù)量越大。其中 使用1位表示一個像素顏色的位圖因為一個數(shù)據(jù)位只能表示兩種顏色,所以又稱為二值位圖。本發(fā)明二值位圖通常以黑白兩種顏色呈現(xiàn)。本發(fā)明建立單一數(shù)字圖像的二值位圖序列,指依據(jù)不同閥值色階(Threshold Level)數(shù)值建立的多個二值位圖,這些二值位圖按照特定序列形式排列。閥值指色調(diào)范圍 內(nèi)黑色/白色的劃分界限。序列,數(shù)學上序列是指被排成一列的對象(或事件);這樣,每個元素不是在其他 元素之前,就是在其他元素之后。這里,元素之間的順序非常重要。序列形式,一個給定序 列的子序列是從給定序列中去除一些元素,而不改變其他元素之間相對位置而得到的。若 序列的項屬于一個偏序集,則單調(diào)遞增序列就是其中每個項都大于等于之前的項;若每個 項都嚴格大于之前的項,這個序列就是嚴格單調(diào)遞增的。本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)建立數(shù)字圖像的二值位圖時,系統(tǒng)使用大量圖 形(graphics)和影像(imaging)技術(shù)全面綜合地計算和處理數(shù)字圖像,并獲得質(zhì)量極佳 的二值位圖。本發(fā)明基元特征提取系統(tǒng)使用的圖形(graphics)和影像(imaging)技術(shù)涉 及色階(Levels)、曲線(Curves)、色彩平衡(Color Balance)、亮度 / 對比度(Brightness/ Cotrast)、色相/飽禾口度(Hue/Saturation)、去色(Desaturate)、匹配顏色(Match Color)、 替換顏色(Iteplace Color)、可選顏色(Selective Color)、通道混合(Channel Mixer)、 濾鏡(Fliter)、陰影 / 高光(Shadow/Highlight)、色調(diào)寬度(Tonal)、顏色校正(Color Correction)、黑白色修剪(Black/White Clip)、曝光度(Exposure)、反相(Invert)、色調(diào) 均化(Equalize)、漸變映射(Gradient Map)、色調(diào)分離(Posterize)、閥值(Threshold)、實 色混合(Hard Mix)、差值(Difference)等等眾多的技術(shù)和方法。獲得數(shù)字圖像的二值位圖序列后,本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)依據(jù)數(shù)字圖 像的二值位圖提取基元?;獔D像的高級表達形式之中含有不同于像素方面的一些要素。 這些要素被稱為基元(primitives,又稱為圖元或者原語)。例如,數(shù)字圖像的線段和曲線 就屬于是其中的基元。本發(fā)明將數(shù)字圖像中能標識、代表、詮釋圖像特征和圖像重要組成部 分的點、線段、曲線、封閉圖形、不規(guī)則圖塊等作為單一的基元。本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)對單一數(shù)字圖像二值位圖可提取一個或多個 基元,每一個數(shù)字圖像二值位圖能提取基元的具體數(shù)量,由圖像特征基元提取系統(tǒng)依據(jù)該 數(shù)字圖像二值位圖序列的具體情況處理,從一個到數(shù)十、數(shù)百、數(shù)千個不等。獲得的最終基 元存儲入數(shù)字圖像基元特征提取系統(tǒng)相關(guān)數(shù)據(jù)庫,并將結(jié)果傳輸給本發(fā)明圖像文件檢索系 統(tǒng)。獲得數(shù)字圖像的基元后,本發(fā)明數(shù)字圖像像素數(shù)據(jù)提取系統(tǒng)依據(jù)基元的位置范圍 對應原始數(shù)字圖像中相關(guān)位置周邊范圍的像素,提取基元周邊范圍像素的RGB值和灰度 (Grayscale)值等數(shù)據(jù),并存儲入同基元特征提取系統(tǒng)數(shù)據(jù)庫相關(guān)聯(lián)匹配的像素數(shù)據(jù)提取 系統(tǒng)數(shù)據(jù)庫,并將結(jié)果傳輸給本發(fā)明圖像文件檢索系統(tǒng)。同時,本發(fā)明地理位置描述文字提取系統(tǒng)對用戶終端發(fā)送的相關(guān)地理位置描述文 字進行分析和識別,依據(jù)關(guān)鍵字、關(guān)鍵詞、關(guān)鍵語句、語意、詞干等文字特性結(jié)合地理位置文 字描述行為等技術(shù)方法提取文字特征;并通過文字檢索系統(tǒng)結(jié)合定位電子地圖關(guān)鍵文本數(shù) 據(jù)庫進行分析、識別、計算,并將結(jié)果傳輸給本發(fā)明圖像文件檢索系統(tǒng)。本發(fā)明圖像文件檢索系統(tǒng)依據(jù)提取到的基元、像素、文字等數(shù)字圖像特征,對數(shù)字 圖像進行最終索引、比對、識別、檢索;并將數(shù)字圖像定位結(jié)果信息數(shù)據(jù)傳輸給數(shù)字圖像定位結(jié)果輸出系統(tǒng)。當用戶終端發(fā)起依據(jù)數(shù)字圖像進行位置定位識別和檢索需求時,本發(fā)明依據(jù)用戶 發(fā)送的數(shù)字圖像和地理位置描述文字同定位電子地圖中的實景圖片和文本進行識別檢索, 為用戶終端提供位置定位信息服務。例如用戶迷失道路方向時,使用移動終端拍攝周邊地 理環(huán)境的建筑物、街道場景、商業(yè)設(shè)施、路牌、商業(yè)店鋪招牌、道路標識、標志性物品等,而后 附加相關(guān)地理位置描述文字通過通信網(wǎng)絡傳輸給本發(fā)明系統(tǒng),其傳輸?shù)男问娇梢允菙?shù)字圖 像、照片、圖片、文字文本、詞語、語句、數(shù)字影像、話音、語音文件等單一或混合形式。本發(fā)明 通過數(shù)字圖像基元特征提取系統(tǒng)、數(shù)字圖像像素數(shù)據(jù)提取系統(tǒng)、地理位置描述文字提取系 統(tǒng)提取用戶終端傳輸?shù)男枰M行位置定位的數(shù)字圖像和文字文本相關(guān)特征,并經(jīng)過識別檢 索系統(tǒng)、文字檢索系統(tǒng)、圖像文字檢索系統(tǒng)的識別、檢索,將最終位置定位結(jié)果傳輸給數(shù)字 圖像定位結(jié)果輸出系統(tǒng),對傳輸數(shù)字圖像的用戶終端進行位置定位,并將相關(guān)定位信息及 周邊地理信息發(fā)送給用戶終端。本發(fā)明對用戶終端發(fā)起識別和檢索位置定位信息的數(shù)字圖像進行基元、像素、文 字等特征提取,將獲得的特征結(jié)果索引該圖像。本發(fā)明的圖像文字檢索系統(tǒng)將該圖像的索 引數(shù)據(jù)信息及原始數(shù)字圖像及文本在本發(fā)明已建立的相關(guān)系統(tǒng)數(shù)據(jù)庫中進行標識和存儲, 并同樣標識、索引和存儲在識別檢索過程中相關(guān)聯(lián)的、相同的、相似的、相匹配的索引結(jié)果 及相對應的其他數(shù)字圖像。對獲得位置定位結(jié)果的數(shù)字圖像,本發(fā)明數(shù)字圖像定位結(jié)果輸出系統(tǒng)將依據(jù)識別 檢索定位結(jié)果信息向用戶終端輸出位置定位信息及周邊地理位置信息。發(fā)起位置定位識別檢索的數(shù)字圖像,通過本發(fā)明所提取的基元、相關(guān)聯(lián)像素,在數(shù) 據(jù)庫的識別、檢索、匹配、比對、計算過程中,同定位電子地圖實景圖片的基元、相關(guān)聯(lián)像素 數(shù)據(jù)最終相似、相匹配的數(shù)量多少將最大程度上影響和決定最終本發(fā)明識別檢索系統(tǒng)結(jié)果 的排序。本發(fā)明識別檢索系統(tǒng)和文字檢索系統(tǒng)依據(jù)定位電子地圖實景圖片和文本數(shù)據(jù)庫 的識別、檢索結(jié)果,最終由本發(fā)明圖像文件檢索系統(tǒng)依據(jù)綜合識別、匹配、比對、計算的數(shù) 據(jù),計算獲得數(shù)字圖像位置定位的結(jié)果。本發(fā)明的有益效果是,本發(fā)明對數(shù)字圖像識別檢索是建立在數(shù)字圖像二值位圖基 礎(chǔ)之上,本發(fā)明二值位圖的普遍存在方式是黑白兩色。由于將彩色圖像轉(zhuǎn)換成二值位圖,大 大縮小了數(shù)字圖像空間存儲數(shù)據(jù)容量的大小,其減小的數(shù)據(jù)量比例是幾十倍、幾百倍,甚至 數(shù)千倍。例,一個空間數(shù)據(jù)量為2,968Kb的數(shù)碼圖像,通過本發(fā)明圖像處理系統(tǒng)建立二值位 圖序列后,采集到的基元、紋素、像素特征文件的空間數(shù)據(jù)量為100KB 20KB之間,其空間 數(shù)據(jù)量僅為原始數(shù)據(jù)圖像空間數(shù)據(jù)量比例的3. 37% 0. 67%。本發(fā)明對數(shù)字圖像基元的提取過程,又將數(shù)字圖像劃分成了多個、數(shù)百個基元單 位,并提取有代表性的、能詮釋圖片特征的多個基元、及其周圍原始數(shù)字圖像中的像素所攜 帶的RGB值和灰度(Grayscale)值等數(shù)據(jù)。這樣在基元的基礎(chǔ)上,保留了數(shù)據(jù)圖像固有的 色彩特性,又獲得了數(shù)據(jù)圖像的多個關(guān)鍵特性(Key of Image),并再一次大大縮小了數(shù)據(jù) 容量,提高了數(shù)據(jù)檢索搜索的效能。通過這樣對單一數(shù)字圖像的識別檢索過程,那些采取錯綜復雜而又往往規(guī)模龐大 的數(shù)字呈現(xiàn)形式的數(shù)字影像,經(jīng)過本發(fā)明簡化并創(chuàng)建成了許多視覺圖像的基元、像素和計算方法;對定位電子地圖實景圖片進行同樣的基元特征和像素數(shù)據(jù)提取,并將相關(guān)數(shù)據(jù)信 息存儲入相應數(shù)據(jù)庫,這樣當用戶終端傳輸?shù)臄?shù)字圖像和文本同定位電子地圖中數(shù)量巨大 的實景數(shù)字圖片和文本索引、識別、檢索就變得非常簡單和清晰。因此,本發(fā)明對數(shù)字圖像 的管理、識別、檢索能最快捷、最高效、最直觀的呈現(xiàn)。
下面結(jié)合附圖和實施例對本發(fā)明進一步說明。圖1是本發(fā)明體系結(jié)構(gòu)示意中1.用戶移動終端,2.傳輸數(shù)字圖像和地理位置描述文字,3.數(shù)字圖像基元特 征提取系統(tǒng),4.數(shù)字圖像像素數(shù)據(jù)提取系統(tǒng),5.識別檢索系統(tǒng),6.定位電子地圖實景圖片 數(shù)據(jù)庫,7.地理位置描述文字提取系統(tǒng),8.文字檢索系統(tǒng),9.定位電子地圖關(guān)鍵文本數(shù)據(jù) 庫,10.圖像文件檢索系統(tǒng),11.數(shù)字圖像定位結(jié)果輸出系統(tǒng)。
具體實施例方式圖1是本發(fā)明基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng)的體系結(jié)構(gòu)示意 圖。在圖1中,用戶通過移動終端設(shè)備(1)拍攝所處地理環(huán)境數(shù)字圖像、撰寫所處地理 位置描述文字傳送給本發(fā)明系統(tǒng)(2),本發(fā)明系統(tǒng)對從用戶移動終端接收到的數(shù)字圖像建 立二值位圖序列,本發(fā)明系統(tǒng)數(shù)字圖像基元特征提取系統(tǒng)(3)從中提取多個基元特征,數(shù) 字圖像像素數(shù)據(jù)提取系統(tǒng)(4)依據(jù)對應基元相關(guān)范圍提取原始數(shù)字圖像的像素數(shù)據(jù);識別 檢索系統(tǒng)(5)依據(jù)基元特征和像素數(shù)據(jù)同定位電子地圖實景數(shù)字圖片數(shù)據(jù)庫(6)比對、識 別和檢索結(jié)果,本發(fā)明地理位置描述文字提取系統(tǒng)(7)結(jié)合用戶發(fā)送的所處地理位置描述 文字信息的識別和檢索結(jié)果,對用戶終端進行位置定位,并通過本發(fā)明數(shù)字圖像定位結(jié)果 輸出系統(tǒng)(11)將相關(guān)定位信息及周邊地理信息發(fā)送給用戶終端;本方法和系統(tǒng)適用于所 有通信網(wǎng)絡終端用戶。當用戶終端發(fā)起依據(jù)數(shù)字圖像進行位置定位識別和檢索需求時,本發(fā)明依據(jù)用戶 發(fā)送的數(shù)字圖像和地理位置描述文字同定位電子地圖中的實景圖片和文本進行識別檢索, 為用戶終端提供位置定位信息服務。例如用戶迷失道路方向時,使用移動終端拍攝周邊地 理環(huán)境的建筑物、街道場景、商業(yè)設(shè)施、路牌、商業(yè)店鋪招牌、道路標識、標志性物品等,而后 附加相關(guān)地理位置描述文字通過通信網(wǎng)絡傳輸給本發(fā)明系統(tǒng)(2),其傳輸?shù)男问娇梢允菙?shù) 字圖像、照片、圖片、文字文本、詞語、語句、數(shù)字影像、話音、語音文件等單一或混合形式。本 發(fā)明通過數(shù)字圖像基元特征提取系統(tǒng)(3)、數(shù)字圖像像素數(shù)據(jù)提取系統(tǒng)(4)、地理位置描述 文字提取系統(tǒng)(7)提取用戶終端傳輸?shù)男枰M行位置定位的數(shù)字圖像和文字文本相關(guān)特 征,并經(jīng)過識別檢索系統(tǒng)(5)、文字檢索系統(tǒng)(6)、圖像文字檢索系統(tǒng)(10)的識別、檢索,將 最終位置定位結(jié)果傳輸給數(shù)字圖像定位結(jié)果輸出系統(tǒng)(11),對傳輸數(shù)字圖像的用戶終端進 行位置定位,并將相關(guān)定位信息及周邊地理信息發(fā)送給用戶終端。本發(fā)明對用戶終端發(fā)起識別和檢索位置定位信息的數(shù)字圖像進行基元、像素、文 字等特征提取,將獲得的特征結(jié)果索引該圖像。本發(fā)明的圖像文字檢索系統(tǒng)(10)將該圖像 的索引數(shù)據(jù)信息及原始數(shù)字圖像及文本在本發(fā)明已建立的相關(guān)系統(tǒng)數(shù)據(jù)庫中進行標識和存儲,并同樣標識、索引和存儲在識別檢索過程中相關(guān)聯(lián)的、相同的、相似的、相匹配的索引 結(jié)果及相對應的其他數(shù)字圖像。對獲得位置定位結(jié)果的數(shù)字圖像,本發(fā)明數(shù)字圖像定位結(jié)果輸出系統(tǒng)(11)將依 據(jù)識別檢索定位結(jié)果信息向用戶終端輸出位置定位信息及周邊地理位置信息。發(fā)起位置定位識別檢索的數(shù)字圖像,通過本發(fā)明所提取的基元、相關(guān)聯(lián)像素,在數(shù) 據(jù)庫的識別、檢索、匹配、比對、計算過程中,同定位電子地圖實景圖片數(shù)據(jù)庫(6)的基元、 相關(guān)聯(lián)像素數(shù)據(jù)最終相似、相匹配的數(shù)量多少將最大程度上影響和決定最終本發(fā)明識別檢 索系統(tǒng)結(jié)果的排序。本發(fā)明識別檢索系統(tǒng)和文字檢索系統(tǒng)依據(jù)定位電子地圖實景圖片(6)和文本數(shù) 據(jù)庫(9)的識別、檢索結(jié)果,最終由本發(fā)明圖像文件檢索系統(tǒng)依據(jù)綜合識別、匹配、比對、計 算的數(shù)據(jù),計算獲得數(shù)字圖像位置定位的結(jié)果。
權(quán)利要求
本發(fā)明公開一種基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng);用戶通過移動終端設(shè)備拍攝所處地理環(huán)境數(shù)字圖像、撰寫所處地理位置描述文字傳送給本系統(tǒng),本系統(tǒng)對從用戶移動終端接收到的數(shù)字圖像建立二值位圖序列(1),并從中提取多個基元(基元,指圖像中不同于像素的要素,如線段、曲線、封閉圖形、紋理等)特征,對應基元相關(guān)范圍提取原始數(shù)字圖像的像素數(shù)據(jù);依據(jù)基元特征和像素數(shù)據(jù)同定位電子地圖的實景數(shù)字圖片比對、識別和檢索結(jié)果(2),結(jié)合用戶發(fā)送的所處地理位置描述文字信息的識別和檢索結(jié)果,對用戶終端進行位置定位(3),數(shù)字圖像定位結(jié)果輸出系統(tǒng)將相關(guān)定位信息及周邊地理信息發(fā)送給用戶終端(4);本方法和系統(tǒng)適用于所有通信網(wǎng)絡終端用戶。
2.根據(jù)權(quán)利要求1所述的基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng),其特征是 在步驟(1)中所述的本發(fā)明系統(tǒng)對從用戶移動終端接收到的數(shù)字圖像建立二值位圖序列, 指的是 數(shù)字圖像,指用戶終端設(shè)備傳輸給本發(fā)明相關(guān)系統(tǒng)的圖形、圖像、圖片、照片等形式 的數(shù)字文件,用戶使用裝載攝影攝像功能的移動終端設(shè)備、手機、移動電話等拍攝的數(shù)字照 片、影像是本發(fā)明系統(tǒng)接收、獲得的數(shù)字圖像主要來源; 建立的二值位圖序列,指依據(jù)不同閥值色階(Threshold Level)數(shù)值建立的多個二 值位圖,這些二值位圖按照特定序列形式排列; 位圖(Bitmap)根據(jù)顏色信息所需的數(shù)據(jù)位分為1、4、8、16、24及32位等,其中使用 1位表示一個像素顏色的位圖因為一個數(shù)據(jù)位只能表示兩種顏色,稱為二值位圖,本發(fā)明二 值位圖通常以黑白兩種顏色呈現(xiàn); 本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)建立數(shù)字圖像的二值位圖序列時,使用大量 圖形圖像(graphics)和影像(imaging)技術(shù)全面綜合地計算和處理數(shù)字圖像,涉及色 階(Levels)、曲線(Curves)、色彩平衡(Color Balance)、亮度 / 對比度(Brightness/ Cotrast)、色相/飽禾口度(Hue/Saturation)、去色(Desaturate)、匹配顏色(Match Color)、 替換顏色(Iteplace Color)、可選顏色(Selective Color)、通道混合(Channel Mixer)、 濾鏡(Fliter)、陰影 / 高光(Shadow/Highlight)、色調(diào)寬度(Tonal)、顏色校正(Color Correction)、黑白色修剪(Black/White Clip)、曝光度(Exposure)、反相(Invert)、色調(diào) 均化(Equalize)、漸變映射(Gradient Map)、色調(diào)分離(Posterize)、閥值(Threshold)、實 色混合(Hard Mix)、差值(Difference)等等眾多的技術(shù)和方法。
3.根據(jù)權(quán)利要求1所述的基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng),其特征是 在步驟(2)中所述的獲得數(shù)字圖像的二值位圖序列后,本發(fā)明系統(tǒng)分別提取數(shù)字圖像的多 個基元、相關(guān)像素數(shù)據(jù),依據(jù)基元特征和像素數(shù)據(jù)同定位電子地圖的實景數(shù)字圖片比對、識 別和檢索結(jié)果,包括 本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)依據(jù)數(shù)字圖像的二值位圖提取基元(基元圖像 的高級表達形式之中含有不同于像素方面的一些要素,這些要素被稱為基元primitives, 又稱為圖元或者原語;例如,數(shù)字圖像的線段和曲線就屬于是其中的基元); 本發(fā)明將數(shù)字圖像中能標識、代表、詮釋圖像特征和圖像重要組成部分的點、線段、 曲線、封閉圖形、不規(guī)則圖塊等作為單一的基元,計算提取,獲得的最終基元存儲入基元特 征提取系統(tǒng)相關(guān)數(shù)據(jù)庫; 本發(fā)明數(shù)字圖像基元特征提取系統(tǒng)對單一數(shù)字圖像二值位圖可提取一個或多個基元,每一個數(shù)字圖像二值位圖能提取基元的具體數(shù)量,由圖像特征基元提取系統(tǒng)依據(jù)該數(shù) 字圖像二值位圖序列的具體情況處理,從一個到數(shù)十、數(shù)百、數(shù)千個不等; 獲得數(shù)字圖像的基元后,本發(fā)明數(shù)字圖像像素數(shù)據(jù)提取系統(tǒng)依據(jù)基元的位置范圍 對應原始數(shù)字圖像中相關(guān)位置周邊范圍的像素,提取基元周邊范圍像素的RGB值和灰度 (Grayscale)值等數(shù)據(jù),并存儲入同數(shù)字圖像基元特征提取系統(tǒng)數(shù)據(jù)庫相關(guān)聯(lián)的數(shù)字圖像 像素數(shù)據(jù)提取系統(tǒng)相關(guān)數(shù)據(jù)庫;眷本發(fā)明依據(jù)提取到的多個基元特征、對應像素數(shù)據(jù)等數(shù)字圖像特征,對數(shù)字圖像進 行索引; 本發(fā)明識別檢索系統(tǒng)依據(jù)數(shù)字圖像基元特征和像素數(shù)據(jù)同定位電子地圖的實景數(shù) 字圖片比對、識別和檢索,并獲得計算結(jié)果; 本發(fā)明所提到涉及的定位電子地圖實景圖片數(shù)據(jù)庫,指在依據(jù)公知定位電子地圖地 理數(shù)據(jù)信息實景拍攝的數(shù)字圖片,這些海量的實景圖片,根據(jù)電子地圖相對應的地理數(shù)據(jù) 信息存儲和索引。
4.根據(jù)權(quán)利要求1所述的基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng),其特征是 在步驟(3)中所述的結(jié)合用戶發(fā)送的所處地理位置描述文字信息的識別和檢索結(jié)果,對用 戶終端進行位置定位,包括 本發(fā)明地理位置描述文字提取系統(tǒng)將用戶傳輸?shù)乃幍乩砦恢妹枋鑫淖诌M行識別 分析,并提取關(guān)鍵字、關(guān)鍵詞、關(guān)鍵語句、標識文字、注釋文字、配套文本、語意、詞干等文字 特征提??; 本發(fā)明系統(tǒng)支持中文、英文等多國語言和文字; 利用獲得的文本特征來注釋索引接收的數(shù)字圖像; 將提取到的文字特征存?zhèn)鬏斀o文字檢索系統(tǒng),同定位電子地圖關(guān)鍵文本數(shù)據(jù)庫中進 行識別、檢索,并將其文字特征數(shù)據(jù)存儲入文字檢索系統(tǒng)數(shù)據(jù)庫;眷本發(fā)明依據(jù)提取到的文字特征等數(shù)字圖像特征,對數(shù)字圖像進行索引; 其中每個數(shù)字圖像的多個基元、相關(guān)像素數(shù)據(jù)是主要位置定位識別檢索的要素,文 字特征識別檢索作為輔助定位檢索要素。
5.根據(jù)權(quán)利要求1所述的基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng),其特征是 在步驟(4)中所述的數(shù)字圖像定位結(jié)果輸出系統(tǒng)將相關(guān)定位信息及周邊地理信息發(fā)送給 用戶終端,包括 本發(fā)明系統(tǒng)可以接收用戶終端從移動通信網(wǎng)絡、互聯(lián)網(wǎng)等眾多通信網(wǎng)絡中傳輸?shù)臄?shù) 字圖像及其文本,同時本發(fā)明數(shù)字圖像定位結(jié)果輸出系統(tǒng)將相關(guān)定位信息及周邊地理信息 可以發(fā)送給移動通信網(wǎng)絡、互聯(lián)網(wǎng)絡等眾多通信網(wǎng)絡的用戶終端設(shè)備; 本發(fā)明通過數(shù)字圖像定位結(jié)果輸出系統(tǒng)傳輸給用戶終端的定位信息,是基于對用 戶終端傳輸?shù)臄?shù)字圖像進行識別和檢索獲得的無線定位信息,包括,用戶終端所處城市、社 區(qū)、地域、街道等名稱,以及經(jīng)緯度數(shù)據(jù)信息等定位數(shù)據(jù); 周邊地理信息,指用戶使用終端設(shè)備拍攝數(shù)字圖像時所處街道、周邊道路地理信息、 相連接的周邊其他交通工具和附近公用商業(yè)建筑設(shè)施、旅游景點、購物商場、餐飲店鋪、娛 樂場所、交通站點、住宅小區(qū)、公用設(shè)施,等等; 本發(fā)明數(shù)字圖像定位結(jié)果輸出系統(tǒng)發(fā)送給用戶終端設(shè)備的定位位置信息,均以文字、圖片、話音、視頻、矢量圖形等多元方式,在用戶的移動通信終端上展現(xiàn),具體形式就是 短信息、彩信、電子地圖、流媒體影像、話音、音樂等多種移動通信技術(shù)業(yè)務形式。
6.根據(jù)權(quán)利要求1所述的基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng),包括 用戶通過移動終端設(shè)備拍攝所處地理環(huán)境數(shù)字圖像、撰寫所處地理位置描述文字傳 送給本發(fā)明系統(tǒng),本發(fā)明對發(fā)起識別和檢索的數(shù)字圖像進行基元、像素、文字等數(shù)字圖像特 征提取,并同定位電子地圖實景圖片、關(guān)鍵文本數(shù)據(jù)庫進行比較、匹配、識別、檢索,將獲得 的定位結(jié)果索引該圖像; 本發(fā)明的識別檢索系統(tǒng)和文字檢索系統(tǒng)將數(shù)字圖像及相關(guān)地理位置描述文本的識 別和檢索,在本發(fā)明已建立的定位電子地圖實景圖片數(shù)據(jù)庫和定位電子地圖關(guān)鍵文本數(shù)據(jù) 庫中進行檢索、匹配和計算,獲得相同的、相似的、相匹配的結(jié)果及相對應的數(shù)字圖像,通過 圖像文件檢索系統(tǒng)完成對數(shù)字圖像的定位計算; 本發(fā)明定位電子地圖實景圖片數(shù)據(jù)庫,指依據(jù)公知定位電子地圖地理數(shù)據(jù)信息實 景拍攝的數(shù)字圖片,這些海量的實景圖片,根據(jù)電子地圖相對應的地理數(shù)據(jù)信息存儲和索 引; 本發(fā)明定位電子地圖關(guān)鍵文本數(shù)據(jù)庫,指依據(jù)公知定位電子地圖地理數(shù)據(jù)信息所承 載的地理信息文字、文本、數(shù)字、字母等文字文本數(shù)據(jù),這些海量的文字文本數(shù)據(jù),根據(jù)電子 地圖相對應的地理數(shù)據(jù)信息存儲和索引; 本方法和系統(tǒng)適用于所有通信網(wǎng)絡終端用戶,指本發(fā)明和系統(tǒng)適用于GSM、PHS、 CDMA、WCDMA、TDCDMA、2. 5G、3G、4G、WiFi、SIM 等移動通訊網(wǎng)絡;適用于 Internet 互聯(lián)網(wǎng)絡、 無線局域網(wǎng)絡等。
全文摘要
公開一種基于數(shù)字圖像識別和檢索的無線定位方法、系統(tǒng)。用戶通過移動終端設(shè)備拍攝所處地理環(huán)境數(shù)字圖像、撰寫所處地理位置描述文字傳送給本系統(tǒng),本系統(tǒng)對從用戶移動終端接收到的數(shù)字圖像建立二值位圖序列,并從中提取多個基元(基元,指圖像中不同于像素的要素,如線段、曲線、封閉圖形、紋理等)特征,對應基元相關(guān)范圍提取原始數(shù)字圖像的像素數(shù)據(jù);依據(jù)基元特征和像素數(shù)據(jù)同定位電子地圖的實景數(shù)字圖片比對、識別和檢索結(jié)果,結(jié)合用戶發(fā)送的所處地理位置描述文字信息的識別和檢索結(jié)果,對用戶終端進行位置定位,并將相關(guān)定位信息及周邊地理信息發(fā)送給用戶終端;本方法和系統(tǒng)適用于所有通信網(wǎng)絡終端用戶。
文檔編號G06F17/30GK101945327SQ20101026980
公開日2011年1月12日 申請日期2010年9月2日 優(yōu)先權(quán)日2010年9月2日
發(fā)明者鄭琪心, 鄭琪文, 鄭茂 申請人:鄭茂