本發(fā)明涉及電子地圖的數(shù)據(jù)處理領(lǐng)域,特別是涉及一種興趣點POI地址編碼的處理方法及裝置。
背景技術(shù):
:隨著網(wǎng)路電子地圖與基于位置服務(wù)的快速發(fā)展,以POI為代表的空間地理數(shù)據(jù)出現(xiàn)快速增長。POI是興趣點(PointofInterest)的縮寫,是一種代表真實地理實體的點狀數(shù)據(jù),POI一般包括名稱、類別、經(jīng)緯度以及地址等基本信息。現(xiàn)有技術(shù)中對POI地址的地址編碼一般會根據(jù)作業(yè)員的工作經(jīng)驗,人工處理成“道路名+門牌號”或“小區(qū)名+樓棟號”。但是,人工地址編碼的處理效率低,不能滿足大數(shù)據(jù)量的地址編碼要求。而且地址編碼質(zhì)量的好壞由人工作業(yè)經(jīng)驗決定,沒有明確的衡量標(biāo)準(zhǔn)。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于提供一種興趣點POI地址編碼的處理方法及裝置,用于解決現(xiàn)有技術(shù)中人工地址編碼效率低,且無法滿足大數(shù)據(jù)量的地址編碼的要求的問題。為了實現(xiàn)上述目的,本發(fā)明實施例提供了一種興趣點POI地址編碼的處理方法,包括:獲取包括道路名稱的道路數(shù)據(jù);按照預(yù)設(shè)的道路分類規(guī)則建立所述道路數(shù)據(jù)對應(yīng)的道路類型表;根據(jù)所述道路類型表,生成與所述道路數(shù)據(jù)相匹配的索引信息;通過所述道路類型表、所述索引信息以及一預(yù)設(shè)算法,對一POI地址進行編碼處理,得到所述POI地址的地址編碼。其中,所述道路名稱為按照省市區(qū)劃分的道路名稱。其中,根據(jù)所述道路類型表,生成與所述道路數(shù)據(jù)相匹配的索引信息的步驟包括:按照所述道路名稱的字節(jié)長短順序?qū)λ龅缆窋?shù)據(jù)進行排序;根據(jù)所述排序的結(jié)果,通過一檢索引擎生成并保存與所述道路數(shù)據(jù)相匹配的索引信息。其中,所述索引信息包括:行政區(qū)劃代碼、道路名稱及道路類型。其中,通過所述道路類型表、所述索引信息以及一預(yù)設(shè)算法,對一POI地址進行編碼處理,得到所述POI地址的地址編碼的步驟包括:獲取一POI地址信息,查詢區(qū)劃配置表確定所述POI地址對應(yīng)的POI行政區(qū)劃代碼;根據(jù)所述道路類型表及所述索引信息得到所述POI地址的道路名稱。其中,所述根據(jù)所述道路類型表及所述索引信息得到所述POI地址的道路名稱的步驟包括:根據(jù)所述道路類型表獲取與所述POI地址相匹配的POI道路類型;根據(jù)所述POI行政區(qū)劃代碼及所述POI道路類型,檢索所述索引信息,得到與所述POI道路類型相匹配的第一匹配道路名稱;通過對所述POI地址的迭代解析處理,在所述第一匹配道路名稱中得到所述POI地址的道路名稱。其中,通過所述道路類型表、所述索引信息以及一預(yù)設(shè)算法,對一POI地址進行編碼處理,得到所述POI地址的地址編碼的步驟還包括:根據(jù)所述預(yù)設(shè)算法獲取所述POI地址中的門牌號碼。其中,還包括:將所述地址編碼保存于所述POI地址的數(shù)據(jù)庫中。本發(fā)明實施例還提供了一種興趣點POI地址編碼的處理裝置,包括:獲取模塊,用于獲取包括道路名稱的道路數(shù)據(jù);分類建立模塊,用于按照預(yù)設(shè)的道路分類規(guī)則建立所述道路數(shù)據(jù)對應(yīng)的道路類型表;索引生成模塊,用于根據(jù)所述道路類型表,生成與所述道路數(shù)據(jù)相匹配的索引信息;編碼處理模塊,用于通過所述道路類型表、所述索引信息以及一預(yù)設(shè)算法,對一POI地址進行編碼處理,得到所述POI地址的地址編碼。其中,所述道路名稱為按照省市區(qū)劃分的地址編碼。其中,所述索引生成模塊包括:排序子模塊,用于按照所述道路名稱的字節(jié)長短順序?qū)λ龅缆窋?shù)據(jù)進行排序;索引生成子模塊,用于根據(jù)所述排序的結(jié)果,通過一檢索引擎生成并保存與所述道路數(shù)據(jù)相匹配的索引信息。其中,所述索引信息包括:行政區(qū)劃代碼、道路名稱及道路類型。其中,所述編碼處理模塊包括:第一處理子模塊,用于獲取一POI地址信息,查詢區(qū)劃配置表確定所述POI地址對應(yīng)的POI行政區(qū)劃代碼;第二處理子模塊,用于根據(jù)所述道路類型表及所述索引信息得到所述POI地址的道路名稱。其中,所述第二處理子模塊包括:獲取單元,用于根據(jù)所述道路類型表獲取與所述POI地址相匹配的POI道路類型;檢索單元,用于根據(jù)所述POI行政區(qū)劃代碼及所述POI道路類型,檢索所述索引信息,得到與所述POI道路類型相匹配的第一匹配道路名稱;處理單元,用于通過對所述POI地址的迭代解析處理,在所述第一匹配道路名稱中得到所述POI地址的道路名稱。其中,所述編碼處理模塊還包括:第三處理子模塊,用于根據(jù)所述預(yù)設(shè)算法獲取所述POI地址中的門牌號碼。其中,還包括:數(shù)據(jù)存儲模塊,用于將所述地址編碼保存于所述POI地址的數(shù)據(jù)庫中。本發(fā)明的上述技術(shù)方案的有益效果如下:本發(fā)明實施例的方案中,通過道路類型表的建立及索引信息的生成,通過不斷地迭代處理可快速地對POI地址進行編碼。提高了地址編碼的處理效率及編碼的準(zhǔn)確性。附圖說明圖1為本發(fā)明實施例的興趣點POI地址編碼的處理方法的基本步驟示意圖;圖2為本發(fā)明實施例的興趣點POI地址編碼的處理方法的具體流程示意圖圖3為本發(fā)明實施例的興趣點POI地址編碼的處理裝置的組成結(jié)構(gòu)示意圖。具體實施方式為使本發(fā)明要解決的技術(shù)問題、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖及具體實施例進行詳細描述。本發(fā)明針對現(xiàn)有技術(shù)中人工地址編碼效率低,且無法滿足大數(shù)據(jù)量的地址編碼的要求的問題,提供一種興趣點POI地址編碼的處理方法,通過道路類型表的建立及索引信息的生成,經(jīng)不斷地迭代處理可快速地對POI地址進行編碼。提高了地址編碼的處理效率及編碼的準(zhǔn)確性。第一實施例如圖1所示,本發(fā)明實施例提供一種興趣點POI地址編碼的處理方法,包括:步驟11,獲取包括道路名稱的道路數(shù)據(jù);具體地,所述道路數(shù)據(jù)主要是指全國道路名稱表。步驟12,按照預(yù)設(shè)的道路分類規(guī)則建立所述道路數(shù)據(jù)對應(yīng)的道路類型表;這里,預(yù)設(shè)的道路分類規(guī)則主要是根據(jù)道路名稱的后綴詞組對所述道路數(shù)據(jù)進行分類。例如,道路名稱為“歐美中心北路”,則其道路類型為“北路”;又如,道路名稱為“學(xué)院路”,則其道路類型為“路”;再如,道路名稱為“金寧世紀(jì)購物廣場步行街”,則其道路類型為“步行街?!辈襟E13,根據(jù)所述道路類型表,生成與所述道路數(shù)據(jù)相匹配的索引信息;步驟14,通過所述道路類型表、所述索引信息以及一預(yù)設(shè)算法,對一POI地址進行編碼處理,得到所述POI地址的地址編碼。這里,所述地址編碼的形式為“道路名稱+門牌號碼”或“小區(qū)名+樓棟號”。本發(fā)明實施例的興趣點POI地址編碼的處理方法,通過道路類型表的建立及索引信息的生成,經(jīng)不斷地迭代處理可快速地對POI地址進行編碼。提高了地址編碼的處理效率及編碼的準(zhǔn)確性。具體地,所述道路名稱為按照省市區(qū)劃分的道路名稱。本發(fā)明實施例中所述步驟13可以進一步包括:步驟131,按照所述道路名稱的字節(jié)長短順序?qū)λ龅缆窋?shù)據(jù)進行排序;這里,道路名稱的字節(jié)長短也就是道路名稱漢字字符的長短。步驟132,根據(jù)所述排序的結(jié)果,通過一檢索引擎生成并保存與所述道路數(shù)據(jù)相匹配的索引信息。需說明的是,這里的檢索引擎優(yōu)選地為開源的Lucene.net全文檢索引擎。Lucene.net是一個開源的全文檢索引擎開發(fā)包,可提供完整的查詢引擎和索引引擎。當(dāng)然本發(fā)明不僅限于該檢索引擎,其他可實現(xiàn)全文檢索功能的檢索引擎均可采用。具體地,如下表1所示,所述索引信息包括:行政區(qū)劃代碼、道路名稱及道路類型。表1行政區(qū)劃代碼道路名稱道路類型320116金寧世紀(jì)購物廣場步行街步行街330100歐美中心北路北路330100歐美中心南路南路110103學(xué)院路路本發(fā)明實施例中所述步驟14可以包括:步驟141,獲取一POI地址信息,查詢區(qū)劃配置表確定所述POI地址對應(yīng)的POI行政區(qū)劃代碼;這里,所述區(qū)劃配置表存儲于本地數(shù)據(jù)庫中,可直接獲取調(diào)用。步驟142,根據(jù)所述道路類型表及所述索引信息得到所述POI地址的道路名稱。進一步地,本發(fā)明實施例中所述步驟142可以包括:步驟1421,根據(jù)所述道路類型表獲取與所述POI地址相匹配的POI道路類型;這里,將獲取的POI地址信息根據(jù)所述道路類型表查詢匹配,確定該POI地址對應(yīng)的道路類型。步驟1422,根據(jù)所述POI行政區(qū)劃代碼及所述POI道路類型,檢索所述索引信息,得到與所述POI道路類型相匹配的第一匹配道路名稱;這里需說明的是,檢索索引信息中,也就是索引文件中行政區(qū)劃代碼與所述POI行政區(qū)劃代碼相同,道路名稱中包含有所述POI道路類型的道路數(shù)據(jù),得到與所述POI道路類型相匹配的第一匹配道路名稱。步驟1423,通過對所述POI地址的迭代解析處理,在所述第一匹配道路名稱中得到所述POI地址的道路名稱。這里,舉例簡要說明本步驟中對所述POI地址進行迭代解析處理的過程。首先,若獲取的POI地址為“北京市海淀區(qū)中科院南路7號”,通過本地區(qū)劃配置表查詢確定與所述POI地址對應(yīng)的的行政區(qū)劃代碼,即POI行政區(qū)劃代碼,這里海淀區(qū)的行政區(qū)劃代碼為110108;這里需要說明的是,獲取到POI地址信息并非以上述明文漢字的形式運行于程序中,需要對獲取到的POI地址進行解析處理。然后,通過遍歷所述道路類型表,獲取與所述POI地址相匹配的道路類型,即POI道路類型;之后,使用開源的Lucene.net全文檢索引擎檢索行政區(qū)劃代碼為所述POI行政區(qū)劃代碼,道路名稱包含所述POI道路類型的道路名稱,得到與所述POI道路類型相匹配的第一匹配道路名稱。這里需說明的是,道路名稱包含所述POI道路類型的道路名稱具體可以是較道路類型本身所占字符多預(yù)設(shè)字符數(shù)的道路名稱。其中,所述字符數(shù)在POI地址迭代解析時可設(shè)置。以本POI地址為例,道路類型為“南路”,道路名稱包含所述POI道路類型的道路名稱可為“科院南路”。這里,得到的第一匹配道路名稱以列表的形式呈現(xiàn)。最后,對所述POI地址的迭代解析處理,在所述第一匹配道路名稱中得到所述POI地址的道路名稱。需說明的是,此處的迭代解析具體為:以在檢索文件中檢索到行政區(qū)劃代碼為所述POI行政區(qū)劃代碼,道路名稱包含所述POI道路類型一第一道路名稱列表;根據(jù)POI地址信息,以設(shè)置的較POI道路類型本身所占字符多預(yù)設(shè)字符數(shù)的道路名稱為檢索對象,在所述第一道路名稱列表中檢索是否有與之相匹配的道路名稱或第二道路名稱列表中;若存在與之相匹配的道路名稱,則確定該道路名稱為POI地址編碼中的道路名稱;若存在與之相匹配的第二道路名稱列表,則調(diào)整上述預(yù)設(shè)字符數(shù)的個數(shù),一般為增加1個或2個字符,之后以調(diào)整的道路名稱為檢索對象,在該第二道路名稱列表中檢索是否有與之相匹配的道路名稱或第三道路名稱列表,如此一直迭代處理,直到獲取到POI地址編碼中的道路名稱。本舉例中,迭代解析具體為:在檢索文件中檢索到POI行政區(qū)劃代碼為110108,道路名稱包含“南路”的一第一道路名稱列表;接著,在該第一道路名稱列表中檢索到與道路名稱為“科院南路”相匹配的第二道路名稱列表;之后,遍歷該第二道路名稱列表,檢索到與道路名稱為“中科院南路”相匹配的道路名稱。這里,“中科院南路”字符數(shù)較之前的“科院南路”多一個,“科院南路”的字符數(shù)較之前的“南路”多兩個。如此在第二道路名稱列表中獲取到POI地址編碼中的道路名稱。進一步地,本發(fā)明實施例中所述步驟14還可以包括:步驟143,根據(jù)所述預(yù)設(shè)算法獲取所述POI地址中的門牌號碼。具體地,所述預(yù)設(shè)算法可以是數(shù)字提取算法,主要是為了提取POI地址信息中的門牌號碼或樓棟號。這里,簡要說明幾種常見的數(shù)字位于POI地址中的位置,即POI地址的格式。A:道路名稱+數(shù)字;比如“學(xué)院路7號”,程序可直接將道路名稱后面的數(shù)字7提取出來。B:道路名稱+同位詞+數(shù)字;比如“萬壽路甲15號”,首先需提取道路名“萬壽路”與數(shù)字“15”之間的文字,遍歷本地存儲的同位詞配置表,若查詢到該字符串“甲”包含在同位詞配置表內(nèi),則確定數(shù)字“15”為門牌號碼。若查詢到該字符串“甲”不在同位詞配置表內(nèi)則需要人工確認,判斷是夠需要將“甲”添加到同位詞配置表內(nèi)。一般道路名稱與門牌號碼之間的字符串長度小于等于4位,門牌號碼的長度小于等于4位。C:道路名稱+數(shù)字+字母;此種格式一般僅用于香港和澳門,程序可直接提取數(shù)字和字母。需要說明的是,數(shù)字提取算法中提取的數(shù)字格式為半角阿拉伯?dāng)?shù)字,若識別到的POI地址中的數(shù)字格式不符合要求,需要在使用數(shù)字提取算法之前將其轉(zhuǎn)換為符合要求的數(shù)字格式。比如“零”轉(zhuǎn)換為“0”。這樣,上述舉例POI地址信息中的數(shù)字可通過該數(shù)字提取算法得到,為道路名稱“中科院南路”之后的數(shù)字“7”。至此,上述舉例POI地址為“北京市海淀區(qū)中科院南路7號”解析得到的地址編碼為“中科院南路+7”。本發(fā)明實施例中所述的興趣點POI地址編碼的處理方法還可包括:步驟15,將所述地址編碼保存于所述POI地址的數(shù)據(jù)庫中。本發(fā)明實施例的方案中,通過道路類型表的建立及索引信息的生成,經(jīng)不斷地迭代處理以及數(shù)字提取算法的應(yīng)用,可快速地對POI地址進行編碼。同時提高了地址編碼的處理效率及編碼的準(zhǔn)確性。第二實施例如圖2所示,為本發(fā)明實施例的興趣點POI地址編碼的處理方法的具體流程示意圖。下面就該圖簡要說明一下該興趣點POI地址編碼的處理方法的主要處理過程。其具體步驟如下:S01,建立一道路類型表;這里,首先獲取按省市區(qū)分類的全國道路名稱表;然后按照預(yù)設(shè)的道路分類規(guī)則建立一與所述全國道路名稱表對應(yīng)的道路類型表。需要說明的是,預(yù)設(shè)的道路分類規(guī)則主要是根據(jù)道路名稱的后綴詞組對所述全國道路名稱表進行分類。例如,道路名稱為“歐美中心北路”,則其道路類型為“北路”;又如,道路名稱為“學(xué)院路”,則其道路類型為“路”;再如,道路名稱為“金寧世紀(jì)購物廣場步行街”,則其道路類型為“步行街?!盨02,根據(jù)道路類型表,建立索引;具體地,根據(jù)道路類型表,通過一全文檢索引擎Lucene.net按照道路名稱的字節(jié)長短順序生成與全國道路名稱表相對應(yīng)的索引文件。S03,解析POI地址進行地址編碼;這里需說明的是,通過建立的道路類型表、生成的索引文件以及一預(yù)設(shè)的算法對POI地址的地址解碼處理。最終得到的地址編碼格式為:“道路名稱+門牌號碼”或“小區(qū)名+樓棟號”。詳細的過程參見第一實施例,在此不再贅述。S04,將得到的地址編碼結(jié)果輸出并保存。這里,對結(jié)果的輸出并保存是為了便于用戶查看最終的地址編碼。本發(fā)明實施例的方案中,通過道路類型表的建立及索引信息的生成,經(jīng)不斷地迭代處理以及數(shù)字提取算法的應(yīng)用,可快速地對POI地址進行編碼。同時提高了地址編碼的處理效率及編碼的準(zhǔn)確性。第二實施例如圖3所示,本發(fā)明實施例還提供一種興趣點POI地址編碼的處理裝置,包括:獲取模塊21,用于獲取包括道路名稱的道路數(shù)據(jù);具體地,所述道路數(shù)據(jù)主要是指全國道路名稱表。分類建立模塊22,用于按照預(yù)設(shè)的道路分類規(guī)則建立所述道路數(shù)據(jù)對應(yīng)的道路類型表;這里,預(yù)設(shè)的道路分類規(guī)則主要是根據(jù)道路名稱的后綴詞組對所述道路數(shù)據(jù)進行分類。例如,道路名稱為“歐美中心北路”,則其道路類型為“北路”;又如,道路名稱為“學(xué)院路”,則其道路類型為“路”;再如,道路名稱為“金寧世紀(jì)購物廣場步行街”,則其道路類型為“步行街。”索引生成模塊23,用于根據(jù)所述道路類型表,生成與所述道路數(shù)據(jù)相匹配的索引信息;編碼處理模塊24,用于通過所述道路類型表、所述索引信息以及一預(yù)設(shè)算法,對一POI地址進行編碼處理,得到所述POI地址的地址編碼。這里,所述地址編碼的形式為“道路名稱+門牌號碼”或“小區(qū)名+樓棟號”具體地,所述道路名稱為按照省市區(qū)劃分的道路名稱。本發(fā)明實施例中所述索引生成模塊23具體可以包括:排序子模塊,用于按照所述道路名稱的字節(jié)長短順序?qū)λ龅缆窋?shù)據(jù)進行排序;這里,道路名稱的字節(jié)長短也就是道路名稱漢字字符的長短。索引生成子模塊,用于根據(jù)所述排序的結(jié)果,通過一檢索引擎生成并保存與所述道路數(shù)據(jù)相匹配的索引信息。需說明的是,這里的檢索引擎優(yōu)選地為開源的Lucene.net全文檢索引擎。Lucene.net是一個開源的全文檢索引擎開發(fā)包,可提供完整的查詢引擎和索引引擎。當(dāng)然本發(fā)明不僅限于該檢索引擎,其他可實現(xiàn)全文檢索功能的檢索引擎均可采用。具體地,如第一實施例中的表1所示,所述索引信息包括:行政區(qū)劃代碼、道路名稱及道路類型。本發(fā)明實施例中所述編碼處理模塊24具體可以包括:第一處理子模塊,用于獲取一POI地址信息,查詢區(qū)劃配置表確定所述POI地址對應(yīng)的POI行政區(qū)劃代碼;這里,所述區(qū)劃配置表存儲于本地數(shù)據(jù)庫中,可直接獲取調(diào)用。第二處理子模塊,用于根據(jù)所述道路類型表及所述索引信息得到所述POI地址的道路名稱。具體地,所述第二處理子模塊可以包括:獲取單元,用于根據(jù)所述道路類型表獲取與所述POI地址相匹配的POI道路類型;這里,將獲取的POI地址信息根據(jù)所述道路類型表查詢匹配,確定該POI地址對應(yīng)的道路類型。檢索單元,用于根據(jù)所述POI行政區(qū)劃代碼及所述POI道路類型,檢索所述索引信息,得到與所述POI道路類型相匹配的第一匹配道路名稱;這里需說明的是,檢索索引信息中,也就是索引文件中行政區(qū)劃代碼與所述POI行政區(qū)劃代碼相同,道路名稱中包含有所述POI道路類型的道路數(shù)據(jù),得到與所述POI道路類型相匹配的第一匹配道路名稱。處理單元,用于通過對所述POI地址的迭代解析處理,在所述第一匹配道路名稱中得到所述POI地址的道路名稱。這里,舉例簡要說明本處理單元中對所述POI地址進行迭代解析處理的過程。首先,若獲取的POI地址為“北京市海淀區(qū)中科院南路7號”,通過本地區(qū)劃配置表查詢確定與所述POI地址對應(yīng)的的行政區(qū)劃代碼,即POI行政區(qū)劃代碼,這里海淀區(qū)的行政區(qū)劃代碼為110108;這里需要說明的是,獲取到POI地址信息并非以上述明文漢字的形式運行于程序中,需要對獲取到的POI地址進行解析處理。然后,通過遍歷所述道路類型表,獲取與所述POI地址相匹配的道路類型,即POI道路類型;之后,使用開源的Lucene.net全文檢索引擎檢索行政區(qū)劃代碼為所述POI行政區(qū)劃代碼,道路名稱包含所述POI道路類型的道路名稱,得到與所述POI道路類型相匹配的第一匹配道路名稱。這里需說明的是,道路名稱包含所述POI道路類型的道路名稱具體可以是較道路類型本身所占字符多預(yù)設(shè)字符數(shù)的道路名稱。其中,所述字符數(shù)在POI地址迭代解析時可設(shè)置。以本POI地址為例,道路類型為“南路”,道路名稱包含所述POI道路類型的道路名稱可為“科院南路”。這里,得到的第一匹配道路名稱以列表的形式呈現(xiàn)。最后,對所述POI地址的迭代解析處理,在所述第一匹配道路名稱中得到所述POI地址的道路名稱。需說明的是,此處的迭代解析具體為:以在檢索文件中檢索到行政區(qū)劃代碼為所述POI行政區(qū)劃代碼,道路名稱包含所述POI道路類型一第一道路名稱列表;根據(jù)POI地址信息,以設(shè)置的較POI道路類型本身所占字符多預(yù)設(shè)字符數(shù)的道路名稱為檢索對象,在所述第一道路名稱列表中檢索是否有與之相匹配的道路名稱或第二道路名稱列表中;若存在與之相匹配的道路名稱,則確定該道路名稱為POI地址編碼中的道路名稱;若存在與之相匹配的第二道路名稱列表,則調(diào)整上述預(yù)設(shè)字符數(shù)的個數(shù),一般為增加1個或2個字符,之后以調(diào)整的道路名稱為檢索對象,在該第二道路名稱列表中檢索是否有與之相匹配的道路名稱或第三道路名稱列表,如此一直迭代處理,直到獲取到POI地址編碼中的道路名稱。本舉例中,迭代解析具體為:在檢索文件中檢索到POI行政區(qū)劃代碼為110108,道路名稱包含“南路”的一第一道路名稱列表;接著,在該第一道路名稱列表中檢索到與道路名稱為“科院南路”相匹配的第二道路名稱列表;之后,遍歷該第二道路名稱列表,檢索到與道路名稱為“中科院南路”相匹配的道路名稱。這里,“中科院南路”字符數(shù)較之前的“科院南路”多一個,“科院南路”的字符數(shù)較之前的“南路”多兩個。如此在第二道路名稱列表中獲取到POI地址編碼中的道路名稱。本發(fā)明實施例中所述編碼處理模塊24具體還可以包括:第三處理子模塊,用于根據(jù)所述預(yù)設(shè)算法獲取所述POI地址中的門牌號碼。具體地,所述預(yù)設(shè)算法可以是數(shù)字提取算法,主要是為了提取POI地址信息中的門牌號碼或樓棟號。這里,簡要說明幾種常見的數(shù)字位于POI地址中的位置,即POI地址的格式。A:道路名稱+數(shù)字;比如“學(xué)院路7號”,程序可直接將道路名稱后面的數(shù)字7提取出來。B:道路名稱+同位詞+數(shù)字;比如“萬壽路甲15號”,首先需提取道路名“萬壽路”與數(shù)字“15”之間的文字,遍歷本地存儲的同位詞配置表,若查詢到該字符串“甲”包含在同位詞配置表內(nèi),則確定數(shù)字“15”為門牌號碼。若查詢到該字符串“甲”不在同位詞配置表內(nèi)則需要人工確認,判斷是夠需要將“甲”添加到同位詞配置表內(nèi)。一般道路名稱與門牌號碼之間的字符串長度小于等于4位,門牌號碼的長度小于等于4位。C:道路名稱+數(shù)字+字母;此種格式一般僅用于香港和澳門,程序可直接提取數(shù)字和字母。需要說明的是,數(shù)字提取算法中提取的數(shù)字格式為半角阿拉伯?dāng)?shù)字,若識別到的POI地址中的數(shù)字格式不符合要求,需要在使用數(shù)字提取算法之前將其轉(zhuǎn)換為符合要求的數(shù)字格式。比如“零”轉(zhuǎn)換為“0”。這樣,上述舉例POI地址信息中的數(shù)字可通過該數(shù)字提取算法得到,為道路名稱“中科院南路”之后的數(shù)字“7”。至此,上述舉例POI地址為“北京市海淀區(qū)中科院南路7號”解析得到的地址編碼為“中科院南路+7”。本發(fā)明實施例中所述的興趣點POI地址編碼的處理裝置具體還可包括:數(shù)據(jù)存儲模塊25,用于將所述地址編碼保存于所述POI地址的數(shù)據(jù)庫中。本發(fā)明實施例的方案中,通過道路類型表的建立及索引信息的生成,經(jīng)不斷地迭代處理以及數(shù)字提取算法的應(yīng)用,可快速地對POI地址進行編碼。同時提高了地址編碼的處理效率及編碼的準(zhǔn)確性。以上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員來說,在不脫離本發(fā)明所述原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。當(dāng)前第1頁1 2 3