地址標(biāo)準(zhǔn)化方法和裝置的制造方法
【專利摘要】本發(fā)明公開了一種地址標(biāo)準(zhǔn)化方法,所述方法包括:當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞;根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞;將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果;根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。本發(fā)明還公開了一種地址標(biāo)準(zhǔn)化裝置。本發(fā)明實(shí)現(xiàn)了將由于用戶書寫習(xí)慣或者某些地區(qū)存在同名等現(xiàn)象所導(dǎo)致的通訊地址不規(guī)范或者不標(biāo)準(zhǔn)的地址轉(zhuǎn)化為標(biāo)準(zhǔn)化形式的地址,提高了通訊地址處理的精確度和通訊地址處理的效率。
【專利說明】
地址標(biāo)準(zhǔn)化方法和裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及通訊地址技術(shù)領(lǐng)域,尤其涉及一種地址標(biāo)準(zhǔn)化方法和裝置。
【背景技術(shù)】
[0002]通訊地址技術(shù)的應(yīng)用領(lǐng)域非常廣泛,與人們的日常生活也息息相關(guān),如郵政領(lǐng)域的信件往來需要對通訊地址進(jìn)行識(shí)別和處理、地理編碼系統(tǒng)中首先需對通訊地址進(jìn)行標(biāo)準(zhǔn)化、銀行業(yè)務(wù)系統(tǒng)中需對地址數(shù)據(jù)進(jìn)行存儲(chǔ)、識(shí)別、更新等處理。通訊地址技術(shù)還可用于網(wǎng)絡(luò)、電子商務(wù)、電子地圖等等。
[0003]通訊地址的不規(guī)范或者不標(biāo)準(zhǔn),將會(huì)給人們帶來諸多的不便。例如:由于用戶地址的不規(guī)范,郵政系統(tǒng)需要投入大量的人力和物力去解決如何識(shí)別正確的、標(biāo)準(zhǔn)的通訊地址,否則將會(huì)造成錯(cuò)誤投遞、重復(fù)投遞的情況,而隨著郵政業(yè)務(wù)數(shù)據(jù)的增長,這種投入將相應(yīng)地進(jìn)行擴(kuò)大,這種情況對郵政系統(tǒng)來說將難以承受。銀行業(yè)務(wù)系統(tǒng)中也存在著用戶地址的不規(guī)范問題,倘若銀行業(yè)務(wù)系統(tǒng)沒有對用戶地址進(jìn)行標(biāo)準(zhǔn)化的處理(事實(shí)上很多銀行業(yè)務(wù)系統(tǒng)確實(shí)沒有對用戶地址進(jìn)行標(biāo)準(zhǔn)化處理,用戶地址的錄入和更新都是人為的進(jìn)行操作),隨著業(yè)務(wù)系統(tǒng)的數(shù)據(jù)量增大,不同數(shù)據(jù)庫的不兼容性,銀行業(yè)務(wù)系統(tǒng)將面臨著處理速度較慢、效率低下,業(yè)務(wù)系統(tǒng)數(shù)據(jù)混亂的現(xiàn)象,很容易造成客戶的損失和流失。因此,將通訊地址標(biāo)準(zhǔn)化,使其轉(zhuǎn)化為地理信息服務(wù)的基礎(chǔ)成果,為大眾的生產(chǎn)生活提供支撐,已成為一項(xiàng)迫切的需要。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的主要目的在于提供一種地址標(biāo)準(zhǔn)化方法和裝置,旨在解決現(xiàn)有通訊地址不規(guī)范或者不標(biāo)準(zhǔn)導(dǎo)致通訊地址處理精確度低,以及處理效率低下的問題。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種地址標(biāo)準(zhǔn)化方法,所述地址標(biāo)準(zhǔn)化方法包括:
[0006]當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞;
[0007]根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞;
[0008]將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果;
[0009]根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。
[0010]優(yōu)選地,所述當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞的步驟之后,還包括:
[0011 ]確定所述關(guān)鍵詞的優(yōu)先級;
[0012]所述將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果的步驟包括:
[0013]根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低;
[0014]按照所述地址分詞的優(yōu)先級高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。
[0015]優(yōu)選地,所述根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞的步驟之后,還包括:
[0016]解析所述地址分詞,確定所述地址分詞是否完全劃分;
[0017]若所述地址分詞中存在未完全劃分的地址分詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,再次劃分所述未完全劃分的地址分詞。
[0018]優(yōu)選地,所述當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞的步驟包括:
[0019]當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,得到預(yù)處理后的待標(biāo)準(zhǔn)化地址;
[0020]在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞。
[0021]優(yōu)選地,所述根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址的步驟之后,還包括:
[0022]對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中。
[0023]此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種地址標(biāo)準(zhǔn)化裝置,所述地址標(biāo)準(zhǔn)化裝置包括:
[0024]提取模塊,用于當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞;
[0025]劃分模塊,用于根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞;
[0026]對比模塊,用于將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果;
[0027]補(bǔ)全模塊,用于根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。
[0028]優(yōu)選地,所述地址標(biāo)準(zhǔn)化裝置還包括:
[0029]確定模塊,用于確定所述關(guān)鍵詞的優(yōu)先級;
[0030]所述對比模塊包括:
[0031]確定單元,用于根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低;
[0032]對比單元,用于按照所述地址分詞的優(yōu)先級高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。
[0033]優(yōu)選地,所述地址標(biāo)準(zhǔn)化裝置還包括:
[0034]解析模塊,用于解析所述地址分詞,確定所述地址分詞是否完全劃分;
[0035]所述補(bǔ)全模塊,還用于若所述地址分詞中存在未完全劃分的地址分詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,再次劃分所述未完全劃分的地址分詞。
[0036]優(yōu)選地,所述提取模塊包括:
[0037]預(yù)處理單元,用于當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,得到預(yù)處理后的待標(biāo)準(zhǔn)化地址;
[0038]提取單元,用于在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵
Τ.κ| ο
[0039]優(yōu)選地,所述地址標(biāo)準(zhǔn)化裝置還包括:
[0040]分類模塊,用于對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中。
[0041]本發(fā)明通過當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),根據(jù)所述待標(biāo)準(zhǔn)化地址中的關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,以得到所述待標(biāo)準(zhǔn)化地址的地址分詞,并將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,根據(jù)對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,以得到標(biāo)準(zhǔn)化地址。實(shí)現(xiàn)了將由于用戶書寫習(xí)慣或者某些地區(qū)存在同名等現(xiàn)象所導(dǎo)致的通訊地址不規(guī)范或者不標(biāo)準(zhǔn)的地址轉(zhuǎn)化為標(biāo)準(zhǔn)化形式的地址,提高了通訊地址處理的精確度和通訊地址處理的效率。
【附圖說明】
[0042]圖1為本發(fā)明地址標(biāo)準(zhǔn)化方法的第一實(shí)施例的流程示意圖;
[0043]圖2為本發(fā)明地址標(biāo)準(zhǔn)化方法的第二實(shí)施例的流程示意圖;
[0044]圖3為本發(fā)明地址標(biāo)準(zhǔn)化方法的第三實(shí)施例的流程示意圖;
[0045]圖4為本發(fā)明地址標(biāo)準(zhǔn)化裝置的第一實(shí)施例的功能模塊示意圖;
[0046]圖5為本發(fā)明地址標(biāo)準(zhǔn)化裝置的第二實(shí)施例的功能模塊示意圖;
[0047]圖6為本發(fā)明實(shí)施例中對比模塊的一種功能模塊示意圖;
[0048]圖7為本發(fā)明地址標(biāo)準(zhǔn)化裝置的第三實(shí)施例的功能模塊示意圖。
[0049]本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
【具體實(shí)施方式】
[0050]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。[0051 ]本發(fā)明提供一種地址標(biāo)準(zhǔn)化方法。
[0052]參照圖1,圖1為本發(fā)明地址標(biāo)準(zhǔn)化方法第一實(shí)施例的流程示意圖。
[0053]在本實(shí)施例中,所述地址標(biāo)準(zhǔn)化方法包括:
[0054]步驟SlO,當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞;
[0055]當(dāng)獲取到待標(biāo)準(zhǔn)化的地址時(shí),解析所述待標(biāo)準(zhǔn)化地址,從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞。需要說明的是,所述關(guān)鍵詞為所述待標(biāo)準(zhǔn)化地址中具有代表性的詞,包括省級關(guān)鍵詞、地區(qū)級關(guān)鍵詞、縣級關(guān)鍵詞、鄉(xiāng)級關(guān)鍵詞、村級關(guān)鍵詞、街巷名關(guān)鍵詞、住宅小區(qū)關(guān)鍵詞、門樓地址關(guān)鍵詞和興趣點(diǎn)關(guān)鍵詞。其中,所述省級關(guān)鍵詞包括但不限于市(直轄市)、省、市(省會(huì))、自治區(qū)和特別行政區(qū);所述地區(qū)級關(guān)鍵詞包括但不限于地區(qū)、盟、自治州和(地級)市;所述縣級關(guān)鍵詞包括但不限于縣、自治州、旗、自治旗和(市轄)區(qū);所述鄉(xiāng)級關(guān)鍵詞包括但不限于鄉(xiāng)、鎮(zhèn)和街道辦;所述村級關(guān)鍵詞包括但不限于村、莊、屯和里;所述街巷名關(guān)鍵詞包括但不限于路、大道、道、大街、街、巷、胡同、條和里;所述住宅小區(qū)關(guān)鍵詞包括但不限于區(qū)、園、村、坊、莊、居、寓、苑、小區(qū)、弄和公寓;所述門樓地址關(guān)鍵詞包括但不限于號(hào)、號(hào)樓、樓、宿舍、齋、館和堂;所述興趣點(diǎn)關(guān)鍵詞包括但不限于大廈、廣場、飯店、中心、大樓、樓、場、廣場、館、酒店、局和城。
[0056]如當(dāng)所獲取待標(biāo)準(zhǔn)化地址為“河北唐山市路北區(qū)麗景逸翠園I號(hào)樓202室”,則解析所述待表標(biāo)準(zhǔn)化地址,得到的關(guān)鍵詞為“市、區(qū)、園、樓和室”。
[0057]步驟S20,根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞;
[0058]當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址的關(guān)鍵詞時(shí),根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞。當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址“河北唐山市路北區(qū)麗景逸翠園I號(hào)樓202室”的關(guān)鍵詞“市、區(qū)、園、樓和室”時(shí),根據(jù)所述關(guān)鍵詞關(guān)鍵詞為“市、區(qū)、園、樓和室”劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞為“河北唐山市”、“路北區(qū),,、“麗景逸翠園”、“I號(hào)樓”和“202室” ο
[0059]進(jìn)一步地,所述步驟S20之后,還包括:
[0060]步驟a,解析所述地址分詞,確定所述地址分詞是否完全劃分;
[0061]步驟b,若所述地址分詞中存在未完全劃分的地址分詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,再次劃分所述未完全劃分的地址分詞。
[0062]進(jìn)一步地,當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化的地址分詞時(shí),解析所述待標(biāo)準(zhǔn)化的地址分詞,確定所述待標(biāo)準(zhǔn)化的地址分詞是否全部已經(jīng)完全劃分。若所述待標(biāo)準(zhǔn)化的地址分詞存在未完全劃分的地址分詞,則表明所述未完全劃分的地址分詞中缺少對應(yīng)的關(guān)鍵詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,以再次劃分所述未完全劃分的地址分詞。如當(dāng)?shù)玫降牡刂贩衷~為“河北唐山市”時(shí),確定所述“河北唐山市”的地址分詞屬于未完全劃分的地址分詞,則按照預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞“河北唐山市”,得到補(bǔ)全之后的地址分詞為“河北省唐山市”,并重新在所述“河北省唐山市”的地址分詞中提取關(guān)鍵詞“省”和“市”,得到對應(yīng)的不能再劃分的地址分詞為“河北省”和“唐山市”。其中,所述預(yù)設(shè)補(bǔ)全規(guī)則為通過一般的地級市的命名規(guī)則去判斷該地址分詞是否需要補(bǔ)充對應(yīng)的關(guān)鍵詞。如“深圳南山區(qū)”,則按照預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全后得到的是“深圳市南山區(qū)”。
[0063]若所述地址分詞中未存在未完全劃分的地址分詞,即全部地址分詞都已完全劃分,則執(zhí)行步驟S30。
[0064]步驟S30,將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果;
[0065]步驟S40,根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。
[0066]當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址的地址分詞時(shí),根據(jù)所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。所述預(yù)設(shè)地址庫中存儲(chǔ)有大量的地址數(shù)據(jù)。如當(dāng)?shù)玫降牡刂贩衷~為“河北唐山市”、“路北區(qū)”、“麗景逸翠園”、“I號(hào)樓”和“202室”時(shí),將所述地址分詞“河北唐山市”、“路北區(qū)”、“麗景逸翠園”、“I號(hào)樓”和“202室”與預(yù)設(shè)地址庫中的地址進(jìn)行對比,得到的對比結(jié)果為地址分詞“河北唐山市”應(yīng)為“河北省唐山市”,所述“路北區(qū)”和所述“麗景逸翠園”之間少了 “建華東道”,所述“I號(hào)樓”和所述“202室”之間少了 “2單元” ο
[0067]根據(jù)所述對比結(jié)果確定所述待標(biāo)準(zhǔn)化地址缺少的地址分詞,將所述待標(biāo)準(zhǔn)化地址所缺少的地址分詞補(bǔ)充至所述待標(biāo)準(zhǔn)化地址中,以補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。如根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址“河北唐山市路北區(qū)麗景逸翠園I號(hào)樓202室”,得到標(biāo)準(zhǔn)化地址為“河北省唐山市路北區(qū)建華東道麗景逸翠園I號(hào)樓2單元202室”。
[0068]本實(shí)施例通過當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),根據(jù)所述待標(biāo)準(zhǔn)化地址中的關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,以得到所述待標(biāo)準(zhǔn)化地址的地址分詞,并將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,根據(jù)對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,以得到標(biāo)準(zhǔn)化地址。實(shí)現(xiàn)了將由于用戶書寫習(xí)慣或者某些地區(qū)存在同名等現(xiàn)象所導(dǎo)致的通訊地址不規(guī)范或者不標(biāo)準(zhǔn)的地址轉(zhuǎn)化為標(biāo)準(zhǔn)化形式的地址,提高了通訊地址處理的精確度和通訊地址的處理效率。
[0069]參照圖2,圖2為本發(fā)明地址標(biāo)準(zhǔn)化方法的第二實(shí)施例的流程示意圖,基于第一實(shí)施例提出本發(fā)明地址標(biāo)準(zhǔn)化方法的第二實(shí)施例。
[0070]在本實(shí)施例中,所述地址標(biāo)準(zhǔn)化方法還包括:
[0071 ]步驟S50,確定所述關(guān)鍵詞的優(yōu)先級;
[0072]當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址的關(guān)鍵詞時(shí),確定所述關(guān)鍵詞的優(yōu)先級。需要說明的是,所述關(guān)鍵詞的優(yōu)先級根據(jù)國家行政區(qū)域劃分標(biāo)準(zhǔn)確定,即根據(jù)國家行政區(qū)域的大小確定。如確定所述省級關(guān)鍵詞為一級關(guān)鍵詞,所述地區(qū)級關(guān)鍵詞為二級關(guān)鍵詞,所述縣級關(guān)鍵詞為三級關(guān)鍵詞,所述鄉(xiāng)級關(guān)鍵詞為四級關(guān)鍵詞,所述村級關(guān)鍵詞為五級關(guān)鍵詞,所述街巷名關(guān)鍵詞、所述住宅小區(qū)關(guān)鍵詞、所述門樓地址關(guān)鍵詞、所述興趣點(diǎn)關(guān)鍵詞為六級關(guān)鍵詞。其中,所述一級關(guān)鍵詞的優(yōu)先級高于二級關(guān)鍵詞,所述二級關(guān)鍵詞的優(yōu)先級高于三級關(guān)鍵詞,以此類推,其余的在此不再贅述。需要說明的是,所述待標(biāo)準(zhǔn)化地址并不會(huì)包括所有級別的關(guān)鍵詞,如可能不包括三級關(guān)鍵詞,也可能不包括五級關(guān)鍵詞等。如確定所述“河北唐山市”為二級關(guān)鍵詞,所述“路北區(qū)”為三級關(guān)鍵詞,所述“麗景逸翠園”、所述“I號(hào)樓”和“202室”為六級關(guān)鍵詞。
[0073]所述步驟S30包括:
[0074]步驟S31,根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低;
[0075]當(dāng)確定所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞的優(yōu)先級后,根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級的高低。如確定所述“河北唐山市”為二級關(guān)鍵詞,所述“路北區(qū)”為三級關(guān)鍵詞,所述“麗景逸翠園”、所述“I號(hào)樓”和“202室”為六級關(guān)鍵詞后,則確定所述“河北唐山市”的優(yōu)先級高于所述“路北區(qū)”的優(yōu)先級,所述“路北區(qū)”的優(yōu)先級高于所述“麗景逸翠園”、所述“I號(hào)樓”和“202室”的優(yōu)先級。
[0076]步驟S32,按照所述地址分詞的優(yōu)先級高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。
[0077]當(dāng)確定所述地址分詞的優(yōu)先級的高低后,按照所述地址分詞的優(yōu)先級的高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,即先將優(yōu)先級最高的地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,在所述預(yù)設(shè)地址庫中除去不屬于所述優(yōu)先級最高的地址分詞的地址,得到第一地址庫,然后再將次優(yōu)先級的地址分詞與所述第一地址庫進(jìn)行對比,在所述預(yù)設(shè)地址庫中除去不屬于所述次優(yōu)先級的地址分詞的地址,得到第二地址庫,以此類推,直到將所述地址分詞對比完畢。如先將“河北唐山市”與所述預(yù)設(shè)地址庫進(jìn)行對比,在預(yù)設(shè)地址庫中篩選出只包含“河北省唐山市”的地址庫,作為第一地址庫;其次將“路北區(qū)”與第一地址庫進(jìn)行對比,在第一地址庫篩選出只包含“河北省唐山市路北區(qū)”的第二地址庫;再者將“麗景逸翠園”、“I號(hào)樓”和“202室”與第二地址庫進(jìn)行對比,得到對比結(jié)果,即得到所述待標(biāo)準(zhǔn)化地址中所缺少的地址分詞。
[0078]本實(shí)施例通過根據(jù)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低,然后按照地址分詞的優(yōu)先級的高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。提高了所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址的效率。
[0079]參照圖3,圖3為本發(fā)明地址標(biāo)準(zhǔn)化方法的第三實(shí)施例的流程示意圖,基于第一實(shí)施例提出本發(fā)明地址標(biāo)準(zhǔn)化方法的第三實(shí)施例。
[0080]在本實(shí)施例中,所述地址標(biāo)準(zhǔn)化方法還包括:
[0081]步驟S60,對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中。
[0082]當(dāng)使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址后,對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一文件夾中。如將屬于廣東省的地址存儲(chǔ)于廣東省文件夾中,將屬于廣東省深圳市的地址存儲(chǔ)于廣東省文件夾中的深圳市的一級子文件夾中,將屬于廣東省深圳市南山區(qū)的地址存儲(chǔ)于深圳市的一級子文件夾中的二級子文件夾中。需要說明的是,并不需要對所述標(biāo)準(zhǔn)化地址進(jìn)行過于詳細(xì)的分類,為了防止過于累贅,一般省級文件夾下面只會(huì)存在三個(gè)子文件夾。
[0083]進(jìn)一步地,所述步驟SlO還包括:
[0084]步驟d,當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,得到預(yù)處理后的待標(biāo)準(zhǔn)化地址;
[0085]步驟e,在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞。
[0086]進(jìn)一步地,當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,即刪除所述待標(biāo)準(zhǔn)化地址中多余的空格,將所述待標(biāo)準(zhǔn)化地址所包含的數(shù)字或者字母的全角字符轉(zhuǎn)換為半角字符,以得到預(yù)處理后的待標(biāo)準(zhǔn)化地址。當(dāng)?shù)玫筋A(yù)處理后的待標(biāo)準(zhǔn)化地址時(shí),在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞。
[0087]本實(shí)施例通過對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中,實(shí)現(xiàn)了對繁多的地址數(shù)據(jù)的有效管理。
[0088]本發(fā)明進(jìn)一步提供一種地址標(biāo)準(zhǔn)化裝置。
[0089]參照圖4,圖4為本發(fā)明地址標(biāo)準(zhǔn)化裝置的第一實(shí)施例的功能模塊示意圖。
[0090]在本實(shí)施例中,所述地址標(biāo)準(zhǔn)化裝置包括:
[0091]提取模塊10,用于當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞;
[0092]當(dāng)獲取到待標(biāo)準(zhǔn)化的地址時(shí),解析所述待標(biāo)準(zhǔn)化地址,從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞。需要說明的是,所述關(guān)鍵詞為所述待標(biāo)準(zhǔn)化地址中具有代表性的詞,包括省級關(guān)鍵詞、地區(qū)級關(guān)鍵詞、縣級關(guān)鍵詞、鄉(xiāng)級關(guān)鍵詞、村級關(guān)鍵詞、街巷名關(guān)鍵詞、住宅小區(qū)關(guān)鍵詞、門樓地址關(guān)鍵詞和興趣點(diǎn)關(guān)鍵詞。其中,所述省級關(guān)鍵詞包括但不限于市(直轄市)、省、市(省會(huì))、自治區(qū)和特別行政區(qū);所述地區(qū)級關(guān)鍵詞包括但不限于地區(qū)、盟、自治州和(地級)市;所述縣級關(guān)鍵詞包括但不限于縣、自治州、旗、自治旗和(市轄)區(qū);所述鄉(xiāng)級關(guān)鍵詞包括但不限于鄉(xiāng)、鎮(zhèn)和街道辦;所述村級關(guān)鍵詞包括但不限于村、莊、屯和里;所述街巷名關(guān)鍵詞包括但不限于路、大道、道、大街、街、巷、胡同、條和里;所述住宅小區(qū)關(guān)鍵詞包括但不限于區(qū)、園、村、坊、莊、居、寓、苑、小區(qū)、弄和公寓;所述門樓地址關(guān)鍵詞包括但不限于號(hào)、號(hào)樓、樓、宿舍、齋、館和堂;所述興趣點(diǎn)關(guān)鍵詞包括但不限于大廈、廣場、飯店、中心、大樓、樓、場、廣場、館、酒店、局和城。
[0093]如當(dāng)所獲取待標(biāo)準(zhǔn)化地址為“河北唐山市路北區(qū)麗景逸翠園I號(hào)樓202室”,則解析所述待表標(biāo)準(zhǔn)化地址,得到的關(guān)鍵詞為“市、區(qū)、園、樓和室”。
[0094]劃分模塊20,用于根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞;
[0095]當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址的關(guān)鍵詞時(shí),根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞。當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址“河北唐山市路北區(qū)麗景逸翠園I號(hào)樓202室”的關(guān)鍵詞“市、區(qū)、園、樓和室”時(shí),根據(jù)所述關(guān)鍵詞關(guān)鍵詞為“市、區(qū)、園、樓和室”劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞為“河北唐山市”、“路北區(qū),,、“麗景逸翠園”、“I號(hào)樓”和“202室” O
[0096]進(jìn)一步地,所述地址標(biāo)準(zhǔn)化裝置還包括:
[0097]解析模塊,用于解析所述地址分詞,確定所述地址分詞是否完全劃分;
[0098]補(bǔ)全模塊40,用于若所述地址分詞中存在未完全劃分的地址分詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,再次劃分所述未完全劃分的地址分詞。
[0099]進(jìn)一步地,當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化的地址分詞時(shí),解析所述待標(biāo)準(zhǔn)化的地址分詞,確定所述待標(biāo)準(zhǔn)化的地址分詞是否全部已經(jīng)完全劃分。若所述待標(biāo)準(zhǔn)化的地址分詞存在未完全劃分的地址分詞,則表明所述未完全劃分的地址分詞中缺少對應(yīng)的關(guān)鍵詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,以再次劃分所述未完全劃分的地址分詞。如當(dāng)?shù)玫降牡刂贩衷~為“河北唐山市”時(shí),確定所述“河北唐山市”的地址分詞屬于未完全劃分的地址分詞,則按照預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞“河北唐山市”,得到補(bǔ)全之后的地址分詞為“河北省唐山市”,并重新在所述“河北省唐山市”的地址分詞中提取關(guān)鍵詞“省”和“市”,得到對應(yīng)的不能再劃分的地址分詞為“河北省”和“唐山市”。其中,所述預(yù)設(shè)補(bǔ)全規(guī)則為通過一般的地級市的命名規(guī)則去判斷該地址分詞是否需要補(bǔ)充對應(yīng)的關(guān)鍵詞。如“深圳南山區(qū)”,則按照預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全后得到的是“深圳市南山區(qū)”。
[0?00]若所述地址分詞中未存在未完全劃分的地址分詞,即全部地址分詞都已完全劃分,則執(zhí)行對比模塊30。
[0101]對比模塊30,用于將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果;
[0102]補(bǔ)全模塊40,用于根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。
[0103]當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址的地址分詞時(shí),根據(jù)所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。所述預(yù)設(shè)地址庫中存儲(chǔ)有大量的地址數(shù)據(jù)。如當(dāng)?shù)玫降牡刂贩衷~為“河北唐山市”、“路北區(qū)”、“麗景逸翠園”、“I號(hào)樓”和“202室”時(shí),將所述地址分詞“河北唐山市”、“路北區(qū)”、“麗景逸翠園”、“I號(hào)樓”和“202室”與預(yù)設(shè)地址庫中的地址進(jìn)行對比,得到的對比結(jié)果為地址分詞“河北唐山市”應(yīng)為“河北省唐山市”,所述“路北區(qū)”和所述“麗景逸翠園”之間少了 “建華東道”,所述“I號(hào)樓”和所述“202室”之間少了 “2單元” ο
[0104]根據(jù)所述對比結(jié)果確定所述待標(biāo)準(zhǔn)化地址缺少的地址分詞,將所述待標(biāo)準(zhǔn)化地址所缺少的地址分詞補(bǔ)充至所述待標(biāo)準(zhǔn)化地址中,以補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。如根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址“河北唐山市路北區(qū)麗景逸翠園I號(hào)樓202室”,得到標(biāo)準(zhǔn)化地址為“河北省唐山市路北區(qū)建華東道麗景逸翠園I號(hào)樓2單元202室”。
[0105]本實(shí)施例通過當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),根據(jù)所述待標(biāo)準(zhǔn)化地址中的關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,以得到所述待標(biāo)準(zhǔn)化地址的地址分詞,并將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,根據(jù)對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,以得到標(biāo)準(zhǔn)化地址。實(shí)現(xiàn)了將由于用戶書寫習(xí)慣或者某些地區(qū)存在同名等現(xiàn)象所導(dǎo)致的通訊地址不規(guī)范或者不標(biāo)準(zhǔn)的地址轉(zhuǎn)化為標(biāo)準(zhǔn)化形式的地址,提高了通訊地址處理的精確度和通訊地址的處理效率。
[0106]參照圖5,圖5為本發(fā)明地址標(biāo)準(zhǔn)化裝置的第二實(shí)施例的功能模塊示意圖,基于第一實(shí)施例提出本發(fā)明地址標(biāo)準(zhǔn)化裝置的第二實(shí)施例。
[0107]在本實(shí)施例中,所述地址標(biāo)準(zhǔn)化裝置還包括:
[0108]確定模塊50,用于確定所述關(guān)鍵詞的優(yōu)先級;
[0109]當(dāng)?shù)玫剿龃龢?biāo)準(zhǔn)化地址的關(guān)鍵詞時(shí),確定所述關(guān)鍵詞的優(yōu)先級。需要說明的是,所述關(guān)鍵詞的優(yōu)先級根據(jù)國家行政區(qū)域劃分標(biāo)準(zhǔn)確定,即根據(jù)國家行政區(qū)域的大小確定。如確定所述省級關(guān)鍵詞為一級關(guān)鍵詞,所述地區(qū)級關(guān)鍵詞為二級關(guān)鍵詞,所述縣級關(guān)鍵詞為三級關(guān)鍵詞,所述鄉(xiāng)級關(guān)鍵詞為四級關(guān)鍵詞,所述村級關(guān)鍵詞為五級關(guān)鍵詞,所述街巷名關(guān)鍵詞、所述住宅小區(qū)關(guān)鍵詞、所述門樓地址關(guān)鍵詞、所述興趣點(diǎn)關(guān)鍵詞為六級關(guān)鍵詞。其中,所述一級關(guān)鍵詞的優(yōu)先級高于二級關(guān)鍵詞,所述二級關(guān)鍵詞的優(yōu)先級高于三級關(guān)鍵詞,以此類推,其余的在此不再贅述。需要說明的是,所述待標(biāo)準(zhǔn)化地址并不會(huì)包括所有級別的關(guān)鍵詞,如可能不包括三級關(guān)鍵詞,也可能不包括五級關(guān)鍵詞等。如確定所述“河北唐山市”為二級關(guān)鍵詞,所述“路北區(qū)”為三級關(guān)鍵詞,所述“麗景逸翠園”、所述“I號(hào)樓”和“202室”為六級關(guān)鍵詞。
[0110]參照圖6,圖6為本發(fā)明實(shí)施例中對比模塊的一種功能模塊示意圖。
[0111]所述對比模塊30包括:
[0112]確定單元31,用于根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低;
[0113]當(dāng)確定所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞的優(yōu)先級后,根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級的高低。如確定所述“河北唐山市”為二級關(guān)鍵詞,所述“路北區(qū)”為三級關(guān)鍵詞,所述“麗景逸翠園”、所述“I號(hào)樓”和“202室”為六級關(guān)鍵詞后,則確定所述“河北唐山市”的優(yōu)先級高于所述“路北區(qū)”的優(yōu)先級,所述“路北區(qū)”的優(yōu)先級高于所述“麗景逸翠園”、所述“I號(hào)樓”和“202室”的優(yōu)先級。
[0114]對比單元32,用于按照所述地址分詞的優(yōu)先級高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。
[0115]當(dāng)確定所述地址分詞的優(yōu)先級的高低后,按照所述地址分詞的優(yōu)先級的高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,即先將優(yōu)先級最高的地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,在所述預(yù)設(shè)地址庫中除去不屬于所述優(yōu)先級最高的地址分詞的地址,得到第一地址庫,然后再將次優(yōu)先級的地址分詞與所述第一地址庫進(jìn)行對比,在所述預(yù)設(shè)地址庫中除去不屬于所述次優(yōu)先級的地址分詞的地址,得到第二地址庫,以此類推,直到將所述地址分詞對比完畢。如先將“河北唐山市”與所述預(yù)設(shè)地址庫進(jìn)行對比,在預(yù)設(shè)地址庫中篩選出只包含“河北省唐山市”的地址庫,作為第一地址庫;其次將“路北區(qū)”與第一地址庫進(jìn)行對比,在第一地址庫篩選出只包含“河北省唐山市路北區(qū)”的第二地址庫;再者將“麗景逸翠園”、“I號(hào)樓”和“202室”與第二地址庫進(jìn)行對比,得到對比結(jié)果,即得到所述待標(biāo)準(zhǔn)化地址中所缺少的地址分詞。
[0116]本實(shí)施例通過根據(jù)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低,然后按照地址分詞的優(yōu)先級的高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。提高了所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址的效率。
[0117]參照圖7,圖7為本發(fā)明地址標(biāo)準(zhǔn)化裝置的第三實(shí)施例的功能模塊示意圖,基于第一實(shí)施例提出本發(fā)明地址標(biāo)準(zhǔn)化裝置的第三實(shí)施例。
[0118]在本實(shí)施例中,所述地址標(biāo)準(zhǔn)化裝置還包括:
[0119]分類模塊60,用于對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中。
[0120]當(dāng)使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址后,對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一文件夾中。如將屬于廣東省的地址存儲(chǔ)于廣東省文件夾中,將屬于廣東省深圳市的地址存儲(chǔ)于廣東省文件夾中的深圳市的一級子文件夾中,將屬于廣東省深圳市南山區(qū)的地址存儲(chǔ)于深圳市的一級子文件夾中的二級子文件夾中。需要說明的是,并不需要對所述標(biāo)準(zhǔn)化地址進(jìn)行過于詳細(xì)的分類,為了防止過于累贅,一般省級文件夾下面只會(huì)存在三個(gè)子文件夾。
[0121]進(jìn)一步地,所述提取模塊10包括:
[0122]預(yù)處理單元,用于當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,得到預(yù)處理后的待標(biāo)準(zhǔn)化地址;
[0123]提取單元,用于在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵
Τ.κ| ο
[0124]進(jìn)一步地,當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,即刪除所述待標(biāo)準(zhǔn)化地址中多余的空格,將所述待標(biāo)準(zhǔn)化地址所包含的數(shù)字或者字母的全角字符轉(zhuǎn)換為半角字符,以得到預(yù)處理后的待標(biāo)準(zhǔn)化地址。當(dāng)?shù)玫筋A(yù)處理后的待標(biāo)準(zhǔn)化地址時(shí),在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞。
[0125]本實(shí)施例通過對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中,實(shí)現(xiàn)了對繁多的地址數(shù)據(jù)的有效管理。
[0126]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如R0M/RAM、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0127]以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種地址標(biāo)準(zhǔn)化方法,其特征在于,所述地址標(biāo)準(zhǔn)化方法包括: 當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞; 根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞; 將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果; 根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。2.如權(quán)利要求1所述的地址標(biāo)準(zhǔn)化方法,其特征在于,所述當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞的步驟之后,還包括: 確定所述關(guān)鍵詞的優(yōu)先級; 所述將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果的步驟包括: 根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低; 按照所述地址分詞的優(yōu)先級高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。3.如權(quán)利要求1所述的地址標(biāo)準(zhǔn)化方法,其特征在于,所述根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞的步驟之后,還包括: 解析所述地址分詞,確定所述地址分詞是否完全劃分; 若所述地址分詞中存在未完全劃分的地址分詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,再次劃分所述未完全劃分的地址分詞。4.如權(quán)利要求1所述的地址標(biāo)準(zhǔn)化方法,其特征在于,所述當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞的步驟包括: 當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,得到預(yù)處理后的待標(biāo)準(zhǔn)化地址; 在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞。5.如權(quán)利要求1至4任一項(xiàng)所述的地址標(biāo)準(zhǔn)化方法,其特征在于,所述根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址的步驟之后,還包括: 對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中。6.一種地址標(biāo)準(zhǔn)化裝置,其特征在于,所述地址標(biāo)準(zhǔn)化裝置包括: 提取模塊,用于當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),從所述待標(biāo)準(zhǔn)化地址中提取關(guān)鍵詞; 劃分模塊,用于根據(jù)所述關(guān)鍵詞劃分所述待標(biāo)準(zhǔn)化地址,得到所述待標(biāo)準(zhǔn)化地址的地址分詞; 對比模塊,用于將所述地址分詞與預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果; 補(bǔ)全模塊,用于根據(jù)所述對比結(jié)果補(bǔ)全所述待標(biāo)準(zhǔn)化地址,使所述待標(biāo)準(zhǔn)化地址轉(zhuǎn)化成標(biāo)準(zhǔn)化地址。7.如權(quán)利要求6所述的地址標(biāo)準(zhǔn)化裝置,其特征在于,所述地址標(biāo)準(zhǔn)化裝置還包括: 確定模塊,用于確定所述關(guān)鍵詞的優(yōu)先級; 所述對比模塊包括: 確定單元,用于根據(jù)所述關(guān)鍵詞的優(yōu)先級的高低確定所述地址分詞的優(yōu)先級高低; 對比單元,用于按照所述地址分詞的優(yōu)先級高低依次將所述地址分詞與所述預(yù)設(shè)地址庫進(jìn)行對比,得到對比結(jié)果。8.如權(quán)利要求6所述的地址標(biāo)準(zhǔn)化裝置,其特征在于,所述地址標(biāo)準(zhǔn)化裝置還包括: 解析模塊,用于解析所述地址分詞,確定所述地址分詞是否完全劃分; 所述補(bǔ)全模塊,還用于若所述地址分詞中存在未完全劃分的地址分詞,則根據(jù)預(yù)設(shè)補(bǔ)全規(guī)則補(bǔ)全所述未完全劃分的地址分詞,再次劃分所述未完全劃分的地址分詞。9.如權(quán)利要求6所述的地址標(biāo)準(zhǔn)化裝置,其特征在于,所述提取模塊包括: 預(yù)處理單元,用于當(dāng)獲取到待標(biāo)準(zhǔn)化地址時(shí),對所述待標(biāo)準(zhǔn)化地址進(jìn)行預(yù)處理,得到預(yù)處理后的待標(biāo)準(zhǔn)化地址; 提取單元,用于在所述預(yù)處理后的待標(biāo)準(zhǔn)化地址中提取所述待標(biāo)準(zhǔn)化地址的關(guān)鍵詞。10.如權(quán)利要求6至9任一項(xiàng)所述的地址標(biāo)準(zhǔn)化裝置,其特征在于,所述地址標(biāo)準(zhǔn)化裝置還包括: 分類模塊,用于對所述標(biāo)準(zhǔn)化地址進(jìn)行分類,將屬于同一類別的地址存儲(chǔ)于同一個(gè)文件夾中。
【文檔編號(hào)】G06F17/30GK106055650SQ201610378657
【公開日】2016年10月26日
【申請日】2016年5月31日
【發(fā)明人】張銳
【申請人】深圳市永興元科技有限公司