地址數(shù)據(jù)處理方法及裝置的制造方法
【專利摘要】本申請(qǐng)?zhí)峁┝说刂窋?shù)據(jù)處理方法及裝置,其中一種方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則確定所述目標(biāo)地址數(shù)據(jù)的缺失格式,并補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與所述缺失格式對(duì)應(yīng)的地址信息。在將地址信息補(bǔ)充至目標(biāo)地址后,目標(biāo)地址便符合預(yù)設(shè)地址格式規(guī)則的規(guī)定,即目標(biāo)地址數(shù)據(jù)具有完整信息,從而可以被準(zhǔn)確識(shí)別。本申請(qǐng)能夠自動(dòng)補(bǔ)充目標(biāo)地址中缺失的信息,使得補(bǔ)充完整后的目標(biāo)地址能夠被準(zhǔn)確識(shí)別,與傳統(tǒng)人工識(shí)別方式相比能夠提升目標(biāo)地址數(shù)據(jù)的識(shí)別準(zhǔn)確率以及效率。
【專利說(shuō)明】
地址數(shù)據(jù)處理方法及裝置
技術(shù)領(lǐng)域
[0001]本申請(qǐng)涉及計(jì)算機(jī)領(lǐng)域,尤其涉及地址數(shù)據(jù)處理方法及裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,為了更好地實(shí)現(xiàn)數(shù)據(jù)交互,許多終端應(yīng)用均涉及用戶地址,所以對(duì)用戶地址進(jìn)行準(zhǔn)確識(shí)別顯得越來(lái)越重要。例如,對(duì)于各大購(gòu)物網(wǎng)站或快遞行業(yè)公司而言,準(zhǔn)確識(shí)別用戶地址,并據(jù)此判斷是否在其業(yè)務(wù)覆蓋范圍內(nèi),這是提供快遞服務(wù)的一個(gè)基礎(chǔ)環(huán)節(jié)。
【發(fā)明內(nèi)容】
[0003]發(fā)明人在研究過(guò)程中發(fā)現(xiàn)現(xiàn)有技術(shù)具有如下問(wèn)題:
[0004]針對(duì)各大購(gòu)物網(wǎng)站或第三方(例如快遞公司)而言,為了判定用戶地址是否在其業(yè)務(wù)范圍內(nèi),可以將用戶地址的省、市、縣區(qū),以及,街道或鄉(xiāng)鎮(zhèn),組成的四級(jí)行政區(qū)域作為輸入信息進(jìn)行查詢。但是,由于用戶大多數(shù)情況下并不清楚自己的街道信息等,所以用戶地址中一般未填寫(xiě)街道或鄉(xiāng)鎮(zhèn)一級(jí)行政區(qū)域,導(dǎo)致無(wú)法準(zhǔn)確地處理地址數(shù)據(jù),例如,確定用戶地址是否在業(yè)務(wù)覆蓋范圍內(nèi)。
[0005]因此,為了解決上述技術(shù)問(wèn)題,本申請(qǐng)實(shí)施例提供一種地址數(shù)據(jù)處理方法及裝置,用以自動(dòng)補(bǔ)充用戶地址所缺失的地址信息,以便用戶地址補(bǔ)充完整后,能夠被準(zhǔn)確識(shí)別。
[0006]為了實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)峁┝艘韵录夹g(shù)手段:
[0007]一種地址數(shù)據(jù)處理方法,包括:
[0008]獲取待處理的目標(biāo)地址數(shù)據(jù);
[0009]根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;
[0010]當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。
[0011]優(yōu)選的,所述根據(jù)預(yù)設(shè)地址格式規(guī)則判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整,包括:
[0012]對(duì)所述目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作生成目標(biāo)分詞信息,所述目標(biāo)分詞信息包括:目標(biāo)行政區(qū)域信息,所述目標(biāo)行政區(qū)域信息包括至少一個(gè)行政區(qū)域名稱,以及與行政區(qū)域名稱對(duì)應(yīng)的行政區(qū)域內(nèi)容;
[0013]判斷目標(biāo)行政區(qū)域信息內(nèi)的行政區(qū)域名稱與所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱是否匹配。
[0014]優(yōu)選的,所述按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息,包括:
[0015]按照所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱,確定所述目標(biāo)行政區(qū)域信息內(nèi)缺失的行政區(qū)域名稱;
[0016]在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有行政區(qū)域名稱與行政區(qū)域內(nèi)容之間的對(duì)應(yīng)關(guān)系;
[0017]將所述目標(biāo)行政區(qū)域內(nèi)容作為所述地址信息,補(bǔ)充至所述目標(biāo)地址數(shù)據(jù)中。
[0018]優(yōu)選的,所述目標(biāo)分詞信息還包括目標(biāo)道路信息和/或目標(biāo)建筑物信息;所述目標(biāo)行政區(qū)域信息中至少包括目標(biāo)縣區(qū)行政區(qū)域;則在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,包括:
[0019]在所述缺失的行政區(qū)域名稱為省行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)行政區(qū)域信息,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)省份內(nèi)容;
[0020]在所述缺失的行政區(qū)域名稱為街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0021]優(yōu)選的,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息以及所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容,包括:
[0022]在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有道路信息,其中所述預(yù)設(shè)道路信息庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有道路信息、以及每個(gè)道路信息所屬的街道或鄉(xiāng)鎮(zhèn)信息;
[0023]在所述所有道路信息中、查找到與所述目標(biāo)道路信息一致的道路信息;
[0024]將所述道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0025]優(yōu)選的,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)建筑物信息以及目標(biāo)縣區(qū)行政區(qū)域確定對(duì)應(yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容,包括:
[0026]將所述目標(biāo)建筑物信息進(jìn)行二元分詞,將所有分詞結(jié)果的集合作為目標(biāo)索引表,其中每個(gè)分詞結(jié)果對(duì)應(yīng)一個(gè)索引;
[0027]在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中、獲得與目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有反向索引表;其中所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有反向索引表,以及每個(gè)反向索引表所屬的街道或鄉(xiāng)鎮(zhèn)信息,所述每個(gè)反向索引表為對(duì)一個(gè)建筑物信息進(jìn)行二元分詞后生成分詞結(jié)果的集合;
[0028]將所述目標(biāo)索引表與所述所有反向索引表進(jìn)行匹配,獲得與所述目標(biāo)索引表匹配率最尚的反向索引表;
[0029]將所述反向索引表對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0030]優(yōu)選的,所述獲取待處理的目標(biāo)地址數(shù)據(jù)包括:
[0031]從預(yù)設(shè)數(shù)據(jù)庫(kù)中獲取一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有用戶預(yù)先輸入的地址數(shù)據(jù),所述預(yù)設(shè)數(shù)據(jù)庫(kù)為本方法所應(yīng)用的電商的地址數(shù)據(jù)庫(kù),或,物流公司的地址數(shù)據(jù)庫(kù)。
[0032]優(yōu)選的,所述獲取待處理的目標(biāo)地址數(shù)據(jù)包括:
[0033]從第二服務(wù)器中獲取用戶預(yù)先輸入的一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述第二服務(wù)器中存儲(chǔ)有其余電商的地址數(shù)據(jù)庫(kù);或,其余物流系統(tǒng)的數(shù)據(jù)庫(kù)。
[0034]優(yōu)選的,在所述補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息之后,還包括:
[0035]將所述目標(biāo)地址數(shù)據(jù)中補(bǔ)充的地址信息,推送至用戶;
[0036]在收到用戶確認(rèn)所述地址信息正確后,保存補(bǔ)充有所述地址信息的目標(biāo)地址數(shù)據(jù)。
[0037]一種地址數(shù)據(jù)處理方法,包括:
[0038]向服務(wù)器發(fā)送待處理的目標(biāo)地址數(shù)據(jù);
[0039]接收并顯示服務(wù)器反饋的待補(bǔ)充地址信息,所述待補(bǔ)充的地址信息為按地址數(shù)據(jù)處理方法處理后得到的;
[0040]其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。
[0041 ] 一種地址數(shù)據(jù)處理方法,包括:
[0042]按地址數(shù)據(jù)處理方法補(bǔ)充目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息;
[0043]將補(bǔ)充地址信息后的目標(biāo)地址數(shù)據(jù)、與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍信息進(jìn)行匹配;
[0044]在匹配成功的情況下,確定所述目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則,確定所述目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi);
[0045]其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。
[0046]優(yōu)選的,還包括:
[0047]更新所述預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中該第三方的業(yè)務(wù)覆蓋范圍。
[0048]一種地址數(shù)據(jù)處理裝置,包括:
[0049]獲取單元,用于獲取待處理的目標(biāo)地址數(shù)據(jù);
[0050]判斷單元,用于根據(jù)預(yù)設(shè)地址格式規(guī)則判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;
[0051]補(bǔ)充單元,用于在所述目標(biāo)地址數(shù)據(jù)的格式不完整的時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。
[0052]優(yōu)選的,所述判斷單元具體用于:
[0053]對(duì)所述目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作生成目標(biāo)分詞信息,所述目標(biāo)分詞信息包括由至少一個(gè)行政區(qū)域信息組成的目標(biāo)行政區(qū)域信息,所述目標(biāo)行政區(qū)域信息包括至少一個(gè)行政區(qū)域名稱,以及與行政區(qū)域名稱對(duì)應(yīng)的行政區(qū)域內(nèi)容;判斷目標(biāo)行政區(qū)域信息內(nèi)的行政區(qū)域名稱與所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱是否匹配。
[0054]優(yōu)選的,所述補(bǔ)充單元包括:
[0055]確定單元,用于按照所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱、確定所述目標(biāo)行政區(qū)域信息內(nèi)缺失的行政區(qū)域名稱;
[0056]查找單元,用于在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有行政區(qū)域名稱與行政區(qū)域內(nèi)容之間的對(duì)應(yīng)關(guān)系;
[0057]補(bǔ)充內(nèi)容單元,用于將所述目標(biāo)行政區(qū)域內(nèi)容作為所述地址信息,補(bǔ)充至所述目標(biāo)地址數(shù)據(jù)中。
[0058]優(yōu)選的,所述目標(biāo)分詞信息還包括目標(biāo)道路信息和/或目標(biāo)建筑物信息;所述目標(biāo)行政區(qū)域信息中至少包括目標(biāo)縣區(qū)行政區(qū)域;則所述查找單元包括:
[0059]第一查找單元,用于在所述缺失的行政區(qū)域名稱為省行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)行政區(qū)域信息、確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)省份內(nèi)容;
[0060]第二查找單元,用于在所述缺失的行政區(qū)域名稱為街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0061]優(yōu)選的,所述第二查找單元包括:
[0062]第三查找單元,用于在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有道路信息,其中所述預(yù)設(shè)道路信息庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有道路信息、以及每個(gè)道路信息所屬的街道或鄉(xiāng)鎮(zhèn)信息;在所述所有道路信息中、查找到與所述目標(biāo)道路信息一致的道路信息;將所述道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容;和/或,
[0063]第四查找單元,用于將所述目標(biāo)建筑物信息進(jìn)行二元分詞,將所有分詞結(jié)果的集合作為目標(biāo)索引表,其中每個(gè)分詞結(jié)果對(duì)應(yīng)一個(gè)索引;在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中、獲得與目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有反向索引表;其中所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有反向索引表,以及每個(gè)反向索引表所屬的街道或鄉(xiāng)鎮(zhèn)信息,所述每個(gè)反向索引表為對(duì)一個(gè)建筑物信息進(jìn)行二元分詞后生成分詞結(jié)果的集合;將所述目標(biāo)索引表與所述所有反向索引表進(jìn)行匹配,獲得與所述目標(biāo)索引表匹配率最高的反向索引表;將所述反向索引表對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0064]優(yōu)選的,還包括:
[0065]保存單元,用于將所述目標(biāo)地址數(shù)據(jù)中補(bǔ)充的地址信息,推送至用戶;待用戶確認(rèn)所述地址信息正確后,保存補(bǔ)充有所述地址信息的目標(biāo)地址數(shù)據(jù)。
[0066]一種地址數(shù)據(jù)處理裝置,包括:
[0067]第二補(bǔ)充單元,用于按地址數(shù)據(jù)處理方法補(bǔ)充目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息;其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息;
[0068]匹配單元,用于將補(bǔ)充地址信息后的目標(biāo)地址數(shù)據(jù)、與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍信息進(jìn)行匹配;
[0069]第二確定單元,用于在匹配成功的情況下,確定所述目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則,確定所述目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi)。
[0070]優(yōu)選的,還包括:
[0071]更新單元,用于更新所述預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中該第三方的業(yè)務(wù)覆蓋范圍。
[0072]與現(xiàn)有技術(shù)相比,本申請(qǐng)具有以下優(yōu)點(diǎn):
[0073]在本申請(qǐng)實(shí)施例中,預(yù)先構(gòu)建預(yù)設(shè)地址格式規(guī)則,該預(yù)設(shè)地址格式規(guī)則代表目標(biāo)地址數(shù)據(jù)所應(yīng)具有的完整格式,并依據(jù)預(yù)設(shè)地址格式規(guī)則判斷目標(biāo)地址數(shù)據(jù)的格式是否完整,在目標(biāo)地址數(shù)據(jù)不完整的情況下,補(bǔ)充目標(biāo)地址數(shù)據(jù)與缺失格式對(duì)應(yīng)的地址信息,使得目標(biāo)地址數(shù)據(jù)符合預(yù)設(shè)地址格式規(guī)則的規(guī)定,即目標(biāo)地址數(shù)據(jù)具有完整格式,從而可以被準(zhǔn)確識(shí)別。本申請(qǐng)與傳統(tǒng)人工識(shí)別方式相比,能夠提升對(duì)目標(biāo)地址數(shù)據(jù)識(shí)別的準(zhǔn)確率以及效率。
[0074]當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
【附圖說(shuō)明】
[0075]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0076]圖1為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理方法實(shí)施例一的流程圖;
[0077]圖2為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理方法實(shí)施例一中步驟S102的具體流程圖;
[0078]圖3為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理方法實(shí)施例一中補(bǔ)充地址信息的流程圖;
[0079]圖4為本申請(qǐng)實(shí)施例提供的又一種地址數(shù)據(jù)處理方法實(shí)施例一中補(bǔ)充地址信息的流程圖;
[0080]圖5為本申請(qǐng)實(shí)施例提供的又一種地址數(shù)據(jù)處理方法實(shí)施例一中補(bǔ)充地址信息的流程圖;
[0081]圖6為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理方法實(shí)施例二的流程圖;
[0082]圖7為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理裝置實(shí)施例一的結(jié)構(gòu)示意圖;
[0083]圖8為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理裝置實(shí)施例一中補(bǔ)充單元的結(jié)構(gòu)示意圖;
[0084]圖9為本申請(qǐng)實(shí)施例提供的一種地址數(shù)據(jù)處理裝置實(shí)施例二的結(jié)構(gòu)示意圖;
[0085]圖10為本申請(qǐng)實(shí)施例提供的又一種地址數(shù)據(jù)處理裝置實(shí)施例二的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0086]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0087]如圖1所示,其為本申請(qǐng)?zhí)峁┑囊环N地址數(shù)據(jù)處理方法實(shí)施例一的流程圖,本實(shí)施例可以包括:
[0088]步驟SlOl:獲取待處理的目標(biāo)地址數(shù)據(jù)。
[0089]本方法可以應(yīng)用于淘寶網(wǎng)、當(dāng)當(dāng)網(wǎng)、天貓等各類購(gòu)物網(wǎng)站的服務(wù)器中,還可以應(yīng)用于快遞公司的服務(wù)器中,以便服務(wù)器可以利用本實(shí)施例的方法來(lái)對(duì)地址數(shù)據(jù)進(jìn)行處理。針對(duì)待處理的目標(biāo)地址數(shù)據(jù),當(dāng)格式不完整時(shí),容易出現(xiàn)無(wú)法準(zhǔn)確處理目標(biāo)地址數(shù)據(jù)的問(wèn)題。例如,目標(biāo)地址數(shù)據(jù)不能準(zhǔn)確用于業(yè)務(wù)覆蓋范圍的判斷。而通過(guò)本實(shí)施例,可將目標(biāo)地址數(shù)據(jù)補(bǔ)充完整,以便后續(xù)正確處理目標(biāo)地址數(shù)據(jù),例如,使得識(shí)別目標(biāo)地址數(shù)據(jù)可以準(zhǔn)確用于業(yè)務(wù)覆蓋范圍的判斷。
[0090]步驟SlOl中,獲得的待處理的目標(biāo)地址數(shù)據(jù),具體獲取過(guò)程可以為以下兩種方式:
[0091]第一種方式:從預(yù)設(shè)數(shù)據(jù)庫(kù)中獲取一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有用戶預(yù)先輸入的地址數(shù)據(jù),所述預(yù)設(shè)數(shù)據(jù)庫(kù)為本方法所應(yīng)用的電商的地址數(shù)據(jù)庫(kù),或,物流公司的地址數(shù)據(jù)庫(kù);
[0092]在本方法應(yīng)用于一個(gè)電商(各大購(gòu)物網(wǎng)站)或一個(gè)物流公司的服務(wù)器的情況下,服務(wù)器內(nèi)設(shè)有預(yù)設(shè)數(shù)據(jù)庫(kù)。預(yù)設(shè)數(shù)據(jù)庫(kù)內(nèi)存儲(chǔ)有用戶預(yù)先輸入的眾多地址數(shù)據(jù)。服務(wù)器在預(yù)設(shè)數(shù)據(jù)庫(kù)中選擇一個(gè)地址數(shù)據(jù),或者接收用戶選擇一個(gè)地址數(shù)據(jù),將該地址數(shù)據(jù)作為目標(biāo)地址數(shù)據(jù)。
[0093]例如,本方法應(yīng)用于淘寶網(wǎng)的服務(wù)器內(nèi),淘寶網(wǎng)的預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有用戶預(yù)先輸入的眾多地址數(shù)據(jù),服務(wù)器自動(dòng)選擇一個(gè)地址數(shù)據(jù),或者服務(wù)器接收用戶選擇的一個(gè)地址數(shù)據(jù),并將該地址數(shù)據(jù)作為目標(biāo)地址數(shù)據(jù)。
[0094]第二種方式:從第二服務(wù)器中獲取用戶預(yù)先輸入的一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述第二服務(wù)器為其余電商的地址數(shù)據(jù)庫(kù);或,其余物流系統(tǒng)的數(shù)據(jù)庫(kù)。
[0095]本方法應(yīng)用的服務(wù)器稱為第一服務(wù)器。在第一種方式中,第一服務(wù)器在自身內(nèi)部的預(yù)設(shè)數(shù)據(jù)庫(kù)中獲取目標(biāo)地址數(shù)據(jù)。在第二種方式中,第一服務(wù)器還可以從第二服務(wù)器中獲取地址數(shù)據(jù)。第二服務(wù)器可以是其他電商的服務(wù)器,或者其他物流系統(tǒng)的服務(wù)器。
[0096]例如,當(dāng)本方法應(yīng)用于淘寶網(wǎng)的第一服務(wù)器的情況下,不僅可以在第一服務(wù)器中的預(yù)設(shè)數(shù)據(jù)庫(kù)中獲取地址數(shù)據(jù),還是可以在天貓、當(dāng)當(dāng)網(wǎng)、京東、順豐、中通、實(shí)體百貨公司等系統(tǒng)的第二服務(wù)器的地址數(shù)據(jù)庫(kù)中,獲取目標(biāo)地址數(shù)據(jù)。
[0097]步驟S102:根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;如果否,則進(jìn)入步驟S103 ;如果是,則進(jìn)入步驟S104。
[0098]在本實(shí)施例執(zhí)行之前,可以預(yù)先構(gòu)建預(yù)設(shè)地址格式規(guī)則,地址格式規(guī)則可以根據(jù)用戶需求設(shè)定不同級(jí)別的行政區(qū)域。例如,預(yù)設(shè)地址格式規(guī)則可以包含四級(jí)行政區(qū)域名稱,分別為省行政區(qū)域、市行政區(qū)域、縣區(qū)行政區(qū)域,以及,街道或鄉(xiāng)鎮(zhèn)行政區(qū)域。
[0099]在預(yù)設(shè)地址格式規(guī)則包含四級(jí)行政區(qū)域的情況下,以中華人民共和國(guó)為例,中華人民共和國(guó)包括23個(gè)省,4個(gè)直轄市(北京、上海、天津、重慶),5個(gè)民族自治區(qū)(西藏、新疆、寧夏、內(nèi)蒙古、廣西)和2個(gè)特別行政區(qū),23個(gè)省、4個(gè)直轄市和5個(gè)民族自治區(qū)、2個(gè)特別行政區(qū)域均為中央直屬行政區(qū)。
[0100]為了使本方法適用于所有地市,將5個(gè)民族自治區(qū)作為省級(jí)行政區(qū)域,使其劃分符合本申請(qǐng)所提供的四級(jí)行政區(qū)域。還可以將四個(gè)直轄市既作為省級(jí)行政區(qū)域又作為市級(jí)行政區(qū)域。以北京市朝陽(yáng)區(qū)SOHU大廈為例,其四級(jí)行政區(qū)域?yàn)楸本┦〖?jí)行政區(qū)域,北京市行政區(qū)域,朝陽(yáng)區(qū)行政區(qū)域,左家莊街道行政區(qū)域。
[0101]在預(yù)先構(gòu)建預(yù)設(shè)地址格式規(guī)則的基礎(chǔ)上,如圖2所示,步驟S102在具體實(shí)現(xiàn)時(shí)可以包括以下步驟S201?步驟S202:
[0102]步驟S201:對(duì)所述目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作,生成目標(biāo)分詞信息,所述目標(biāo)分詞信息包括由目標(biāo)行政區(qū)域信息,所述目標(biāo)行政區(qū)域信息包括至少一個(gè)行政區(qū)域名稱,以及與行政區(qū)域名稱對(duì)應(yīng)的行政區(qū)域內(nèi)容。
[0103]為了識(shí)別目標(biāo)地址數(shù)據(jù)的格式,即:目標(biāo)地址數(shù)據(jù)所包含的行政區(qū)域名稱,對(duì)目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作。具體的,可以調(diào)用已有的分詞服務(wù),來(lái)執(zhí)行分詞操作,詳細(xì)分詞步驟不再贅述。
[0104]以目標(biāo)地址數(shù)據(jù)為“河北省保定市北市區(qū)瑞興路86號(hào)秀蘭尚城小區(qū)”為例,對(duì)目標(biāo)地址數(shù)據(jù)分詞后的分詞結(jié)果為:三個(gè)行政區(qū)域信息(河北省行政區(qū)域、保定市行政區(qū)域和北市區(qū)行政區(qū)域),一個(gè)道路信息(瑞興路86號(hào))和一個(gè)建筑物信息(秀蘭尚城小區(qū))。
[0105]可見(jiàn),目標(biāo)分詞信息可以包含目標(biāo)行政區(qū)域信息、道路信息和建筑物信息,而道路信息和建筑物信息不屬于行政區(qū)域,所以本例中目標(biāo)行政區(qū)域信息包含河北省行政區(qū)域”、“保定市行政區(qū)域”和“北市區(qū)行政區(qū)域”。
[0106]其中,一個(gè)行政區(qū)域信息包含行政區(qū)域名稱和行政區(qū)域內(nèi)容,以“河北省行政區(qū)域”為例,其中“省行政區(qū)域”為行政區(qū)域名稱,“河北”為行政區(qū)域內(nèi)容。
[0107]步驟S202:判斷目標(biāo)行政區(qū)域信息內(nèi)的行政區(qū)域名稱與所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱是否匹配。
[0108]以所述預(yù)設(shè)地址格式規(guī)則中包含四級(jí)行政區(qū)域?yàn)槔?,則預(yù)設(shè)地址格式規(guī)則指示的名稱區(qū)域名稱分別為:省行政區(qū)域、市行政區(qū)域、縣區(qū)行政區(qū)域,以及,街道或鄉(xiāng)鎮(zhèn)行政區(qū)域。若目標(biāo)行政區(qū)域信息中也同樣包含有四級(jí)行政區(qū)域名稱,則確定兩者匹配,表示目標(biāo)地址數(shù)據(jù)完整;若目標(biāo)行政區(qū)域信息中少于四級(jí)行政區(qū)域名稱,確定兩者不匹配,表示目標(biāo)地址數(shù)據(jù)不完整。
[0109]接著返回圖1,進(jìn)入步驟S103:按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。
[0110]如圖3所示,本步驟具體執(zhí)行過(guò)程包括步驟S301?步驟303:
[0111]步驟S301:按照所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱,確定所述目標(biāo)行政區(qū)域信息內(nèi)缺失的行政區(qū)域名稱。
[0112]將目標(biāo)地址數(shù)據(jù)中的所有目標(biāo)行政區(qū)域名稱、與預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱逐一對(duì)比,確定目標(biāo)地址數(shù)據(jù)所缺失的行政區(qū)域名稱。例如:當(dāng)目標(biāo)地址數(shù)據(jù)為“河北省保定市北市區(qū)瑞興路86號(hào)秀蘭尚城小區(qū)”的情況下,目標(biāo)行政區(qū)域信息中缺失的行政區(qū)域名稱為“街道或鄉(xiāng)鎮(zhèn)”。
[0113]步驟S302:在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中,利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容;所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有行政區(qū)域名稱與行政區(qū)域內(nèi)容之間的對(duì)應(yīng)關(guān)系。
[0114]在本實(shí)施例中,可以預(yù)先構(gòu)建一個(gè)預(yù)設(shè)地址數(shù)據(jù)庫(kù),該預(yù)設(shè)地址數(shù)據(jù)庫(kù)的形式為樹(shù)形結(jié)構(gòu),最上層的父節(jié)點(diǎn)為各個(gè)省級(jí)行政區(qū)域信息,二級(jí)葉子節(jié)點(diǎn)為各個(gè)省級(jí)行政區(qū)域管轄范圍內(nèi)的市行政區(qū)域信息,三級(jí)葉子節(jié)點(diǎn)為每個(gè)市行政區(qū)域管轄范圍的縣區(qū)行政區(qū)域信息,四級(jí)葉子節(jié)點(diǎn)為每個(gè)縣區(qū)行政區(qū)域管轄范圍內(nèi)的街道或鄉(xiāng)鎮(zhèn)行政區(qū)域信息,五級(jí)葉子節(jié)點(diǎn)為每個(gè)街道或鄉(xiāng)鎮(zhèn)管轄范圍下的道路信息和建筑物信息。
[0115]在步驟S102將目標(biāo)地址數(shù)據(jù)分詞后,可以獲得目標(biāo)地址數(shù)據(jù)中所包含的多級(jí)行政區(qū)域信息,再將多級(jí)行政區(qū)域信息在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中逐級(jí)搜索,便可以與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容。
[0116]步驟S303:將所述目標(biāo)行政區(qū)域內(nèi)容作為所述地址信息,補(bǔ)充至所述目標(biāo)地址數(shù)據(jù)中。
[0117]在本步驟中,查找到目標(biāo)行政區(qū)域內(nèi)容之后,將其作為地址信息補(bǔ)充至目標(biāo)地址數(shù)據(jù)中。例如:在預(yù)設(shè)地址數(shù)據(jù)庫(kù)查找,與缺失的行政區(qū)域名稱“街道或鄉(xiāng)鎮(zhèn)”對(duì)應(yīng)的“五四路街道”,并將“五四路街道”補(bǔ)充至目標(biāo)地址數(shù)據(jù)中,以完善目標(biāo)地址數(shù)據(jù),方便后續(xù)對(duì)目標(biāo)地址數(shù)據(jù)進(jìn)行準(zhǔn)確識(shí)別。
[0118]接著返回圖1,進(jìn)入步驟S104:退出程序。
[0119]在目標(biāo)地址數(shù)據(jù)完整的情況下,無(wú)需執(zhí)行補(bǔ)充地址信息的操作,所以退出本實(shí)施例的執(zhí)行程序。
[0120]經(jīng)過(guò)上述步驟后,能夠獲得目標(biāo)地址數(shù)據(jù)中所缺失的地址信息。為了驗(yàn)證補(bǔ)充的地址信息是否正確,可以將所述目標(biāo)地址數(shù)據(jù)中補(bǔ)充的地址信息,推送至用戶;供用戶確認(rèn)本方法的地址信息是否正確,待用戶確認(rèn)所述地址信息正確后,保存補(bǔ)充有所述地址信息的目標(biāo)地址數(shù)據(jù)。以便后續(xù)準(zhǔn)確驗(yàn)證目標(biāo)地址數(shù)據(jù)是否在業(yè)務(wù)覆蓋范圍內(nèi)。
[0121]本申請(qǐng)實(shí)施例提供的地址數(shù)據(jù)處理方法,其中預(yù)先構(gòu)建了預(yù)設(shè)地址格式規(guī)則,該預(yù)設(shè)地址格式規(guī)則可以表示出目標(biāo)地址數(shù)據(jù)所應(yīng)具有的完整格式,然后再依據(jù)預(yù)設(shè)地址格式規(guī)則判斷目標(biāo)地址數(shù)據(jù)的格式是否完整,從而可以在目標(biāo)地址數(shù)據(jù)不完整的情況下,通過(guò)補(bǔ)充目標(biāo)地址數(shù)據(jù)中缺失格式所對(duì)應(yīng)的地址信息,來(lái)使得目標(biāo)地址數(shù)據(jù)符合預(yù)設(shè)地址格式規(guī)則的規(guī)定,即目標(biāo)地址數(shù)據(jù)具有完整格式,從而可以保證補(bǔ)充后的目標(biāo)地址數(shù)據(jù)被準(zhǔn)確處理,例如準(zhǔn)確識(shí)別目標(biāo)地址數(shù)據(jù)是否在業(yè)務(wù)覆蓋范圍內(nèi)。也因此,本申請(qǐng)與傳統(tǒng)人工識(shí)別方式相比,能夠提升對(duì)目標(biāo)地址數(shù)據(jù)識(shí)別的準(zhǔn)確率以及效率。
[0122]在實(shí)際應(yīng)用中,目標(biāo)分詞信息還可以包括目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,目標(biāo)行政區(qū)域信息;所述目標(biāo)行政區(qū)域信息中至少包括目標(biāo)縣區(qū)行政區(qū)域。由于目標(biāo)地址數(shù)據(jù)中所缺失的地址信息不確定,所以圖3中步驟S302在具體執(zhí)行時(shí),可以分為以下三種情況:
[0123]第一種情況:在所述缺失的行政區(qū)域名稱為省行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)行政區(qū)域信息、確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)省份內(nèi)容。
[0124]在缺失省行政區(qū)域的情況下,一般可采用目標(biāo)地址數(shù)據(jù)中目標(biāo)市區(qū)內(nèi)容(即市行政區(qū)域信息下的市行政區(qū)域內(nèi)容,例如:保定市),在預(yù)設(shè)地址數(shù)據(jù)庫(kù)的二級(jí)葉子節(jié)點(diǎn)中進(jìn)行匹配,并獲得匹配成功的市行政區(qū)域內(nèi)容。然后確定該市行政區(qū)域內(nèi)容、在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中對(duì)應(yīng)的省份內(nèi)容(例如:河北省),將該省份內(nèi)容作為目標(biāo)地址數(shù)據(jù)中所缺失的目標(biāo)省份內(nèi)容。
[0125]第二種情況:在所述缺失的行政區(qū)域名稱為市行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)縣區(qū)行政區(qū)域信息、確定與所述市行政區(qū)域?qū)?yīng)的目標(biāo)市區(qū)內(nèi)容。
[0126]在所述目標(biāo)分詞信息缺失行政區(qū)域名稱為市行政區(qū)域情況下,在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用目標(biāo)縣區(qū)內(nèi)容(即縣區(qū)行政區(qū)域信息下的縣區(qū)行政區(qū)域內(nèi)容,例如:北市區(qū)),在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中在三級(jí)葉子節(jié)點(diǎn)中進(jìn)行搜索,以確定縣區(qū)信息對(duì)應(yīng)的市區(qū)內(nèi)容,將該市區(qū)內(nèi)容作為目標(biāo)地址數(shù)據(jù)中所缺失的目標(biāo)市區(qū)內(nèi)容。
[0127]可見(jiàn),在第二種情況下,為了防止不同市信息下具有相同縣區(qū)內(nèi)容而出現(xiàn)匹配錯(cuò)誤的情況,將目標(biāo)省區(qū)內(nèi)容和目標(biāo)縣區(qū)內(nèi)容結(jié)合在一起,一并在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中搜素,以提高搜索的準(zhǔn)確性。
[0128]第三種情況:在所述缺失的行政區(qū)域名稱為街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容;
[0129]因?yàn)樵趯?shí)際應(yīng)用時(shí)一般用戶會(huì)忽略填寫(xiě)街道或鄉(xiāng)鎮(zhèn),因此本實(shí)施例中將著重描述如何補(bǔ)充街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的內(nèi)容。
[0130]針對(duì)第三種情況來(lái)說(shuō),補(bǔ)充街道或鄉(xiāng)鎮(zhèn)信息具體又分為以下兩種方式:
[0131]第一種方式:在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息以及所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0132]第一種方式的具體執(zhí)行過(guò)程,如圖4所示,包括如下所示的步驟S401?步驟S403:
[0133]步驟S401:在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有道路信息,其中所述預(yù)設(shè)道路信息庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有道路信息,以及,每個(gè)道路信息所屬的街道或鄉(xiāng)鎮(zhèn)信息。
[0134]在預(yù)設(shè)地址數(shù)據(jù)庫(kù)的三級(jí)葉子節(jié)點(diǎn)中查找到目標(biāo)縣區(qū)行政區(qū)域,并獲得目標(biāo)縣區(qū)行政區(qū)域下所有街道或鄉(xiāng)鎮(zhèn)管轄范圍內(nèi)的所有道路信息。其中,道路信息可以包括道路名稱和道路號(hào)碼。
[0135]步驟S402:在所述所有道路信息中、查找到與所述目標(biāo)道路信息一致的道路信息。
[0136]將目標(biāo)道路信息與所有道路信息一一匹配,當(dāng)目標(biāo)道路信息與其中一個(gè)道路信息的道路名稱和道路號(hào)碼均一致時(shí),確定匹配成功,將該匹配成功的道路信息所屬的街道或鄉(xiāng)鎮(zhèn)、作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)信息。
[0137]傳統(tǒng)的預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有:道路名稱以及道路名稱的所有號(hào)碼,為了減少道路號(hào)碼的冗余信息,僅在保存道路名稱在一個(gè)街道或鄉(xiāng)鎮(zhèn)內(nèi)的起始號(hào)碼和終止號(hào)碼。在搜索過(guò)程中,在道路名稱一致時(shí),僅需要判斷道路號(hào)碼是否在起始號(hào)碼和終止號(hào)碼的范圍內(nèi)即可。
[0138]步驟S403:將所述道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0139]在獲得道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容后,將其作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容,以完善目標(biāo)地址數(shù)據(jù)。
[0140]在介紹完第一種方式的具體執(zhí)行過(guò)程之后,下面介紹第二種方式。
[0141]第二種方式:在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)建筑物信息以及目標(biāo)縣區(qū)行政區(qū)域確定對(duì)應(yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0142]該方式的具體執(zhí)行過(guò)程,如圖5所示,包括以下步驟S501?S504:
[0143]步驟S501:將所述目標(biāo)建筑物信息進(jìn)行二元分詞,將所有分詞結(jié)果的集合作為目標(biāo)索引表;其中每個(gè)分詞結(jié)果對(duì)應(yīng)一個(gè)索引。
[0144]由于目標(biāo)建筑物信息可能為用戶習(xí)慣的縮略方式或簡(jiǎn)稱方式,例如:一個(gè)大廈全稱為“西湖國(guó)際科技大廈”,用戶輸入的可能為“西湖科技大廈”、“西湖國(guó)際大廈”、“西湖大廈”等。因此,以目標(biāo)建筑物信息為“西湖國(guó)際大廈”為例,為了實(shí)現(xiàn)搜索匹配,將目標(biāo)建筑物信息進(jìn)行二元分詞,分為西湖、湖國(guó)、國(guó)際、際大和大廈五個(gè)分詞結(jié)果,將每個(gè)分詞結(jié)果作為一個(gè)索引,所有分詞結(jié)果組成目標(biāo)索引表。
[0145]步驟S502:在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲得與目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有反向索引表。
[0146]其中所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有反向索引表,以及每個(gè)反向索引表所屬的街道或鄉(xiāng)鎮(zhèn)信息,所述每個(gè)反向索引表為對(duì)一個(gè)建筑物信息進(jìn)行二元分詞后生成分詞結(jié)果的集合。
[0147]在申請(qǐng)本實(shí)施例一之前,對(duì)標(biāo)準(zhǔn)街道或鄉(xiāng)鎮(zhèn)信息下的建筑物信息的標(biāo)準(zhǔn)名稱采用二元分詞法進(jìn)行拆分,例如,將標(biāo)準(zhǔn)的“西湖國(guó)際科技大廈”拆分為西湖、湖國(guó)、國(guó)際、際科、科技、技大和大廈6個(gè)分詞結(jié)果,每個(gè)分詞結(jié)果作為一個(gè)索引,所有分詞結(jié)果的集合即所有索引的集合形成一個(gè)反向索引表。再將街道或鄉(xiāng)鎮(zhèn)信息下的所有建筑物信息,均構(gòu)建為對(duì)應(yīng)的反向索引表,并將反向索引表存儲(chǔ)至預(yù)設(shè)地址數(shù)據(jù)庫(kù)的對(duì)應(yīng)街道或鄉(xiāng)鎮(zhèn)信息下。在從預(yù)設(shè)地址數(shù)據(jù)庫(kù)中查找反向索引表時(shí),將目標(biāo)分詞信息在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中逐級(jí)搜索,獲得縣區(qū)行政區(qū)域下的所有反向索引表,每個(gè)反向索引表對(duì)應(yīng)一個(gè)街道或鄉(xiāng)鎮(zhèn)信息。
[0148]步驟S503:將所述目標(biāo)索引表與所述所有反向索引表進(jìn)行匹配,獲得與所述目標(biāo)索引表匹配率最高的反向索引表。
[0149]將目標(biāo)索引表與所有反向索引表一一匹配,匹配率越高代表兩者相似程度越高,所以在眾所反向索引表中獲得匹配率最高的反向索引表,匹配率最高代表目標(biāo)索引表與反向索引表的相似程度最大,即目標(biāo)建筑物信息與反向索引表對(duì)應(yīng)的建筑物信息相似程度最大。
[0150]步驟S504:將所述反向索引表對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0151]在確定與目標(biāo)建筑物信息對(duì)應(yīng)的建筑物信息后,將該建筑物信息在預(yù)設(shè)數(shù)據(jù)庫(kù)中對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)信息作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)信息。
[0152]以上為對(duì)目標(biāo)地址數(shù)據(jù)中缺失信息進(jìn)行補(bǔ)充的具體實(shí)現(xiàn)方式,當(dāng)然以上內(nèi)容僅對(duì)部分缺失地址信息進(jìn)行舉例說(shuō)明,可以理解的是,可按照類似的方式在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中搜索,而獲得其他缺失的地址信息,具體實(shí)現(xiàn)方式不再一一贅述。
[0153]本申請(qǐng)還提供了一種地址數(shù)據(jù)處理方法,應(yīng)用于客戶端,包括:
[0154]向服務(wù)器發(fā)送待處理的目標(biāo)地址數(shù)據(jù);
[0155]接收并顯示服務(wù)器反饋的待補(bǔ)充地址信息,所述待補(bǔ)充的地址信息為按地址數(shù)據(jù)處理方法處理后得到的;
[0156]其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。
[0157]在上述實(shí)施例中將目標(biāo)地址數(shù)據(jù)補(bǔ)充完整后,便可以進(jìn)一步對(duì)目標(biāo)地址數(shù)據(jù)進(jìn)行處理,例如,判定目標(biāo)地址數(shù)據(jù)是否在各大購(gòu)物網(wǎng)站或第三方的業(yè)務(wù)覆蓋范圍內(nèi)。如圖6所示,本申請(qǐng)還提供了一種地址數(shù)據(jù)處理方法實(shí)施例二,本實(shí)施例可以包括:
[0158]步驟S601:按實(shí)施例一所示的地址數(shù)據(jù)處理方法補(bǔ)充目標(biāo)地址數(shù)據(jù)中與缺失格式對(duì)應(yīng)地址信息。
[0159]在獲得目標(biāo)地址數(shù)據(jù)后,對(duì)目標(biāo)地址數(shù)據(jù)進(jìn)行分詞操作獲得目標(biāo)行政區(qū)域信息,并與預(yù)設(shè)地址格式規(guī)則進(jìn)行對(duì)比,以判斷目標(biāo)地址數(shù)據(jù)的格式是否完整。若目標(biāo)地址數(shù)據(jù)的格式完整,則無(wú)需補(bǔ)充地址信息;若目標(biāo)地址數(shù)據(jù)的格式不完整,則需要補(bǔ)充地址信息。
[0160]以預(yù)設(shè)地址格式規(guī)則中包含四級(jí)行政區(qū)域?yàn)槔?,如果目?biāo)地址數(shù)據(jù)的格式只包括三級(jí)行政區(qū)域,那就需要將目標(biāo)地址數(shù)據(jù)缺失的那級(jí)行政區(qū)域,補(bǔ)償后的目標(biāo)地址數(shù)據(jù)的格式也應(yīng)該包含四級(jí)行政區(qū)域信息。
[0161]步驟S602:將補(bǔ)充地址信息后的目標(biāo)地址數(shù)據(jù)與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍信息進(jìn)行匹配。
[0162]在本申請(qǐng)實(shí)施例中,可以預(yù)先構(gòu)建一個(gè)預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù),在預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中可以維護(hù)第三方在預(yù)設(shè)地址格式規(guī)則下的覆蓋范圍,即:在四級(jí)行政區(qū)域下的覆蓋范圍。
[0163]在得到完整格式的目標(biāo)地址數(shù)據(jù)之后,可以將目標(biāo)地址數(shù)據(jù)的四級(jí)行政區(qū)域信息,與第三方在四級(jí)行政區(qū)域下的業(yè)務(wù)覆蓋范圍進(jìn)行匹配??梢岳斫獾氖?,還可以采用四級(jí)行政區(qū)域下的三級(jí)行政區(qū)域甚至兩級(jí)行政區(qū)域,與第三方在四級(jí)行政區(qū)域下的業(yè)務(wù)覆蓋范圍進(jìn)行匹配模糊匹配。例如,將四級(jí)行政區(qū)域信息中的市行政區(qū)域,縣區(qū)行政區(qū)域,和,街道或鄉(xiāng)鎮(zhèn)行政區(qū)域,與第三方在四級(jí)行政區(qū)域下的業(yè)務(wù)覆蓋范圍進(jìn)行匹配。
[0164]為了保證匹配的準(zhǔn)確率,在將目標(biāo)地址數(shù)據(jù)與第三方在四級(jí)行政區(qū)域下的業(yè)務(wù)覆蓋范圍進(jìn)行匹配時(shí),目標(biāo)地址數(shù)據(jù)中至少應(yīng)該包括縣區(qū)行政區(qū)域,和,街道或鄉(xiāng)鎮(zhèn)行政區(qū)域。
[0165]步驟S603:在匹配成功的情況下,確定所述目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則,確定所述目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi)。若預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍包含目標(biāo)地址數(shù)據(jù)的四級(jí)行政區(qū)域信息,則確定目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則表示目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi)。
[0166]本實(shí)施例中僅需要將目標(biāo)地址數(shù)據(jù)與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)在四級(jí)行政區(qū)域下的業(yè)務(wù)覆蓋范圍進(jìn)行對(duì)比即可,簡(jiǎn)單方便,無(wú)需將目標(biāo)地址數(shù)據(jù)與歷史地址數(shù)據(jù)進(jìn)行對(duì)比,無(wú)需更新歷史地址數(shù)據(jù),因此提高了搜索效率,降低了預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)的維護(hù)成本。
[0167]進(jìn)一步的,預(yù)設(shè)地址數(shù)據(jù)庫(kù)中的業(yè)務(wù)覆蓋范圍還可以隨時(shí)更新。例如:在第三方的業(yè)務(wù)覆蓋范圍有變動(dòng)的情況下,修改預(yù)設(shè)地址數(shù)據(jù)庫(kù)中原有第三方的業(yè)務(wù)覆蓋范圍;在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中添加第三方情況下,在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中添加第三方的業(yè)務(wù)覆蓋范圍;或者,刪除預(yù)設(shè)地址數(shù)據(jù)庫(kù)中某個(gè)第三方的業(yè)務(wù)覆蓋范圍。
[0168]本實(shí)施例中第三方的業(yè)務(wù)覆蓋范圍改變的情況下,僅需要更新預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍即可,無(wú)需調(diào)整第三方的歷史地址數(shù)據(jù),從而減少對(duì)歷史數(shù)據(jù)的維護(hù)費(fèi)用。并且業(yè)務(wù)覆蓋范圍的數(shù)量遠(yuǎn)遠(yuǎn)小于第三方的歷史地址數(shù)據(jù),所以利用第三方的業(yè)務(wù)覆蓋范圍與目標(biāo)地址數(shù)據(jù)進(jìn)行匹配時(shí),匹配效率能夠大大提高。
[0169]與上述本申請(qǐng)一種地址數(shù)據(jù)處理方法中實(shí)施例一所提供的方法相對(duì)應(yīng),如圖7所示,本申請(qǐng)?zhí)峁┝艘环N地址數(shù)據(jù)處理裝置實(shí)施例一,具體包括:
[0170]獲取單元701,用于獲取待處理的目標(biāo)地址數(shù)據(jù);
[0171]判斷單元702,用于根據(jù)預(yù)設(shè)地址格式規(guī)則判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;
[0172]補(bǔ)充單元703,用于在所述目標(biāo)地址數(shù)據(jù)的格式不完整的情況下,按照所述預(yù)設(shè)地址格式規(guī)則確定所述目標(biāo)地址數(shù)據(jù)的缺失格式,并補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與所述缺失格式對(duì)應(yīng)的地址信息。
[0173]此外,本申請(qǐng)?zhí)峁┝艘环N地址數(shù)據(jù)處理裝置實(shí)施例一,還包括:
[0174]保存單元704,用于將所述目標(biāo)地址數(shù)據(jù)中補(bǔ)充的地址信息,推送至用戶;待用戶確認(rèn)所述地址信息正確后,保存補(bǔ)充有所述地址信息的目標(biāo)地址數(shù)據(jù)。
[0175]針對(duì)圖7所示的地址數(shù)據(jù)處理裝置,其中,獲取單元701,具體用于從預(yù)設(shè)數(shù)據(jù)庫(kù)中獲取一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有用戶預(yù)先輸入的地址數(shù)據(jù),所述預(yù)設(shè)數(shù)據(jù)庫(kù)為本方法所應(yīng)用的電商的地址數(shù)據(jù)庫(kù),或,物流公司的地址數(shù)據(jù)庫(kù)。
[0176]所述獲取單元701,還可以具體用于從第二服務(wù)器中獲取用戶預(yù)先輸入的一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述第二服務(wù)器中存儲(chǔ)有其余電商的地址數(shù)據(jù)庫(kù);或,其余物流系統(tǒng)的數(shù)據(jù)庫(kù)。
[0177]其中,所述判斷單元702具體用于對(duì)所述目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作生成目標(biāo)分詞信息,所述目標(biāo)分詞信息包括由至少一個(gè)行政區(qū)域信息組成的目標(biāo)行政區(qū)域信息,所述目標(biāo)行政區(qū)域信息包括至少一個(gè)行政區(qū)域名稱,以及與行政區(qū)域名稱對(duì)應(yīng)的行政區(qū)域內(nèi)容;判斷目標(biāo)行政區(qū)域信息內(nèi)的行政區(qū)域名稱與所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱是否匹配。如圖8所示,圖7所示的地址數(shù)據(jù)處理裝置中,所述補(bǔ)充單元703包括:
[0178]確定單元801,用于按照所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱、確定所述目標(biāo)行政區(qū)域信息內(nèi)缺失的行政區(qū)域名稱;
[0179]查找單元802,用于在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有行政區(qū)域名稱與行政區(qū)域內(nèi)容之間的對(duì)應(yīng)關(guān)系;
[0180]補(bǔ)充內(nèi)容單元803,用于將所述目標(biāo)行政區(qū)域內(nèi)容作為所述地址信息,補(bǔ)充至所述目標(biāo)地址數(shù)據(jù)中。
[0181]在“所述目標(biāo)分詞信息還包括目標(biāo)道路信息和/或目標(biāo)建筑物信息;所述目標(biāo)行政區(qū)域信息中至少包括目標(biāo)縣區(qū)行政區(qū)域”的情況下;其中所述查找單元802包括:
[0182]第一查找單元812,用于在所述缺失的行政區(qū)域名稱為省行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)行政區(qū)域信息、確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)省份內(nèi)容;
[0183]第二查找單元822,用于在所述缺失的行政區(qū)域名稱為街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0184]其中,所述第二查找單元822包括:
[0185]第三查找單元8221,用于在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有道路信息,其中所述預(yù)設(shè)道路信息庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有道路信息、以及每個(gè)道路信息所屬的街道或鄉(xiāng)鎮(zhèn)信息;在所述所有道路信息中、查找到與所述目標(biāo)道路信息一致的道路信息;將所述道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容;和/或
[0186]第四查找單元8222,用于將所述目標(biāo)建筑物信息進(jìn)行二元分詞,將所有分詞結(jié)果的集合作為目標(biāo)索引表,其中每個(gè)分詞結(jié)果對(duì)應(yīng)一個(gè)索引;在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中、獲得與目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有反向索引表;其中所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有反向索引表,以及每個(gè)反向索引表所屬的街道或鄉(xiāng)鎮(zhèn)信息,所述每個(gè)反向索引表為對(duì)一個(gè)建筑物信息進(jìn)行二元分詞后生成分詞結(jié)果的集合;將所述目標(biāo)索引表與所述所有反向索引表進(jìn)行匹配,獲得與所述目標(biāo)索引表匹配率最高的反向索引表;將所述反向索引表對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。
[0187]與上述本申請(qǐng)一種地址數(shù)據(jù)處理方法中實(shí)施例二所提供的方法相對(duì)應(yīng),如圖9所示,本申請(qǐng)還提供了一種地址數(shù)據(jù)處理裝置實(shí)施例二,包括:
[0188]第二補(bǔ)充單元901,用于按地址數(shù)據(jù)處理方法實(shí)施例一中所述的方法補(bǔ)充目標(biāo)地址數(shù)據(jù)中與缺失格式對(duì)應(yīng)的地址信息;其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息;
[0189]匹配單元902,用于將補(bǔ)充地址信息后的目標(biāo)地址數(shù)據(jù)、與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍信息進(jìn)行匹配;
[0190]第二確定單元903,用于在匹配成功的情況下,確定所述目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則,確定所述目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi)。
[0191]如圖10所示,本實(shí)施例還提供的一種地址數(shù)據(jù)處理裝置還包括:
[0192]更新單元904,用于更新所述預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中該第三方的業(yè)務(wù)覆蓋范圍。
[0193]本申請(qǐng)?zhí)峁┝艘环N地址數(shù)據(jù)處理裝置,本申請(qǐng)實(shí)施例中預(yù)先構(gòu)建預(yù)設(shè)地址格式規(guī)貝1J,該預(yù)設(shè)地址格式規(guī)則代表目標(biāo)地址數(shù)據(jù)所應(yīng)具有的完整格式,依據(jù)預(yù)設(shè)地址格式規(guī)則判斷目標(biāo)地址數(shù)據(jù)的格式是否完整,在目標(biāo)地址數(shù)據(jù)不完整的情況下,補(bǔ)充目標(biāo)地址數(shù)據(jù)與缺失格式對(duì)應(yīng)的地址信息,使得目標(biāo)地址數(shù)據(jù)符合預(yù)設(shè)地址格式規(guī)則的規(guī)定,即目標(biāo)地址數(shù)據(jù)具有完整格式,從而可以被準(zhǔn)確識(shí)別,本申請(qǐng)與傳統(tǒng)人工識(shí)別方式相比,能夠提升對(duì)目標(biāo)地址數(shù)據(jù)識(shí)別的準(zhǔn)確率以及效率。
[0194]本實(shí)施例方法所述的功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算設(shè)備可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)實(shí)施例對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,移動(dòng)計(jì)算設(shè)備或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0195]本說(shuō)明書(shū)中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其它實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同或相似部分互相參見(jiàn)即可。
[0196]對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本申請(qǐng)。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本申請(qǐng)的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本申請(qǐng)將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
【主權(quán)項(xiàng)】
1.一種地址數(shù)據(jù)處理方法,其特征在于,包括: 獲取待處理的目標(biāo)地址數(shù)據(jù); 根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整; 當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)地址格式規(guī)則判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整,包括: 對(duì)所述目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作生成目標(biāo)分詞信息,所述目標(biāo)分詞信息包括:目標(biāo)行政區(qū)域信息,所述目標(biāo)行政區(qū)域信息包括至少一個(gè)行政區(qū)域名稱,以及與行政區(qū)域名稱對(duì)應(yīng)的行政區(qū)域內(nèi)容; 判斷目標(biāo)行政區(qū)域信息內(nèi)的行政區(qū)域名稱與所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱是否匹配。3.如權(quán)利要求2所述的方法,其特征在于,所述按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息,包括: 按照所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱,確定所述目標(biāo)行政區(qū)域信息內(nèi)缺失的行政區(qū)域名稱; 在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有行政區(qū)域名稱與行政區(qū)域內(nèi)容之間的對(duì)應(yīng)關(guān)系; 將所述目標(biāo)行政區(qū)域內(nèi)容作為所述地址信息,補(bǔ)充至所述目標(biāo)地址數(shù)據(jù)中。4.如權(quán)利要求3所述的方法,其特征在于,所述目標(biāo)分詞信息還包括目標(biāo)道路信息和/或目標(biāo)建筑物信息;所述目標(biāo)行政區(qū)域信息中至少包括目標(biāo)縣區(qū)行政區(qū)域;則在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,包括: 在所述缺失的行政區(qū)域名稱為省行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)行政區(qū)域信息,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)省份內(nèi)容; 在所述缺失的行政區(qū)域名稱為街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。5.如權(quán)利要求4所述的方法,其特征在于,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息以及所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容,包括: 在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有道路信息,其中所述預(yù)設(shè)道路信息庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有道路信息、以及每個(gè)道路信息所屬的街道或鄉(xiāng)鎮(zhèn)信息; 在所述所有道路信息中、查找到與所述目標(biāo)道路信息一致的道路信息; 將所述道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。6.如權(quán)利要求4所述的方法,其特征在于,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)建筑物信息以及目標(biāo)縣區(qū)行政區(qū)域確定對(duì)應(yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容,包括: 將所述目標(biāo)建筑物信息進(jìn)行二元分詞,將所有分詞結(jié)果的集合作為目標(biāo)索引表,其中每個(gè)分詞結(jié)果對(duì)應(yīng)一個(gè)索引; 在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中、獲得與目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有反向索引表;其中所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有反向索引表,以及每個(gè)反向索引表所屬的街道或鄉(xiāng)鎮(zhèn)信息,所述每個(gè)反向索引表為對(duì)一個(gè)建筑物信息進(jìn)行二元分詞后生成分詞結(jié)果的集合; 將所述目標(biāo)索引表與所述所有反向索引表進(jìn)行匹配,獲得與所述目標(biāo)索引表匹配率最尚的反向索引表; 將所述反向索引表對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。7.如權(quán)利要求1-6任一項(xiàng)所述的方法,其特征在于,所述獲取待處理的目標(biāo)地址數(shù)據(jù)包括: 從預(yù)設(shè)數(shù)據(jù)庫(kù)中獲取一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述預(yù)設(shè)數(shù)據(jù)庫(kù)中存儲(chǔ)有用戶預(yù)先輸入的地址數(shù)據(jù),所述預(yù)設(shè)數(shù)據(jù)庫(kù)為本方法所應(yīng)用的電商的地址數(shù)據(jù)庫(kù),或,物流公司的地址數(shù)據(jù)庫(kù)。8.如權(quán)利要求1-6任一項(xiàng)所述的方法,其特征在于,所述獲取待處理的目標(biāo)地址數(shù)據(jù)包括: 從第二服務(wù)器中獲取用戶預(yù)先輸入的一個(gè)地址數(shù)據(jù),作為待處理的目標(biāo)地址數(shù)據(jù);其中,所述第二服務(wù)器中存儲(chǔ)有其余電商的地址數(shù)據(jù)庫(kù);或,其余物流系統(tǒng)的數(shù)據(jù)庫(kù)。9.如權(quán)利要求1-6任一項(xiàng)所述的方法,其特征在于,在所述補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息之后,還包括: 將所述目標(biāo)地址數(shù)據(jù)中補(bǔ)充的地址信息,推送至用戶; 在收到用戶確認(rèn)所述地址信息正確后,保存補(bǔ)充有所述地址信息的目標(biāo)地址數(shù)據(jù)。10.一種地址數(shù)據(jù)處理方法,其特征在于,包括: 向服務(wù)器發(fā)送待處理的目標(biāo)地址數(shù)據(jù); 接收并顯示服務(wù)器反饋的待補(bǔ)充地址信息,所述待補(bǔ)充的地址信息為按地址數(shù)據(jù)處理方法處理后得到的; 其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。11.一種地址數(shù)據(jù)處理方法,其特征在于,包括: 按地址數(shù)據(jù)處理方法補(bǔ)充目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息; 將補(bǔ)充地址信息后的目標(biāo)地址數(shù)據(jù)、與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍信息進(jìn)行匹配; 在匹配成功的情況下,確定所述目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則,確定所述目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi); 其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。12.如權(quán)利要求11所述的方法,其特征在于,還包括: 更新所述預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中該第三方的業(yè)務(wù)覆蓋范圍。13.一種地址數(shù)據(jù)處理裝置,其特征在于,包括: 獲取單元,用于獲取待處理的目標(biāo)地址數(shù)據(jù); 判斷單元,用于根據(jù)預(yù)設(shè)地址格式規(guī)則判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整; 補(bǔ)充單元,用于在所述目標(biāo)地址數(shù)據(jù)的格式不完整的時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息。14.如權(quán)利要求13所述的裝置,其特征在于,所述判斷單元具體用于: 對(duì)所述目標(biāo)地址數(shù)據(jù)執(zhí)行分詞操作生成目標(biāo)分詞信息,所述目標(biāo)分詞信息包括由至少一個(gè)行政區(qū)域信息組成的目標(biāo)行政區(qū)域信息,所述目標(biāo)行政區(qū)域信息包括至少一個(gè)行政區(qū)域名稱,以及與行政區(qū)域名稱對(duì)應(yīng)的行政區(qū)域內(nèi)容;判斷目標(biāo)行政區(qū)域信息內(nèi)的行政區(qū)域名稱與所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱是否匹配。15.如權(quán)利要求14所述的裝置,其特征在于,所述補(bǔ)充單元包括: 確定單元,用于按照所述預(yù)設(shè)地址格式規(guī)則指示的行政區(qū)域名稱、確定所述目標(biāo)行政區(qū)域信息內(nèi)缺失的行政區(qū)域名稱; 查找單元,用于在預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息查找與所述缺失的行政區(qū)域名稱對(duì)應(yīng)的目標(biāo)行政區(qū)域內(nèi)容,所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中存儲(chǔ)有行政區(qū)域名稱與行政區(qū)域內(nèi)容之間的對(duì)應(yīng)關(guān)系; 補(bǔ)充內(nèi)容單元,用于將所述目標(biāo)行政區(qū)域內(nèi)容作為所述地址信息,補(bǔ)充至所述目標(biāo)地址數(shù)據(jù)中。16.如權(quán)利要求15所述的裝置,其特征在于,所述目標(biāo)分詞信息還包括目標(biāo)道路信息和/或目標(biāo)建筑物信息;所述目標(biāo)行政區(qū)域信息中至少包括目標(biāo)縣區(qū)行政區(qū)域;則所述查找單元包括: 第一查找單元,用于在所述缺失的行政區(qū)域名稱為省行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)行政區(qū)域信息、確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)省份內(nèi)容; 第二查找單元,用于在所述缺失的行政區(qū)域名稱為街道或鄉(xiāng)鎮(zhèn)行政區(qū)域的情況下,在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中利用所述目標(biāo)分詞信息的目標(biāo)道路信息和/或目標(biāo)建筑物信息,以及,所述目標(biāo)縣區(qū)行政區(qū)域,確定與所述省行政區(qū)域?qū)?yīng)的目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。17.如權(quán)利要求16所述的裝置,其特征在于,所述第二查找單元包括: 第三查找單元,用于在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中獲取與所述目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有道路信息,其中所述預(yù)設(shè)道路信息庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有道路信息、以及每個(gè)道路信息所屬的街道或鄉(xiāng)鎮(zhèn)信息;在所述所有道路信息中、查找到與所述目標(biāo)道路信息一致的道路信息;將所述道路信息對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容;和/或, 第四查找單元,用于將所述目標(biāo)建筑物信息進(jìn)行二元分詞,將所有分詞結(jié)果的集合作為目標(biāo)索引表,其中每個(gè)分詞結(jié)果對(duì)應(yīng)一個(gè)索引;在所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中、獲得與目標(biāo)縣區(qū)行政區(qū)域?qū)?yīng)的所有反向索引表;其中所述預(yù)設(shè)地址數(shù)據(jù)庫(kù)中包含有眾多縣區(qū)行政區(qū)域下的所有反向索引表,以及每個(gè)反向索引表所屬的街道或鄉(xiāng)鎮(zhèn)信息,所述每個(gè)反向索引表為對(duì)一個(gè)建筑物信息進(jìn)行二元分詞后生成分詞結(jié)果的集合;將所述目標(biāo)索引表與所述所有反向索引表進(jìn)行匹配,獲得與所述目標(biāo)索引表匹配率最高的反向索引表;將所述反向索引表對(duì)應(yīng)的街道或鄉(xiāng)鎮(zhèn)內(nèi)容作為目標(biāo)街道或鄉(xiāng)鎮(zhèn)內(nèi)容。18.如權(quán)利要求13所述的裝置,其特征在于,還包括: 保存單元,用于將所述目標(biāo)地址數(shù)據(jù)中補(bǔ)充的地址信息,推送至用戶;待用戶確認(rèn)所述地址信息正確后,保存補(bǔ)充有所述地址信息的目標(biāo)地址數(shù)據(jù)。19.一種地址數(shù)據(jù)處理裝置,其特征在于,包括: 第二補(bǔ)充單元,用于按地址數(shù)據(jù)處理方法補(bǔ)充目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息;其中,所述地址數(shù)據(jù)處理方法包括:獲取待處理的目標(biāo)地址數(shù)據(jù);根據(jù)預(yù)設(shè)地址格式規(guī)則,判斷所述目標(biāo)地址數(shù)據(jù)的格式是否完整;當(dāng)所述目標(biāo)地址數(shù)據(jù)的格式不完整時(shí),按照所述預(yù)設(shè)地址格式規(guī)則,補(bǔ)充所述目標(biāo)地址數(shù)據(jù)中與其缺失格式對(duì)應(yīng)的地址信息; 匹配單元,用于將補(bǔ)充地址信息后的目標(biāo)地址數(shù)據(jù)、與預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中第三方的業(yè)務(wù)覆蓋范圍信息進(jìn)行匹配; 第二確定單元,用于在匹配成功的情況下,確定所述目標(biāo)地址數(shù)據(jù)在第三方的業(yè)務(wù)覆蓋范圍內(nèi),否則,確定所述目標(biāo)地址數(shù)據(jù)不在第三方的業(yè)務(wù)覆蓋范圍內(nèi)。20.如權(quán)利要求19所述的裝置,其特征在于,還包括: 更新單元,用于更新所述預(yù)設(shè)覆蓋數(shù)據(jù)庫(kù)中該第三方的業(yè)務(wù)覆蓋范圍。
【文檔編號(hào)】G06F17/30GK106033460SQ201510121494
【公開(kāi)日】2016年10月19日
【申請(qǐng)日】2015年3月19日
【發(fā)明人】凌宇
【申請(qǐng)人】阿里巴巴集團(tuán)控股有限公司