亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基礎(chǔ)地址庫構(gòu)建方法及系統(tǒng)與流程

文檔序號(hào):12466016閱讀:353來源:國知局
基礎(chǔ)地址庫構(gòu)建方法及系統(tǒng)與流程
本發(fā)明涉及地址數(shù)據(jù)處理
技術(shù)領(lǐng)域
,具體涉及一種基礎(chǔ)地址庫構(gòu)建方法及系統(tǒng)。
背景技術(shù)
:基礎(chǔ)地址庫主要是為了實(shí)現(xiàn)保存、修改、完善地址要素和轉(zhuǎn)化地址信息功能的基礎(chǔ)庫。目前絕大多數(shù)數(shù)據(jù)系統(tǒng)中都保存著地址信息,不同的機(jī)構(gòu)根據(jù)自身的需要對(duì)這些數(shù)據(jù)進(jìn)行采集存儲(chǔ)、管理。但是,由于機(jī)構(gòu)間協(xié)作水平的限制,不同機(jī)構(gòu)的業(yè)務(wù)系統(tǒng)并沒有經(jīng)過頂層設(shè)計(jì)和統(tǒng)籌規(guī)劃,導(dǎo)致地址體系異常復(fù)雜,如地址結(jié)構(gòu)無序,地名命名復(fù)雜,缺乏規(guī)律性,街道門牌號(hào)混亂,缺乏統(tǒng)一的標(biāo)準(zhǔn)等,使得很多地址信息都沒有得到充分利用,對(duì)地址信息的應(yīng)用和共享產(chǎn)生了障礙。這種情況下,就需要地址標(biāo)準(zhǔn)化技術(shù),可以將不同機(jī)構(gòu)的數(shù)據(jù)進(jìn)行整合,構(gòu)造地址數(shù)據(jù)的主要數(shù)據(jù)庫,實(shí)現(xiàn)不同機(jī)構(gòu)的數(shù)據(jù)共享。但現(xiàn)有的構(gòu)建基礎(chǔ)地址庫的方法,通常需要人工進(jìn)行,耗時(shí)耗力,數(shù)據(jù)來源多,數(shù)據(jù)梳理難度高。技術(shù)實(shí)現(xiàn)要素:針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供的基礎(chǔ)地址庫構(gòu)建方法及系統(tǒng),利用不同機(jī)構(gòu)的地址數(shù)據(jù)自動(dòng)化的構(gòu)建基礎(chǔ)地址庫,提高了基礎(chǔ)地址庫構(gòu)建的效率和基礎(chǔ)地址庫的精準(zhǔn)度。第一方面,本發(fā)明提供的基礎(chǔ)地址庫構(gòu)建方法,包括:步驟S1,將獲取的地址數(shù)據(jù)拆分成多個(gè)地址要素,并標(biāo)注所有地址要素的地址等級(jí);步驟S2,根據(jù)所述地址要素的地址等級(jí),將所述地址要素填入標(biāo)準(zhǔn)地址中;步驟S3,根據(jù)所述地址數(shù)據(jù)的地址編碼,在統(tǒng)一編碼庫中關(guān)聯(lián)匹配所述標(biāo)準(zhǔn)地址中空缺的部分,根據(jù)關(guān)聯(lián)匹配結(jié)果補(bǔ)全所述標(biāo)準(zhǔn)地址,將補(bǔ)全后的標(biāo)準(zhǔn)地址存入基礎(chǔ)地址庫。本發(fā)明提供的基礎(chǔ)地址庫構(gòu)建方法,能夠?qū)⒏袷讲唤y(tǒng)一的地址數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)格式的地址,整合不同機(jī)構(gòu)的地址數(shù)據(jù),自動(dòng)化的構(gòu)建方式提高了基礎(chǔ)地址庫構(gòu)建的效率和基礎(chǔ)地址庫的精準(zhǔn)度?;A(chǔ)地址庫有助于實(shí)現(xiàn)地址信息的共享,為其它基于地址信息的應(yīng)用提供了可靠的保證。優(yōu)選地,還包括:若拆分過程中存在異常,則進(jìn)行異常處理,所述異常處理包括:若拆分后的字段中存在特殊字符,則將特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符后,再拆分所述字段得到地址要素,并標(biāo)注地址要素的地址等級(jí);若為路/路號(hào)數(shù)據(jù)異常,則根據(jù)所述地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的路或路號(hào);若為樓棟/房間數(shù)據(jù)異常,則根據(jù)所述地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的樓號(hào)或房號(hào)。優(yōu)選地,將所述特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符,包括:根據(jù)前一地址要素的地址等級(jí),確定當(dāng)前處理地址要素中的特殊字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符,將所述特殊字符替換為所述標(biāo)準(zhǔn)字符。優(yōu)選地,還包括:若存在其它異常情況,則將所述地址數(shù)據(jù)存入異常地址數(shù)據(jù)表單,并發(fā)出人工查驗(yàn)的提醒。優(yōu)選地,在步驟S1之前還包括:對(duì)同一地址的不同來源的地址數(shù)據(jù),取優(yōu)先級(jí)高的地址數(shù)據(jù)進(jìn)行拆分,所述優(yōu)先級(jí)根據(jù)地址數(shù)據(jù)的來源確定。優(yōu)選地,還包括:在基礎(chǔ)地址庫中查找與所述地址數(shù)據(jù)的地址編碼匹配的標(biāo)準(zhǔn)地址,根據(jù)補(bǔ)全后的標(biāo)準(zhǔn)地址更新基礎(chǔ)地址庫中的標(biāo)準(zhǔn)地址。第二方面,本發(fā)明提供的基礎(chǔ)地址庫構(gòu)建系統(tǒng),包括:地址拆分模塊,用于將獲取的地址數(shù)據(jù)拆分成多個(gè)地址要素,并標(biāo)注所有地址要素的地址等級(jí);地址標(biāo)準(zhǔn)化模塊,用于根據(jù)所述地址要素的地址等級(jí),將所述地址要素填入標(biāo)準(zhǔn)地址中;地址補(bǔ)全模塊,用于根據(jù)所述地址數(shù)據(jù)的地址編碼,在統(tǒng)一編碼庫中關(guān)聯(lián)匹配所述標(biāo)準(zhǔn)地址中空缺的部分,根據(jù)關(guān)聯(lián)匹配結(jié)果補(bǔ)全所述標(biāo)準(zhǔn)地址,將補(bǔ)全后的標(biāo)準(zhǔn)地址存入基礎(chǔ)地址庫。本發(fā)明提供的基礎(chǔ)地址庫構(gòu)建系統(tǒng),能夠?qū)⒏袷讲唤y(tǒng)一的地址數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)格式的地址,整合不同機(jī)構(gòu)的地址數(shù)據(jù),自動(dòng)化的構(gòu)建方式提高了基礎(chǔ)地址庫構(gòu)建的效率和基礎(chǔ)地址庫的精準(zhǔn)度?;A(chǔ)地址庫有助于實(shí)現(xiàn)地址信息的共享,為其它基于地址信息的應(yīng)用提供了可靠的保證。優(yōu)選地,還包括異常處理模塊,用于:若拆分過程中存在異常,則進(jìn)行異常處理,所述異常處理包括:若拆分后的字段中存在特殊字符,則將特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符后,再拆分所述字段得到地址要素,并標(biāo)注地址要素的地址等級(jí);若為路/路號(hào)數(shù)據(jù)異常,則根據(jù)所述地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的路或路號(hào);若為樓棟/房間數(shù)據(jù)異常,則根據(jù)所述地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的樓號(hào)或房號(hào)。優(yōu)選地,所述地址拆分模塊中,將所述特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符,包括:根據(jù)前一地址要素的地址等級(jí),確定當(dāng)前處理地址要素中的特殊字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符,將所述特殊字符替換為所述標(biāo)準(zhǔn)字符。優(yōu)選地,還包括異常提醒模塊,用于若存在其它異常情況,則將所述地址數(shù)據(jù)存入異常地址數(shù)據(jù)表單,并發(fā)出人工查驗(yàn)的提醒。優(yōu)選地,還包括數(shù)據(jù)選取模塊,用于對(duì)同一地址的不同來源的地址數(shù)據(jù),取優(yōu)先級(jí)高的地址數(shù)據(jù)進(jìn)行拆分,所述優(yōu)先級(jí)根據(jù)地址數(shù)據(jù)的來源確定。優(yōu)選地,還包括地址更新模塊,用于在基礎(chǔ)地址庫中查找與所述地址數(shù)據(jù)的地址編碼匹配的標(biāo)準(zhǔn)地址,根據(jù)補(bǔ)全后的標(biāo)準(zhǔn)地址更新基礎(chǔ)地址庫中的標(biāo)準(zhǔn)地址。附圖說明圖1為本發(fā)明實(shí)施例所提供的一種基礎(chǔ)地址庫構(gòu)建方法的流程圖;圖2為本發(fā)明實(shí)施例所提供的一種基礎(chǔ)地址庫構(gòu)建系統(tǒng)的結(jié)構(gòu)框圖;圖3為地址編碼的一個(gè)示例。具體實(shí)施方式下面將結(jié)合附圖對(duì)本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。需要注意的是,除非另有說明,本申請(qǐng)使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。如圖1所示,本發(fā)明實(shí)施例提供的一種基礎(chǔ)地址庫構(gòu)建方法,包括:步驟S1,將獲取的地址數(shù)據(jù)拆分成多個(gè)地址要素,并標(biāo)注所有地址要素的地址等級(jí)。其中,地址數(shù)據(jù)來源于各個(gè)機(jī)構(gòu),如:公安部門、房屋管理中心等。地址要素包含的數(shù)據(jù)主要有:省級(jí)行政區(qū)名、市級(jí)行政區(qū)名、縣級(jí)行政區(qū)名、鄉(xiāng)級(jí)行政區(qū)名、路名、路號(hào)、小區(qū)名、樓號(hào)、單元號(hào)、房間號(hào)等。地址等級(jí)是根據(jù)國家規(guī)定的行政等級(jí)進(jìn)行劃分的,地址等級(jí)的劃分如表1所示:表1第一級(jí)省第二級(jí)市第三級(jí)區(qū)、縣第四級(jí)鎮(zhèn)、鄉(xiāng)、街道第五級(jí)社區(qū)、行政村第六級(jí)路、巷第七級(jí)路號(hào)第八級(jí)小區(qū)、自然村、大廈第九級(jí)樓號(hào)第十級(jí)單元號(hào)、房號(hào)其中,地址拆分的方法有很多,比如,根據(jù)關(guān)鍵詞進(jìn)行拆分,關(guān)鍵詞可以選用“省”、“市”、“路”等諸如此類表示行政等級(jí)的詞。以拆分路名和小區(qū)名字為例,拆分方法可以是根據(jù)關(guān)鍵字區(qū)分,路名包含大道、巷、街等關(guān)鍵字,而小區(qū)名稱包含自然村,XX大廈,XX花園等信息;拆分方法還可以結(jié)合路號(hào)或者樓號(hào)來區(qū)分是小區(qū)名或路名。地址拆分時(shí)按第一級(jí)到第十級(jí)的順序進(jìn)行拆分。步驟S2,根據(jù)地址要素的地址等級(jí),將地址要素填入標(biāo)準(zhǔn)地址中。其中,標(biāo)準(zhǔn)地址按照標(biāo)準(zhǔn)的格式進(jìn)行存儲(chǔ),標(biāo)準(zhǔn)地址根據(jù)地址等級(jí)劃分為九個(gè)部分:省、市、區(qū)(縣)、鄉(xiāng)(鎮(zhèn)、街道)、社區(qū)(行政村)、路(巷)、路號(hào)、小區(qū)(自然村、大廈)、樓號(hào)、單元號(hào)(房號(hào))。根據(jù)給地址要素標(biāo)注的地址等級(jí),將切分得到的地址要素存入標(biāo)準(zhǔn)地址中的相應(yīng)部分。由于地址數(shù)據(jù)拆分后不一定包含標(biāo)準(zhǔn)地址中的所有部分,對(duì)于缺失的部分,暫時(shí)不填,等待后續(xù)補(bǔ)全。步驟S3,根據(jù)地址數(shù)據(jù)的地址編碼,在統(tǒng)一編碼庫中關(guān)聯(lián)匹配標(biāo)準(zhǔn)地址中空缺的部分,根據(jù)關(guān)聯(lián)匹配結(jié)果補(bǔ)全標(biāo)準(zhǔn)地址,將補(bǔ)全后的標(biāo)準(zhǔn)地址存入基礎(chǔ)地址庫。其中,每個(gè)采集到的地址數(shù)據(jù)都有帶有一個(gè)地址編碼,這個(gè)地址編碼對(duì)應(yīng)唯一的一個(gè)地址,是地址數(shù)據(jù)生成時(shí)就進(jìn)行標(biāo)注的。如圖3所示,地址編碼一共25位,依次為6位市轄區(qū)編碼(省、市、區(qū))、3位街道順序碼、3社區(qū)順序碼、2為空間基礎(chǔ)網(wǎng)格順序碼、5位樓棟編碼、6為房屋編碼。統(tǒng)一編碼庫中存儲(chǔ)有地址編碼對(duì)應(yīng)的準(zhǔn)確的地址信息,如:一個(gè)地址編碼為“440306002011”,則“44”代表了廣東省,“03”代表了深圳市,“06”代表寶安區(qū),002代表福永街道,011代表新和社區(qū),以此類推,通過地址編碼就能在編碼庫中找到對(duì)應(yīng)的地址信息,將找到的地址信息填入標(biāo)準(zhǔn)地址的相應(yīng)部分。比如步驟S2中得到的標(biāo)準(zhǔn)地址中缺失的部分為“省”,則獲取地址編碼中表示省這級(jí)行政等級(jí)的編號(hào),假設(shè)為“44”,在統(tǒng)一編碼庫中查找編號(hào)為“44”的省級(jí)行政等級(jí)代表廣東省,將“廣東省”填入標(biāo)準(zhǔn)地址中“省”對(duì)應(yīng)的部分?;A(chǔ)地址庫中的標(biāo)準(zhǔn)地址是按地址等級(jí)拆分好的地址。本實(shí)施例提供的基礎(chǔ)地址庫構(gòu)建方法,能夠?qū)⒏袷讲唤y(tǒng)一的地址數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)格式的地址,整合不同機(jī)構(gòu)的地址數(shù)據(jù),自動(dòng)化的構(gòu)建方式提高了基礎(chǔ)地址庫構(gòu)建的效率和基礎(chǔ)地址庫的精準(zhǔn)度?;A(chǔ)地址庫有助于實(shí)現(xiàn)地址信息的共享,為其它基于地址信息的應(yīng)用提供了可靠的保證。由于大部分地址數(shù)據(jù)都是網(wǎng)格員手動(dòng)輸入的,寫法較混亂,給出幾個(gè)非標(biāo)準(zhǔn)的地址數(shù)據(jù)如下:“河西三坊198號(hào)30#1201”、“南山路208號(hào)404”、“風(fēng)和苑17-299”、“富成路廣州軍區(qū)大樓A棟302-17”、“桃源居十四區(qū)A.B.C座B203”、“福中福商業(yè)城D5棟804”、“海城新村一區(qū)15號(hào)304”、“寶城花園甲棟204”、“107國道寶田路口段第一棟310”。從以上提供的地址數(shù)據(jù)可以看到地址中的具體地址,有些是小區(qū)名字,有些是路名和門牌號(hào),并且樓號(hào)的寫法也不一致,表示的方法有“#”、“-”、“座”等,編號(hào)的方式也多樣化,包括字母、數(shù)字、大寫中文一二三四、甲乙丙丁等號(hào)。這些非標(biāo)準(zhǔn)的地址數(shù)據(jù)會(huì)影響拆分的準(zhǔn)確度,且不利于統(tǒng)一地址的格式,并會(huì)導(dǎo)致拆分過程無法順利進(jìn)行,因此,必須對(duì)這些地址數(shù)據(jù)中非標(biāo)準(zhǔn)化的特殊字符進(jìn)行替換,將其統(tǒng)一為標(biāo)準(zhǔn)的表述。為了自動(dòng)化處理地址數(shù)據(jù)在標(biāo)準(zhǔn)化的過程中出現(xiàn)的異常情況,本實(shí)施的方法還包括:若拆分過程中存在異常,則進(jìn)行異常處理。其中,異常處理包括:步驟S11,若拆分后的字段中存在特殊字符,則將特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符后,再拆分字段得到地址要素,并標(biāo)注地址要素的地址等級(jí)。步驟S12,若為路/路號(hào)數(shù)據(jù)異常,則根據(jù)地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的路或路號(hào)。獲得的路或路號(hào)即作為地址要素。步驟S13,若為樓棟/房間數(shù)據(jù)異常,則根據(jù)地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的樓號(hào)或房號(hào)。獲得的樓號(hào)或房號(hào)即作為地址要素。在經(jīng)過異常處理后,得到準(zhǔn)確的地址要素,隨后根據(jù)步驟S2和步驟S3做相應(yīng)處理即可。其中,特殊字符以及特殊字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符通過統(tǒng)計(jì)和經(jīng)驗(yàn)預(yù)先確定好,形成特殊字符集合,檢測(cè)和替換時(shí),根據(jù)特殊字符集合進(jìn)行比對(duì)和替換。例如:地址“常興路常興新村47號(hào)(601棟)601”,其中括號(hào)為中文“(”改為英文“(”;地址“桃園路106號(hào)蘇豪大廈27G1”,把全角的“106”變成半角的“106”;若地址的前后存在特殊字符“-”則進(jìn)行處理,若地址的中間出現(xiàn)特殊字符“-”則不處理。地址拆分過程中的異常情況實(shí)際是一種枚舉的形式,因此總會(huì)存在一些異常情況不在枚舉范圍內(nèi),影響拆分。因此,在異常處理還包括:步驟S14,若存在其它異常情況,則將地址數(shù)據(jù)存入異常地址數(shù)據(jù)表單,并發(fā)出人工查驗(yàn)的提醒。由人工進(jìn)行干預(yù),排除異常情況,并把異常情況添加的異常處理程序中,使得后續(xù)能夠自動(dòng)處理該異常情況。有些特殊字符可能存在多個(gè)標(biāo)準(zhǔn)字符與之對(duì)應(yīng),如“#”,在“河西三坊198號(hào)30#1201”中表示樓棟,在“南山路208#”中表示路號(hào)。為了準(zhǔn)確區(qū)分同一特殊字符表示不同意思的情況,步驟S11中,將特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符,包括:根據(jù)前一地址要素的地址等級(jí),確定當(dāng)前處理地址要素中的特殊字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符,將特殊字符替換為標(biāo)準(zhǔn)字符。如:對(duì)“河西三坊198號(hào)30#1201”進(jìn)行拆分時(shí),在替換“#”時(shí),可知前一地址要素“198”為路號(hào),因此“#”對(duì)應(yīng)的地址等級(jí)應(yīng)該是樓號(hào),將“#”替換為“棟”。其中,判斷是否為路/路號(hào)數(shù)據(jù)異常的方法為:檢測(cè)拆分后的地址要素中是否有大道、港巷、道路、路等關(guān)鍵字,如果沒有就認(rèn)為路/路號(hào)數(shù)據(jù)存在異常。以下列舉了幾種常見的路數(shù)據(jù)異常情況:(1)XXX路與XXX路交匯處,例如:體育一路與新合路交匯處金地朗悅酒店803。(2)XXX路與XXX路交界處,例如:大窩白石交界處三棟廠房101。(3)XX路XX街,例如:愛國路東湖一街11號(hào)6棟102。(4)XX路XX巷,例如:紅寶路聯(lián)益巷4號(hào)406。(5)側(cè))|旁(邊,例如:濱河路南側(cè)漁民村住宅1棟409。(6)數(shù)字路,例如:107國道宏發(fā)君域花園5棟1302。路號(hào)數(shù)據(jù)異常情況,如:東/西/南/北XX號(hào),例如:南152號(hào)。其中,判斷是否為樓棟/房間數(shù)據(jù)異常的方法為:檢測(cè)拆分后的地址要素中是否有樓、棟、號(hào)等關(guān)鍵字,如果沒有就認(rèn)為樓棟/房間數(shù)據(jù)異常存在異常。以下列舉了幾種常見的樓棟/房間數(shù)據(jù)據(jù)異常情況:(1)甲|乙|丙|丁|東|西|南|北棟或者幢,例如:寶城花園甲棟404。(2)純數(shù)字棟,例如:輕鐵花園822棟。(3)英文字母+數(shù)字棟,例如:航城大道172號(hào)A7棟702。(4)特殊字符棟,例如:銀田文樂工業(yè)區(qū)A棟銀田工業(yè)區(qū)1#(A棟)廠房1層。(5)說明性樓棟(所在樓棟),例如:固戍一路97號(hào)所在樓棟348。不同機(jī)構(gòu)對(duì)同一地址的重復(fù)采集,致使同一地址存在多個(gè)地址數(shù)據(jù),為減少數(shù)據(jù)處理量,在步驟S1之前還包括:對(duì)同一地址的不同來源的地址數(shù)據(jù),取優(yōu)先級(jí)高的地址數(shù)據(jù)進(jìn)行拆分。其中,優(yōu)先級(jí)根據(jù)地址數(shù)據(jù)的來源確定,比如,公安本部門的優(yōu)先級(jí)最高,則采用公安部門的地址數(shù)據(jù)進(jìn)行處理,忽略其它機(jī)構(gòu)的數(shù)據(jù)。其中,確定兩個(gè)地址數(shù)據(jù)是同一地址的方法有以下兩種:(1)通過比對(duì)兩個(gè)地址數(shù)據(jù)的地址編碼確定。(2)通過地址信息包含和被包含關(guān)系確定,例如:地址數(shù)據(jù)1“龍崗區(qū)湖田路51號(hào)宏開大廈”和地址數(shù)據(jù)2“龍崗區(qū)湖田路51號(hào)”,對(duì)地址數(shù)據(jù)2拆分后得到樓棟名稱“宏開大廈”,對(duì)地址數(shù)據(jù)2拆分后,獲取“路”+“路號(hào)”為“湖田路”+“51號(hào)”,根據(jù)“路”+“路號(hào)”去基礎(chǔ)地址數(shù)據(jù)庫中匹配得到“湖田路”+“51號(hào)”對(duì)應(yīng)的就是“宏開大廈”,因此可以確定地址數(shù)據(jù)1和地址數(shù)據(jù)2是同一地址。為了持續(xù)保障地址數(shù)據(jù)庫中的數(shù)據(jù)質(zhì)量,還需要經(jīng)常更新基礎(chǔ)地址庫的數(shù)據(jù),本發(fā)明實(shí)施例提供的一種基礎(chǔ)地址庫構(gòu)建方法,還包括更新基礎(chǔ)地址庫的過程:步驟S10,將獲取的地址數(shù)據(jù)拆分成多個(gè)地址要素,并標(biāo)注所有地址要素的地址等級(jí)。步驟S20,根據(jù)地址要素的地址等級(jí),將地址要素填入標(biāo)準(zhǔn)地址中。步驟S30,根據(jù)地址數(shù)據(jù)的地址編碼,在統(tǒng)一編碼庫中關(guān)聯(lián)匹配標(biāo)準(zhǔn)地址中空缺的部分,根據(jù)關(guān)聯(lián)匹配結(jié)果補(bǔ)全標(biāo)準(zhǔn)地址。步驟S40,在基礎(chǔ)地址庫中查找與地址數(shù)據(jù)的地址編碼匹配的標(biāo)準(zhǔn)地址,根據(jù)將補(bǔ)全后的標(biāo)準(zhǔn)地址更新基礎(chǔ)地址庫中的標(biāo)準(zhǔn)地址。其中,步驟S40中,根據(jù)將補(bǔ)全后的標(biāo)準(zhǔn)地址更新基礎(chǔ)地址庫中的標(biāo)準(zhǔn)地址,包括以下兩種處理方式:(1)用新的標(biāo)準(zhǔn)地址提換原來的標(biāo)準(zhǔn)地址;(2)將新的標(biāo)準(zhǔn)地址與原來的標(biāo)準(zhǔn)地址一起進(jìn)行存儲(chǔ),這樣在使用基礎(chǔ)地址庫進(jìn)行地址匹配、搜索等處理時(shí),可以查找到更新前后的地址,這種更新方式尤其是在高速城市化建設(shè)的環(huán)境下顯得尤為重要,老舊的街道、路名、大廈名等會(huì)發(fā)生更改,而市民大多熟悉了原來的名稱,這種更新方式保證了使用基礎(chǔ)地址庫時(shí)更加的人性化?;谂c上述基礎(chǔ)地址庫構(gòu)建方法相同的發(fā)明構(gòu)思,本實(shí)施例提供了一種基礎(chǔ)地址庫構(gòu)建系統(tǒng),如圖2所示,包括:地址拆分模塊,用于將獲取的地址數(shù)據(jù)拆分成多個(gè)地址要素,并標(biāo)注所有地址要素的地址等級(jí);地址標(biāo)準(zhǔn)化模塊,用于根據(jù)地址要素的地址等級(jí),將地址要素填入標(biāo)準(zhǔn)地址中;地址補(bǔ)全模塊,用于根據(jù)地址數(shù)據(jù)的地址編碼,在統(tǒng)一編碼庫中關(guān)聯(lián)匹配標(biāo)準(zhǔn)地址中空缺的部分,根據(jù)關(guān)聯(lián)匹配結(jié)果補(bǔ)全標(biāo)準(zhǔn)地址,將補(bǔ)全后的標(biāo)準(zhǔn)地址存入基礎(chǔ)地址庫。本實(shí)施例提供的基礎(chǔ)地址庫構(gòu)建系統(tǒng),能夠?qū)⒏袷讲唤y(tǒng)一的地址數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)格式的地址,整合不同機(jī)構(gòu)的地址數(shù)據(jù),自動(dòng)化的構(gòu)建方式提高了基礎(chǔ)地址庫構(gòu)建的效率和基礎(chǔ)地址庫的精準(zhǔn)度?;A(chǔ)地址庫有助于實(shí)現(xiàn)地址信息的共享,為其它基于地址信息的應(yīng)用提供了可靠的保證。其中,還包括異常處理模塊,用于:若拆分過程中存在異常,則進(jìn)行異常處理,異常處理包括:若拆分后的字段中存在特殊字符,則將特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符后,再拆分字段得到地址要素,并標(biāo)注地址要素的地址等級(jí);若為路/路號(hào)數(shù)據(jù)異常,則根據(jù)地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的路或路號(hào);若為樓棟/房間數(shù)據(jù)異常,則根據(jù)地址數(shù)據(jù)的地址編碼在統(tǒng)一編碼庫中獲取正確的樓號(hào)或房號(hào)。其中,地址拆分模塊中,將特殊字符替換為對(duì)應(yīng)的標(biāo)準(zhǔn)字符,包括:根據(jù)前一地址要素的地址等級(jí),確定當(dāng)前處理地址要素中的特殊字符對(duì)應(yīng)的標(biāo)準(zhǔn)字符,將特殊字符替換為標(biāo)準(zhǔn)字符。其中,還包括異常提醒模塊,用于若存在其它異常情況,則將所述地址數(shù)據(jù)存入異常地址數(shù)據(jù)表單,并發(fā)出人工查驗(yàn)的提醒。其中,還包括數(shù)據(jù)選取模塊,用于對(duì)同一地址的不同來源的地址數(shù)據(jù),取優(yōu)先級(jí)高的地址數(shù)據(jù)進(jìn)行拆分,優(yōu)先級(jí)根據(jù)地址數(shù)據(jù)的來源確定。其中,還包括地址更新模塊,用于在基礎(chǔ)地址庫中查找與地址數(shù)據(jù)的地址編碼匹配的標(biāo)準(zhǔn)地址,根據(jù)補(bǔ)全后的標(biāo)準(zhǔn)地址更新基礎(chǔ)地址庫中的標(biāo)準(zhǔn)地址。最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1