亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種地址切分及級別標(biāo)注方法和地址切分及級別標(biāo)注裝置的制作方法

文檔序號:6604623閱讀:135來源:國知局
專利名稱:一種地址切分及級別標(biāo)注方法和地址切分及級別標(biāo)注裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及地理信息系統(tǒng)領(lǐng)域,尤其涉及一種地址切分及級別標(biāo)注方法和地址切分及級別標(biāo)注裝置。
背景技術(shù)
在地理信息系統(tǒng)中需要對地址進(jìn)行各種處理,以便為上層應(yīng)用(例如地名索引、 地名相似度計算及地圖導(dǎo)航等)提供底層基礎(chǔ)數(shù)據(jù)。地址處理最基礎(chǔ)的就是地址切分處理和級別標(biāo)注處理。地址切分處理是指將長的地址切分成一個個地址片段,切分得到的每個地址片段可以明確表述原地址部分信息。例如,地址“海淀區(qū)西三環(huán)中路18號萬發(fā)大廈”切分得到的地址片段包括海淀區(qū)I西三環(huán)中路118號ι萬發(fā)大廈。級別標(biāo)注處理是指在對地址進(jìn)行切分處理后,識別并標(biāo)注出各個地址片段的地址級別。例如,上述地址片段的級別標(biāo)注結(jié)果是海淀區(qū)[區(qū)級]I西三環(huán)中路[路級]118號 [門牌號]萬發(fā)大廈[大廈]。在對現(xiàn)有技術(shù)研究和實踐過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有基于字典或者基于自然語言的切分方法只能實現(xiàn)對地址的識別,但是不能實現(xiàn)對地址的切分。因此,亟需提供一種能夠?qū)崿F(xiàn)地址切分及級別標(biāo)注的技術(shù)。

發(fā)明內(nèi)容
本發(fā)明實施例要解決的技術(shù)問題是提供一種能夠?qū)Φ刂愤M(jìn)行切分的地址切分及級別標(biāo)注方法和地址切分及級別標(biāo)注裝置。為解決上述技術(shù)問題,本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的本發(fā)明提供了一種地址切分及地址級別標(biāo)注方法,所述方法包括接收地址;對所述地址進(jìn)行角色標(biāo)注處理;按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列。本發(fā)明還提供了一種地址切分及級別標(biāo)注裝置,所述裝置包括地址接收單元,用于接收地址;角色標(biāo)注單元,用于對所述地址進(jìn)行角色標(biāo)注處理;地址切分單元,用于按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列。上述技術(shù)方案具有如下有益效果本發(fā)明實施例提供的技術(shù)方案先對地址進(jìn)行角色標(biāo)注處理,再按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列。由于本發(fā)明實施例提供技術(shù)方案是按照角色標(biāo)注結(jié)果對地址進(jìn)行切分,因此,切分得到的地址片段精確度較尚。


圖1為本發(fā)明實施例一提供的地址切分方法流程圖;圖2為本發(fā)明實施例二提供的地址切分及地址級別標(biāo)注方法流程圖;圖3為本發(fā)明實施例一提供的地址切分裝置組成示意圖;圖4為本發(fā)明實施例二提供的地址切分及級別標(biāo)注裝置組成示意圖。
具體實施例方式為使本發(fā)明實施例的目的、技術(shù)方案、及優(yōu)點更加清楚明白,以下參照附圖對本發(fā)明實施例提供的技術(shù)方案進(jìn)行詳細(xì)說明。請參見圖1,為本發(fā)明實施例一提供的一種地址切分方法流程圖,所述方法包括步驟101 接收地址(地址描述串);步驟102 對接收到的地址進(jìn)行角色標(biāo)注處理;步驟103 按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列;其中,所述地址片段序列中的地址片段按照地址的書寫順序排序。比如,地址“北京市朝陽區(qū)安慧里四區(qū)15號樓”的地址片段序列為北京市I朝陽區(qū)I安惠里I四區(qū)115號樓。以上是本發(fā)明實施例提供地址切分方法,該方法可以對地理系統(tǒng),地名系統(tǒng)中各種地址信息進(jìn)行切分處理,切分得到的地址片段可作為地圖搜索、地圖導(dǎo)航、地理編碼等上層地址處理的底層地址數(shù)據(jù)。由于本發(fā)明實施例提供的方法是按照角色標(biāo)注結(jié)果對地址進(jìn)行切分,因此,切分得到的地址片段精確度較高,從而也提高了上層地址處理的精確度。進(jìn)一步,由于某些上層地址處理過程中需要地址片段的地址級別信息,因此,本發(fā)明實施例二還提供了一種地址切分及地址級別標(biāo)注方法,請參見圖2,該方法步驟201至步驟203與本發(fā)明實施例一完全相同,此處不再贅述,實施例二與實施例一的區(qū)別在于實施例二提供方法進(jìn)一步包括對地址片段序列中每個地址片段進(jìn)行地址級別標(biāo)注的步驟
204。進(jìn)一步,為提高地址片段切分結(jié)果的準(zhǔn)確度,本發(fā)明實施例二提供的方法可以進(jìn)一步包括按照地址片段的地址級別,對所述地址片段序列中的地址片段進(jìn)行修正的步驟
205。以上是本發(fā)明實施例二提供的地址切分及級別標(biāo)注方法。由于實際地址信息中經(jīng)常會包含各種各樣的噪音信息,為進(jìn)一步提高地址切分及級別標(biāo)注精確度,本發(fā)明實施例一和本發(fā)明實施例二提供的方法,需要去除地址中的噪音信息,因此,前文所述方法在除噪步驟具體為在角色標(biāo)注處理后切分處理前可以進(jìn)一步包括除噪步驟,除噪步驟具體為刪除地址中角色標(biāo)注結(jié)果為停用詞的詞。以上介紹了本發(fā)明實施例提供的地址切分及級別標(biāo)注方法,以下結(jié)合具體實例對上述方法采用的各個技術(shù)手段進(jìn)行詳細(xì)介紹。
1、角色標(biāo)注在實際應(yīng)用中,可以通過預(yù)置地址角色表,采用正向最大匹配原則對地址進(jìn)行角色標(biāo)注處理,前文所述地址進(jìn)行角色標(biāo)注處理具體包括如下步驟從所述地址的第一個字開始,采用每次遞加一個字的方式讀取所述地址,直到讀取到與預(yù)置地址角色表中關(guān)鍵字完全匹配的一個最長的詞,將所述詞的角色標(biāo)注為與其完全匹配的關(guān)鍵詞對應(yīng)的角色,若最長詞的最后一個字不是所述地址的結(jié)尾,則從所述地址未讀取部分的第一個字開始,重復(fù)上述步驟進(jìn)行角色標(biāo)注,直到處理完所述地址。請參見表1,為本發(fā)明實施例提供的地址角色表。
權(quán)利要求
1.一種地址切分及地址級別標(biāo)注方法,其特征在于,所述方法包括 接收地址;對所述地址進(jìn)行角色標(biāo)注處理;按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列。
2.如權(quán)利要求1所述的方法,其特征在于,所述方法進(jìn)一步包括 對地址片段序列中的每個地址片段進(jìn)行地址級別標(biāo)注。
3.如權(quán)利要求2所述的方法,其特征在于,所述方法進(jìn)一步包括按照地址片段的地址級別,對所述地址片段序列中的地址片段進(jìn)行修正。
4.如權(quán)利要求3所述的方法,其特征在于,若所述地址片段序列包括地址片段 L1,.. .,Li-^LijLw. . .,Ln,則按照地址片段的地址級別,對構(gòu)成所述地址的地址片段進(jìn)行修正具體包括從所述地址片段序列的最后一個地址片段Ln開始,判斷每兩個地址片段中后一地址片段!^的地址級別是否高于或等于前一地址片段Lh的地址級別,如果是,則將地址片段Li 和地址片段Lw合并為一個新的地址片段。
5.如權(quán)利要求1至4中任一項權(quán)利要求所述的方法,其特征在于,對所述地址進(jìn)行角色標(biāo)注處理具體包括從所述地址的第一個字開始,采用每次遞加一個字的方式讀取所述地址,直到讀取到與預(yù)置地址角色表中關(guān)鍵字完全匹配的一個最長的詞,將所述詞的角色標(biāo)注為與其完全匹配的關(guān)鍵詞對應(yīng)的角色,若所述最長詞的最后一個字不是所述地址的結(jié)尾,則從所述地址未讀取部分的第一個字開始,重復(fù)上述步驟進(jìn)行角色標(biāo)注,直到處理完所述地址。
6.如權(quán)利要求5所述的方法,其特征在于,按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列具體包括判斷角色標(biāo)注結(jié)果是否為地名后綴詞,如果是,則判斷所述角色標(biāo)注結(jié)果對應(yīng)的詞是否位于所述地址的結(jié)尾,如果否,則將所述詞的左邊界標(biāo)注為切分點;判斷角色標(biāo)注結(jié)果是否為已知地名,如果是,則將所述詞的左邊界標(biāo)注為切分點; 判斷角色標(biāo)注結(jié)果是否為方位詞或者方位詞加后綴,如果是,則將所述詞的左邊界標(biāo)注為切分點;判斷角色標(biāo)注結(jié)果是否為中英文標(biāo)點符號,如果是,則將所述詞的左邊界標(biāo)注為切分占. 判斷角色標(biāo)注結(jié)果是否為英文數(shù)字或中文數(shù)字或英文字母,如果是,則判斷其左側(cè)的結(jié)果是否為天干地支,如果是,則將所述詞的左邊界標(biāo)注為切分點; 根據(jù)標(biāo)注的切分點,對所述地址進(jìn)行切分,得到地址片段序列。
7.如權(quán)利要求5所述的方法,其特征在于,在角色標(biāo)注處理后切分處理前,所述方法進(jìn)一步包括刪除地址中角色標(biāo)注結(jié)果為停用詞的詞。
8.如權(quán)利要求2至4中任一項權(quán)利要求所述的方法,其特征在于,對地址片段序列中的每個地址片段進(jìn)行級別標(biāo)注具體包括讀取地址片段序列中的每個地址片段;將所述地址片段的后綴與預(yù)置地址級別表中的關(guān)鍵詞進(jìn)行匹配; 將所述地址片段的地址級別標(biāo)注為與其完全匹配的關(guān)鍵詞對應(yīng)的地址級別。
9.一種地址切分及級別標(biāo)注裝置,其特征在于,所述裝置包括 地址接收單元,用于接收地址;角色標(biāo)注單元,用于對所述地址進(jìn)行角色標(biāo)注處理;地址切分單元,用于按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列。
10.如權(quán)利要求9所述的裝置,其特征在于,所述裝置進(jìn)一步包括 級別標(biāo)注單元,用于對地址片段序列中的每個地址片段進(jìn)行地址級別標(biāo)注。
11.如權(quán)利要求10所述的裝置,其特征在于,所述裝置進(jìn)一步包括片段修正單元,用于按照地址片段的地址級別,對所述地址片段序列中的地址片段進(jìn)行修正。
12.如權(quán)利要求11所述的裝置,其特征在于,若所述地址片段序列包括地址片段 L1, ... , Lp1,Li, ... , Ln,則所述片段修正單元具體包括級別判斷單元,用于從所述地址片段序列的最后一個地址片段Ln開始,判斷每兩個地址片段中后一地址片段Li的地址級別是否高于或等于前一地址片段Lh的地址級別,如果是,則觸發(fā)地址合并單元;地址合并單元,用于將地址片段Li和地址片段Lw合并為一個新的地址片段。
13.如權(quán)利要求9至12中任一項權(quán)利要求所述的裝置,其特征在于,所述角色標(biāo)注單元具體包括最大詞匹配單元,用于從所述地址的第一個字開始,采用每次遞加一個字的方式讀取所述地址,直到讀取到與預(yù)置地址角色表中關(guān)鍵字完全匹配的一個最長的詞,觸發(fā)角色標(biāo)注字單元;結(jié)尾判斷單元,用于判斷最大詞匹配單元得到的最長詞的最后一個字不是所述地址的結(jié)尾,則如果否,則觸發(fā)所述最大詞匹配單元從所述地址未讀取部分的第一個字開始,對所述地址尚未讀取部分進(jìn)行角色標(biāo)注;角色標(biāo)注子單元,用于將所述詞的角色標(biāo)注為與其完全匹配的關(guān)鍵詞對應(yīng)的角色。
14.如權(quán)利要求13所述的裝置,其特征在于,地址切分單元具體包括角色標(biāo)注結(jié)果第一判斷單元,用于判斷角色標(biāo)注結(jié)果是否為地名后綴詞,如果是,則判斷所述角色標(biāo)注結(jié)果對應(yīng)的詞是否位于所述地址的結(jié)尾,如果否,則觸發(fā)切分點標(biāo)注單元;角色標(biāo)注結(jié)果第二判斷單元,用于判斷角色標(biāo)注結(jié)果是否為已知地名,如果是,則觸發(fā)切分點標(biāo)注單元;角色標(biāo)注結(jié)果第三判斷單元,用于判斷角色標(biāo)注結(jié)果是否為方位詞或者方位詞加后綴,如果是,則觸發(fā)切分點標(biāo)注單元;角色標(biāo)注結(jié)果第四判斷單元,用于判斷角色標(biāo)注結(jié)果是否為中英文標(biāo)點符號,如果是, 則觸發(fā)切分點標(biāo)注單元;角色標(biāo)注結(jié)果第五判斷單元,用于判斷角色標(biāo)注結(jié)果是否為英文數(shù)字或中文數(shù)字或英文字母,如果是,則判斷其左側(cè)的結(jié)果是否為天干地支,如果是,則觸發(fā)切分點標(biāo)注單元; 切分點標(biāo)注單元,用于將所述詞的左邊界標(biāo)注為切分點;片段切分單元,用于根據(jù)標(biāo)注的切分點,對所述地址進(jìn)行切分,得到地址片段序列。
15.如權(quán)利要求13所述的裝置,其特征在于,所述裝置進(jìn)一步包括除噪單元; 角色標(biāo)注單元在對所述地址進(jìn)行角色標(biāo)注后,觸發(fā)除噪單元;除噪單元,用于刪除地址中角色標(biāo)注結(jié)果為停用詞的詞。
16.如權(quán)利要求10至12中任一項權(quán)利要求所述的裝置,其特征在于,級別標(biāo)注單元具體包括地址片段讀取單元,用于讀取地址片段序列中的每個地址片段; 片段后綴匹配單元,用于將所述地址片段的后綴與預(yù)置地址級別表中的關(guān)鍵詞進(jìn)行匹配;地址級別標(biāo)注單元,用于將所述地址片段的地址級別標(biāo)注為與其完全匹配的關(guān)鍵詞對應(yīng)的地址級別。
全文摘要
本發(fā)明提供了一種地址切分及地址級別標(biāo)注方法及地址切分及級別標(biāo)注裝置。本發(fā)明提供的方法包括接收地址;對所述地址進(jìn)行角色標(biāo)注處理;按照所述地址的角色標(biāo)注結(jié)果,對所述地址進(jìn)行切分,得到構(gòu)成所述地址的地址片段序列。本發(fā)明還提供了一種實現(xiàn)上述方法的裝置。由于本發(fā)明提供技術(shù)方案是按照角色標(biāo)注結(jié)果對地址進(jìn)行切分,因此,切分得到的地址片段精確度較高。
文檔編號G06F17/30GK102298585SQ20101020814
公開日2011年12月28日 申請日期2010年6月24日 優(yōu)先權(quán)日2010年6月24日
發(fā)明者姜吉發(fā), 董克欽, 馬永成 申請人:高德軟件有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1