亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

復(fù)雜地址中多條路徑的分析方法

文檔序號(hào):8922663閱讀:510來(lái)源:國(guó)知局
復(fù)雜地址中多條路徑的分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種復(fù)雜地址中多條路徑的分析方法。
【背景技術(shù)】
[0002]人們?cè)谔顚?xiě)收件人地址、辦公地址、家庭住址等地址信息時(shí)一般都是將省、市、區(qū)、門(mén)牌號(hào)、住宅小區(qū)、房間號(hào)等信息寫(xiě)在一起組成地址信息,如“廣東深圳南山區(qū)高新中一道9號(hào)科技園軟件大廈713”,這種寫(xiě)法適合人工識(shí)別,而當(dāng)通過(guò)機(jī)器識(shí)別地址的結(jié)構(gòu)化細(xì)節(jié)信息時(shí)首先要做的處理就是分詞與標(biāo)注,將輸入的長(zhǎng)文本切分成一個(gè)一個(gè)的地址詞,并對(duì)地址詞的屬性按照標(biāo)注標(biāo)簽進(jìn)行標(biāo)注,如上例地址信息的分詞標(biāo)注結(jié)果可能為:“廣東/省深圳/市南山區(qū)/區(qū)高新中一道/道路9號(hào)/路號(hào)科技園/片區(qū)軟件大廈/樓棟713/房間”。現(xiàn)有分詞標(biāo)注技術(shù)中應(yīng)用的比較成熟的是基于統(tǒng)計(jì)的方法,例如,隱馬爾可夫模型(HMM)的分詞標(biāo)注技術(shù)就是一種典型的基于統(tǒng)計(jì)模型的分詞標(biāo)注方法。
[0003]由于人們填寫(xiě)地址的隨意性,給機(jī)器處理地址帶來(lái)很大的不便。其中一種問(wèn)題就是一條地址可能包含多個(gè)地址實(shí)體,如某公司地址存在多個(gè)辦公場(chǎng)所深圳市南山區(qū)軟件大廈713科興科學(xué)園A座1-501”,或描述地址中帶有輔助信息:“深圳市南山區(qū)軟件大廈旁科興科學(xué)園A座1-501”等。二個(gè)例子中都包含兩個(gè)獨(dú)立建筑實(shí)體“軟件大廈”和“科興科學(xué)園”,兩者間隔一條馬路。為了處理這種情況,亟需一種方案能夠?qū)?fù)雜地址中獨(dú)立的建筑實(shí)體拆分成不同的地址路徑進(jìn)行處理,如:從“深圳市南山區(qū)軟件大廈713科興科學(xué)園A座1-501”中分析出“深圳市南山區(qū)軟件大廈713”、“深圳市南山區(qū)科興科學(xué)園A座1-501”。

【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的在于提供一種復(fù)雜地址中多條路徑的分析方法,解決復(fù)雜地址中多條路徑的識(shí)別與拆分問(wèn)題。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明提供一種復(fù)雜地址中多條路徑的分析方法,包括:
[0006]步驟10、預(yù)先定義標(biāo)注標(biāo)簽所對(duì)應(yīng)標(biāo)注的地址詞的級(jí)別;
[0007]步驟20、對(duì)輸入地址進(jìn)行切分與標(biāo)注,切分標(biāo)注結(jié)果包括地址詞及對(duì)應(yīng)的標(biāo)注標(biāo)簽;
[0008]步驟30、初始化一新的地址路徑;初始化標(biāo)注標(biāo)簽為其他的地址詞的數(shù)量OtherNum為0,初始化上一個(gè)地址詞的級(jí)別prevLevel ;
[0009]步驟40、按序分析每個(gè)地址詞的標(biāo)注標(biāo)簽,如果為其他,則OtherNum加1,直至當(dāng)前地址詞的標(biāo)注標(biāo)簽不為其他;
[0010]步驟50、獲取當(dāng)前地址詞的級(jí)別CUrLevel,根據(jù)otherNum的值或者根據(jù)prevLevel和curLevel之間的關(guān)系判斷當(dāng)前地址詞是否是新的地址路徑的開(kāi)始;
[0011]步驟60、如果出現(xiàn)新的地址路徑,初始化一新的地址路徑并添加當(dāng)前地址詞至該新的地址路徑;
[0012]步驟70、如果未出現(xiàn)新的地址路徑,當(dāng)前地址詞添加到當(dāng)前地址路徑中;
[0013]步驟80、設(shè)置otherNum為0,返回步驟40,直至所有地址詞處理完成。
[0014]其中,所述標(biāo)注標(biāo)簽包括省、市、區(qū)、街道、社區(qū)、道路、路號(hào)、片區(qū)、樓棟、房間,還包括用于標(biāo)注用前述標(biāo)注標(biāo)簽無(wú)法標(biāo)明的地址詞的其他。
[0015]其中,用省、市、區(qū)、街道、社區(qū)標(biāo)注標(biāo)簽標(biāo)注的行政區(qū)域地址詞的級(jí)別為I級(jí),用道路、路號(hào)標(biāo)注標(biāo)簽標(biāo)注的門(mén)樓牌地址詞的級(jí)別為2級(jí),用片區(qū)標(biāo)注標(biāo)簽標(biāo)注的片區(qū)地址詞的級(jí)別為3級(jí),用樓棟標(biāo)注標(biāo)簽標(biāo)注的樓棟地址詞的級(jí)別為4級(jí),用房間標(biāo)注標(biāo)簽標(biāo)注的房間地址詞的級(jí)別為5級(jí)。
[0016]其中,步驟50中,當(dāng)otherNum大于特定值時(shí),判斷當(dāng)前地址詞是新的地址路徑的開(kāi)始。
[0017]其中,步驟50中,當(dāng)prevLevel>curLevel,但不滿足curLevel為門(mén)樓牌地址詞的級(jí)別且prevLevel為片區(qū)或樓棟地址詞的級(jí)別時(shí),判斷當(dāng)前地址詞是新的地址路徑的開(kāi)始。
[0018]其中,步驟30中初始化prevLevel為O級(jí)。
[0019]其中,步驟30還包括初始化一新的地址片段,地址片段用于存儲(chǔ)一條地址中連續(xù)、級(jí)別相同的地址詞。
[0020]其中,步驟60包括:
[0021]步驟61、如果當(dāng)前地址片段內(nèi)容不為空,則將該地址片段添加到當(dāng)前地址路徑中;
[0022]步驟62、保存當(dāng)前地址路徑,并初始化一新地址路徑;
[0023]步驟63、如果當(dāng)前地址詞不為行政區(qū)域地址詞且上一條地址路徑包含行政區(qū)域地址片段,則將上一條地址路徑中的行政區(qū)域地址片段添加至該新地址路徑中;
[0024]步驟64、初始化一新地址片段,該新地址片段的級(jí)別為curLevel且添加當(dāng)前地址詞至該新地址片段;設(shè)置prevLevel = curLevel。
[0025]其中,步驟70包括:
[0026]步驟71、如果prevLevel = curLevel或者當(dāng)前地址片段內(nèi)容為空,貝U當(dāng)前地址片段中增加當(dāng)前地址詞;
[0027]步驟72、否則將當(dāng)前地址片段增加到當(dāng)前地址路徑中,并初始化一新地址片段,該新地址片段的級(jí)別為curLevel且添加當(dāng)前地址詞至該新地址片段;設(shè)置prevLevel =curLevelο
[0028]綜上所述,本發(fā)明的復(fù)雜地址中多條路徑的分析方法能夠從復(fù)雜地址中識(shí)別與拆分出多條路徑。
【附圖說(shuō)明】
[0029]圖1為本發(fā)明復(fù)雜地址中多條路徑的分析方法的流程圖。
【具體實(shí)施方式】
[0030]下面結(jié)合附圖,通過(guò)對(duì)本發(fā)明的【具體實(shí)施方式】詳細(xì)描述,將使本發(fā)明的技術(shù)方案及其有益效果顯而易見(jiàn)。
[0031]對(duì)應(yīng)于地址的標(biāo)注標(biāo)簽,本發(fā)明定義地址如下概念:
[0032]省:由“國(guó)家地名地址數(shù)據(jù)規(guī)范”規(guī)定的一級(jí)行政區(qū)域,包含:省、直轄市、自治區(qū)、特別行政區(qū);
[0033]市:由“國(guó)家地名地址數(shù)據(jù)規(guī)范”規(guī)定的二級(jí)行政區(qū)域,包含:地級(jí)市、地區(qū)、自治州、盟;
[0034]區(qū):由“國(guó)家地名地址數(shù)據(jù)規(guī)范”規(guī)定的三級(jí)行政區(qū)域,包含:市轄區(qū)、縣級(jí)市、縣、旗、特區(qū)、林區(qū);
[0035]街道:由“國(guó)家地名地址數(shù)據(jù)規(guī)范”規(guī)定的四級(jí)行政區(qū)域,包含:區(qū)公所、鎮(zhèn)、鄉(xiāng)、蘇木、街道;
[0036]社區(qū):由“國(guó)家地名地址數(shù)據(jù)規(guī)范”規(guī)定的五級(jí)行政區(qū)域,包含:社區(qū)、居委會(huì)、行政村;
[0037]道路:道路、街、巷;
[0038]路號(hào):門(mén)牌號(hào);
[0039]片區(qū):區(qū)域性質(zhì)的地址名,通常該名稱(chēng)所代表的地址區(qū)域內(nèi)容有數(shù)棟建筑,如科技園、深南花園、下沙村等;
[0040]樓棟:建筑物名稱(chēng),通指一棟建筑,如軟件大廈、I棟、2號(hào)樓、A座等;
[0041]房間:樓棟內(nèi)的房間編號(hào),如713 ;
[0042]其他:其他內(nèi)容,用于標(biāo)注用前述標(biāo)注標(biāo)簽無(wú)法標(biāo)明的地址詞,如“與”、表示方位及位置關(guān)系的方位詞等。
[0043]在本發(fā)明一較佳實(shí)施例中,定義:
[0044]行政區(qū)域地址詞:由“國(guó)家地名地址數(shù)據(jù)規(guī)范”規(guī)定的一至五級(jí)行政區(qū)域統(tǒng)稱(chēng)為行政區(qū)域地址詞;
[0045]門(mén)樓牌地址詞:道路與路號(hào)統(tǒng)稱(chēng)為門(mén)樓牌地址詞。
[0046]并且定義各地址詞及相應(yīng)的標(biāo)注標(biāo)簽的級(jí)別如下:
[0047]行政區(qū)域地址詞:1級(jí);
[0048]門(mén)樓牌地址詞:2級(jí);
[0049]片區(qū)地址詞:3級(jí);
[0050]樓棟地址詞:4級(jí);
[0051]房間地址詞:5級(jí)。
[0052]通過(guò)這樣的定義,除門(mén)樓牌地址詞外,可以簡(jiǎn)單判定級(jí)別小的地址詞(空間上)包含級(jí)別大的地址詞。
[0053]在本發(fā)明的較佳實(shí)施例中,將標(biāo)注標(biāo)簽分為I級(jí)到5級(jí)共五個(gè)級(jí)別,以數(shù)字1-5分別表示各個(gè)級(jí)別,并且對(duì)于標(biāo)注標(biāo)簽“其他”未設(shè)定級(jí)別而是單獨(dú)列出,同時(shí)將prevLevel初始化的級(jí)別定為O級(jí),可以方便后續(xù)的地址詞關(guān)系比較,簡(jiǎn)化邏輯運(yùn)算。實(shí)際上,應(yīng)用本發(fā)明時(shí),也可根據(jù)實(shí)際情況自行設(shè)定標(biāo)簽的數(shù)量、級(jí)別(分組)及級(jí)別表示形式。
[0054]參見(jiàn)圖1,其為本發(fā)明復(fù)雜地址中多條路徑的分析方法的流程圖,主要包括:
[0055]步驟10、預(yù)先定義標(biāo)注標(biāo)簽所對(duì)應(yīng)標(biāo)注的地址詞的級(jí)別。標(biāo)注標(biāo)簽可以包括省、市、區(qū)、街道、社區(qū)、道路、路號(hào)、片區(qū)、樓棟、房間,還包括用于標(biāo)注用前述標(biāo)注標(biāo)簽無(wú)法標(biāo)明的地址詞的其他。用省、市、區(qū)、街道、社區(qū)標(biāo)注標(biāo)簽標(biāo)注的行政區(qū)域地址詞的級(jí)別為I級(jí),用道路、路號(hào)標(biāo)注標(biāo)簽標(biāo)注的門(mén)樓牌地址詞的級(jí)別為2級(jí),用片區(qū)標(biāo)注標(biāo)簽標(biāo)注的片區(qū)地址詞的級(jí)別為3級(jí),用樓棟標(biāo)注標(biāo)簽標(biāo)注的樓棟地址詞的級(jí)別為4級(jí),用房間標(biāo)注標(biāo)簽標(biāo)注的房間地址詞的級(jí)別為5級(jí)。
[0056]步驟20、對(duì)輸入地址進(jìn)行切分與標(biāo)注,切分標(biāo)注結(jié)果包括地址詞及對(duì)應(yīng)的標(biāo)注標(biāo)簽。切分與標(biāo)注可以基于隱馬爾可夫模型進(jìn)行,也可以選用其他常用的方法。如“深圳市南山區(qū)軟件大廈713科興科學(xué)園A座1-501”切分標(biāo)注的結(jié)果為:“深圳市/市,南山區(qū)/區(qū),軟件大廈/樓棟,713/房間,科興科學(xué)園/片區(qū),A座/樓棟,1-501/房間”。
[0057]步驟30、初始化一新的地址路徑;初始化標(biāo)注標(biāo)簽為其他的地址詞的數(shù)量otherNum為0,初始化上一個(gè)地址詞的級(jí)別prevLevel。新的地址路徑初始化后內(nèi)容為空;prevLevel可以初始化為O級(jí)。
[0058]在本發(fā)
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1