明的較佳實(shí)施例中,還可以初始化一新的地址片段,地址片段用于存儲(chǔ)一條地址中連續(xù)、級別相同的地址詞。新的地址片段初始化后內(nèi)容為空。本發(fā)明定義一條地址中,連續(xù)、相同級別的地址詞組成一個(gè)地址片段,一條地址路徑由一個(gè)或多個(gè)地址片段組成。通過設(shè)置地址片段,同級的連續(xù)的地址詞可以首先存入同一地址片段,同一地址片段再統(tǒng)一存入地址路徑,而不是按地址詞逐個(gè)存入,可以提高處理效率。通過設(shè)置地址片段,可以對同級的連續(xù)的地址詞整體進(jìn)行操作,還可以方便后續(xù)復(fù)制行政區(qū)域地址片段的操作。
[0059]步驟40、按序分析每個(gè)地址詞的標(biāo)注標(biāo)簽,如果為其他,則otherNum加1,直至當(dāng)前地址詞的標(biāo)注標(biāo)簽不為其他。如果為其他,則otherNum加I并繼續(xù)處理下一個(gè)地址詞。因?yàn)闃?biāo)注標(biāo)簽為其他的地址詞通常并非描述分析出的地址路徑所必需的,因此在本發(fā)明的較佳實(shí)施例中僅通過otherNum來統(tǒng)計(jì)其數(shù)量以判斷是否有新的地址路徑開始,而對這些標(biāo)注標(biāo)簽為其他的地址詞不作具體處理。當(dāng)然,根據(jù)具體情況或需求,也可以進(jìn)一步存儲(chǔ)這些地址詞以備后續(xù)使用。
[0060]步驟50、獲取當(dāng)前地址詞的級別curLevel,根據(jù)otherNum的值或者根據(jù)prevLevel和curLevel之間的關(guān)系判斷當(dāng)前地址詞是否是新的地址路徑的開始。
[0061]例如,如深圳市的標(biāo)注標(biāo)簽為“市”,屬于行政區(qū)域地址詞,所以級別為I ;科興科學(xué)園的標(biāo)注標(biāo)簽為“片區(qū)”,級別為3。通過前后地址詞的級別可以判斷當(dāng)前地址詞是否是新地址路徑的開始。
[0062]當(dāng)otherNum大于特定值時(shí),判斷當(dāng)前地址詞是新的地址路徑的開始。當(dāng)otherNum大于某特定值時(shí),例如3,可知2個(gè)地址詞之間未知內(nèi)容太多,則認(rèn)為是新地址路徑開始。
[0063]當(dāng)prevLeveDcurLeveI,但不滿足curLeveI為門樓牌地址詞的級別且prevLeveI為片區(qū)或樓棟地址詞的級別時(shí),判斷當(dāng)前地址詞是新的地址路徑的開始,也即新出現(xiàn)的地址詞級別比前一個(gè)小,判定是新地址路徑出現(xiàn),如當(dāng)前地址詞為“科興科學(xué)園/片區(qū)”時(shí),由于prevLevel為5(713/房間),而房間不能包含片區(qū),因此判定“科興科學(xué)園/片區(qū)”為新地址路徑的開始。但門樓牌地址詞有一定的特殊性,不完全符合包含關(guān)系,如村中的門樓牌地址詞描述的含義是樓棟,所以片區(qū)地址詞允許包含門樓牌地址詞;門樓牌地址詞出現(xiàn)在樓棟地址詞后面的時(shí)候通常是在描述店面,因此也是允許的。
[0064]判斷結(jié)果為是時(shí),進(jìn)行步驟60、如果出現(xiàn)新的地址路徑,初始化一新的地址路徑并添加當(dāng)前地址詞至該新的地址路徑??梢砸缘刂吩~為操作單位進(jìn)行添加。
[0065]在本發(fā)明的較佳實(shí)施例中,也可以以地址片段為單位進(jìn)行添加,此時(shí)步驟60包括:
[0066]步驟61、如果當(dāng)前地址片段內(nèi)容不為空,則將該地址片段添加到當(dāng)前地址路徑中;
[0067]步驟62、保存當(dāng)前地址路徑,并初始化一新地址路徑;
[0068]步驟63、如果當(dāng)前地址詞不為行政區(qū)域地址詞且上一條地址路徑包含行政區(qū)域地址片段,則將上一條地址路徑中的行政區(qū)域地址片段添加至該新地址路徑中;
[0069]步驟64、初始化一新地址片段,該新地址片段的級別為curLevel且添加當(dāng)前地址詞至該新地址片段;設(shè)置prevLevel = curLevel。
[0070]判斷結(jié)果為否時(shí),進(jìn)行步驟70、如果未出現(xiàn)新的地址路徑,當(dāng)前地址詞添加到當(dāng)前地址路徑中??梢砸缘刂吩~為操作單位進(jìn)行添加。
[0071]在本發(fā)明的較佳實(shí)施例中,也可以以地址片段為單位進(jìn)行添加,此時(shí)步驟70包括:步驟71、如果prevLevel = curLevel或者當(dāng)前地址片段內(nèi)容為空,則當(dāng)前地址片段中增加當(dāng)前地址詞;步驟72、否則將當(dāng)前地址片段增加到當(dāng)前地址路徑中,并初始化一新地址片段,該新地址片段的級別為curLevel且添加當(dāng)前地址詞至該新地址片段;設(shè)置prevLevel = curLevel0
[0072]步驟80、設(shè)置otherNum為0,返回步驟40,直至所有地址詞處理完成。所有地址詞處理完畢后,可獲得所有地址路徑列表。
[0073]例如“深圳市南山區(qū)軟件大廈713科興科學(xué)園A座1-501”將得到2條地址路徑:1.{[深圳市/市,南山區(qū)/區(qū)][軟件大廈/樓棟][713/房間]} ;2.{[深圳市/市,南山區(qū)/區(qū)][科興科學(xué)園/片區(qū)][A座/樓棟][1-501/房間]}。其中每個(gè)中括號內(nèi)的內(nèi)容為一地址片段。
[0074]綜上所述,本發(fā)明的復(fù)雜地址中多條路徑的分析方法能夠從復(fù)雜地址中識別與拆分出多條路徑。
[0075]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種復(fù)雜地址中多條路徑的分析方法,其特征在于,包括: 步驟10、預(yù)先定義標(biāo)注標(biāo)簽所對應(yīng)標(biāo)注的地址詞的級別; 步驟20、對輸入地址進(jìn)行切分與標(biāo)注,切分標(biāo)注結(jié)果包括地址詞及對應(yīng)的標(biāo)注標(biāo)簽;步驟30、初始化一新的地址路徑;初始化標(biāo)注標(biāo)簽為其他的地址詞的數(shù)量otherNum為0,初始化上一個(gè)地址詞的級別prevLevel ; 步驟40、按序分析每個(gè)地址詞的標(biāo)注標(biāo)簽,如果為其他,則otherNum加1,直至當(dāng)前地址詞的標(biāo)注標(biāo)簽不為其他; 步驟50、獲取當(dāng)前地址詞的級別curLevel,根據(jù)otherNum的值或者根據(jù)prevLevel和curLevel之間的關(guān)系判斷當(dāng)前地址詞是否是新的地址路徑的開始; 步驟60、如果出現(xiàn)新的地址路徑,初始化一新的地址路徑并添加當(dāng)前地址詞至該新的地址路徑; 步驟70、如果未出現(xiàn)新的地址路徑,當(dāng)前地址詞添加到當(dāng)前地址路徑中; 步驟80、設(shè)置otherNum為0,返回步驟40,直至所有地址詞處理完成。2.根據(jù)權(quán)利要求1所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,所述標(biāo)注標(biāo)簽包括省、市、區(qū)、街道、社區(qū)、道路、路號、片區(qū)、樓棟、房間,還包括用于標(biāo)注用前述標(biāo)注標(biāo)簽無法標(biāo)明的地址詞的其他。3.根據(jù)權(quán)利要求2所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,用省、市、區(qū)、街道、社區(qū)標(biāo)注標(biāo)簽標(biāo)注的行政區(qū)域地址詞的級別為I級,用道路、路號標(biāo)注標(biāo)簽標(biāo)注的門樓牌地址詞的級別為2級,用片區(qū)標(biāo)注標(biāo)簽標(biāo)注的片區(qū)地址詞的級別為3級,用樓棟標(biāo)注標(biāo)簽標(biāo)注的樓棟地址詞的級別為4級,用房間標(biāo)注標(biāo)簽標(biāo)注的房間地址詞的級別為5級。4.根據(jù)權(quán)利要求1所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,步驟50中,當(dāng)otherNum大于特定值時(shí),判斷當(dāng)前地址詞是新的地址路徑的開始。5.根據(jù)權(quán)利要求3所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,步驟50中,當(dāng)prevLeveDcurLeveI,但不滿足curLeveI為門樓牌地址詞的級別且prevLeveI為片區(qū)或樓棟地址詞的級別,判斷當(dāng)前地址詞是新的地址路徑的開始。6.根據(jù)權(quán)利要求3所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,步驟30中初始化prevLevel為O級。7.根據(jù)權(quán)利要求1所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,步驟30還包括初始化一新的地址片段,地址片段用于存儲(chǔ)一條地址中連續(xù)、級別相同的地址詞。8.根據(jù)權(quán)利要求7所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,步驟60包括: 步驟61、如果當(dāng)前地址片段內(nèi)容不為空,則將該地址片段添加到當(dāng)前地址路徑中; 步驟62、保存當(dāng)前地址路徑,并初始化一新地址路徑; 步驟63、如果當(dāng)前地址詞不為行政區(qū)域地址詞且上一條地址路徑包含行政區(qū)域地址片段,則將上一條地址路徑中的行政區(qū)域地址片段添加至該新地址路徑中; 步驟64、初始化一新地址片段,該新地址片段的級別為curLevel且添加當(dāng)前地址詞至該新地址片段;設(shè)置prevLevel = curLevel。9.根據(jù)權(quán)利要求7所述的復(fù)雜地址中多條路徑的分析方法,其特征在于,步驟70包括: 步驟71、如果prevLevel = curLevel或者當(dāng)前地址片段內(nèi)容為空,貝U當(dāng)前地址片段中增加當(dāng)前地址詞; 步驟72、否則將當(dāng)前地址片段增加到當(dāng)前地址路徑中,并初始化一新地址片段,該新地址片段的級別為curLevel且添加當(dāng)前地址詞至該新地址片段;設(shè)置prevLevel =curLevelο
【專利摘要】本發(fā)明涉及一種復(fù)雜地址中多條路徑的分析方法。該方法包括:步驟10、預(yù)先定義標(biāo)注標(biāo)簽所對應(yīng)標(biāo)注的地址詞的級別;步驟20、對輸入地址進(jìn)行切分與標(biāo)注;步驟30、初始化一新的地址路徑;初始化標(biāo)注標(biāo)簽為其他的地址詞的數(shù)量otherNum為0,初始化上一個(gè)地址詞的級別prevLevel;步驟40、按序分析每個(gè)地址詞的標(biāo)注標(biāo)簽;步驟50、獲取當(dāng)前地址詞的級別curLevel,判斷當(dāng)前地址詞是否是新的地址路徑的開始;步驟60、如果出現(xiàn)新的地址路徑,添加當(dāng)前地址詞至該新的地址路徑;步驟70、如果未出現(xiàn)新的地址路徑,當(dāng)前地址詞添加到當(dāng)前地址路徑中;步驟80、返回步驟40,直至所有地址詞處理完成。本發(fā)明的復(fù)雜地址中多條路徑的分析方法能夠從復(fù)雜地址中識別與拆分出多條路徑。
【IPC分類】G06F17/30
【公開號】CN104899296
【申請?zhí)枴緾N201510310107
【發(fā)明人】王明興, 賈西貝
【申請人】深圳市華傲數(shù)據(jù)技術(shù)有限公司
【公開日】2015年9月9日
【申請日】2015年6月8日