對(duì)poi信息進(jìn)行分類的方法、裝置和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體而言,本發(fā)明涉及對(duì)POI信息進(jìn)行分類的方法和裝置。
【背景技術(shù)】
[0002]隨著科技的發(fā)展和社會(huì)的進(jìn)步,包括電子地圖在內(nèi)的地理信息服務(wù)以其方便快捷、直觀可視化的特點(diǎn),日益受到網(wǎng)民的歡迎,并廣泛應(yīng)用于各個(gè)生活領(lǐng)域,同時(shí),各行各業(yè)對(duì)與位置相關(guān)的信息的獲取需求愈來愈強(qiáng)烈,其中,與位置相關(guān)的信息可能包括某地址處的賓館、機(jī)場(chǎng)、餐館、銀行、商場(chǎng)、醫(yī)院、公園、加油站等,此類與位置相關(guān)的地理實(shí)體信息稱為POI信息。由于此類POI信息將地理實(shí)體信息與地理位置信息相整合,因此能夠給用戶帶來極大的便捷。為了進(jìn)一步提高用戶查詢POI信息的效率,從而更好地幫助人們提高生活效率及生活質(zhì)量,需要對(duì)POI位置信息進(jìn)行分類。
[0003]現(xiàn)有技術(shù)中一般通過提取POI信息對(duì)應(yīng)的網(wǎng)頁中的文本內(nèi)容,并基于文本內(nèi)容與預(yù)定關(guān)鍵字進(jìn)行匹配來確定POI信息的分類,即現(xiàn)有的POI信息分類方式中需要對(duì)POI信息對(duì)應(yīng)的網(wǎng)頁的全文文本做切詞,隨后將切分后的大量切分片段逐一與預(yù)定關(guān)鍵字進(jìn)行匹配,如果匹配命中則該P(yáng)OI信息屬于預(yù)定關(guān)鍵字對(duì)應(yīng)的分類。
[0004]現(xiàn)有的POI信息分類方式的缺點(diǎn)主要包括:一方面,由于網(wǎng)頁文本內(nèi)容通常比較長(zhǎng),因此對(duì)網(wǎng)頁文本進(jìn)行切詞的耗時(shí)較長(zhǎng),且切詞后的得到的切分片段較多,使得關(guān)鍵字匹配次數(shù)也相應(yīng)較多,因此總體分類運(yùn)行效率較低;另一方面,POI信息對(duì)應(yīng)的網(wǎng)頁中的網(wǎng)頁文本并非所有內(nèi)容都能夠代表POI信息的種類,即并非所有文本內(nèi)容都與POI信息相關(guān),因此傳統(tǒng)分類方法中由于大量干擾信息的存在,使得分類準(zhǔn)確率偏低。
【發(fā)明內(nèi)容】
[0005]為克服上述技術(shù)問題或者至少部分地解決上述技術(shù)問題,特提出以下技術(shù)方案:
[0006]本發(fā)明的實(shí)施例提出了一種對(duì)POI信息進(jìn)行分類的方法,包括:
[0007]提取待分類POI信息的名稱信息;
[0008]對(duì)名稱信息進(jìn)行切詞處理,獲取多個(gè)切分片段;
[0009]將多個(gè)切分片段以預(yù)定匹配順序與分類關(guān)鍵詞進(jìn)行匹配;
[0010]將最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞指向的POI分類,確定為待分類POI信息的所屬分類。
[0011]本發(fā)明的實(shí)施例還提出了一種對(duì)POI信息進(jìn)行分類的裝置,其特征在于,包括:
[0012]名稱提取模塊,用于提取待分類POI信息的名稱信息;
[0013]切詞模塊,用于對(duì)名稱信息進(jìn)行切詞處理,獲取多個(gè)切分片段;
[0014]匹配模塊,用于將多個(gè)切分片段以預(yù)定匹配順序與分類關(guān)鍵詞進(jìn)行匹配;
[0015]分類確定模塊,用于將最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞指向的POI分類,確定為待分類POI信息的所屬分類
[0016]本方案的實(shí)施例中,由于僅需對(duì)待分類POI信息的名稱信息進(jìn)行切詞處理,可降低切詞所需時(shí)間;隨后將切詞得到的切分片段進(jìn)行關(guān)鍵詞匹配,基于切詞后的得到的較少切分片段,在后續(xù)進(jìn)行關(guān)鍵字匹配時(shí)匹配次數(shù)也可相應(yīng)減少,提高了 POI信息分類過程的運(yùn)行時(shí)間;同時(shí),由于名稱信息與POI信息具有高相關(guān)性,使得基于名稱信息確定的分類準(zhǔn)確性較高,從整體上提高了 POI信息分類的效率。
[0017]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0018]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0019]圖1為本發(fā)明中對(duì)POI信息進(jìn)行分類的方法一個(gè)實(shí)施例的流程圖;
[0020]圖2為本發(fā)明中對(duì)POI信息進(jìn)行分類的裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對(duì)本發(fā)明的限制。
[0022]本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個(gè)”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進(jìn)一步理解的是,本發(fā)明的說明書中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。應(yīng)該理解,當(dāng)我們稱元件被“連接”或“耦接”到另一元件時(shí),它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無線連接或無線耦接。這里使用的措辭“和/或”包括一個(gè)或更多個(gè)相關(guān)聯(lián)的列出項(xiàng)的全部或任一單元和全部組合。
[0023]本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(包括技術(shù)術(shù)語和科學(xué)術(shù)語),具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語,應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣被特定定義,否則不會(huì)用理想化或過于正式的含義來解釋。
[0024]圖1為本發(fā)明中對(duì)POI信息進(jìn)行分類的方法一個(gè)實(shí)施例的流程圖。
[0025]步驟SllO:提取待分類POI信息的名稱信息;步驟S120:對(duì)名稱信息進(jìn)行切詞處理,獲取多個(gè)切分片段;步驟S130:將多個(gè)切分片段以預(yù)定匹配順序與分類關(guān)鍵詞進(jìn)行匹配;步驟S140:將最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞指向的POI分類,確定為待分類POI信息的所屬分類。
[0026]本方案的實(shí)施例中,由于僅需對(duì)待分類POI信息的名稱信息進(jìn)行切詞處理,可降低切詞所需時(shí)間;隨后將切詞得到的切分片段進(jìn)行關(guān)鍵詞匹配,基于切詞后的得到的較少切分片段,在后續(xù)進(jìn)行關(guān)鍵字匹配時(shí)匹配次數(shù)也可相應(yīng)減少,提高了 POI信息分類過程的運(yùn)行時(shí)間;同時(shí),由于名稱信息與POI信息具有高相關(guān)性,使得基于名稱信息確定的分類準(zhǔn)確性較高,從整體上提高了 POI信息分類的效率。
[0027]步驟SllO:提取待分類POI信息的名稱信息。
[0028]其中,POI信息中包括但不限于名稱信息、地址信息、經(jīng)瑋度、聯(lián)系方式等。
[0029]例如,一條待分類POI信息為“陜西西安灞橋席王新寺路569號(hào)第四軍醫(yī)大學(xué)唐都醫(yī)院”,基于預(yù)先標(biāo)記的名稱標(biāo)識(shí)或基于字符串匹配等方式,從該條待分類POI信息中提取名稱信息為“第四軍醫(yī)大學(xué)唐都醫(yī)院”。
[0030]步驟S120:對(duì)名稱信息進(jìn)行切詞處理,獲取多個(gè)切分片段。
[0031]具體地,以逆向切分方式對(duì)名稱信息進(jìn)行切詞處理,獲取多個(gè)切分片段;其中,逆向切分方式包括最大逆向匹配法、最小逆向匹配法等。
[0032]例如,接上例,對(duì)名稱信息“第四軍醫(yī)大學(xué)唐都醫(yī)院”進(jìn)行切詞處理,切詞后獲取多個(gè)切分片段包括第四”、“軍醫(yī)”、“大學(xué)”、“唐都”和“醫(yī)院”。
[0033]步驟S130:將多個(gè)切分片段以預(yù)定匹配順序與分類關(guān)鍵詞進(jìn)行匹配。
[0034]具體地,將多個(gè)切分片段以其在名稱信息中的逆向出現(xiàn)順序依次與分類關(guān)鍵詞進(jìn)行匹配。
[0035]例如,多個(gè)切分片段分別為“第四”、“軍醫(yī)”、“大學(xué)”、“唐都”和“醫(yī)院”,該五個(gè)且切分片段在名稱信息“第四軍醫(yī)大學(xué)唐都醫(yī)院”中的逆向出現(xiàn)順序依次為“醫(yī)院”為逆向第一排序、“唐都”為逆向第二排序、“大學(xué)”為逆向第三排序、“軍醫(yī)”為逆向第四排序、“第四”為逆向第五排序;將該五個(gè)且切分片段按照逆向出現(xiàn)順序依次與分類關(guān)鍵詞進(jìn)行匹配,即首先使用切分片段“醫(yī)院”與分類關(guān)鍵詞進(jìn)行匹配。
[0036]步驟S140:將最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞指向的POI分類,確定為待分類POI信息的所屬分類。
[0037]例如,接上例,若使用切分片段“醫(yī)院”與分類關(guān)鍵詞“醫(yī)院”匹配成功時(shí),確定待分類POI信息的所屬分類為“醫(yī)院”;若使用“醫(yī)院”匹配不成功,則繼續(xù)按照逆向出現(xiàn)順序依次進(jìn)行匹配,即使用“唐都”進(jìn)行匹配,直至將最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞指向的POI分類,確定為待分類POI信息的所屬分類。
[0038]優(yōu)選地,POI信息的所屬分類包括至少一個(gè)等級(jí);當(dāng)包括多個(gè)等級(jí)時(shí),上級(jí)分類包括多個(gè)下級(jí)分類。
[0039]更優(yōu)選地(參照?qǐng)D1),步驟S140包括步驟S141 (圖中未示出)和步驟S142 (圖中未示出);步驟S141:當(dāng)最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞所在的POI分類為下級(jí)分類時(shí),提取該下級(jí)分類對(duì)應(yīng)的上級(jí)分類;步驟S142:將上級(jí)分類及下級(jí)分類確定為待分類POI信息的所屬分類。
[0040]例如,POI信息所屬分類包括兩個(gè)等級(jí),上級(jí)分類為“醫(yī)療”,其包括的下級(jí)分類包括“醫(yī)院”、“診所”、“藥店”、“急救中心”等。接前例,最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞“醫(yī)院”所在的POI分類為下級(jí)分類,提取該下級(jí)分類“醫(yī)院”對(duì)應(yīng)的上級(jí)分類“醫(yī)療”;將上級(jí)分類及下級(jí)分類確定為待分類POI信息的所屬分類,即該待分類POI信息的所屬分類為“醫(yī)療-醫(yī)院”。
[0041]圖2為本發(fā)明中對(duì)POI信息進(jìn)行分類的裝置一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
[0042]名稱提取模塊210提取待分類POI信息的名稱信息;切詞模塊220對(duì)名稱信息進(jìn)行切詞處理,獲取多個(gè)切分片段;匹配模塊230將多個(gè)切分片段以預(yù)定匹配順序與分類關(guān)鍵詞進(jìn)行匹配;分類確定模塊240將最先匹配成功的切分片段對(duì)應(yīng)的分類關(guān)鍵詞指向的POI分類,確定為待分類POI信息的所屬分類。