本發(fā)明涉及地理信息處理
技術(shù)領(lǐng)域:
,尤其涉及一種興趣點(diǎn)的標(biāo)注方法以及裝置。
背景技術(shù):
:興趣點(diǎn)(POI,PointOfInterest)是地理信息系統(tǒng)中的一個(gè)術(shù)語(yǔ),泛指一切可以抽象為點(diǎn)的地理對(duì)象,尤其是一些與人們生活密切相關(guān)的地理實(shí)體,如學(xué)校、銀行、餐館、加油站、醫(yī)院、超市等。興趣點(diǎn)的主要用途是對(duì)事物或事件的地址進(jìn)行描述,能在很大程度上增強(qiáng)對(duì)事物或事件位置的描述能力和查詢(xún)能力,提高地理定位的精度和速度。相關(guān)技術(shù)中,興趣點(diǎn)的采集方法通常是由數(shù)據(jù)提供商通過(guò)采集人員攜帶相關(guān)設(shè)備直接進(jìn)行外業(yè)采集,之后將采集到的數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)處理后提供給需求方。但是,目前存在的問(wèn)題是,通過(guò)上述這種人工外業(yè)采集的方式,往往需要數(shù)月才能更新地圖中的POI數(shù)據(jù),顯然無(wú)法滿(mǎn)足實(shí)時(shí)性需求,并且,通過(guò)人工進(jìn)行大規(guī)模的外業(yè)數(shù)據(jù)采集,會(huì)導(dǎo)致采集成本高、效率低。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問(wèn)題之一。為此,本發(fā)明的第一個(gè)目的在于提出一種興趣點(diǎn)的標(biāo)注方法。該方法利用用戶(hù)上傳的海量的POI的位置及屬性信息,快速準(zhǔn)確地挖掘出POI點(diǎn),節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。本發(fā)明的第二個(gè)目的在于提出一種興趣點(diǎn)的標(biāo)注裝置。為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的興趣點(diǎn)的標(biāo)注方法,包括:接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù);采用聚類(lèi)算法將所述多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域;分別將所述多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集;根據(jù)所述多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注方法,可接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù),并采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域,并分別將多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集,最后,根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。即通過(guò)接收用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù),并將用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù)進(jìn)行二次聚類(lèi),最終根據(jù)二次聚類(lèi)后的結(jié)果實(shí)現(xiàn)對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注,這種方式可以快速準(zhǔn)確地挖掘POI點(diǎn),節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。本發(fā)明的第二個(gè)目的在于提出一種興趣點(diǎn)的標(biāo)注裝置,包括:接收模塊,用于接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù);第一聚類(lèi)模塊,用于采用聚類(lèi)算法將所述多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域;第二聚類(lèi)模塊,用于分別將所述多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集;標(biāo)注模塊,用于根據(jù)所述多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注裝置,可通過(guò)接收模塊接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù),第一聚類(lèi)模塊采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域,第二聚類(lèi)模塊分別將多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集,標(biāo)注模塊根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。即通過(guò)接收用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù),并將用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù)進(jìn)行二次聚類(lèi),最終根據(jù)二次聚類(lèi)后的結(jié)果實(shí)現(xiàn)對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注,這種方式可以快速準(zhǔn)確地挖掘POI點(diǎn),節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。附圖說(shuō)明本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的興趣點(diǎn)的標(biāo)注方法的流程圖;圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的Geo哈希字符串標(biāo)識(shí)位置區(qū)域的示意圖;圖3是根據(jù)本發(fā)明一個(gè)具體實(shí)施例的興趣點(diǎn)的標(biāo)注方法的流程圖;圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的興趣點(diǎn)的標(biāo)注裝置的結(jié)構(gòu)示意圖;圖5是根據(jù)本發(fā)明一個(gè)具體實(shí)施例的興趣點(diǎn)的標(biāo)注裝置的結(jié)構(gòu)示意圖;圖6是根據(jù)本發(fā)明另一個(gè)具體實(shí)施例的興趣點(diǎn)的標(biāo)注裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。下面參考附圖描述本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注方法以及裝置。圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的興趣點(diǎn)的標(biāo)注方法的流程圖。需要說(shuō)明的是,本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注方法可應(yīng)用于本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注裝置,該標(biāo)注裝置可被配置于具有地圖功能的大數(shù)據(jù)平臺(tái)或云存儲(chǔ)平臺(tái)。該大數(shù)據(jù)平臺(tái)或云存儲(chǔ)平臺(tái)可利用本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注方法,對(duì)其為用戶(hù)提供的地圖應(yīng)用程序中的POI數(shù)據(jù)進(jìn)行更新,即對(duì)地圖應(yīng)用程序中的存在有效興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注,以實(shí)現(xiàn)對(duì)地圖應(yīng)用程序中地圖的更新。如圖1所示,該興趣點(diǎn)的標(biāo)注方法可以包括:S110,接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù)??梢岳斫猓瑸榱四軌蚴占罅坑脩?hù)上傳的興趣點(diǎn)數(shù)據(jù),作為一種示例,可預(yù)先為用戶(hù)提供上傳界面,該上傳界面可用于接收用戶(hù)填寫(xiě)的興趣點(diǎn)數(shù)據(jù),并在接收到用戶(hù)的確認(rèn)上傳指令時(shí),將用戶(hù)填寫(xiě)的興趣點(diǎn)數(shù)據(jù)進(jìn)行上傳。其中,該興趣點(diǎn)數(shù)據(jù)可包括但不限于興趣點(diǎn)的名稱(chēng)、興趣點(diǎn)的經(jīng)緯度信息等。這樣,大量的用戶(hù)可通過(guò)該上傳界面將自己了解的興趣點(diǎn)數(shù)據(jù)進(jìn)行上傳,以幫助后續(xù)根據(jù)用戶(hù)上傳的興趣點(diǎn)數(shù)據(jù)對(duì)存在有效興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。作為一種示例,可通過(guò)上述上傳界面實(shí)時(shí)接收大量用戶(hù)上傳的多個(gè)興趣點(diǎn)POI信息以及對(duì)應(yīng)的經(jīng)緯度信息。S120,采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域。作為一種示例,該位置信息可為經(jīng)緯度信息。具體地,可采用聚類(lèi)算法將用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù)按照經(jīng)緯度等位置信息進(jìn)行一次聚類(lèi)之后,可以將地理范圍分為多個(gè)區(qū)域,將位置相近的興趣點(diǎn)聚為一類(lèi),這些同類(lèi)的興趣點(diǎn)共享一個(gè)位置區(qū)域,其中,該聚類(lèi)算法可包括Geo哈希算法等。舉例而言,可采用Geo哈希算法將一定地理范圍內(nèi)的興趣點(diǎn)的經(jīng)度、緯度轉(zhuǎn)換為對(duì)應(yīng)的字符串,每個(gè)字符串不是代表一個(gè)點(diǎn),而是代表了一個(gè)矩形區(qū)域,這個(gè)矩形區(qū)域內(nèi)的所有點(diǎn)都享有共同的Geo哈希位置信息。例如,如圖2所示,采用Geo哈希算法可將一定范圍內(nèi)的經(jīng)緯度點(diǎn)聚合到一起,其中,如圖2所示的字符串,即為該矩形區(qū)域內(nèi)的所有興趣點(diǎn)共同享有的Geo哈希位置信息。這樣,采用Geo哈希算法可將用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行聚類(lèi),得到多個(gè)聚類(lèi)區(qū)域,每個(gè)聚類(lèi)區(qū)域都有對(duì)應(yīng)的字符串進(jìn)行表示。也就是說(shuō),可根據(jù)多個(gè)興趣點(diǎn)數(shù)據(jù)中的經(jīng)緯度信息,分別給每個(gè)興趣點(diǎn)編碼設(shè)置一個(gè)Geo哈希字符串,Geo哈希字符串標(biāo)識(shí)對(duì)應(yīng)興趣點(diǎn)數(shù)據(jù)的位置,然后,根據(jù)各個(gè)興趣點(diǎn)的Geo哈希字符串,采用Geo哈希算法將各個(gè)興趣點(diǎn)進(jìn)行聚類(lèi)。作為一種示例,假設(shè)一個(gè)興趣點(diǎn)數(shù)據(jù)中的經(jīng)緯度分別為116.389550和39.928167,則對(duì)經(jīng)緯度進(jìn)行Geo哈希編碼的過(guò)程如下:地球緯度區(qū)間是[-90,90],可以通過(guò)下面算法對(duì)緯度39.928167進(jìn)行逼近編碼:(1)將區(qū)間[-90,90]分為[-90,0)和[0,90],稱(chēng)為左右區(qū)間,可以確定39.928167屬于右區(qū)間[0,90],給標(biāo)記為1;(2)接著將區(qū)間[0,90]進(jìn)行二分為[0,45),[45,90],可以確定39.928167屬于左區(qū)間[0,45),給標(biāo)記為0;(3)遞歸上述過(guò)程,39.928167總是屬于某個(gè)區(qū)間[a,b]。隨著每次迭代區(qū)間[a,b]總在縮小,并越來(lái)越逼近39.928167;(4)如果給定的緯度x(39.928167)屬于左區(qū)間,則記錄0,如果屬于右區(qū)間則記錄1。這樣隨著算法的進(jìn)行會(huì)產(chǎn)生一個(gè)序列1011100011,該序列即為根據(jù)緯度得到的編碼,其中,序列的長(zhǎng)度與給定的區(qū)間劃分次數(shù)有關(guān);同理,地球的經(jīng)度區(qū)間是[-180,180],對(duì)經(jīng)度116.389550進(jìn)行編碼得到的編碼為1101001011。將偶數(shù)位放經(jīng)度,奇數(shù)為放緯度,組合成新編碼為11100111010010001111。然后再將編碼轉(zhuǎn)換為十進(jìn)制的數(shù)字,由于5位編碼對(duì)應(yīng)一個(gè)十進(jìn)制的數(shù)字,轉(zhuǎn)換的十進(jìn)制范圍為0-31。上面的編碼對(duì)應(yīng)的十進(jìn)制數(shù)位28、29、4、15,最后按照十進(jìn)制與Base32的對(duì)應(yīng)關(guān)系,將十進(jìn)制數(shù)轉(zhuǎn)換成字符串,也即是哈希字符串,在本示例中,使用的哈希字符串的長(zhǎng)度為4,經(jīng)緯度對(duì)應(yīng)的字符串為WX4G??梢岳斫猓珿eo哈希算法中Geo哈希字符串的長(zhǎng)度與表示的經(jīng)緯度范圍經(jīng)度具有對(duì)應(yīng)關(guān)系,該對(duì)應(yīng)關(guān)系如下表1所示:表1Lengthlaterrorlngerrorkmerror12323250022.85.663030.700.77840.0870.182050.0220.0222.460.00270.00550.6170.000680.000680.07680.0000850.000170.019為了兼顧精準(zhǔn)度與采集的興趣點(diǎn)POI數(shù)據(jù)的粒度,作為一種示例,采用Geo哈希算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi)時(shí),采用的Geo哈希字符串的長(zhǎng)度可為7。也就是說(shuō),在采用Geo哈希算法對(duì)多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行聚類(lèi)時(shí),可選擇Geo哈希字符串的長(zhǎng)度為7,這樣,可以將面積為76*68地理范圍內(nèi)的POI點(diǎn)會(huì)聚集到一個(gè)聚類(lèi)區(qū)域中。S130,分別將多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集。具體地,在將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi)以生成多個(gè)聚類(lèi)區(qū)域之后,可分別對(duì)生成的每一個(gè)聚類(lèi)區(qū)域,按照POI名稱(chēng)的編輯距離相似性進(jìn)行二次聚類(lèi),以得到對(duì)應(yīng)的聚類(lèi)結(jié)果集。也就是說(shuō),在對(duì)多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi)之后,再按照POI名稱(chēng)將第一次聚類(lèi)后的興趣點(diǎn)進(jìn)行第二次聚類(lèi),以使得將編輯距離相似的POI名稱(chēng)所對(duì)應(yīng)的興趣點(diǎn)聚為一類(lèi)。S140,根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。具體而言,在本發(fā)明的一個(gè)實(shí)施例中,針對(duì)每個(gè)聚類(lèi)結(jié)果集,判斷每個(gè)聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù)是否大于或等于第二閾值,如果每個(gè)聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù)大于或等于第二閾值,則判定每個(gè)聚類(lèi)結(jié)果集中存在有效興趣點(diǎn),并從每個(gè)聚類(lèi)結(jié)果集中的興趣點(diǎn)數(shù)據(jù)中,隨機(jī)選取經(jīng)緯度信息,并將該隨機(jī)選取的經(jīng)緯度信息作為該存在有效興趣點(diǎn)的位置區(qū)域的坐標(biāo)。更具體地,針對(duì)每個(gè)聚類(lèi)結(jié)果集,可先統(tǒng)計(jì)該聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù),并判斷該個(gè)數(shù)是否大于或等于第二閾值,若是,則可判定該聚類(lèi)結(jié)果集中存在有效興趣點(diǎn),即可認(rèn)為此類(lèi)POI是可靠的興趣點(diǎn),此時(shí)可從該聚類(lèi)結(jié)果集中的興趣點(diǎn)數(shù)據(jù)中,隨機(jī)選取一個(gè)經(jīng)緯度信息,并將該隨機(jī)選取的經(jīng)緯度信息作為該存在有效興趣點(diǎn)的位置區(qū)域的坐標(biāo)。由此,實(shí)現(xiàn)了對(duì)該位置區(qū)域進(jìn)行興趣點(diǎn)的標(biāo)注。其中,在本發(fā)明的實(shí)施例中,該第二閾值可為315,該第二閾值可為預(yù)先通過(guò)大量試驗(yàn)而得到的標(biāo)定值。本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注方法,可接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù),并采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域,并分別將多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集,最后,根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。即通過(guò)接收用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù),并將用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù)進(jìn)行二次聚類(lèi),最終根據(jù)二次聚類(lèi)后的結(jié)果實(shí)現(xiàn)對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注,這種方式可以快速準(zhǔn)確地挖掘POI點(diǎn),節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。圖3是根據(jù)本發(fā)明一個(gè)具體實(shí)施例的興趣點(diǎn)的標(biāo)注方法的流程圖。為了兼顧興趣點(diǎn)標(biāo)注的準(zhǔn)確率,以及提高興趣點(diǎn)的召回率,可按照POI名稱(chēng)的編輯距離相似性對(duì)聚類(lèi)區(qū)域中的興趣點(diǎn)進(jìn)行二次聚類(lèi),并將兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性與第一閾值進(jìn)行比對(duì),并將編輯距離相似性大于第一閾值的名稱(chēng)所對(duì)應(yīng)的興趣點(diǎn)聚為一類(lèi)。具體地,如圖3所示,該興趣點(diǎn)的標(biāo)注方法可以包括:S310,接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù)。S320,采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域。作為一種示例,該位置信息可為經(jīng)緯度信息。具體地,可采用聚類(lèi)算法將用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù)按照經(jīng)緯度等位置信息進(jìn)行一次聚類(lèi)之后,可以將地理范圍分為多個(gè)區(qū)域,將位置相近的興趣點(diǎn)聚為一類(lèi),這些同類(lèi)的興趣點(diǎn)共享一個(gè)位置區(qū)域,其中,該聚類(lèi)算法可包括Geo哈希算法等。舉例而言,可采用Geo哈希算法將一定地理范圍內(nèi)的興趣點(diǎn)的經(jīng)度、緯度轉(zhuǎn)換為對(duì)應(yīng)的字符串,每個(gè)字符串不是代表一個(gè)點(diǎn),而是代表了一個(gè)矩形區(qū)域,這個(gè)矩形區(qū)域內(nèi)的所有點(diǎn)都享有共同的Geo哈希位置信息。例如,如圖2所示,采用Geo哈希算法可將一定范圍內(nèi)的經(jīng)緯度點(diǎn)聚合到一起,其中,如圖2所示的字符串,即為該矩形區(qū)域內(nèi)的所有興趣點(diǎn)共同享有的Geo哈希位置信息。這樣,采用Geo哈希算法可將用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行聚類(lèi),得到多個(gè)聚類(lèi)區(qū)域,每個(gè)聚類(lèi)區(qū)域都有對(duì)應(yīng)的字符串進(jìn)行表示。S330,針對(duì)每個(gè)聚類(lèi)區(qū)域,計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性。具體而言,在本發(fā)明的一個(gè)實(shí)施例中,針對(duì)每個(gè)聚類(lèi)區(qū)域,可計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離,并根據(jù)兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)的字符總數(shù)、以及編輯距離,計(jì)算兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性。更具體地,計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離,并根據(jù)兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)的字符總數(shù)、以及編輯距離,計(jì)算兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)的相同字符個(gè)數(shù),并根據(jù)兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)的相同字符個(gè)數(shù)、以及字符總數(shù),計(jì)算兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性。例如,假設(shè)聚類(lèi)區(qū)域中有興趣點(diǎn)A和興趣點(diǎn)B,興趣點(diǎn)A的名稱(chēng)為“中國(guó)”,興趣點(diǎn)B的名稱(chēng)為“中國(guó)人”,則興趣點(diǎn)A與興趣點(diǎn)B的名稱(chēng)的編輯距離為1,其中,興趣點(diǎn)A與B的字符總數(shù)為5,則興趣點(diǎn)A與興趣點(diǎn)B中名稱(chēng)的相同字符個(gè)數(shù)為4,最后,可計(jì)算出興趣點(diǎn)A和興趣點(diǎn)B名稱(chēng)之間的編輯距離相似性為4/5。S340,將編輯距離相似性大于第一閾值的名稱(chēng)所對(duì)應(yīng)的興趣點(diǎn)進(jìn)行聚類(lèi),生成對(duì)應(yīng)的聚類(lèi)結(jié)果集。作為一種示例,該第一閾值可為0.9。具體地,在計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性之后,可將得到的編輯距離相似性與第一閾值進(jìn)行大小比對(duì),并將編輯距離相似性大于該第一閾值的名稱(chēng)所對(duì)應(yīng)的興趣點(diǎn)進(jìn)行聚類(lèi),最后得到每個(gè)聚類(lèi)區(qū)域?qū)?yīng)的聚類(lèi)結(jié)果集。也就是說(shuō),在按照POI名稱(chēng)的編輯距離相似性對(duì)每個(gè)聚類(lèi)區(qū)域進(jìn)行二次聚類(lèi)時(shí),可將聚類(lèi)區(qū)域中POI名稱(chēng)的編輯距離相似性大于第一閾值的興趣點(diǎn)聚為一類(lèi)。S350,根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。具體而言,在本發(fā)明的一個(gè)實(shí)施例中,針對(duì)每個(gè)聚類(lèi)結(jié)果集,判斷每個(gè)聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù)是否大于或等于第二閾值,如果每個(gè)聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù)大于或等于第二閾值,則判定每個(gè)聚類(lèi)結(jié)果集中存在有效興趣點(diǎn),并從每個(gè)聚類(lèi)結(jié)果集中的興趣點(diǎn)數(shù)據(jù)中,隨機(jī)選取經(jīng)緯度信息,并將該隨機(jī)選取的經(jīng)緯度信息作為該存在有效興趣點(diǎn)的位置區(qū)域的坐標(biāo)。本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注方法,可按照POI名稱(chēng)的編輯距離相似性對(duì)聚類(lèi)區(qū)域中的興趣點(diǎn)進(jìn)行二次聚類(lèi),并將兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性與第一閾值進(jìn)行比對(duì),并將編輯距離相似性大于第一閾值的名稱(chēng)所對(duì)應(yīng)的興趣點(diǎn)聚為一類(lèi),這樣,不僅可以兼顧興趣點(diǎn)標(biāo)注的準(zhǔn)確率,還可以提高興趣點(diǎn)的召回率。與上述幾種實(shí)施例提供的興趣點(diǎn)的標(biāo)注方法相對(duì)應(yīng),本發(fā)明的一種實(shí)施例還提供一種興趣點(diǎn)的標(biāo)注裝置,由于本發(fā)明實(shí)施例提供的興趣點(diǎn)的標(biāo)注裝置與上述幾種實(shí)施例提供的興趣點(diǎn)的標(biāo)注方法相對(duì)應(yīng),因此在前述興趣點(diǎn)的標(biāo)注方法的實(shí)施方式也適用于本實(shí)施例提供的興趣點(diǎn)的標(biāo)注裝置,在本實(shí)施例中不再詳細(xì)描述。圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的興趣點(diǎn)的標(biāo)注裝置的結(jié)構(gòu)示意圖。如圖4所示,該興趣點(diǎn)的標(biāo)注裝置可以包括:接收模塊410、第一聚類(lèi)模塊420、第二聚類(lèi)模塊430和標(biāo)注模塊440。具體地,接收模塊410用于接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù)。第一聚類(lèi)模塊420用于采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域。其中,在本發(fā)明的實(shí)施例中,該聚類(lèi)算法可為Geo哈希算法,該位置信息可為經(jīng)緯度信息。作為一種示例,第一聚類(lèi)模塊420采用Geo哈希算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi)時(shí),采用的Geo哈希字符串的長(zhǎng)度為7。第二聚類(lèi)模塊430用于分別將多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集。具體而言,在本發(fā)明的一個(gè)實(shí)施例中,如圖5所示,該第二聚類(lèi)模塊430可包括:計(jì)算單元431和聚類(lèi)單元432。其中,計(jì)算單元431用于針對(duì)每個(gè)聚類(lèi)區(qū)域,計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性。聚類(lèi)單元432用于將編輯距離相似性大于第一閾值的名稱(chēng)所對(duì)應(yīng)的興趣點(diǎn)進(jìn)行聚類(lèi),生成對(duì)應(yīng)的聚類(lèi)結(jié)果集。具體而言,在本發(fā)明的一個(gè)實(shí)施例中,計(jì)算單元431計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性的具體實(shí)現(xiàn)過(guò)程可如下:計(jì)算每個(gè)聚類(lèi)區(qū)域中的兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離;根據(jù)兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)的字符總數(shù)、以及編輯距離,計(jì)算兩兩興趣點(diǎn)數(shù)據(jù)中名稱(chēng)之間的編輯距離相似性。標(biāo)注模塊440用于根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。具體而言,在本發(fā)明的一個(gè)實(shí)施例中,如圖6所示,該標(biāo)注模塊440可以包括:判斷單元441、判定單元442和標(biāo)注單元443。其中,判斷單元441用于針對(duì)每個(gè)聚類(lèi)結(jié)果集,判斷每個(gè)聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù)是否大于或等于第二閾值。判定單元442用于在每個(gè)聚類(lèi)結(jié)果集中興趣點(diǎn)的個(gè)數(shù)大于或等于第二閾值時(shí),判定每個(gè)聚類(lèi)結(jié)果集中存在有效興趣點(diǎn)。標(biāo)注單元443用于從每個(gè)聚類(lèi)結(jié)果集中的興趣點(diǎn)數(shù)據(jù)中,隨機(jī)選取經(jīng)緯度信息,并將隨機(jī)選取的經(jīng)緯度信息作為存在有效興趣點(diǎn)的位置區(qū)域的坐標(biāo)。本發(fā)明實(shí)施例的興趣點(diǎn)的標(biāo)注裝置,可通過(guò)接收模塊接收多個(gè)用戶(hù)上傳的多個(gè)興趣點(diǎn)數(shù)據(jù),第一聚類(lèi)模塊采用聚類(lèi)算法將多個(gè)興趣點(diǎn)數(shù)據(jù)按照位置信息進(jìn)行一次聚類(lèi),生成多個(gè)聚類(lèi)區(qū)域,第二聚類(lèi)模塊分別將多個(gè)聚類(lèi)區(qū)域按照興趣點(diǎn)的名稱(chēng)進(jìn)行二次聚類(lèi),生成多個(gè)聚類(lèi)結(jié)果集,標(biāo)注模塊根據(jù)多個(gè)聚類(lèi)結(jié)果集對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注。即通過(guò)接收用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù),并將用戶(hù)上傳的大量興趣點(diǎn)數(shù)據(jù)進(jìn)行二次聚類(lèi),最終根據(jù)二次聚類(lèi)后的結(jié)果實(shí)現(xiàn)對(duì)存在興趣點(diǎn)的位置區(qū)域進(jìn)行標(biāo)注,這種方式可以快速準(zhǔn)確地挖掘POI點(diǎn),節(jié)省了人力物力成本,提高了POI更新速度,提高了POI標(biāo)注效率。在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書(shū)中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。當(dāng)前第1頁(yè)1 2 3