6] 例如,將η設(shè)置為8,將表一中聯(lián)系方式比較,表一中5個(gè)POI的數(shù)據(jù)的聯(lián)系方式 相同,都為"82589332"。因此,將5個(gè)POI數(shù)據(jù)"ΑΑ火鍋"、"ΑΑ(巴溝店)"、"ΑΑ火鍋(巴溝 店)"AA火鍋(萬(wàn)柳華聯(lián)分店)"AA (萬(wàn)柳店)"判定為相同POI數(shù)據(jù)。
[0057] 在步驟S130中,從相同POI數(shù)據(jù)中選擇一個(gè)或多個(gè)POI數(shù)據(jù)進(jìn)行保留,從數(shù)據(jù)庫(kù) 中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。
[0058] 在實(shí)施例一中,所述從相同POI數(shù)據(jù)中選擇一個(gè)或多個(gè)POI數(shù)據(jù)進(jìn)行保留,進(jìn)一步 包括:按對(duì)應(yīng)時(shí)間從新到舊的順序從相同POI數(shù)據(jù)中選擇一個(gè)或多個(gè)POI數(shù)據(jù)進(jìn)行保留。
[0059] 例如,各個(gè)POI具有對(duì)應(yīng)的獲取時(shí)間,按對(duì)應(yīng)的獲取時(shí)間從新到舊的順序,將相同 POI數(shù)據(jù)排序。按配置從相同POI數(shù)據(jù)中選擇m個(gè)POI數(shù)據(jù),m為配置的正整數(shù),將選擇的 m個(gè)POI數(shù)據(jù)保留,從數(shù)據(jù)庫(kù)中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。
[0060] 在本實(shí)施例中,根據(jù)本發(fā)明的技術(shù)方案可以將各個(gè)POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn) 行比較;將比較結(jié)果符合相同標(biāo)準(zhǔn)的POI數(shù)據(jù)判定為相同POI數(shù)據(jù);從相同POI數(shù)據(jù)中選 擇一個(gè)或多個(gè)POI數(shù)據(jù)進(jìn)行保留,從數(shù)據(jù)庫(kù)中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。 由此解決了地圖中POI數(shù)據(jù)中的重復(fù)數(shù)據(jù)過(guò)多的問(wèn)題,取得了去除POI中重復(fù)數(shù)據(jù),節(jié)約存 儲(chǔ)空間和數(shù)據(jù)維護(hù)成本的有益效果。并且,在聯(lián)系方式包括電話號(hào)碼時(shí),對(duì)數(shù)字進(jìn)行比較, 而不需要對(duì)字符串相似度進(jìn)行比較,使得POI去重操作更加容易實(shí)施,提高了操作效率。
[0061] 在一實(shí)施例中,所述POI數(shù)據(jù)中包括地理位置信息;如圖2所示,所述方法還包 括:
[0062] 在步驟S210中,在將各個(gè)POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn)行比較前,將各個(gè)POI數(shù) 據(jù)中的地理位置信息進(jìn)行比較。
[0063] 在步驟S220中,將地理位置信息相同的POI數(shù)據(jù)確定為同一地址下的POI數(shù)據(jù)。
[0064] 所述將各個(gè)POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn)行比較,進(jìn)一步包括:將同一地址下的 POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn)行比較。
[0065] 其中,所述地理位置信息包括:經(jīng)煒度信息。
[0066] 例如,將表一中各個(gè)POI數(shù)據(jù)的經(jīng)煒度信息進(jìn)行比較,其中5個(gè)POI數(shù)據(jù)的經(jīng)煒度 都為"東經(jīng):116. 294712,北煒:39. 9731761",5個(gè)POI數(shù)據(jù)的經(jīng)煒度相同,將5個(gè)POI數(shù)據(jù) 確定為同一地址下的POI數(shù)據(jù)。將表一中同一地址下的5個(gè)POI數(shù)據(jù)的聯(lián)系方式進(jìn)行比較, 5個(gè)POI數(shù)據(jù)的聯(lián)系方式的后8位相同,將5個(gè)POI數(shù)據(jù)判定為相同的POI。表一中5個(gè) POI具有對(duì)應(yīng)的獲取時(shí)間,按對(duì)應(yīng)的獲取時(shí)間從新到舊的順序,將相同POI數(shù)據(jù)排序。按配 置從相同POI數(shù)據(jù)中選擇m個(gè)POI數(shù)據(jù),m為配置的正整數(shù),將選擇的m個(gè)POI數(shù)據(jù)保留, 從數(shù)據(jù)庫(kù)中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。
[0067] 在本實(shí)施例中,在將POI數(shù)據(jù)的聯(lián)系方式進(jìn)行比較前,進(jìn)行地理位置信息比較,當(dāng) 判定POI數(shù)據(jù)在同一地址下后,再進(jìn)行POI數(shù)據(jù)的聯(lián)系方式比較。例如,在地址相同的前提 下利用電話信息去重POI數(shù)據(jù),將漢字字符串相似度計(jì)算轉(zhuǎn)換為數(shù)字字符串是否相同的比 較。如此,進(jìn)一步增加重復(fù)POI數(shù)據(jù)判斷的準(zhǔn)確性。
[0068] 圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的地圖中興趣點(diǎn)POI數(shù)據(jù)去重的方法的流程 圖。該方法適于任何一種服務(wù)器。其中,POI數(shù)據(jù)中包括聯(lián)系方式信息和地理位置信息,聯(lián) 系方式信息包括電話號(hào)碼,地理位置信息包括經(jīng)煒度,如圖3所述,包括如下步驟。
[0069] 在步驟S310中,將各個(gè)POI數(shù)據(jù)中的經(jīng)煒度進(jìn)行比較。
[0070] 在步驟S320中,將經(jīng)煒度相同的POI數(shù)據(jù)確定為同一地址下的POI數(shù)據(jù)。
[0071] 在步驟S330中,將同一地址下的POI數(shù)據(jù)的電話號(hào)碼進(jìn)行比較。
[0072] 在步驟S340中,將電話號(hào)碼中后η位相同的POI數(shù)據(jù)判定為相同POI數(shù)據(jù)。
[0073] 其中,η為配置的正整數(shù)。
[0074] 在步驟S350中,按對(duì)應(yīng)時(shí)間從新到舊的順序從相同POI數(shù)據(jù)中選擇多個(gè)POI數(shù)據(jù) 進(jìn)行保留,從數(shù)據(jù)庫(kù)中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。
[0075] 上述僅為本發(fā)明的地圖中興趣點(diǎn)POI數(shù)據(jù)去重的方法的實(shí)例性說(shuō)明,本發(fā)明不限 于此。凡在本發(fā)明的精神或原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明 的保護(hù)范圍內(nèi)。
[0076] 圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的地圖中興趣點(diǎn)POI數(shù)據(jù)去重的裝置的結(jié)構(gòu) 圖。該裝置適于任何一種服務(wù)器。其中,POI數(shù)據(jù)中包括聯(lián)系方式信息,如圖4所示,該裝 置包括如下模塊。
[0077] 比較模塊410,適于將各個(gè)POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn)行比較;
[0078] 判定模塊420,適于將比較結(jié)果符合相同標(biāo)準(zhǔn)的POI數(shù)據(jù)判定為相同POI數(shù)據(jù);
[0079] 去重模塊430,適于從相同POI數(shù)據(jù)中選擇一個(gè)或多個(gè)POI數(shù)據(jù)進(jìn)行保留,從數(shù)據(jù) 庫(kù)中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。
[0080] 在一實(shí)施例中,所述相同標(biāo)準(zhǔn)包括:聯(lián)系方式全部相同;
[0081] 判定模塊420,進(jìn)一步適于將聯(lián)系方式全部相同的POI數(shù)據(jù)判定為相同POI數(shù)據(jù)。
[0082] 舉例而言,從互聯(lián)網(wǎng)網(wǎng)頁(yè)中獲取的POI數(shù)據(jù)如下表一所示。表一中的聯(lián)系方式為: "ΑΑ火鍋"的聯(lián)系方式為"(010) 82589332","ΑΑ(巴溝店)"的聯(lián)系方式為"010-82589332", "ΑΑ火鍋(巴溝店)"的聯(lián)系方式為"010-82589332","ΑΑ火鍋(萬(wàn)柳華聯(lián)分店)"的聯(lián)系方 式為"010-82589332","ΑΑ(萬(wàn)柳店)"的聯(lián)系方式為"010-82589332"。判定模塊420將表 一中聯(lián)系方式比較,后4個(gè)POI的數(shù)據(jù)的聯(lián)系方式相同,都為"010-82589332"。因此,將后 4個(gè)POI數(shù)據(jù)"ΑΑ (巴溝店)"、"ΑΑ火鍋(巴溝店)"、"ΑΑ火鍋(萬(wàn)柳華聯(lián)分店)"、"ΑΑ (萬(wàn) 柳店)"判定為相同POI數(shù)據(jù)。
[0083] 在一實(shí)施例中,所述聯(lián)系方式包括電話號(hào)碼,所述相同標(biāo)準(zhǔn)包括:電話號(hào)碼中后η 位相同,η為正整數(shù);
[0084] 判定模塊420,進(jìn)一步適于將電話號(hào)碼中后η位相同的POI數(shù)據(jù)判定為相同POI數(shù) 據(jù)。
[0085] 例如,將η設(shè)置為8,將表一中聯(lián)系方式比較,表一中5個(gè)POI的數(shù)據(jù)的聯(lián)系方式相 同,都為" 82589332 "。判定模塊420將5個(gè)POI數(shù)據(jù)"AA火鍋"、"AA (巴溝店)"、"AA火鍋 (巴溝店)"AA火鍋(萬(wàn)柳華聯(lián)分店)"AA (萬(wàn)柳店)"判定為相同POI數(shù)據(jù)。
[0086] 在一實(shí)施例中,去重模塊430,進(jìn)一步適于按對(duì)應(yīng)時(shí)間從新到舊的順序從相同POI 數(shù)據(jù)中選擇一個(gè)或多個(gè)POI數(shù)據(jù)進(jìn)行保留。
[0087] 例如,各個(gè)POI具有對(duì)應(yīng)的獲取時(shí)間,去重模塊430按對(duì)應(yīng)的獲取時(shí)間從新到舊的 順序,將相同POI數(shù)據(jù)排序。去重模塊430按配置從相同POI數(shù)據(jù)中選擇m個(gè)POI數(shù)據(jù),m 為配置的正整數(shù),將選擇的m個(gè)POI數(shù)據(jù)保留,從數(shù)據(jù)庫(kù)中去除掉相同POI數(shù)據(jù)中未被選擇 的POI數(shù)據(jù)。
[0088] 在本實(shí)施例中,解決了地圖中POI數(shù)據(jù)中的重復(fù)數(shù)據(jù)過(guò)多的問(wèn)題,取得了去除POI 中重復(fù)數(shù)據(jù),節(jié)約存儲(chǔ)空間和數(shù)據(jù)維護(hù)成本的有益效果。并且,在聯(lián)系方式包括電話號(hào)碼 時(shí),對(duì)數(shù)字進(jìn)行比較,而不需要對(duì)字符串相似度進(jìn)行比較,使得POI去重操作更加容易實(shí) 施,提高了操作效率。
[0089] 在一實(shí)施例中,所述POI數(shù)據(jù)中包括地理位置息;
[0090] 比較模塊410,還適于在將各個(gè)POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn)行比較前,將各個(gè) POI數(shù)據(jù)中的地理位置信息進(jìn)行比較;
[0091] 判定模塊420,還適于將地理位置信息相同的POI數(shù)據(jù)確定為同一地址下的POI數(shù) 據(jù);
[0092] 比較模塊410,進(jìn)一步適于將同一地址下的POI數(shù)據(jù)中的聯(lián)系方式信息進(jìn)行比較。
[0093] 其中,所述地理位置信息包括:經(jīng)煒度信息。
[0094] 例如,比較模塊410將表一中各個(gè)POI數(shù)據(jù)的經(jīng)煒度信息進(jìn)行比較,其中5個(gè)POI 數(shù)據(jù)的經(jīng)煒度都為"東經(jīng):116. 294712,北煒:39. 9731761",5個(gè)POI數(shù)據(jù)的經(jīng)煒度相同,判 定模塊420將5個(gè)POI數(shù)據(jù)確定為同一地址下的POI數(shù)據(jù)。比較模塊410將表一中同一地 址下的5個(gè)POI數(shù)據(jù)的聯(lián)系方式進(jìn)行比較,5個(gè)POI數(shù)據(jù)的聯(lián)系方式的后8位相同,判定