模 塊420將5個POI數(shù)據(jù)判定為相同的POI。表一中5個POI具有對應的獲取時間,去重模 塊430按對應的獲取時間從新到舊的順序,將相同POI數(shù)據(jù)排序。去重模塊430按配置從 相同POI數(shù)據(jù)中選擇m個POI數(shù)據(jù),m為配置的正整數(shù),將選擇的m個POI數(shù)據(jù)保留,從數(shù) 據(jù)庫中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。
[0095] 在本實施例中,在將POI數(shù)據(jù)的聯(lián)系方式進行比較前,進行地理位置信息比較,當 判定POI數(shù)據(jù)在同一地址下后,再進行POI數(shù)據(jù)的聯(lián)系方式比較。例如,在地址相同的前提 下利用電話信息去重POI數(shù)據(jù),將漢字字符串相似度計算轉換為數(shù)字字符串是否相同的比 較。如此,進一步增加重復POI數(shù)據(jù)判斷的準確性。
[0096] 需要說明的是:
[0097] 在此提供的算法和顯示不與任何特定計算機、虛擬裝置或者其它設備固有相關。 各種通用裝置也可以與基于在此的示教一起使用。根據(jù)上面的描述,構造這類裝置所要求 的結構是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種 編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā) 明的最佳實施方式。
[0098] 在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施 例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構 和技術,以便不模糊對本說明書的理解。
[0099] 類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在 上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施 例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保 護的本發(fā)明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面 的權利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此, 遵循【具體實施方式】的權利要求書由此明確地并入該【具體實施方式】,其中每個權利要求本身 都作為本發(fā)明的單獨實施例。
[0100] 本領域那些技術人員可以理解,可以對實施例中的設備中的模塊進行自適應性地 改變并且把它們設置在與該實施例不同的一個或多個設備中??梢园褜嵤├械哪K或單 元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或 子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任 何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開 的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴 隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代 特征來代替。
[0101] 此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例 中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的 范圍之內(nèi)并且形成不同的實施例。例如,在下面的權利要求書中,所要求保護的實施例的任 意之一都可以以任意的組合方式來使用。
[0102] 本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行 的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領域的技術人員應當理解,可以在實踐中使用 微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的地圖中興趣點POI數(shù)據(jù)去 重的設備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里 所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產(chǎn) 品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個 信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任 何其他形式提供。
[0103] 應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領 域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中, 不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞"包含"不排除存在 未列在權利要求中的元件或步驟。位于元件之前的單詞"一"或"一個"不排除存在多個這 樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來 實現(xiàn)。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件 項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為 名稱。
【主權項】
1. 一種地圖中興趣點POI數(shù)據(jù)去重的方法,所述POI數(shù)據(jù)中包括聯(lián)系方式信息;所述 方法包括: 將各個POI數(shù)據(jù)中的聯(lián)系方式信息進行比較; 將比較結果符合相同標準的POI數(shù)據(jù)判定為相同POI數(shù)據(jù); 從相同POI數(shù)據(jù)中選擇一個或多個POI數(shù)據(jù)進行保留,從數(shù)據(jù)庫中去除掉相同POI數(shù) 據(jù)中未被選擇的POI數(shù)據(jù)。2. 根據(jù)權利要求1所述的方法,其中,所述POI數(shù)據(jù)中包括地理位置信息;所述方法還 包括: 在將各個POI數(shù)據(jù)中的聯(lián)系方式信息進行比較前,將各個POI數(shù)據(jù)中的地理位置信息 進行比較; 將地理位置信息相同的POI數(shù)據(jù)確定為同一地址下的POI數(shù)據(jù); 所述將各個POI數(shù)據(jù)中的聯(lián)系方式信息進行比較,進一步包括: 將同一地址下的POI數(shù)據(jù)中的聯(lián)系方式信息進行比較。3. 根據(jù)權利要求1或2所述的方法,其中,所述相同標準包括:聯(lián)系方式全部相同; 所述將比較結果符合相同標準的POI數(shù)據(jù)判定為相同POI數(shù)據(jù),進一步包括: 將聯(lián)系方式全部相同的POI數(shù)據(jù)判定為相同POI數(shù)據(jù)。4. 根據(jù)權利要求2所述的方法,其中,所述聯(lián)系方式包括電話號碼,所述相同標準包 括:電話號碼中后n位相同,n為正整數(shù); 所述將比較結果符合相同標準的POI數(shù)據(jù)判定為相同POI數(shù)據(jù),進一步包括: 將電話號碼中后n位相同的POI數(shù)據(jù)判定為相同POI數(shù)據(jù)。5. 根據(jù)權利要求1至4任一所述的方法,其中,所述從相同POI數(shù)據(jù)中選擇一個或多個 POI數(shù)據(jù)進行保留,進一步包括: 按對應時間從新到舊的順序從相同POI數(shù)據(jù)中選擇一個或多個POI數(shù)據(jù)進行保留。6. 根據(jù)權利要求1至5任一所述的方法,其中,所述地理位置信息包括:經(jīng)煒度信息。7. -種地圖中興趣點POI數(shù)據(jù)去重的裝置,所述POI數(shù)據(jù)中包括聯(lián)系方式信息;所述 裝置包括: 比較模塊,適于將各個POI數(shù)據(jù)中的聯(lián)系方式信息進行比較; 判定模塊,適于將比較結果符合相同標準的POI數(shù)據(jù)判定為相同POI數(shù)據(jù); 去重模塊,適于從相同POI數(shù)據(jù)中選擇一個或多個POI數(shù)據(jù)進行保留,從數(shù)據(jù)庫中去除 掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。8. 根據(jù)權利要求7所述的裝置,其中,所述POI數(shù)據(jù)中包括地理位置息; 所述比較模塊,還適于在將各個POI數(shù)據(jù)中的聯(lián)系方式信息進行比較前,將各個POI數(shù) 據(jù)中的地理位置信息進行比較; 所述判定模塊,還適于將地理位置信息相同的POI數(shù)據(jù)確定為同一地址下的POI數(shù) 據(jù); 所述比較模塊,進一步適于將同一地址下的POI數(shù)據(jù)中的聯(lián)系方式信息進行比較。9. 根據(jù)權利要求7或8所述的裝置,其中,所述相同標準包括:聯(lián)系方式全部相同; 所述判定模塊,進一步適于將聯(lián)系方式全部相同的POI數(shù)據(jù)判定為相同POI數(shù)據(jù)。10. 根據(jù)權利要求8所述的裝置,其中,所述聯(lián)系方式包括電話號碼,所述相同標準包 括:電話號碼中后n位相同,n為正整數(shù); 所述判定模塊,進一步適于將電話號碼中后n位相同的POI數(shù)據(jù)判定為相同POI數(shù)據(jù)。11. 根據(jù)權利要求7至10任一所述的裝置,其中,所述去重模塊,進一步適于按對應時 間從新到舊的順序從相同POI數(shù)據(jù)中選擇一個或多個POI數(shù)據(jù)進行保留。12. 根據(jù)權利要求7至11任一所述的裝置,其中,所述地理位置信息包括:經(jīng)煒度信 息。
【專利摘要】本發(fā)明涉及計算機技術領域,公開了地圖中興趣點POI數(shù)據(jù)去重的方法及裝置,所述POI數(shù)據(jù)中包括聯(lián)系方式信息;所述方法包括:將各個POI數(shù)據(jù)中的聯(lián)系方式信息進行比較;將比較結果符合相同標準的POI數(shù)據(jù)判定為相同POI數(shù)據(jù);從相同POI數(shù)據(jù)中選擇一個或多個POI數(shù)據(jù)進行保留,從數(shù)據(jù)庫中去除掉相同POI數(shù)據(jù)中未被選擇的POI數(shù)據(jù)。本發(fā)明解決了地圖中POI數(shù)據(jù)中的重復數(shù)據(jù)過多的問題,取得了去除POI中重復數(shù)據(jù),節(jié)約存儲空間和數(shù)據(jù)維護成本的有益效果。
【IPC分類】G06F17/30
【公開號】CN105159921
【申請?zhí)枴緾N201510454370
【發(fā)明人】王智廣, 傅彤
【申請人】北京奇虎科技有限公司, 奇智軟件(北京)有限公司
【公開日】2015年12月16日
【申請日】2015年7月29日