1.一種興趣點的標注方法,其特征在于,包括以下步驟:
接收多個用戶上傳的多個興趣點數(shù)據(jù);
采用聚類算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;
分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結果集;
根據(jù)所述多個聚類結果集對存在興趣點的位置區(qū)域進行標注。
2.如權利要求1所述的方法,其特征在于,所述分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結果集,包括:
針對每個聚類區(qū)域,計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性;
將編輯距離相似性大于第一閾值的名稱所對應的興趣點進行聚類,生成對應的聚類結果集。
3.如權利要求2所述的方法,其特征在于,所述計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性,包括:
計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離;
根據(jù)所述兩兩興趣點數(shù)據(jù)中名稱的字符總數(shù)、以及所述編輯距離,計算所述兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性。
4.如權利要求1所述的方法,其特征在于,所述根據(jù)所述多個聚類結果集對存在興趣點的位置區(qū)域進行標注,包括:
針對每個聚類結果集,判斷所述每個聚類結果集中興趣點的個數(shù)是否大于或等于第二閾值;
如果所述每個聚類結果集中興趣點的個數(shù)大于或等于所述第二閾值,則判定所述每個聚類結果集中存在有效興趣點;
從所述每個聚類結果集中的興趣點數(shù)據(jù)中,隨機選取經(jīng)緯度信息,并將所述隨機選取的經(jīng)緯度信息作為所述存在有效興趣點的位置區(qū)域的坐標。
5.如權利要求1所述的方法,其特征在于,所述聚類算法為Geo哈希算法,所述位置信息為經(jīng)緯度信息。
6.如權利要求5所述的方法,其特征在于,采用所述Geo哈希算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類時,采用的Geo哈希字符串的長度為7。
7.一種興趣點的標注裝置,其特征在于,包括:
接收模塊,用于接收多個用戶上傳的多個興趣點數(shù)據(jù);
第一聚類模塊,用于采用聚類算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類,生成多個聚類區(qū)域;
第二聚類模塊,用于分別將所述多個聚類區(qū)域按照興趣點的名稱進行二次聚類,生成多個聚類結果集;
標注模塊,用于根據(jù)所述多個聚類結果集對存在興趣點的位置區(qū)域進行標注。
8.如權利要求7所述的裝置,其特征在于,所述第二聚類模塊包括:
計算單元,用于針對每個聚類區(qū)域,計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性;
聚類單元,用于將編輯距離相似性大于第一閾值的名稱所對應的興趣點進行聚類,生成對應的聚類結果集。
9.如權利要求8所述的裝置,其特征在于,所述計算單元具體用于:
計算所述每個聚類區(qū)域中的兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離;
根據(jù)所述兩兩興趣點數(shù)據(jù)中名稱的字符總數(shù)、以及所述編輯距離,計算所述兩兩興趣點數(shù)據(jù)中名稱之間的編輯距離相似性。
10.如權利要求7所述的裝置,其特征在于,所述標注模塊包括:
判斷單元,用于針對每個聚類結果集,判斷所述每個聚類結果集中興趣點的個數(shù)是否大于或等于第二閾值;
判定單元,用于在所述每個聚類結果集中興趣點的個數(shù)大于或等于所述第二閾值時,判定所述每個聚類結果集中存在有效興趣點;
標注單元,用于從所述每個聚類結果集中的興趣點數(shù)據(jù)中,隨機選取經(jīng)緯度信息,并將所述隨機選取的經(jīng)緯度信息作為所述存在有效興趣點的位置區(qū)域的坐標。
11.如權利要求7所述的裝置,其特征在于,所述聚類算法為Geo哈希算法,所述位置信息為經(jīng)緯度信息。
12.如權利要求11所述的裝置,其特征在于,所述第一聚類模塊采用所述Geo哈希算法將所述多個興趣點數(shù)據(jù)按照位置信息進行一次聚類時,采用的Geo哈希字符串的長度為7。