元獲取到的目標(biāo)P0I數(shù)據(jù) 中,確定與所述待關(guān)聯(lián)P0I數(shù)據(jù)關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù)之前,從第一數(shù)據(jù)獲取單元獲取到的名 稱中包含所述搜索關(guān)鍵詞的目標(biāo)P0I數(shù)據(jù)中,獲取行政區(qū)劃碼與待關(guān)聯(lián)P0I數(shù)據(jù)的行政區(qū) 劃碼相同的目標(biāo)P0I數(shù)據(jù); 所述數(shù)據(jù)確定單元,具體用于從第二數(shù)據(jù)獲取單元獲取到的行政區(qū)劃碼與待關(guān)聯(lián)P0I 數(shù)據(jù)的行政區(qū)劃碼相同的目標(biāo)P0I數(shù)據(jù)中,確定與所述待關(guān)聯(lián)P0I數(shù)據(jù)關(guān)聯(lián)的目標(biāo)P0I數(shù) 據(jù)。
16. 如權(quán)利要求14所述的裝置,其特征在于,還包括: 文本匹配度確定單元,用于在數(shù)據(jù)確定單元從第一數(shù)據(jù)獲取單元獲取到的目標(biāo)P0I數(shù) 據(jù)中,確定與所述待關(guān)聯(lián)P0I數(shù)據(jù)關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù)之前,基于向量空間模型,確定所述 搜索關(guān)鍵詞與第一數(shù)據(jù)獲取單元獲取到的各目標(biāo)P0I數(shù)據(jù)之間的文本匹配度; 數(shù)據(jù)排序單元,用于按照文本匹配度由大到小的順序,對(duì)第一數(shù)據(jù)獲取單元獲取到的 各目標(biāo)P0I數(shù)據(jù)進(jìn)行排序; 第H數(shù)據(jù)獲取單元,用于在排序后的各目標(biāo)P0I數(shù)據(jù)中,按照文本匹配度由大到小的 順序獲取預(yù)置數(shù)目個(gè)目標(biāo)POI數(shù)據(jù); 所述數(shù)據(jù)確定單元,具體用于從第H數(shù)據(jù)獲取單元獲取到的預(yù)置數(shù)目個(gè)目標(biāo)P0I數(shù)據(jù) 中,確定與所述待關(guān)聯(lián)P0I數(shù)據(jù)關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù)。
17. 如權(quán)利要求14?16中任一權(quán)利要求所述的裝置,其特征在于,所述預(yù)設(shè)的角色類(lèi) 型包含:行政區(qū)劃、主名稱、特定品牌名稱、修飾詞、行業(yè)詞、后綴詞;所述搜索關(guān)鍵詞選擇 單元,具體用于: 當(dāng)存在角色類(lèi)型為主名稱的分詞時(shí),則從各分詞中,選擇角色類(lèi)型為主名稱的分詞作 為搜索關(guān)鍵詞,結(jié)束流程;否則, 當(dāng)不存在角色類(lèi)型為行政區(qū)劃的分詞時(shí),則按照特定品牌名稱、修飾詞、行業(yè)詞、后綴 詞優(yōu)先級(jí)由高到低的順序,從各分詞中選擇角色類(lèi)型與特定品牌名稱、修飾詞、行業(yè)詞或后 綴詞相同且優(yōu)先級(jí)最高的分詞作為搜索關(guān)鍵詞; 當(dāng)存在角色類(lèi)型為行政區(qū)劃的分詞時(shí),則按照特定品牌名稱、修飾詞、行業(yè)詞、后綴詞 優(yōu)先級(jí)由高到低的順序,從各分詞中選擇角色類(lèi)型與特定品牌名稱、修飾詞、行業(yè)詞或后綴 詞相同且優(yōu)先級(jí)最高的分詞和角色類(lèi)型為行政區(qū)劃的分詞的組合作為搜索關(guān)鍵詞。
18. 如權(quán)利要求14?16中任一權(quán)利要求所述的裝置,其特征在于,所述數(shù)據(jù)確定單元 具體包括: 相似度確定子單元,用于根據(jù)待關(guān)聯(lián)P0I數(shù)據(jù)與各獲取到的目標(biāo)P0I數(shù)據(jù)的屬性信息, 確定待關(guān)聯(lián)P0I數(shù)據(jù)與各獲取到的目標(biāo)P0I數(shù)據(jù)的P0I相似度; 數(shù)據(jù)確定子單元,用于根據(jù)各目標(biāo)P0I數(shù)據(jù)的P0I相似度,確定與待關(guān)聯(lián)P0I數(shù)據(jù)關(guān)聯(lián) 的目標(biāo)P0I數(shù)據(jù)。
19. 如權(quán)利要求18所述的裝置,其特征在于,若P0I數(shù)據(jù)的屬性包含名稱、類(lèi)型、地址、 地理坐標(biāo),則所述相似度確定子單元具體包括: 類(lèi)型相似度確定模塊,用于根據(jù)待關(guān)聯(lián)P0I數(shù)據(jù)與目標(biāo)P0I數(shù)據(jù)的類(lèi)型,確定待關(guān)聯(lián) P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的類(lèi)型相似度; 地址相似度確定模塊,用于根據(jù)待關(guān)聯(lián)P0I數(shù)據(jù)的地址與該目標(biāo)P0I數(shù)據(jù)的地址和/ 或地理坐標(biāo),確定待關(guān)聯(lián)P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的地址相似度; 名稱相似度確定模塊,用于根據(jù)待關(guān)聯(lián)P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的名稱,確定待關(guān)聯(lián) P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的名稱相似度; 地理距離確定模塊,用于根據(jù)待關(guān)聯(lián)P0I數(shù)據(jù)的地理坐標(biāo)與該目標(biāo)P0I數(shù)據(jù)的地理坐 標(biāo)和/或地址,確定待關(guān)聯(lián)P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的地理距離; P0I相似度確定模塊,用于根據(jù)所述類(lèi)型相似度、地址相似度、名稱相似度W及地理距 離,確定待關(guān)聯(lián)P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的P0I相似度。
20. 如權(quán)利要求19所述的裝置,其特征在于,若所述類(lèi)型包括大類(lèi)、中類(lèi)及小類(lèi)H個(gè)字 段,則所述類(lèi)型相似度確定模塊具體用于: 判斷待關(guān)聯(lián)P0I數(shù)據(jù)中是否存在類(lèi)型該一屬性信息,如果不存在,則所述待關(guān)聯(lián)P0I數(shù) 據(jù)與該目標(biāo)P0I數(shù)據(jù)的類(lèi)型相似度等于預(yù)置的中類(lèi)相似度,如果存在,則判斷待關(guān)聯(lián)P0I數(shù) 據(jù)與目標(biāo)P0I數(shù)據(jù)的類(lèi)型中的大類(lèi)是否相同,如果大類(lèi)不相同,則所述待關(guān)聯(lián)P0I數(shù)據(jù)與該 目標(biāo)P0I數(shù)據(jù)的類(lèi)型相似度等于預(yù)置的聯(lián)合相似度,如果大類(lèi)相同,則判斷二者類(lèi)型中的 中類(lèi)是否相同,如果中類(lèi)不同或者中類(lèi)為未知,則所述待關(guān)聯(lián)P0I數(shù)據(jù)與該目標(biāo)P0I數(shù)據(jù)的 類(lèi)型相似度等于預(yù)置的大類(lèi)權(quán)值,如果中類(lèi)相同,則判斷二者類(lèi)型中的小類(lèi)是否相同,如果 小類(lèi)不同或者小類(lèi)為未知,則所述待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的類(lèi)型相似度等于預(yù) 置的中類(lèi)權(quán)值,如果小類(lèi)相同,則所述待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的類(lèi)型相似度等于 預(yù)置的小類(lèi)權(quán)值,其中,所述預(yù)置的大類(lèi)權(quán)值< 中類(lèi)權(quán)值<小類(lèi)權(quán)值,所述中類(lèi)相似度的絕 對(duì)值與所述中類(lèi)權(quán)值的絕對(duì)值相等。
21. 如權(quán)利要求19所述的裝置,其特征在于,所述地址相似度確定模塊具體用于: 若所述待關(guān)聯(lián)POI數(shù)據(jù)的地址及地理坐標(biāo)均為已知,則根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的地址與 該目標(biāo)POI數(shù)據(jù)的地址,確定第一地址相似度;對(duì)待關(guān)聯(lián)POI數(shù)據(jù)的地理坐標(biāo)進(jìn)行逆地理編 碼,得到轉(zhuǎn)換地址;根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的轉(zhuǎn)換地址與該目標(biāo)POI數(shù)據(jù)的地址,確定第二地 址相似度;從所述第一地址相似度和第二地址相似度中,選擇最大的一個(gè)相似度作為待關(guān) 聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地址相似度; 若所述待關(guān)聯(lián)POI數(shù)據(jù)中地址為未知,地理坐標(biāo)為已知,則對(duì)待關(guān)聯(lián)POI數(shù)據(jù)的地理坐 標(biāo)進(jìn)行逆地理編碼,得到轉(zhuǎn)換地址;根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的轉(zhuǎn)換地址與該目標(biāo)POI數(shù)據(jù)的地 址,得到待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地址相似度; 若所述待關(guān)聯(lián)POI數(shù)據(jù)中地址為已知,地理坐標(biāo)為未知,則根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的地址 與該目標(biāo)POI數(shù)據(jù)的地址,得到待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地址相似度。
22. 如權(quán)利要求21所述的裝置,其特征在于,所述地址至少包括;道路名稱和口牌號(hào)兩 個(gè)字段,則所述地址相似度確定模塊具體用于: 判斷待關(guān)聯(lián)POI數(shù)據(jù)與目標(biāo)POI數(shù)據(jù)的地址中的道路名稱是否相同,如果不相同,則所 述待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地址相似度等于預(yù)置的地址相似度值,如果相同,貝U 判斷二者地址中的口牌是否相同,如果不同,則所述待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地 址相似度等于預(yù)置的道路名稱權(quán)值,如果相同,則所述待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的 地址相似度等于預(yù)置的口牌權(quán)值,其中,所述道路名稱權(quán)值< 口牌權(quán)值。
23. 如權(quán)利要求19所述的裝置,其特征在于,所述名稱相似度確定模塊,具體用于從待 關(guān)聯(lián)POI數(shù)據(jù)的名稱的分詞中,獲取與目標(biāo)POI數(shù)據(jù)的名稱的分詞相同的分詞;將獲取出的 分詞的角色類(lèi)型對(duì)應(yīng)的權(quán)值累加,得到待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的名稱相似度;若 未獲取到相同的分詞,則待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的名稱相似度等于預(yù)置的名稱 相似度值。
24. 如權(quán)利要求19所述的裝置,其特征在于,所述地理距離確定模塊具體用于: 若所述待關(guān)聯(lián)POI數(shù)據(jù)的地理坐標(biāo)和地址均為已知,則根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的地理坐 標(biāo)與該目標(biāo)POI數(shù)據(jù)的地理坐標(biāo),得到第一地理距離;對(duì)待關(guān)聯(lián)POI數(shù)據(jù)的地址進(jìn)行逆地理 編碼,得到轉(zhuǎn)換地理坐標(biāo);根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的轉(zhuǎn)換地理坐標(biāo)與該目標(biāo)POI數(shù)據(jù)的地理坐 標(biāo),得到第二地理距離;從所述第一地理距離和第二地理距離中,選擇距離最小的一個(gè)地理 距離作為待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)之間的地理距離; 若所述目標(biāo)POI數(shù)據(jù)的地址已知,地理坐標(biāo)未知,則對(duì)待關(guān)聯(lián)POI數(shù)據(jù)的地址進(jìn)行逆地 理編碼,得到轉(zhuǎn)換地理坐標(biāo);根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的轉(zhuǎn)換地理坐標(biāo)與該目標(biāo)POI數(shù)據(jù)的地理 坐標(biāo),得到待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地理距離; 若所述目標(biāo)POI數(shù)據(jù)的地址未知,地理坐標(biāo)已知,則根據(jù)待關(guān)聯(lián)POI數(shù)據(jù)的地理坐標(biāo)與 該目標(biāo)POI數(shù)據(jù)的地理坐標(biāo),得到待關(guān)聯(lián)POI數(shù)據(jù)與該目標(biāo)POI數(shù)據(jù)的地理距離。
25. 如權(quán)利要求19所述的裝置,其特征在于,所述POI相似度確定模塊,具體用于將所 述類(lèi)型相似度、地址相似度、名稱相似度累加,得到第一聯(lián)合相似度;根據(jù)預(yù)置的地理距離 范圍與相似度調(diào)整值的對(duì)應(yīng)關(guān)系,得到所述地理距離所在的地理距離范圍對(duì)應(yīng)的相似度調(diào) 整值;將所述第一聯(lián)合相似度與所述相似度調(diào)整值累加,得到待關(guān)聯(lián)P0I數(shù)據(jù)與該目標(biāo)P0I 數(shù)據(jù)的P0I相似度。
26. 如權(quán)利要求25所述的裝置,其特征在于,所述數(shù)據(jù)確定單元具體用于: 將各目標(biāo)P0I數(shù)據(jù)按照相似度由高到低的順序進(jìn)行排序,若存在相似度相同的目標(biāo) P0I數(shù)據(jù),則將相似度相同的目標(biāo)P0I數(shù)據(jù)按照地理距離由小到大的順序進(jìn)行排序; 根據(jù)預(yù)置的P0I相似度范圍與關(guān)聯(lián)精度等級(jí)的對(duì)應(yīng)關(guān)系,得到各目標(biāo)P0I數(shù)據(jù)的P0I 相似度所在的P0I相似度范圍對(duì)應(yīng)的關(guān)聯(lián)精度等級(jí),其中,關(guān)聯(lián)精度等級(jí)包含高精度關(guān)聯(lián)、 較高精度關(guān)聯(lián)、中等精度關(guān)聯(lián)和不關(guān)聯(lián); 判斷是否存在關(guān)聯(lián)精度等級(jí)為高精度關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù),如果存在,則將關(guān)聯(lián)精度 等級(jí)為高精度關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù)中,排在第一位的目標(biāo)P0I數(shù)據(jù)確定為所述待關(guān)聯(lián)P0I 數(shù)據(jù)關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù),如果不存在,則判斷是否存在關(guān)聯(lián)精度等級(jí)為較高精度關(guān)聯(lián)的 目標(biāo)P0I數(shù)據(jù),如果存在,則將關(guān)聯(lián)精度等級(jí)為較高精度關(guān)聯(lián)的各目標(biāo)P0I數(shù)據(jù)中,排在第 一位的目標(biāo)P0I數(shù)據(jù)確定為所述待關(guān)聯(lián)P0I數(shù)據(jù)關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù),如果不存在,則判斷 是否存在關(guān)聯(lián)精度等級(jí)為中等精度關(guān)聯(lián)的目標(biāo)P0I數(shù)據(jù),如果存在,則返回關(guān)聯(lián)精度等級(jí) 為中等精度關(guān)聯(lián)的各目標(biāo)P0I數(shù)據(jù),如果不存在,則結(jié)束流程。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法及裝置,該方法包括:將待關(guān)聯(lián)興趣點(diǎn)POI數(shù)據(jù)的名稱進(jìn)行分詞處理,得到組成所述名稱的分詞;對(duì)各分詞進(jìn)行角色標(biāo)注,得到各分詞的角色類(lèi)型;按照預(yù)設(shè)的角色類(lèi)型優(yōu)先級(jí)順序,從各分詞中選擇角色類(lèi)型與預(yù)設(shè)的角色類(lèi)型相同且優(yōu)先級(jí)最高的分詞作為搜索關(guān)鍵詞;從目標(biāo)POI數(shù)據(jù)庫(kù)中,獲取名稱中包含所述搜索關(guān)鍵詞的目標(biāo)POI數(shù)據(jù);從獲取到的目標(biāo)POI數(shù)據(jù)中,確定與所述待關(guān)聯(lián)POI數(shù)據(jù)關(guān)聯(lián)的目標(biāo)POI數(shù)據(jù)。采用本發(fā)明技術(shù)方案,解決了現(xiàn)有技術(shù)中POI數(shù)據(jù)關(guān)聯(lián)的處理效率非常低的問(wèn)題。
【IPC分類(lèi)】G06F17-30
【公開(kāi)號(hào)】CN104572645
【申請(qǐng)?zhí)枴緾N201310472877
【發(fā)明人】胡云喜
【申請(qǐng)人】高德軟件有限公司
【公開(kāi)日】2015年4月29日
【申請(qǐng)日】2013年10月11日