本技術(shù)涉及數(shù)據(jù)挖掘,具體涉及一種數(shù)據(jù)構(gòu)建方法和裝置。本技術(shù)同時涉及一種建筑物別名構(gòu)建方法和裝置,計算機存儲介質(zhì)和電子設(shè)備。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)和計算機技術(shù)的不斷發(fā)展,越來越多的基于互聯(lián)網(wǎng)和計算機為基礎(chǔ)的服務(wù)需求被廣泛應(yīng)用,如:導(dǎo)航、配送等服務(wù)。因此,定位就顯得尤為重要,因為,定位的準(zhǔn)確性決定服務(wù)的準(zhǔn)確性。
2、然而,任何一種定位需要基于具體地址或位置,而現(xiàn)實生活場景中對于建筑物通常會有正式名稱,即標(biāo)準(zhǔn)稱謂,也會存在多種不同于正式名稱的其他名稱,即別名。由于別名的存在,會導(dǎo)致數(shù)據(jù)服務(wù)或數(shù)據(jù)處理過程中受影響。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供一種數(shù)據(jù)構(gòu)建方法,以解決現(xiàn)有技術(shù)中根據(jù)正式名稱進行數(shù)據(jù)處理或數(shù)據(jù)服務(wù)過程中導(dǎo)致的局限性和準(zhǔn)確性問題。
2、本技術(shù)提供一種數(shù)據(jù)構(gòu)建方法,包括:
3、將獲取的目標(biāo)對象第一名稱與地址庫中的地址信息進行匹配,確定所述目標(biāo)對象的位置坐標(biāo)信息;
4、根據(jù)對所述位置坐標(biāo)信息選取的周邊地址信息的解析,確定所述周邊地址信息的結(jié)構(gòu)化單元信息中與所述目標(biāo)對象對應(yīng)的第二名稱集合;
5、根據(jù)所述第二名稱集合中第二名稱擴展確定的所述第二名稱的擴展名稱,構(gòu)建所述目標(biāo)對象的第二名稱知識庫。
6、在一些實施例中,所述將獲取的目標(biāo)對象的第一名稱與地址庫中的地址信息進行匹配,確定所述目標(biāo)對象的位置坐標(biāo)信息,包括:
7、根據(jù)建立的所述目標(biāo)對象的信息數(shù)據(jù)庫,獲取所述目標(biāo)對象的第一名稱;
8、將所述第一名稱與建立的地址庫中的地址信息進行模糊匹配,確定與所述第一名稱相關(guān)的位置坐標(biāo)信息。
9、在一些實施例中,所述將所述第一名稱與建立的地址庫中的地址信息進行模糊匹配,確定與所述目標(biāo)對象相關(guān)的位置坐標(biāo)信息,包括:
10、將所述第一名稱與建立的地址庫中的地址信息進行模糊匹配,確定與所述目標(biāo)對象相關(guān)的候選地址信息;
11、根據(jù)所述候選地址信息對應(yīng)的經(jīng)緯度數(shù)據(jù),選取所述經(jīng)緯度數(shù)據(jù)的中位數(shù),或者,選取所述經(jīng)緯度數(shù)據(jù)的眾數(shù);
12、將與所述中位數(shù)或者與所述眾數(shù)對應(yīng)的經(jīng)緯度數(shù)據(jù),確定為與所述目標(biāo)對象對應(yīng)的位置坐標(biāo)信息。
13、在一些實施例中,所述根據(jù)對所述位置坐標(biāo)信息選取的周邊地址信息的解析,確定所述周邊地址信息的結(jié)構(gòu)化單元信息中與所述目標(biāo)對象對應(yīng)的第二名稱集合,包括:
14、根據(jù)所述位置坐標(biāo)信息選取所述目標(biāo)對象的周邊地址信息;
15、對所述周邊地址信息進行解析,確定所述周邊地址信息的結(jié)構(gòu)化單元信息;
16、根據(jù)所述結(jié)構(gòu)單元信息,確定與所述目標(biāo)對象對應(yīng)的第二名稱集合。
17、在一些實施例中,所述根據(jù)所述位置坐標(biāo)信息選取所述目標(biāo)對象的周邊地址信息,包括:
18、以所述位置坐標(biāo)信息為中心,對預(yù)設(shè)范圍內(nèi)的搜索區(qū)域進行網(wǎng)格編碼處理,確定網(wǎng)格編碼區(qū)域;
19、根據(jù)網(wǎng)格編碼區(qū)域進行周邊地址信息查找,獲取所述目標(biāo)對象的周邊地址信息。
20、在一些實施例中,所述對所述周邊地址信息進行解析,確定所述周邊地址信息的結(jié)構(gòu)化單元信息,包括:
21、根據(jù)地址解析工具對所述周邊地址信息進行結(jié)構(gòu)化處理,獲取組成所述周邊地址信息的結(jié)構(gòu)化單元信息。
22、在一些實施例中,所述根據(jù)對所述第二名稱集合中第二名稱的名稱擴展確定的所述第二名稱的擴展名稱,構(gòu)建所述目標(biāo)對象的第二名稱知識庫,包括:
23、根據(jù)對所述第二名稱集合中第二名稱的過濾處理,更新所述第二名稱集合;
24、對更新后的所述第二名稱集合中的第二名稱進行名稱擴展,獲取所述第二名稱的擴展名稱;
25、根據(jù)所述擴展名稱構(gòu)建所述第二名稱知識庫。
26、在一些實施例中,所述根據(jù)對所述第二名稱集合中第二名稱的過濾處理,更新所述第二名稱集合,包括:
27、根據(jù)統(tǒng)計的所述第二名稱集合中第二名稱的出現(xiàn)頻次,過濾所述出現(xiàn)頻次不滿足頻次過濾要求的名稱,和/或,根據(jù)所述第二名稱集合中第二名稱與所述第一名稱之間的相似度,過濾不滿足相似度要求的名稱;
28、更新所述第二名稱集合中的所述第二名稱。
29、在一些實施例中,所述對更新后的所述第二名稱集合中的第二名稱進行名稱擴展,獲取所述第二名稱的擴展名稱,包括:
30、根據(jù)更新后的所述第二名稱集合中的第二名稱采用標(biāo)簽傳播方式進行名稱擴展,獲取所述擴展名稱。
31、在一些實施例中,所述根據(jù)所述第二名稱集合中第二名稱擴展確定的所述第二名稱的擴展名稱,構(gòu)建所述目標(biāo)對象的第二名稱知識庫,包括:
32、對所述擴展名稱進行清理處理;
33、根據(jù)清理后的擴展名稱,構(gòu)建所述目標(biāo)對象的第二名稱知識庫。
34、本技術(shù)還提供一種數(shù)據(jù)構(gòu)建裝置,包括:
35、第一確定單元,用于將獲取的目標(biāo)對象的第一名稱與地址庫中的地址信息進行匹配,確定所述目標(biāo)對象的位置坐標(biāo)信息;
36、第二確定單元,用于根據(jù)對所述位置坐標(biāo)信息選取的周邊地址信息的解析,確定所述周邊地址信息的結(jié)構(gòu)化單元信息中與所述目標(biāo)對象對應(yīng)的第二名稱集合;
37、構(gòu)建單元,用于根據(jù)所述第二名稱集合中第二名稱擴展確定的所述第二名稱的擴展名稱,構(gòu)建所述目標(biāo)對象的第二名稱知識庫。
38、本技術(shù)還提供一種建筑物別名構(gòu)建方法,包括:
39、將獲取的建筑物正式名稱與地址庫中的地址信息進行匹配,確定所述建筑物的位置坐標(biāo)信息;
40、根據(jù)對所述位置坐標(biāo)信息選取的周邊地址信息的解析,確定所述周邊地址信息的結(jié)構(gòu)化單元信息中與所述建筑物對應(yīng)的別名集合;
41、根據(jù)所述別名集合中別名擴展確定的所述別名的擴展名稱,構(gòu)建所述建筑物的第二名稱知識庫。
42、本技術(shù)還提供一種計算機存儲介質(zhì),包括計算機程序,當(dāng)所述計算機程序在電子設(shè)備上運行時,使得所述電子設(shè)備執(zhí)行如上述的數(shù)據(jù)構(gòu)建方法,或者,執(zhí)行如上述的建筑物別名構(gòu)建方法。
43、本技術(shù)還提供一種電子設(shè)備,包括:
44、處理器;
45、存儲器,用于存儲對電子設(shè)備產(chǎn)生數(shù)據(jù)進行處理的程序,所述程序在被所述處理器讀取執(zhí)行時,執(zhí)行如上述的數(shù)據(jù)構(gòu)建方法,或者,執(zhí)行如上述的建筑物別名構(gòu)建方法。
46、與現(xiàn)有技術(shù)相比,本技術(shù)具有以下優(yōu)點:
47、本技術(shù)提供的一種數(shù)據(jù)構(gòu)建方法能夠根據(jù)目標(biāo)對象的第一名稱與地址庫中的地址信息通過模糊匹配方式,獲取到目標(biāo)對象的位置坐標(biāo)信息,并進一步通過經(jīng)緯度數(shù)據(jù)的中數(shù)或眾數(shù)提高位置坐標(biāo)信息的精度和準(zhǔn)確度。再利用獲取的周邊地址信息的結(jié)構(gòu)化信息確定目標(biāo)對象的第二名稱,從而在目標(biāo)對象具有第一名稱之外,還能夠具有第二名稱的表達(dá)形式,該過程中,進一步可以通過相應(yīng)的過濾方式提高第二名稱的有效性和準(zhǔn)確性,再者為保證第二名稱的全面性,還可以對過濾后的第二名稱進行名稱擴展,將擴展后的名稱也作為第二名稱建立所述目標(biāo)對象第二名稱知識庫,從而為后續(xù)在各種場景需求下,能夠提升目標(biāo)對象搜索功能的智能化水平,確保能夠快速理解并響應(yīng)用戶的多樣化查詢需求,加速目標(biāo)對象的搜索過程,提升用戶體驗,確保迅速且準(zhǔn)確地定位到目標(biāo)對象的位置。
48、本技術(shù)提供的一種建筑物別名構(gòu)建方法中,利用收貨地址信息挖掘建筑物別名,并據(jù)此構(gòu)建別名知識庫,通過建筑物正式名稱與地址的模糊匹配,獲取經(jīng)緯度信息,通過經(jīng)緯度信息挖掘周邊可能存在用于表達(dá)建筑物的別名信息,進而能夠通過廣泛的搜集鄰近的收貨地址信息,從而建立別名知識庫。在諸如房產(chǎn)數(shù)據(jù)處理應(yīng)用場景下,提供更具全面性和實用性的別名知識庫。