本發(fā)明涉及數(shù)據(jù)挖掘,尤其涉及一種空間相關興趣點推薦方法、系統(tǒng)、設備、產(chǎn)品及介質。
背景技術:
1、隨著大多數(shù)智能手機已經(jīng)配備了全球衛(wèi)星導航系統(tǒng)(gps),從而具有定位功能,用戶可以通過包含gps的智能手機或移動設備隨時隨地上傳他們的位置,并且能夠在基于位置的社交網(wǎng)絡中分享他們的興趣點簽到數(shù)據(jù)。近年來,越來越多的研究開始關注利用基于位置的社交網(wǎng)絡的大量用戶簽到數(shù)據(jù)來建模用戶偏好,從而呈現(xiàn)給用戶未訪問過的興趣點推薦結果。然而,簽到數(shù)據(jù)是一種隱性反饋,它反映了用戶對特定興趣點的積極偏好,但未訪問某些地點并不一定表示用戶不喜歡這些地點。
2、在興趣點的推薦任務中,地理影響因素最為顯著,因此被絕大部分興趣點推薦模型作為挖掘用戶偏好的重要建模對象。由于用戶傾向于訪問地理位置靠近用戶活動中心的興趣點,因此用戶更傾向于訪問他們之前簽到過的興趣點附近的新興趣點。所以用戶偏好學習中增強興趣點之間的地理相關性建模,可以提高用戶偏好理解的準確性。
3、在地理特征表示方面,目前興趣點推薦模型中的地理特征通常通過規(guī)則的網(wǎng)格域或均勻概率分布來表示并以此來確定興趣點之間的空間相關性。這些方法往往依賴人為的約束規(guī)則,且地理區(qū)域劃分粒度不夠精細,在捕捉所有候選興趣點之間的空間關系方面缺乏客觀性和完整性。其次,從未將空間相關性作為學習目標,從而無法使模型對那些用戶已訪問過的興趣點呈高度空間相關性的其它興趣點表現(xiàn)敏感性。
技術實現(xiàn)思路
1、本發(fā)明旨在至少解決相關技術中存在的技術問題之一。為此,本發(fā)明提供一種空間相關興趣點推薦方法、系統(tǒng)、設備、產(chǎn)品及介質,實現(xiàn)興趣點推薦效果的提高。
2、本發(fā)明提供一種空間相關興趣點推薦方法,包括:
3、s1:獲取訓練樣本中的興趣點,構建位置向量預訓練網(wǎng)絡,通過位置向量預訓練網(wǎng)絡訓練興趣點的位置向量;
4、s2:將用戶歷史簽到數(shù)據(jù)劃分為以周為間隔的軌跡切片;
5、s3:建立軌跡編碼網(wǎng)絡,通過軌跡編碼網(wǎng)絡將所述軌跡切片和訓練后的所述位置向量進行融合,獲得軌跡切片向量,構建softmax函數(shù)對軌跡切片向量進行變換,得到軌跡切片中所有興趣點的興趣點偏好得分;
6、s4:確定每個所述軌跡切片中的用戶訪問目標并生成每個用戶訪問目標對應的空間關聯(lián)目標集合,獲取用戶訪問目標和空間關聯(lián)目標集合的興趣點偏好得分,對用戶訪問目標和空間關聯(lián)目標集合進行損失值的計算,迭代至損失值收斂以實現(xiàn)所述軌跡編碼網(wǎng)絡的訓練;
7、s5:通過訓練后的所述軌跡編碼網(wǎng)絡計算每個所述軌跡切片的位置偏好得分,通過對位置偏好得分進行權重相加得到興趣點推薦結果。
8、根據(jù)本發(fā)明提供的一種空間相關興趣點推薦方法,步驟s1進一步包括:
9、s11:獲取所述訓練樣本中的所述興趣點,將訓練樣本中的興趣點的位置信息轉化為olc序列;
10、s12:在全部的olc序列中隨機采樣成對的olc序列構成olc序列對,計算olc序列對的真實空間相關性得分;
11、s13:構建位置向量預訓練網(wǎng)絡,帶入真實空間相關性得分計算均方誤差損失值,迭代位置向量預訓練網(wǎng)絡至均方誤差損失值收斂;
12、s14:利用位置向量預訓練網(wǎng)絡對興趣點進行訓練得到興趣點的位置向量。
13、根據(jù)本發(fā)明提供的一種空間相關興趣點推薦方法,步驟s13中還包括:
14、s131:將所述olc序列對中的每個所述olc序列的每個字符轉化為第一嵌入向量;
15、s132:構建孿生gru網(wǎng)絡作為所述位置向量預訓練網(wǎng)絡,每個olc序列對中的兩個olc序列分別利用位置向量預訓練網(wǎng)絡中的一個gru網(wǎng)絡更新第一嵌入向量;
16、s133:提取每個olc序列中最后一位上的經(jīng)過位置向量預訓練網(wǎng)絡更新過的第一嵌入向量作為特征第一嵌入向量,利用曼哈頓距離計算兩個特征第一嵌入向量的語義相關性,通過語義相關性和所述真實空間相關性得分計算均方誤差損失值;
17、s134:在所有所述訓練樣本中迭代數(shù)次,直至位置向量預訓練網(wǎng)絡的均方誤差損失值收斂為止。
18、根據(jù)本發(fā)明提供的一種空間相關興趣點推薦方法,步驟s3進一步包括:
19、s31:構建長短記憶網(wǎng)絡作為所述軌跡編碼網(wǎng)絡,融合所述軌跡切片中的所述用戶歷史簽到數(shù)據(jù)和所述位置向量獲得第二嵌入向量,利用軌跡編碼網(wǎng)絡對每個軌跡切片中的第二嵌入向量進行更新;
20、s32:計算每個軌跡切片中的平均位置信息,將平均位置信息與當前軌跡切片中的所有第二嵌入向量之和拼接,得到所述軌跡切片向量;
21、s33:構建softmax函數(shù),將軌跡切片向量通過線性網(wǎng)絡進行轉換并和候選的興趣點表示相乘,對軌跡切片向量和興趣點表示通過softmax函數(shù)進行softmax變換得到所有所述興趣點的所述興趣點偏好得分。
22、根據(jù)本發(fā)明提供的一種空間相關興趣點推薦方法,步驟s4進一步包括:
23、s41:將每個所述軌跡切片中時間位于當前軌跡切片之后的5個軌跡切片中出現(xiàn)的所述用戶歷史簽到數(shù)據(jù)中的所述興趣點確定為用戶訪問目標集合;
24、s42:從用戶訪問目標集合中確定所述用戶訪問目標和所述空間關聯(lián)目標集合;
25、s43:確定每個軌跡切片的用戶訪問目標和空間關聯(lián)目標集合中的所述興趣點偏好得分的集合為特征興趣點偏好得分集合,代入特征興趣點偏好得分集合并利用融合弱標簽的多目標交叉熵來計算用戶訪問目標和空間關聯(lián)目標集合的多目標損失值;
26、s44:在所有所述訓練樣本中迭代數(shù)次,直至軌跡編碼網(wǎng)絡的用戶訪問目標和空間關聯(lián)目標集合的多目標損失值收斂為止。
27、根據(jù)本發(fā)明提供的一種空間相關興趣點推薦方法,步驟s42中還包括:
28、s421:在當前所述軌跡切片對應的所述用戶訪問目標集合中,將所有的所述興趣點的粗粒度位置信息作為軌跡切片的第一空間相關olc集合;
29、s422:統(tǒng)計所有軌跡切片的第一空間相關olc集合;
30、s423:在當前軌跡切片中確定一個用戶訪問目標,從第一空間相關olc集合中找出所有包含用戶訪問目標的粗粒度位置信息的所有空間相關olc的集合作為第二空間相關olc集合;
31、s424:將所有第二空間相關olc集合對應的興趣點確定為用戶訪問目標對應的所述空間關聯(lián)目標集合。
32、本發(fā)明還提供一種空間相關興趣點推薦系統(tǒng),用于執(zhí)行如以上任一項所述的一種空間相關興趣點推薦方法,包括:
33、位置向量預訓練模塊:用于獲取訓練樣本中的興趣點,構建位置向量預訓練網(wǎng)絡,通過位置向量預訓練網(wǎng)絡訓練興趣點的位置向量;
34、用戶歷史簽到數(shù)據(jù)預處理模塊:用于將用戶歷史簽到數(shù)據(jù)劃分為以周為間隔的軌跡切片;
35、軌跡編碼網(wǎng)絡建立模塊:用于建立軌跡編碼網(wǎng)絡,通過軌跡編碼網(wǎng)絡將所述軌跡切片和訓練后的所述位置向量進行融合,獲得軌跡切片向量,構建softmax函數(shù)對軌跡切片向量進行變換,得到軌跡切片中所有興趣點的興趣點偏好得分;
36、軌跡編碼網(wǎng)絡訓練模塊:用于確定每個所述軌跡切片中的用戶訪問目標并生成每個用戶訪問目標對應的空間關聯(lián)目標集合,獲取用戶訪問目標和空間關聯(lián)目標集合的興趣點偏好得分,對用戶訪問目標和空間關聯(lián)目標集合進行損失值的計算,迭代至損失值收斂以實現(xiàn)所述軌跡編碼網(wǎng)絡的訓練;
37、興趣點推薦模塊:用于通過訓練后的所述軌跡編碼網(wǎng)絡計算每個所述軌跡切片的位置偏好得分,通過對位置偏好得分進行權重相加得到興趣點推薦結果。
38、本發(fā)明還提供了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)如以上任一項所述的一種空間相關興趣點推薦方法。
39、本發(fā)明還提供一種非暫態(tài)計算機可讀存儲介質,其上存儲有計算機程序所述計算機程序被處理器執(zhí)行時實現(xiàn)如以上任一項所述的一種空間相關興趣點推薦方法。
40、本發(fā)明還提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括存儲在非暫態(tài)計算機可讀存儲介質上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執(zhí)行時,計算機能夠執(zhí)行如以上任一項所述的一種空間相關興趣點推薦方法。
41、本發(fā)明實施例中的上述一個或多個技術方案,至少具有如下技術效果之一:
42、本發(fā)明提供的一種空間相關興趣點推薦方法,通過位置向量預訓練網(wǎng)絡生成的興趣點位置向量不僅能使每個興趣點擁有唯一的用于描述絕對位置的向量表示,同時還能捕捉任意兩個預訓練位置向量和對應興趣點之間的相對距離關系,從而實現(xiàn)地理位置相關性語義的準確描述。多目標學習方法聯(lián)合用戶訪問目標和空間相關目標共同計算模型訓練損失能使用戶軌跡表示在描述用戶偏好的同時,還會主動關注和用戶自身訪問過的興趣點有著高度地理關聯(lián)的其它興趣點,從而實現(xiàn)對用戶偏好的反映出的空間聚類模式的捕捉。本發(fā)明所設計的用戶訪問目標和空間相關目標的空間相關性建模方法共同促進了興趣點推薦的效果。
43、本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。