本發(fā)明涉及城市推薦,具體為基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法。
背景技術(shù):
1、位置社交網(wǎng)絡(luò)的快速發(fā)展引發(fā)了對個性化位置推薦服務(wù)的廣泛關(guān)注。序列興趣點(poi)推薦旨在根據(jù)用戶的歷史簽到序列預測下一次訪問的poi。隨著城市環(huán)境日益復雜,對推薦的準確性和時效性提出了更高要求,序列poi推薦在城市中的應(yīng)用變得至關(guān)重要。目前基于深度學習的推薦技術(shù)主要有:①多層感知機;②循環(huán)神經(jīng)網(wǎng)絡(luò);③卷積神經(jīng)網(wǎng)絡(luò);④基于transformer的技術(shù)。
2、transformer模型已成為主流技術(shù),通過自注意力機制有效捕捉用戶簽到序列中的時序關(guān)系,準確建模長距離依賴,從而提升推薦效果。其核心編碼器-解碼器結(jié)構(gòu)支持并行處理輸入序列,大幅提高計算效率?;趖ransformer的序列poi推薦不僅能捕捉用戶的歷史偏好,還能結(jié)合復雜的時空特征,成為城市poi推薦中的重要技術(shù)手段。
3、現(xiàn)有的序列poi推薦方法存在兩大主要問題。首先,這些方法通常側(cè)重于序列相關(guān)性,忽視了簽到序列中蘊含的具體時間戳信息,導致用戶行為模式的建模不夠完整,進而影響推薦結(jié)果的準確性。其次,將時間戳作為輔助信息的推薦方法雖然引入了時間因素,但無法準確捕捉用戶的日常規(guī)律和時間偏好,導致個性化程度不足,推薦效果不理想??傊?,這些方法在長距離依賴關(guān)系的建模上存在局限性,難以有效處理復雜的時空特征,進一步削弱了推薦的精度與效果。
技術(shù)實現(xiàn)思路
1、本部分的目的在于概述本發(fā)明的實施方式的一些方面以及簡要介紹一些較佳實施方式。在本部分以及本技術(shù)的說明書摘要和發(fā)明名稱中可能會做些簡化或省略以避免使本部分、說明書摘要和發(fā)明名稱的目的模糊,而這種簡化或省略不能用于限制本發(fā)明的范圍。
2、因此,本發(fā)明的目的是提供基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法,以解決上述背景技術(shù)中提出的問題。
3、為解決上述技術(shù)問題,根據(jù)本發(fā)明的一個方面,本發(fā)明提供了如下技術(shù)方案:
4、基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法,包括如下步驟:
5、s1、收集用戶的歷史簽到數(shù)據(jù),并按照時間順序?qū)γ课挥脩舻暮灥接涗涍M行排序,形成用戶簽到序列,隨后將數(shù)據(jù)實時傳輸至服務(wù)器并存儲;
6、s2、對數(shù)據(jù)進行預處理,然后從預處理后的用戶簽到序列中提取出有效的poi序列和時間戳序列,分別表示為和;
7、s3、將poi序列和時間戳序列輸入到構(gòu)建的tapt模型中,利用tapt模型中高效的編碼器模塊和嵌入連接層,將poi嵌入與時間戳嵌入進行融合,形成聯(lián)合嵌入,最終,聯(lián)合嵌入輸入到poi推薦模型和時間戳預測器中,實現(xiàn)對poi及其對應(yīng)時間戳的聯(lián)合預測。
8、作為本發(fā)明所述的基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法的一種優(yōu)選方案,其中,步驟s1中,利用移動應(yīng)用程序和gps傳感器,定期收集用戶的歷史簽到數(shù)據(jù),包括每個poi及其對應(yīng)的時間戳,并將數(shù)據(jù)實時傳輸至服務(wù)器并存儲。
9、作為本發(fā)明所述的基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法的一種優(yōu)選方案,其中,步驟s2中,對數(shù)據(jù)進行預處理的具體步驟如下:
10、首先進行數(shù)據(jù)清洗,剔除含有缺失值或異常值的用戶和poi交互數(shù)據(jù),并按時間順序排序每個用戶的歷史簽到數(shù)據(jù),公式如下:
11、;
12、其中,是第個用戶排序后的歷史簽到序列,是第個用戶的原始輸入序列,代表排序函數(shù),表示按照時間戳先后進行排序;
13、然后采用過濾技術(shù),去除不活躍用戶和冷門poi的交互,以保證數(shù)據(jù)的質(zhì)量和代表性,操作方式如下:
14、;
15、;
16、其中,和分別代表過濾后的活躍用戶集合和熱門poi集合,和分別表示用戶的簽到次數(shù)和興趣點的交互次數(shù),和分別代表簽到次數(shù)閾值和交互次數(shù)閾值。
17、作為本發(fā)明所述的基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法的一種優(yōu)選方案,其中,所述tapt模型包括編碼器模塊、poi推薦模塊以及時間戳預測模塊。
18、作為本發(fā)明所述的基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法的一種優(yōu)選方案,其中,編碼器模塊由poi編碼器和時間戳編碼器組成;
19、在處理poi序列時,將其轉(zhuǎn)換為,其中表示序列長度,表示poi的嵌入維度,將poi序列轉(zhuǎn)換為對應(yīng)嵌入,公式如下:
20、;
21、其中,表示poi嵌入,是poi編碼器,是輸入的poi序列;
22、為了捕捉用戶日常的行為模式,將時間戳序列解耦為三個組成部分:小時、分鐘和秒鐘,解耦的公式如下:
23、;
24、其中,是解耦的時間戳序列,是時間戳解耦器,是輸入的時間戳序列,
25、隨后,將編碼為可學習的嵌入,公式如下:
26、;
27、其中,是時間戳嵌入,是時間戳嵌入維度,是時間戳編碼器,
28、在獲得poi嵌入和時間戳嵌入后,將二者輸入到一個拼接層,以生成聯(lián)合嵌入表征,具體的處理公式如下:
29、;
30、其中,是聯(lián)合嵌入,并且,是連接操作。
31、作為本發(fā)明所述的基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法的一種優(yōu)選方案,其中,時間戳預測模塊具體實現(xiàn)如下步驟:
32、首先,將從中學得的聯(lián)合表征輸入到一個transformer模型中,
33、其中,是學習得到的信息表征,是序列poi推薦的基本架構(gòu);
34、然后進一步學習時間戳表征:
35、;
36、其中,是進一步學習到的聯(lián)合表征,表示基于transformer架構(gòu)的深度模型;
37、隨后,通過時間戳特征提取器來提取與時間戳相關(guān)的特征:
38、;
39、其中,是提取到的用于時間戳預測任務(wù)的特征,是時間戳特征提取器;
40、隨后,通過解碼器解碼,將提取到的特征轉(zhuǎn)換為時間戳表示:
41、;
42、其中,是解碼的表征,是解碼器;
43、最終,通過激活函數(shù)和縮放操作映射為表示時間戳信息的離散值:
44、;
45、其中,是最終預測的時間戳信息,和分別表示縮放操作和激活操作。
46、作為本發(fā)明所述的基于用戶歷史簽到序列的城市poi推薦與時間戳預測方法的一種優(yōu)選方案,其中,步驟s3中,構(gòu)建的tapt模型通過梯度下降法更新模型參數(shù),以最小化訓練過程中的損失函數(shù),從而實現(xiàn)有效的模型訓練,練過程中采用的損失函數(shù)如下:
47、;
48、其中,是用于序列poi推薦的損失:
49、;
50、其中,表示樣本總數(shù),是sigmoid函數(shù),是第個正樣本的得分,是第個負樣本的得分,是一個超參數(shù)用來平衡兩個損失函數(shù);
51、采用均方誤差mse損失來進行優(yōu)化:
52、;
53、其中,是每個用戶的時間戳序列長度,是第個樣本的真實時間戳,是第個樣本的預測時間戳。
54、與現(xiàn)有技術(shù)相比,本發(fā)明具有的有益效果是:本發(fā)明通過提出基于時間感知的poi推薦和時間戳預測框架(tapt),有效克服了現(xiàn)有技術(shù)在用戶行為建模和時間信息處理方面的不足,首先,采用數(shù)據(jù)過濾技術(shù),排除不活躍用戶和冷門poi,確保數(shù)據(jù)質(zhì)量和代表性。隨后,通過精心設(shè)計的時間戳編碼和特征連接,模型能夠更全面地捕捉用戶的時空偏好,提高推薦的準確性。此外,多任務(wù)學習框架的應(yīng)用,使得poi推薦與時間戳預測相輔相成,進一步增強了系統(tǒng)的整體性能。這些優(yōu)點使得tapt在實時推薦和預測任務(wù)中表現(xiàn)出色,提升了用戶體驗和滿意度。