基于加權(quán)時空效應(yīng)的情境感知Web 服務(wù)推薦方法
【專利摘要】本發(fā)明公開了一種基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,包括,建立加權(quán)時間衰減模型,從而找到與當(dāng)前用戶在考慮時間衰減作用的情況下偏好相似的用戶集合;采用位置感知相似度挖掘算法,獲得和用戶當(dāng)前所處情境相似的用戶集合;建立時空相關(guān)性與用戶偏好的關(guān)系模型,從而得到與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄;基于上述得到的與當(dāng)前用戶在考慮時間衰減作用的情況下偏好相似的用戶集合,用戶當(dāng)前所處情境相似的用戶集合以及與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄利用貝葉斯定理進行服務(wù)QoS值預(yù)測,得到滿意度最高的服務(wù);對得到的服務(wù)進行結(jié)果評估。實現(xiàn)提高推薦準(zhǔn)確率的優(yōu)點。
【專利說明】
基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體地,涉及一種基于加權(quán)時空效應(yīng)的情境感知Web服務(wù) 推薦方法。
【背景技術(shù)】
[0002] Web服務(wù)是一種面向服務(wù)的應(yīng)用程序,它通過標(biāo)準(zhǔn)的Web協(xié)議提供服務(wù),目的是保 證不同平臺的應(yīng)用服務(wù)能夠?qū)崿F(xiàn)互操作。常見的Web服務(wù)有提供天氣預(yù)報查詢的Web服務(wù)、 提供應(yīng)用程序下載的Web服務(wù)等。隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,大量功能類似的Web服務(wù)在 Internet上發(fā)布。因此,如何為用戶篩選并推薦滿足其個性化需求的Web服務(wù)是一個迫切需 要解決的問題。針對于此,工業(yè)界和學(xué)術(shù)界從多重視角對Web服務(wù)推薦進行了大量研究實 踐,提出了 Web服務(wù)推薦的各種技術(shù)和系統(tǒng)。這些技術(shù)大致分為三類:基于協(xié)同過濾的推薦 方法,QoS感知的推薦方法,以及基于情境感知的推薦方法。
[0003] C.Wu,J.Wu,Z.Zheng等人提出了一種協(xié)同過濾的推薦方法,即根據(jù)用戶的歷史記 錄或"用戶-服務(wù)"評分矩陣計算用戶相似度或服務(wù)相似度來為用戶推薦感興趣或者評分最 高的Web服務(wù)。另外,Xiaohui Cui等在在協(xié)同過濾過程中考慮了時間衰減的因素,對距離當(dāng) 前時間不同的QoS評分,賦予不同的權(quán)重,即距離當(dāng)前時間越近,在用戶興趣相似度求解的 過程中所占的權(quán)重越大。該技術(shù)方案的缺點是:用戶對不同Web服務(wù)的歷史評分存在巨大差 異,然而本方法忽視了差異化的評分對Web服務(wù)推薦的不同影響,因此在相似度計算過程中 造成了推薦算法效率低的缺陷。
[0004] Zibin Zheng等人提出了一種基于QoS感知的Web服務(wù)推薦方法。該方法的核心是 提出了一種利用歷史Web服務(wù)QoS信息的用戶協(xié)同機制,并基于采集的歷史QoS數(shù)據(jù)為當(dāng)前 用戶預(yù)測Web服務(wù)的QoS值。缺點:Web服務(wù)的QoS值(如響應(yīng)時間)很大程度上依賴于網(wǎng)絡(luò)條 件等情境因素。兩個用戶所處的情境越相近,則兩者對相同Web服務(wù)的QoS值就越相似。然 而,此方法沒有考慮上述情境相似性。因此,造成了 QoS預(yù)測準(zhǔn)確性低的缺陷。
[0005] 情境感知的推薦算法主要考慮社會網(wǎng)絡(luò)、空間、時間等情境因素,為用戶進行更加 準(zhǔn)確的網(wǎng)絡(luò)服務(wù)推薦。Kuang Li,M. Tang,Y. Hu等人考慮用戶和網(wǎng)絡(luò)服務(wù)的空間位置情境, 提出了一種基于位置感知的協(xié)同過濾推薦方法,能夠根據(jù)用戶所處的位置信息和Web服務(wù) 的服務(wù)質(zhì)量,為用戶做出綜合的服務(wù)推薦。上述方法的缺點是:用戶所處的空間位置會隨著 時間的變化而變化,然而現(xiàn)有技術(shù)很少考慮時空相關(guān)性對用戶偏好的影響。
[0006] 現(xiàn)有技術(shù)中三套具有代表性且和本發(fā)明相關(guān)的技術(shù)方案為:
[0007] l)Yan Hu等人和Xiaohui Cui等人對推薦中存在的時間衰減進行不同的建模,為 用戶進行推薦。
[0008] 2)Zheng等人提出了根據(jù)用戶需求、興趣偏好和歷史記錄等信息,并利用"用戶-月艮 務(wù)"評分矩陣來為用戶推薦感興趣或者評分最高的Web服務(wù)的方法。
[0009] 3)M. Tang,Y. Hu等人提出了情境感知的Web服務(wù)推薦方法,旨在向當(dāng)前用戶推薦與 之所處的情境信息相似的服務(wù)調(diào)用記錄中的服務(wù)。
[0010] 上述三套解決方案的缺點是:第一,在協(xié)同過濾的過程中考慮了時間衰減效應(yīng),但 沒有考慮不同的Q〇S數(shù)值對協(xié)同過濾也有不同權(quán)重的影響,即缺少對加權(quán)時間衰減效應(yīng)的 考慮;第二,忽略了用戶當(dāng)前所處的情境信息,Web服務(wù)的QoS值(如響應(yīng)時間)很大程度上依 賴于網(wǎng)絡(luò)條件等情境因素。兩個用戶所處的情境越相近,則兩者對相同Web服務(wù)的QoS值就 越相似。然而,此方法缺少考慮情境相似效應(yīng)的影響。因此,造成了 QoS預(yù)測準(zhǔn)確性低的缺 陷;第三,僅僅將情境信息作為"過濾器",即利用篩選所得到的與當(dāng)前用戶偏好相關(guān)的歷史 調(diào)用數(shù)據(jù)進行推薦,但由于沒有考慮時空相關(guān)性對用戶偏好之間的影響,從而影響了推薦 方法的準(zhǔn)確率。
【發(fā)明內(nèi)容】
[0011] 本發(fā)明的目的在于,針對上述問題,提出一種基于加權(quán)時空效應(yīng)的情境感知Web月艮 務(wù)推薦方法,以實現(xiàn)提高推薦準(zhǔn)確率的優(yōu)點。
[0012] 為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:
[0013] 一種基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,包括,
[0014] 步驟1、建立加權(quán)時間衰減模型,從而找到與當(dāng)前用戶在考慮時間衰減作用的情況 下偏好相似的用戶集合;
[0015] 步驟2、采用位置感知相似度挖掘算法,獲得和用戶當(dāng)前所處情境相似的用戶集 合;
[0016] 步驟3、建立時空相關(guān)性與用戶偏好的關(guān)系模型,從而得到與用戶當(dāng)前偏好相符的 網(wǎng)絡(luò)服務(wù)調(diào)用記錄;
[0017] 步驟4、基于上述得到的與當(dāng)前用戶在考慮時間衰減作用的情況下偏好相似的用 戶集合,用戶當(dāng)前所處情境相似的用戶集合以及與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄 利用貝葉斯定理進行服務(wù)QoS值預(yù)測,得到滿意度最高的服務(wù);
[0018] 步驟5、對上述步驟4得到的服務(wù)進行結(jié)果評估。
[0019] 優(yōu)選的,所述步驟1中建立加權(quán)時間衰減模型具體為:
[0020] 建立時間衰減的函數(shù)為:
[0021] f( a , t) = e_aitc贓ent_At|,
[0022] 對于不同的QoS,能得到其影響系數(shù)α:
[0024] 其中,巧政和\辦分別代表用戶Ul和用戶對服務(wù)洗的用戶滿意度,&和&分別 代表用戶m和用戶叫對所有共同調(diào)用過的服務(wù)的滿意度平均值;
[0025] 結(jié)合皮爾森方程,計算考慮時間衰減效應(yīng)的相似度大小,如下,
[0027] 其中,是用戶Ul和用戶u課同調(diào)用的網(wǎng)絡(luò)服務(wù)的集合,Sk是胃Ui, u#的任意 一個服務(wù),iUi是用戶m對所有網(wǎng)絡(luò)服務(wù)評分的均值,fUj是用戶W對所有網(wǎng)絡(luò)服務(wù)評分的均
值,t current 代表當(dāng)前時間,。
[0028] 優(yōu)選的,所述步驟2的位置感知相似度挖掘算法中,采用歐幾里得距離計算兩個用 戶之間不同時間所處位置的相似度,其公式如下:
[0030] 其中,表示兩個用戶之間位置相似度,Ink和Ut,k分別表示用戶 m和用戶uj在t時刻的位置的第k個維度。
[0031] 優(yōu)選的,所述步驟3建立時空相關(guān)性與用戶偏好的關(guān)系模型中,具體為建立網(wǎng)絡(luò)距 離對用戶偏好的影響模型,模型公式如下:
[0032] PNDSit) = P〇r)is(lu.tilSk)nor
[0033] 其中,Po是一個常數(shù),Dis(lUi,t,lSk)代表用戶和服務(wù)之間的網(wǎng)絡(luò)距離, Dis(lUi,t,iSk)nor是為了對偏好影響的量化在一個數(shù)量級上而進行的歸一化處理,結(jié)果歸 一化到0-1之間;
[0034] PRC s⑴和Pnd s⑴是時空相關(guān)性對用戶偏好造成的影響,分別賦給它們不同的權(quán)重, 可得到總體的偏好影響如下,
[0035] Ps(t) = s(t) + w2P0Dis(lM, lSk)nor
[0036] 最后,利用Ps(t)得到與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄,^和《2分別代表 QoS屬性的權(quán)重。
[0037] 優(yōu)選的,貝葉斯定理,用公式表示為:
[0039] 其中,P(0S=l|Si)表示對服務(wù)Si滿意度,P(0S=1)表示對所有服務(wù)的滿意率,P( Si |os=i)表示滿意的服務(wù)是81的概率,p(Sl)表示在所有的調(diào)用記錄中調(diào)用服務(wù)81的概率。 [0040]優(yōu)選的,所述步驟5對得到的服務(wù)進行結(jié)果評估具體為:
[0041 ] 采用MAE/RMSE值進行預(yù)測結(jié)果的評估,
[0042]具體采用平均絕對誤差的公式:
[0044]均方根誤差的公式:
[0046] 其中,Qu,#表用戶u對服務(wù)s總體QoS值的實際值,g.u,s代表用戶u對服務(wù)s總體QoS
值的預(yù)測值,N代表預(yù)測的總次數(shù)。MAE/RMSE的值越小,說明預(yù)測的誤差越小,即推薦系統(tǒng)預(yù) 測得越準(zhǔn)。
[0047]優(yōu)選的,所述步驟1建立加權(quán)時間衰減模型前還包括數(shù)據(jù)集預(yù)處理的步驟,
[0048]所述數(shù)據(jù)集預(yù)處理,包括將數(shù)據(jù)集劃分訓(xùn)練集和測試集、數(shù)據(jù)集的預(yù)處理、每一條 調(diào)用記錄Q〇 S值的計算和閾值q的設(shè)定。
[0049] 優(yōu)選的,所述訓(xùn)練集和測試集的劃分比例為:14:1、13; 2,12:3、11: 4、10: 5、9:6或 8:7〇
[0050]優(yōu)選的,所述數(shù)據(jù)集預(yù)處理采用高斯標(biāo)準(zhǔn)化方法,高斯方法標(biāo)準(zhǔn)化QoS特性的數(shù)據(jù) 公式如下:
[0052] 其中,qjf表示服務(wù)81被用戶w調(diào)用時第k個QoS特性的數(shù)值大小,£}$是對q;;·1歸一 化后的結(jié)果,I是用戶的第k個特性的平均值,力是用戶的第k個特性的標(biāo)準(zhǔn)差。
[0053] 優(yōu)選的,每一條調(diào)用記錄QoS值的計算公式為:
[0054] Q〇S = Wl*VRTT+W2*VData Size+W3*VR HTTP Message
[0055] 其中,VRTT、VData Size、VR HTTP Message分別是響應(yīng)時間、數(shù)據(jù)大小、響應(yīng)消息的Q〇S值, W1、W2、W3分別是三個QoS屬性的權(quán)重。
[0056] 優(yōu)選的,W1、W2和W3分別賦值為0 · 35、0 · 05和0 · 60。
[0057]本發(fā)明的技術(shù)方案具有以下有益效果:
[0058] 本發(fā)明主要考慮網(wǎng)絡(luò)服務(wù)中時間效應(yīng)的影響,首先,在協(xié)同過濾的過程中,將原有 時間衰減效應(yīng)與不同QoS值的影響相結(jié)合,進行新的建模;其次,考慮用戶所處情境相似性 的影響,即兩個用戶所處的情境越相近,則兩者對相同Web服務(wù)的QoS值就越相似,據(jù)此為用 戶做出更準(zhǔn)確的推薦;最后,考慮空間情境隨時間變化的時空相關(guān)性因素,建模其對用戶偏 好的影響,為用戶做出實時的個性化的推薦。
[0059] 下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細(xì)描述。
【附圖說明】
[0060] 圖1為本發(fā)明實施例所述的考慮時間效應(yīng)的天氣預(yù)報Web服務(wù)推薦方法的場景示 意圖;
[0061] 圖2為本發(fā)明實施例所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法的流 程圖;
[0062] 圖3為本發(fā)明實施例所述的時間衰減效應(yīng)模型示意圖;
[0063] 圖4為本發(fā)明實施例所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法模塊 示意圖;
[0064] 圖5為本發(fā)明實施例所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法的具 體實施方式原理框圖;
[0065] 圖6a和圖6b為不同算法的MAE和RMSE結(jié)果示意圖;
[0066]圖7a和圖7b為不同測試集和訓(xùn)練集比例下各種算法的MAE和RMSE結(jié)果示意圖; [0067] 圖8a和圖8b為在不同相鄰用戶個數(shù)下的MAE和RMSE結(jié)果示意圖。
【具體實施方式】
[0068] 以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實 施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0069] 現(xiàn)有技術(shù)存在的缺陷有:第一,現(xiàn)有技術(shù)雖然在協(xié)同過濾的過程中考慮到了時間 衰減效應(yīng),但從沒有考慮到不同的QoS數(shù)值對協(xié)同過濾也有不同權(quán)重的影響;第二,現(xiàn)有技 術(shù)很少考慮到情境相似性的影響,即兩個用戶所處的情境越相近,則兩者對相同Web服務(wù)的 QoS值就越相似;第三,現(xiàn)有技術(shù)很少有考慮時空相關(guān)性對用戶偏好的影響,即用戶的位置 會隨著時間的變化而變化,由于Web服務(wù)本身與網(wǎng)絡(luò)息息相關(guān),這會導(dǎo)致用戶的偏好發(fā)生變 化。
[0070] 針對現(xiàn)有技術(shù)存在的缺陷,本發(fā)明首先建立了協(xié)同過濾過程中考慮不同QoS數(shù)值 影響的加權(quán)時間衰減效應(yīng)模型;其次,建立了情境相似效應(yīng)影響模型;再次,對時空相關(guān)性 對用戶偏好影響進行建模;最后結(jié)合貝葉斯預(yù)測方法,實現(xiàn)了一種基于加權(quán)時空效應(yīng)的個 性化網(wǎng)絡(luò)服務(wù)推薦機制,解決了現(xiàn)有技術(shù)方案推薦準(zhǔn)確率不高、推薦效果較差等問題。
[0071] 首先,考慮時空相關(guān)性對用戶偏好的影響。附圖1展示了本發(fā)明公開的考慮時空相 關(guān)性對用戶偏好的影響的天氣預(yù)報網(wǎng)絡(luò)服務(wù)推薦方法的場景圖。圖中包含一個服務(wù)層(里 面包含許多服務(wù),且這些服務(wù)廣泛地分布在世界各地)、一個空間層和一個時間層。
[0072] 假設(shè)這個服務(wù)存儲庫里面包含有許多在線的天氣預(yù)報服務(wù)(81和82代表美國國家 氣象局的天氣預(yù)報服務(wù),S3代表中國國家氣象中心的天氣預(yù)報服務(wù),s 5也代表氣象中國的天 氣預(yù)報服務(wù),S4代表英國BBC的天氣預(yù)報服務(wù))。
[0073]由于天氣預(yù)報服務(wù)的準(zhǔn)確度與地域的相關(guān)性很大,很自然地,用戶偏好于選擇距 離自己當(dāng)前位置比較近的天氣預(yù)報網(wǎng)絡(luò)服務(wù)。在附圖1的場景中,2015年1月12日的時候用 戶m在紐約,則其會傾向于選擇來自紐約的天氣預(yù)報網(wǎng)絡(luò)服務(wù) 81或82。而2015年1月13日到 2015年1月16日,用戶m由于出差一直呆在北京,則其傾向于選擇來自北京的天氣預(yù)報網(wǎng)絡(luò) 服務(wù) 83和85。此外,對于和地域不相關(guān)的服務(wù),由于響應(yīng)時間、相應(yīng)結(jié)果、數(shù)據(jù)大小等都與網(wǎng) 絡(luò)位置有關(guān),用戶和服務(wù)之間的網(wǎng)絡(luò)越近,其調(diào)用性能就越好,所以對用戶來說即使是服務(wù) 本身與地域不相關(guān),還是傾向于選擇距自己較近的服務(wù)??傊?dāng)隨著時間的變化,用戶的 位置發(fā)生變化時,用戶的偏好也會隨之發(fā)生相應(yīng)的變化,據(jù)此建立用戶時空相關(guān)性與用戶 偏好之間的影響模型。
[0074]其次,考慮不同的QoS值對協(xié)同過濾過程的影響。現(xiàn)有技術(shù)通常在協(xié)同過濾的過程 中考慮時間衰減效應(yīng),即隨著時間的變化,用戶之前的服務(wù)調(diào)用記錄在進行推薦時所起到 的作用也會發(fā)生變化,距離當(dāng)前時間越遠(yuǎn)的調(diào)用記錄可能對用戶相似度求解所起的作用越 小。而不同的QoS值也會對這一過程產(chǎn)生影響,比如,用戶A調(diào)用服務(wù)1,響應(yīng)時間為0.60秒, 而調(diào)用功能相似的服務(wù)2時,響應(yīng)時間是20秒,從用戶體驗的角度來說,用戶對服務(wù)1的偏好 就大一些,如果和另外一個用戶B進行興趣相似度的求解時,我們應(yīng)當(dāng)放大"用戶A更加喜歡 服務(wù)Γ這個事實。
[0075]另外,考慮情境相似效應(yīng)的影響。所謂情境相似效應(yīng)就是說如果兩個用戶當(dāng)前所 處的情境(如網(wǎng)速,帶寬等)一樣,由于Web服務(wù)的QoS特性與那些情境密切相關(guān),那么調(diào)用同 一 Web服務(wù)時,情境相似的用戶會得到相似的QoS特性。據(jù)此,我們可以為用戶尋找情境相似 的用戶,為其做出更合理的推薦。
[0076]如圖2所示,基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,包括以下步驟:
[0077]步驟1、建立加權(quán)時間衰減模型:
[0078]傳統(tǒng)的協(xié)同過濾算法一般是利用用戶-商品評分矩陣尋找相似的用戶或相似的商 品,進而為用戶進行推薦。但在實際情況下,隨著時間的推移,距離當(dāng)前時間比較遠(yuǎn)的用戶-商品評分記錄在相似度計算的過程中所起的作用會慢慢減小,而距離當(dāng)前時間比較近的用 戶-商品評分記錄在相似度計算的過程中所起的作用相對來說會比較大一些,即用戶-商品 評分記錄會隨著時間的推移所起的作用會發(fā)生衰減。本發(fā)明建立時間衰減模型,下面結(jié)合 圖3進行說明。
[0079]圖3中tstart代表開始時間,tlk代表用戶i調(diào)用網(wǎng)絡(luò)服務(wù)sk的時間,4代表用戶j調(diào) 用網(wǎng)絡(luò)服務(wù)sk的時間,t?rrent代表當(dāng)前時間,Δ ti是tik與當(dāng)前時間t?nt的時間差,Δ tj是 tjk與當(dāng)前時間t current 的時間差。
[0080]對于不同的QoS,可以得到其影響系數(shù)α:
[0082]本發(fā)明建立時間衰減的函數(shù)如下,
[0084] 在進行相似度的計算時,用戶i和用戶j共同調(diào)用網(wǎng)絡(luò)服務(wù)Sk,它們關(guān)于網(wǎng)絡(luò)服務(wù)Sk 的相似度對整體的相似作用應(yīng)該有一個時間的衰減。為此,我們?nèi)≈虚g時間A t=( △ t+Δ t j )/2 〇
[0085] 結(jié)合傳統(tǒng)的相似度計算方法(皮爾森方程),可以計算考慮時間衰減效應(yīng)的相似度 大小,如下,
[0087]其中,胃Ui,Uj是用戶m和用戶化共同調(diào)用的網(wǎng)絡(luò)服務(wù)的集合,sk是W^uj中的任意 一個服務(wù),fUi是用戶m對所有網(wǎng)絡(luò)服務(wù)評分的均值。由此可以找到與當(dāng)前用戶在考慮時間 衰減作用的情況下偏好相似的用戶集合。
[0088]步驟2、位置感知相似度挖掘算法:
[0089]兩個用戶,當(dāng)他們所處的情境越相似,他們越有可能選擇相似的服務(wù)。通過情境相 似度的挖掘,獲得和用戶當(dāng)前所處情境相似的用戶集合。但是,隨著時間的變化,用戶所處 的情境會發(fā)生變化,因此本發(fā)明考慮隨著時間變化情境發(fā)生變化時情境感知挖掘,計算不 同時間下用戶與用戶之間情境多元組的相似度。本發(fā)明采用了歐幾里得距離來計算兩個用 戶之間不同時間所處位置的相似度,其公式如下:
[0091] 對于一個新來的用戶,可以利用歐幾里得距離公式計算其情境信息與各個簇心的 距離,距離最近的那個簇心所在的簇,其里面的用戶就是與當(dāng)前用戶情境最相似的。
[0092] 步驟3、時空相關(guān)性與用戶偏好的關(guān)系模型:
[0093]已經(jīng)知道,用戶的位置會隨著時間的推移而發(fā)生變化,用戶的這一時空相關(guān)性會 影響用戶的偏好。如1)場景介紹中所描述的,對于與地域相關(guān)的網(wǎng)絡(luò)服務(wù),用戶會偏好于距 離自己比較近的服務(wù),據(jù)此建立地域相關(guān)性對用戶偏好的影響,如下
[0095] 對于和地域不相關(guān)的服務(wù),由于響應(yīng)時間、相應(yīng)結(jié)果、數(shù)據(jù)大小等都與網(wǎng)絡(luò)位置有 關(guān),用戶和服務(wù)之間的網(wǎng)絡(luò)越近,其調(diào)用性能就越好,所以對用戶來說即使是服務(wù)本身與地 域不相關(guān),還是傾向于選擇距自己較近的服務(wù)。可以建立網(wǎng)絡(luò)距離對用戶偏好的影響模型, 如下
[0096] PpJD S(t)二:?0肋(1叫,1:,lsk.)nor,
[0097] 其中,Po是一個常數(shù),為了對偏好影響的量化在一個數(shù)量級上,本發(fā)明將Po設(shè)為1。 Dfe.(lUi,t, lSfc)代表用戶和服務(wù)之間的網(wǎng)絡(luò)距離,Dis(lUi>t, 量化在一個數(shù)量級上而進行的歸一化處理,將結(jié)果歸一化到0-1之間。
[0098] PRC S⑴和P_ S⑴都是時空相關(guān)性對用戶偏好造成的影響,分別賦給它們不同的權(quán) 重,可得到總體的偏好影響如下,
[0099] Ps")二 wAc S(:t) + w.2.P〇Di.S(lUi,t;,.lSk):n〇r,.
[0100] 最后,利用ps(t)可以得到與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄。
[0101] 步驟4、基于貝葉斯定理的QoS預(yù)測:
[0102] 經(jīng)過以上步驟得到與當(dāng)前用戶相關(guān)性比較大的服務(wù)調(diào)用記錄。在此基礎(chǔ)上,利用 貝葉斯定理進行服務(wù)QoS值(對當(dāng)前用戶來說)的預(yù)測。
[0103] 首先給出貝葉斯定理,用公式表示為:
[0105] 其中,p(os=i|Si)表示對服務(wù)Si滿意度,P(0S=1)表示對所有服務(wù)的滿意率,p(Si 〇S = l)表示滿意的里面是81的概率。
[0106] 下面根據(jù)表1來舉例說怎樣利用貝葉斯定理進行總體QoS的預(yù)測。
[0108] 表1、貝葉斯定理應(yīng)用表,
[0109] 在表1中,服務(wù)S1和服務(wù)82被相似用戶分別調(diào)用3次,服務(wù)S3被相似用戶調(diào)用了2次。 QoS是每次調(diào)用后的QoS大小,0S是根據(jù)設(shè)定的滿意閾值來判定是否滿意,0代表不滿意,1代 表滿意。利用貝葉斯公式,可預(yù)測每一個服務(wù)對當(dāng)前用戶的QoS值的大小,如下:
[0113] 通過以上預(yù)測結(jié)果可以看出,預(yù)測滿意度最高的服務(wù)是S1。
[0114] 步驟5、預(yù)測結(jié)果評估:
[0115] 對服務(wù)推薦預(yù)測結(jié)果的評估方法主要有兩種。一種是通過precision準(zhǔn)確率)/ recall(召回率)的方法來評估,這主要應(yīng)用于給用戶一次推薦多個服務(wù)的算法;另一種是 通過通常所說的MAE(平均絕對誤差)/RMSE(均方根誤差)來評估,MAE/RMSE的值越小,說明 預(yù)測的誤差越小,即推薦系統(tǒng)預(yù)測得越準(zhǔn),這種方法主要應(yīng)用于給出QoS預(yù)測值的算法。由 于本發(fā)明的預(yù)測結(jié)果是以QoS的形式給出的,所以采用MAE/RMSE值進行預(yù)測結(jié)果的評估。
[0116] 平均絕對誤差的公式
[0118]均方根誤差的公式
[0120] 其中,QU,SR表用戶u對服務(wù)s總體QoS值的實際值,gu;sR表用戶u對服務(wù)s總體QoS 值的預(yù)測值,N代表預(yù)測的總次數(shù)。MAE/RMSE的值越小,說明預(yù)測的誤差越小,即推薦系統(tǒng)預(yù) 測得越準(zhǔn)。
[0121] 當(dāng)用戶的時間情境發(fā)生變化時,重復(fù)上面的過程。
[0122] 1)數(shù)據(jù)集的預(yù)處理。主要包括數(shù)據(jù)集的訓(xùn)練集和測試集的劃分、數(shù)據(jù)集的預(yù)處理、 每一條調(diào)用記錄QoS值的計算、閾值q的設(shè)定。
[0123] 數(shù)據(jù)集的要劃分為訓(xùn)練集和測試集,訓(xùn)練集主要用來訓(xùn)練得出預(yù)測的結(jié)果,然后 和測試集中的結(jié)果進行比較,得出預(yù)測誤差。本實施例中,將數(shù)據(jù)集劃分訓(xùn)練集和測試集的 比例為 14:1,13;2,12:3,11:4,10:5,9:6,8:7。
[0124] 如圖4所示,在MATLAB軟件下對數(shù)據(jù)集中的數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。數(shù)據(jù)標(biāo)準(zhǔn)化屬于 現(xiàn)有技術(shù),目前存在許多種對數(shù)據(jù)預(yù)處理的方法。為了避免數(shù)據(jù)標(biāo)準(zhǔn)化的結(jié)果被一些極大 或極小的數(shù)據(jù)所影響,本文采用了高斯標(biāo)準(zhǔn)化方法。高斯方法標(biāo)準(zhǔn)化QoS特性的數(shù)據(jù)(RTT, Data Size),公式如下:
[0126] 其中·^是用戶的第k個特性的平均值,力是用戶的第k個特性的標(biāo)準(zhǔn)差。
[0127] 再次,計算用戶每一次調(diào)用服務(wù)后的整體滿意度QoS,公式為:
[0128] Q〇S = Wl*VRTT+W2*VData Size+W3*VR HTTP Message ?
[01 29] 其中,VRTT、VData Size、VR HTTP Message分別是響應(yīng)時間、數(shù)據(jù)大小、響應(yīng)消息的QoS值, WH2I3分別是三個Q〇S屬性的權(quán)重。這里根據(jù)各個特性的重要性大小,分別將三個權(quán)重賦 值為0.35,0.05 和0.60。
[0130]最后,設(shè)置表示用戶對此次Web服務(wù)調(diào)用是否滿意的閾值(根據(jù)QoS的結(jié)果,選擇一 個最有區(qū)分度的值)。對于每一個Web服務(wù)調(diào)用記錄,大于等于該閾值則為滿意(設(shè)為1),小 于該閾值則不滿意(設(shè)為〇)。
[0131]如圖5所示,數(shù)據(jù)集采用香港中文大學(xué)服務(wù)計算實驗室開發(fā)的WS-Dream Dataset。 該數(shù)據(jù)集是目前Web服務(wù)推薦最權(quán)威的數(shù)據(jù)集之一,包括Web服務(wù)調(diào)用記錄中的用戶IP地 址、Web服務(wù)地址、響應(yīng)時間、響應(yīng)消息、數(shù)據(jù)大小、數(shù)據(jù)吞吐量、失敗率等信息。數(shù)據(jù)集中有 150個用戶,100條服務(wù)。每個用戶對每條服務(wù)分別調(diào)用100次,所以大約共有150萬條服務(wù)調(diào) 用記錄。
[0132] 本實施例是使用MATLAB(2013a版本)來實現(xiàn)的。選擇MATLAB的好處是,該軟件中包 含有許多作圖的功能,為實驗結(jié)果的可視化提供了便利。上述軟件所運行的環(huán)境是Lenovo ThinkPad E430c,其CPU是2.5GHz Intel Core 15,操作系統(tǒng)是64位的Windows 7。
[0133] 與本發(fā)明實施結(jié)果的進行比較的參考算法:
[0134] 全部推薦方法:該算法利用數(shù)據(jù)集的所有數(shù)據(jù)直接進行QoS值的預(yù)測。
[0135] UPCC方法:其利用用戶的user-i tem評分矩陣,尋找與當(dāng)前用戶興趣相似的用戶的 歷史調(diào)用記錄進行預(yù)測。用戶之間的相似度利用皮爾森相關(guān)系數(shù)方程來計算。
[0136] IPCC方法:其利用item-user評分矩陣尋找用戶曾經(jīng)喜歡的item的相似items推薦 給用戶,item之間的相似度也是通過皮爾森相關(guān)系數(shù)方程來計算。
[0137] CASR方法:該方法通過尋找相似情境下的用戶集合的服務(wù)調(diào)用記錄為當(dāng)前用戶做 出推薦,它基于的假設(shè)是兩個用戶調(diào)用服務(wù)時所處的情境越相似,他們越有可能選擇相同 的服務(wù)。
[0138] CASR-UP方法:該方法考慮由用戶位置決定的用戶偏好,進而為用戶進行推薦。
[0139] ITRP-WS方法:該方法在推薦的時候考慮時間衰減效應(yīng)。
[0140] CASR-ΤΕ方法:該方法在推薦時考慮時空相關(guān)性和時間衰減效應(yīng),但不考慮不同 QoS值的影響。
[0141] 比較的結(jié)果具體見圖6a、圖6b、圖7a、圖7b、圖8a和圖8b。
[0142] 其中圖6a和圖6b中每個數(shù)據(jù)組中的數(shù)據(jù)柱從左至右依次為:UPCC、IPCC、RBA、 CASR、ITRP-WS、CASR-UP、CASR-TE、CASR-TSE。
[0143] 圖8a和圖8b中每個數(shù)據(jù)組中的數(shù)據(jù)柱從左至右依次為:UPCC、IPCC、ITRP-WS、 CASR-TE、CASR-TSE。
[0144] 通過以上實驗結(jié)果可以看出,本發(fā)明的CASR-TSE算法具有更小的實驗誤差,比其 它算法要好。
[0145] 另外對于以下技術(shù)方案的替換也在本發(fā)明技術(shù)方案的保護之中,
[0146] 1)本發(fā)明方法的數(shù)據(jù)預(yù)處理存在其它歸一化方法可以替代,如凡一切可進行歸一 化的方法均可替代數(shù)據(jù)預(yù)處理;
[0147] 2)本發(fā)明方法的位置感知相似度挖掘模塊存在,如位置感知相似度挖掘模塊存在 一些可以替換的方案,凡是求解多維向量之間距離大小的數(shù)學(xué)方法均可代替本方案進行建 模;
[0148] 3)本發(fā)明方法的QoS預(yù)測模塊,可以通過其它預(yù)測模型如SVM、決策樹或神經(jīng)網(wǎng)絡(luò) 等進行預(yù)測。凡是通過替代以上模塊而重新完成的發(fā)明方法技術(shù),都可視為在本發(fā)明技術(shù) 方案的保護之中。
[0149] 縮略語和關(guān)鍵術(shù)語說明:
[0150] RS(Recommender System,推薦系統(tǒng)):是根據(jù)用戶的信息需求、興趣和歷史行為記 錄等,將用戶感興趣的信息、產(chǎn)品等推薦給用戶的個性化信息推薦系統(tǒng)。
[0151] CARS(Context_aware Recommender System,情境感知推薦系統(tǒng)):是一種特殊的 推薦系統(tǒng),即一方面為用戶推薦那些與其信息需求相似的產(chǎn)品或服務(wù),另一方面基于情境 信息為用戶做出個性化推薦。
[0152] Web服務(wù)(網(wǎng)絡(luò)服務(wù)):是一個應(yīng)用程序,它能夠向外界提供一個通過網(wǎng)絡(luò)進行調(diào)用 的應(yīng)用程序接口(API)。
[0153] QoS(Quality of Service,服務(wù)質(zhì)量):當(dāng)用戶通過網(wǎng)絡(luò)調(diào)用一個Web服務(wù)時,會表 現(xiàn)出一些反應(yīng)服務(wù)質(zhì)量的特性,如調(diào)用是否成功、響應(yīng)時間、傳輸數(shù)據(jù)量大小等,這些特性 統(tǒng)稱為QoS。
[0154] 綜上所述,本發(fā)明帶來了以下有益的效果:
[0155] 1)本發(fā)明方法考慮了加權(quán)的時間衰減效應(yīng)模型,提升了推薦系統(tǒng)協(xié)同過濾過程中 相似度的求解準(zhǔn)確度。推薦系統(tǒng)中凡是涉及到協(xié)同過濾方法,即便對于不同的推薦對象(如 書,音樂,電影,商品等)都可以利用此加權(quán)的時間衰減效應(yīng)模型,來提升協(xié)同過濾過程中相 似度的求解準(zhǔn)確度,進而提升推薦的準(zhǔn)確率。
[0156] 2)本發(fā)明方法考慮了情境相似度的影響,即兩個用戶所處的情境越相近,則兩者 對相同Web服務(wù)的QoS值就越相似,并建立了情境相似度挖掘模型,進一步提升了推薦準(zhǔn)確 度。
[0157] 3)針對Web服務(wù)的推薦,本發(fā)明方法建立了時空相關(guān)性對用戶偏好影響的關(guān)系模 型,這一模型可以應(yīng)用到Web服務(wù)以及其它有著類似關(guān)系模型的推薦中去。
[0158] 4)本發(fā)明方法將以上兩種模型和位置相似度挖掘相結(jié)合,并利用貝葉斯方法進行 QoS的預(yù)測,得到了基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,可以進一步提升推薦 的準(zhǔn)確度。
[0159] 5)本基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,實現(xiàn)簡單,不需要使用其他 輔助模塊,可以在用戶隨著時間發(fā)生迀移變化時進行循環(huán)迭代,實現(xiàn)網(wǎng)絡(luò)服務(wù)預(yù)測與推薦 效率的去耦自校正,改善服務(wù)推薦效果。
[0160] 最后應(yīng)說明的是:以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明, 盡管參照前述實施例對本發(fā)明進行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可 以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換。 凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的 保護范圍之內(nèi)。
【主權(quán)項】
1. 一種基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在于,包括, 步驟1、建立加權(quán)時間衰減模型,從而找到與當(dāng)前用戶在考慮時間衰減作用的情況下偏 好相似的用戶集合; 步驟2、采用位置感知相似度挖掘算法,獲得和用戶當(dāng)前所處情境相似的用戶集合; 步驟3、建立時空相關(guān)性與用戶偏好的關(guān)系模型,從而得到與用戶當(dāng)前偏好相符的網(wǎng)絡(luò) 服務(wù)調(diào)用記錄; 步驟4、基于上述得到的與當(dāng)前用戶在考慮時間衰減作用的情況下偏好相似的用戶集 合,用戶當(dāng)前所處情境相似的用戶集合W及與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄利用 貝葉斯定理進行服務(wù)QoS值預(yù)測,得到滿意度最高的服務(wù); 步驟5、對上述步驟4得到的服務(wù)進行結(jié)果評估。2. 根據(jù)權(quán)利要求1所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,所述步驟1中建立加權(quán)時間衰減模型具體為: 建立時間衰減的函數(shù)為:對于不同的QoS,能得到其影響系數(shù)α:其中,rui,卻和r"柳分別代表用戶Ui和用戶U擁服務(wù)Sk的用戶滿意度,馬沖^分別代 表用戶m和用戶W對所有共同調(diào)用過的服務(wù)的滿意度平均值;結(jié)合皮爾森方程,計算考慮時 間衰減效應(yīng)的相似度大小,如下,其中,Wui,ui是用戶m和用戶U決同調(diào)用的網(wǎng)絡(luò)服務(wù)的集合,sk是中的任意一個 服務(wù),fui是用戶m對所有網(wǎng)絡(luò)服務(wù)評分的均值,fuj是用戶U苗f所有網(wǎng)絡(luò)服務(wù)評分的均值, tcurrent代表當(dāng)前時間。3. 根據(jù)權(quán)利要求2所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,所述步驟2的位置感知相似度挖掘算法中,采用歐幾里得距離計算兩個用戶之間不同時 間所處位置的相似度,其公式如下:其中,表示兩個用戶之間位置相似度,和Ut,k分別表示用戶m和 用戶w在t時刻的位置的第k個維度。4. 根據(jù)權(quán)利要求3所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,所述步驟3建立時空相關(guān)性與用戶偏好的關(guān)系模型中,具體為建立網(wǎng)絡(luò)距離對用戶偏好 的影響模型,模型公式如下:其中,P。是一個常數(shù),DiS化決Isk)代表用戶和服務(wù)之間的網(wǎng)絡(luò)距離,日iS(l叫,t,lsk)no:r 是為了對偏好影響的量化在一個數(shù)量級上而進行的歸一化處理,結(jié)果歸一化到0-1之間; 扣CS(t)和PNDS(t)是時空相關(guān)性對用戶偏好造成的影響,分別賦給它們不同的權(quán)重,可得 到總體的偏好影響如下,最后,利用Ps(t)得到與用戶當(dāng)前偏好相符的網(wǎng)絡(luò)服務(wù)調(diào)用記錄,W1和W2分別代表QoS屬 性的權(quán)重。5. 根據(jù)權(quán)利要求4所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于, 貝葉斯定理,用公式表示為:其中,P(0S=l|si)表示對服務(wù)Si滿意度,P(0S = 1)表示對所有服務(wù)的滿意率,P(si|〇S =1)表示滿意的服務(wù)是Si的概率,P(Si)表示在所有的調(diào)用記錄中調(diào)用服務(wù)Si的概率。6. 根據(jù)權(quán)利要求5所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,所述步驟5對得到的服務(wù)進行結(jié)果評估具體為: 采用MAE/RMSE值進行預(yù)測結(jié)果的評估, 具體采用平均絕對誤差的公式:其中,Qu,s代表用戶U對服務(wù)S總體QoS值的實際值,^,s代表用戶U對服務(wù)S總體QoS值的 預(yù)測值,N代表預(yù)測的總次數(shù),MAE/RMSE的值越小,說明預(yù)測的誤差越小,即推薦系統(tǒng)預(yù)測得 越準(zhǔn)。7. 根據(jù)權(quán)利要求1至6任一所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其 特征在于,所述步驟1建立加權(quán)時間衰減模型前還包括數(shù)據(jù)集預(yù)處理的步驟, 所述數(shù)據(jù)集預(yù)處理,包括將數(shù)據(jù)集劃分訓(xùn)練集和測試集、數(shù)據(jù)集的預(yù)處理、每一條調(diào)用 記錄QoS值的計算和闊值q的設(shè)定。8. 根據(jù)權(quán)利要求7所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,所述訓(xùn)練集和測試集的劃分比例為:14:1、13;2,12:3、11:4、10:5、9:6或8: 7。9. 根據(jù)權(quán)利要求8所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,所述數(shù)據(jù)集預(yù)處理采用高斯標(biāo)準(zhǔn)化方法,高斯方法標(biāo)準(zhǔn)化QoS特性的數(shù)據(jù)公式如下:其中,表示服務(wù)Si被用戶uj調(diào)用時第k個QoS特性的數(shù)值大小,qik^f是對向一化后 的結(jié)果,·是用戶U撕第k個特性的平均值,0遺用戶U說第k個特性的標(biāo)準(zhǔn)差。10. 根據(jù)權(quán)利要求98所述的基于加權(quán)時空效應(yīng)的情境感知Web服務(wù)推薦方法,其特征在 于,每一條調(diào)用記錄QoS值的計算公式為: QoS二W1 本VRTT+W2本VData Size+W3本VR 肌TP Message 其中,VRTT、VData Size、VR HTTP Message分別是響應(yīng)時間、數(shù)據(jù)大小、響應(yīng)消息的QoS值,W1、W2、 W3分別是蘭個QoS屬性的權(quán)重; W1、W2和W3分別賦值為0 · 35、0 · 0巧no · 60。
【文檔編號】G06F17/30GK106095887SQ201610396968
【公開日】2016年11月9日
【申請日】2016年6月7日 公開號201610396968.X, CN 106095887 A, CN 106095887A, CN 201610396968, CN-A-106095887, CN106095887 A, CN106095887A, CN201610396968, CN201610396968.X
【發(fā)明人】范曉亮, 胡亞昆, 王玉杰, 韓寧, 郭磊
【申請人】蘭州大學(xué)