基于用戶上下文數(shù)據(jù)的Web服務(wù)信譽(yù)度度量方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于用戶上下文的Web服務(wù)信譽(yù)度度量方法,屬于計(jì)算機(jī)應(yīng)用的
技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 面向服務(wù)的體系結(jié)構(gòu)SOA(Service-OrientedArchitecture)是一個(gè)組件模型,它 將應(yīng)用程序的不同功能單元(又稱為服務(wù))通過(guò)這些服務(wù)之間定義良好的接口和契約聯(lián)系 起來(lái)。S0A技術(shù)的存在已超過(guò)20年,但是,一直未得到廣泛應(yīng)用。隨著Web服務(wù)的出現(xiàn),已 逐漸被人們接納,S0A終于迎來(lái)了自己的"春天"。
[0003] 在開(kāi)放的S0A環(huán)境中,由于受很多因素的影響,用戶不能同時(shí)保證服務(wù)提供者發(fā) 布的服務(wù)QoS信息是客觀的、可靠的和真實(shí)的。因此,有效地衡量服務(wù)提供者發(fā)布服務(wù)的 QoS的真實(shí)性、可信性,對(duì)于服務(wù)選擇是非常重要的。信譽(yù)度正是對(duì)QoS真實(shí)性、可信性進(jìn)行 衡量的一個(gè)重要因素。信譽(yù)度一般是根據(jù)大量用戶在使用某項(xiàng)服務(wù)后所給出的反饋等級(jí), 計(jì)算評(píng)估出一個(gè)與服務(wù)信譽(yù)相關(guān)的值。它代表了一個(gè)Web服務(wù)的真實(shí)、可信程度。因此,月艮 務(wù)提供者提供某種功能服務(wù)時(shí),不僅要滿足傳統(tǒng)QoS要求,也要同時(shí)滿足消費(fèi)者對(duì)于信譽(yù) 度的需求。Web服務(wù)信譽(yù)度對(duì)于服務(wù)選擇等有著重要意義。準(zhǔn)確的服務(wù)信譽(yù)度度量方法, 一方面有利于服務(wù)請(qǐng)求者(服務(wù)消費(fèi)者/用戶)能夠選擇信譽(yù)好的服務(wù)提供者,從而獲得 安全、可靠的服務(wù);另一方面,也有利于服務(wù)提供者通過(guò)度量得到的信譽(yù)度來(lái)提升自身的服 務(wù),從而吸引更多的服務(wù)請(qǐng)求者,形成Web服務(wù)健康而又穩(wěn)定的發(fā)展和服務(wù)的局面。因此, Web服務(wù)信譽(yù)度度量已經(jīng)成為研宄熱點(diǎn)。
[0004] 國(guó)外現(xiàn)有技術(shù)情況是:文獻(xiàn)《Atrustmanagementframeworkfor service-orientedenvironments〉〉(干丨_|于In:Proc.ofthe18thInt, 1Conf.onWorld WideWeb"WWW2009"2009. 289-302. [doi: 10. 1145/1526709. 1526829])提出了一個(gè)面向 開(kāi)放分布式服務(wù)環(huán)境的基于信譽(yù)度的服務(wù)可信管理框架,其核心是可信服務(wù)管理,不僅支 持多種不同實(shí)體的信任關(guān)系,同時(shí)還支持每個(gè)實(shí)體采用不同的信譽(yù)度評(píng)分函數(shù)對(duì)同樣的反 饋數(shù)據(jù)進(jìn)行評(píng)估。該框架的一個(gè)顯著優(yōu)點(diǎn)是支持多種信譽(yù)度評(píng)估方法,具有較高的實(shí)用價(jià) 值。
[0005] 文獻(xiàn)《Aclassofhierarchicalfuzzysystemswithconstraintsonthe fuzzyrules[J].》(刊于"FuzzySystems,IEEETransactions"on,2005,13 (2),194-203) 綜合考慮了服務(wù)QoS和用戶相似度兩種角度,對(duì)Web服務(wù)信譽(yù)度進(jìn)行度量。該文在傳統(tǒng)Web 服務(wù)模型的基礎(chǔ)上進(jìn)行了擴(kuò)展,添加服務(wù)檢測(cè)中心。提出了基于用戶主觀和客觀評(píng)價(jià)相結(jié) 合的角度。將從服務(wù)檢測(cè)中心得到的QoS數(shù)據(jù)與發(fā)布的值進(jìn)行對(duì)比來(lái)更新QoS。然后通過(guò) 用戶的相似度,基于相似用戶對(duì)服務(wù)推薦等。
[0006] 國(guó)內(nèi)現(xiàn)有技術(shù)情況是:北京大學(xué)的梅宏等人提出了一種有效地考慮用戶反饋等級(jí) 的真實(shí)性和準(zhǔn)確性的信譽(yù)度度量方法。該方法通過(guò)統(tǒng)計(jì)的方法,用統(tǒng)計(jì)量足夠的用戶反饋 數(shù)據(jù)作為標(biāo)準(zhǔn)值,根據(jù)標(biāo)準(zhǔn)值來(lái)修正其他反饋數(shù)據(jù),以有效地修正惡意反饋,從而獲得更為 可信的信譽(yù)度評(píng)估環(huán)境。
[0007] 華中科技大學(xué)的徐蘭芳等人針對(duì)傳統(tǒng)分析方法中存在惡意客戶的虛假推薦,提出 了以灰色系統(tǒng)理論為基礎(chǔ)、以灰色聚類評(píng)估算法為主要內(nèi)容的信譽(yù)報(bào)告機(jī)制方案。該方案 克服了傳統(tǒng)分析中每個(gè)用戶的評(píng)級(jí)權(quán)視為相等的做法,能夠使數(shù)據(jù)更為客觀,具有評(píng)估可 靠、可操作性強(qiáng)等優(yōu)點(diǎn)。
[0008] 北京郵電大學(xué)的王尚廣等人提出了一種用于QoS感知Web服務(wù)選擇中信譽(yù)度的評(píng) 估方法。該方法的主要思想是,通過(guò)反饋核查、校正和檢測(cè)這三個(gè)信譽(yù)度評(píng)估模塊應(yīng)對(duì)來(lái)自 用戶的混亂、偏好和惡意三種反饋對(duì)信譽(yù)度評(píng)估客觀性和準(zhǔn)確性的影響。所提出的方法有 效提高了信譽(yù)度評(píng)估的客觀性,還顯著減小了服務(wù)選擇的偏離度。
[0009] 綜上所述,盡管已有的Web服務(wù)信譽(yù)度度量方法能夠有效地提高服務(wù)信譽(yù)度度量 的準(zhǔn)確性,但其大都存在以下缺點(diǎn):(1)上述方法將所有用戶都視為同一權(quán)重,即認(rèn)為所有 有效的反饋用戶影響因子相同,而這點(diǎn)很顯然是不準(zhǔn)確的。(2)上述方法忽略了用戶使用服 務(wù)時(shí)所處環(huán)境,以及所用設(shè)備造成的影響,即忽略了用戶上下文這個(gè)影響因素,沒(méi)有對(duì)不同 環(huán)境下的反饋數(shù)據(jù)區(qū)分對(duì)待。這些問(wèn)題都導(dǎo)致了方法存在一定程度上的不準(zhǔn)確性。
[0010] 因此,如何有效地考慮用戶上下文對(duì)用戶反饋等級(jí)造成的影響并對(duì)影響加以弱 化,以更準(zhǔn)確的度量服務(wù)信譽(yù)度,成為業(yè)內(nèi)科技人員關(guān)注的新課題,并對(duì)其進(jìn)行了大量的探 索與研宄。
【發(fā)明內(nèi)容】
[0011] 有鑒于此,本發(fā)明的目的是提供一種基于用戶上下文數(shù)據(jù)的Web服務(wù)信譽(yù)度度量 方法,本發(fā)明方法能夠在移動(dòng)環(huán)境中,用戶上下文數(shù)據(jù)對(duì)服務(wù)QoS影響較大的情況下進(jìn)行 Web服務(wù)信譽(yù)度的準(zhǔn)確度量,該方法是先對(duì)用戶使用服務(wù)時(shí)所在的用戶上下文數(shù)據(jù)信息進(jìn) 行預(yù)處理,以便對(duì)用戶上下文數(shù)據(jù)進(jìn)行分類,根據(jù)大量的用戶反饋等級(jí)數(shù)據(jù)以及對(duì)應(yīng)的用 戶上下文數(shù)據(jù)分類,推理出不同用戶上下文數(shù)據(jù)類別對(duì)反饋等級(jí)造成的影響,進(jìn)而弱化用 戶上下文數(shù)據(jù)對(duì)反饋等級(jí)造成的影響,根據(jù)弱化用戶上下文影響后的反饋等級(jí),準(zhǔn)確度量 服務(wù)信譽(yù)度。
[0012] 為了達(dá)到上述發(fā)明目的,本發(fā)明提供了一種基于用戶上下文數(shù)據(jù)的Web服務(wù)信譽(yù) 度度量方法,其特征在于:首先采集用戶訪問(wèn)Web服務(wù)時(shí)的該用戶的上下文數(shù)據(jù),并利用歸 一化方式對(duì)該用戶以向量表示的上下文數(shù)據(jù)進(jìn)行預(yù)處理,再利用k-means方法對(duì)該用戶的 這些預(yù)處理后的上下文數(shù)據(jù)進(jìn)行聚類,以便用不同類別分別表示不同用戶的上下文數(shù)據(jù); 然后,根據(jù)用戶反饋等級(jí)和聚類后的用戶上下文數(shù)據(jù)計(jì)算不同類別的用戶上下文數(shù)據(jù)對(duì)反 饋等級(jí)造成的影響,將不同類別的用戶上下文數(shù)據(jù)的反饋等級(jí)轉(zhuǎn)換為統(tǒng)一的參考級(jí)別,以 弱化不同類別用戶上下文數(shù)據(jù)對(duì)反饋等級(jí)的影響;最后,根據(jù)轉(zhuǎn)換后的反饋等級(jí)計(jì)算用戶 相似度,并以此獲得參考用戶的上下文數(shù)據(jù)類別對(duì)應(yīng)的服務(wù)信譽(yù)度,最終轉(zhuǎn)化為其他用戶 上下文數(shù)據(jù)類別對(duì)應(yīng)的服務(wù)信譽(yù)度;所述方法包括下列操作步驟:
[0013] 步驟1,對(duì)采集到的用戶訪問(wèn)Web服務(wù)時(shí)的上下文數(shù)據(jù)執(zhí)行預(yù)處理:因?yàn)閷?duì)用戶上 下文數(shù)據(jù)產(chǎn)生影響的因素有多個(gè),至少包括CPU、內(nèi)存、屏幕尺寸和網(wǎng)絡(luò)帶寬四個(gè)因素,且不 同因素的物理涵義、取值范圍和計(jì)量單位又各不相同,故先選取其中影響大的因素,并對(duì)該 影響大的各個(gè)因素進(jìn)行歸一化處理,再將歸一化后的各個(gè)因素統(tǒng)一采用向量表示,作為歸 一化后的用戶上下文數(shù)據(jù);然后用k-means方法對(duì)歸一化后的用戶上下文數(shù)據(jù)進(jìn)行聚類, 以便能夠根據(jù)用戶上下文數(shù)據(jù)將用戶反饋等級(jí)歸分為不同類別;
[0014] 步驟2,計(jì)算不同類別的用戶上下文數(shù)據(jù)對(duì)反饋等級(jí)的影響:根據(jù)聚類后的用戶 上下文數(shù)據(jù)及其相應(yīng)的反饋等級(jí),為每個(gè)用戶分別計(jì)算不同類別用戶上下文數(shù)據(jù)對(duì)其反饋 等級(jí)造成的影響,也就是求解每個(gè)用戶在訪問(wèn)同一服務(wù)時(shí),在不同類別用戶上下文數(shù)據(jù)環(huán) 境下,將不同類別的用戶上下文數(shù)據(jù)反饋等級(jí)轉(zhuǎn)換為統(tǒng)一的參考級(jí)別,使得該用戶提交的 反饋等級(jí)之間的差別實(shí)現(xiàn)弱化處理;
[0015]步驟3,根據(jù)轉(zhuǎn)換后的統(tǒng)一的