專利名稱:一種基于用戶聚類的sky line在線計(jì)算方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種服務(wù)計(jì)算中的sky line計(jì)算發(fā)現(xiàn),尤其涉及實(shí)現(xiàn)了基于用戶聚類了離線預(yù)測(cè)的在線sky line計(jì)算方法。
背景技術(shù):
近年來,Web服務(wù)計(jì)算領(lǐng)域隨著SOA技術(shù)的廣泛應(yīng)用而得到了快速發(fā)展,從中衍生出了服務(wù)發(fā)現(xiàn)、服務(wù)組合、服務(wù)選擇等若干子領(lǐng)域。隨著SOA的廣泛應(yīng)用,當(dāng)今互聯(lián)網(wǎng)上的Web服務(wù)(之后簡稱為服務(wù))數(shù)量急劇的增加,使得人工的查找、選擇和調(diào)用服務(wù)不再能滿足需求,從而高效的發(fā)現(xiàn)、選擇和組合服務(wù)算法成為了迫切的研究需要。如何根據(jù)用戶功能需求描述,在海量服務(wù)中找到符合此功能需求的服務(wù),是服務(wù)發(fā)現(xiàn)的研究內(nèi)容。然而,在海量的服務(wù)中,通常會(huì)存在相當(dāng)數(shù)量由不同服務(wù)提供商所提供的,功能相同而非功能屬性完全不同的服務(wù),如何從大量功能上等價(jià)的服務(wù)中,根據(jù)其非功能屬性有效的選擇出最為合適的服務(wù),是服務(wù)選擇所解決的問題。作為服務(wù)選擇中的重要步驟,基于服務(wù)QoS屬性的skyI ine計(jì)算課題亦成為了熱門的研究方向。一次典型的服務(wù)計(jì)算請(qǐng)求,通常包括服務(wù)發(fā)現(xiàn)、組合、選擇、執(zhí)行過程,整個(gè)過程由用戶發(fā)起,最終將結(jié)果返回給用戶,其中各個(gè)步驟的執(zhí)行效率直接影響整體服務(wù)計(jì)算的響應(yīng)效率,對(duì)于服務(wù)選擇中的sky line計(jì)算環(huán)節(jié)而言,同樣如此。傳統(tǒng)的方法,通常是對(duì)skyline計(jì)算進(jìn)行獨(dú)立的探討,而忽略了其在真實(shí)服務(wù)計(jì)算場(chǎng)景中的應(yīng)用;基于對(duì)整體服務(wù)QoS數(shù)據(jù)進(jìn)行sky line全局計(jì)算的方法效率較低,不能滿足于在線請(qǐng)求的實(shí)時(shí)性;每一時(shí)刻發(fā)起sky line請(qǐng)求的用戶是不可預(yù)知的,因而不可能事先對(duì)所有用的sky line進(jìn)行離線計(jì)算。目前的skyline計(jì)算方法主要可以分為完全離線計(jì)算和漸進(jìn)式在線計(jì)算兩類。完全離線方法對(duì)全局服務(wù)QoS數(shù)據(jù)集進(jìn)行分析,其計(jì)算結(jié)果準(zhǔn)確但難以滿足在線的skyline計(jì)算需求;漸進(jìn)式在線計(jì)算方法,通過在線不斷的對(duì)sky line進(jìn)行調(diào)整修正,逐漸逼近最終sky line結(jié)果,其計(jì)算過程雖然符合在線特性,但準(zhǔn)確結(jié)果需逐步細(xì)化且完全在線完成,整體計(jì)算效率偏低??梢钥吹剑€沒有一種很好的結(jié)合離線運(yùn)算的全局性和在線運(yùn)算的實(shí)時(shí)性優(yōu)點(diǎn)的sky line計(jì)算方法。
發(fā)明內(nèi)容
針對(duì)上述技術(shù)缺陷,本發(fā)明提出一種基于用戶聚類的sky line在線計(jì)算方法。為了解決上述技術(shù)問題,本發(fā)明的技術(shù)方案如下:一種基于用戶聚類的sky line在線計(jì)算方法,包括如下步驟:11)基于用戶-服務(wù)QoS矩陣對(duì)相似用戶進(jìn)行聚類步驟:當(dāng)為單維度場(chǎng)景時(shí),采用將所有維度的QoS值歸一化處理后按照其權(quán)重計(jì)算為一維數(shù)值,用戶u對(duì)服務(wù)s的多維QoS的歸一化公式如下:
權(quán)利要求
1.一種基于用戶聚類的Sky line在線計(jì)算方法,其特征在于,包括如下步驟: 11)基于用戶-服務(wù)QoS矩陣對(duì)相似用戶進(jìn)行聚類步驟: 當(dāng)為單維度場(chǎng)景時(shí),采用將所有維度的QoS值歸一化處理后按照其權(quán)重計(jì)算為一維數(shù)值,用戶u對(duì)服務(wù)s的多維QoS的歸一化公式如下:
2.根據(jù)權(quán)利要求1所述的一種基于用戶聚類的skyline在線計(jì)算方法,其特征在于,所述步驟12)和步驟13)可采用如下步驟替代: 首先定義sky line合并;如果SK(S1) ,SK(S2)分別是集合S1, S2上的sky line,SK(S/ )是這兩條 sky line 的并,即 SK(S' ) =merge (SK(S1),SK(S2)),那么 SK(S')是這樣一個(gè)集合.Ns eSK(S'), s e SK(S1) V s e SK(S2),且在 SK(S1),SK(S2)中不存在的服務(wù) s',使得s' > s,且 merge (SK (S2), SK (S2)) =SK (S1 U S2),即并集的 sky line 等于各自 sky line 的并對(duì)聚類C上的等價(jià)服務(wù)集S的最優(yōu)sky line的計(jì)算,可以由聚類C上各用戶u的歷史sky line記錄合并 獲得。
全文摘要
本發(fā)明公開了一種基于用戶聚類的sky line在線計(jì)算方法,(1)通過用戶聚類,將QoS相似的用戶聚集在一起,利用聚類共同特征代替用戶個(gè)體特征,使得計(jì)算數(shù)據(jù)量有效減少;將對(duì)所有用戶進(jìn)行離線處理轉(zhuǎn)化為對(duì)各個(gè)聚類進(jìn)行離線處理,提高了離線計(jì)算的效率,大幅減少了存儲(chǔ)空間消耗,提高了系統(tǒng)的可實(shí)施性,(2)將計(jì)算過程劃分為離線和在線模塊,通過將大量復(fù)雜運(yùn)算在離線模塊中進(jìn)行,有效提高在線算法的執(zhí)行效率,(3)利用群體特征sky line對(duì)個(gè)體sky line進(jìn)行預(yù)測(cè),一方面在精度要求不高時(shí)可以直接作為結(jié)果返回;另一方面在需要求解準(zhǔn)確sky line時(shí)在此預(yù)測(cè)sky line基礎(chǔ)上進(jìn)行修正,可以簡化計(jì)算過程。
文檔編號(hào)G06F17/30GK103150336SQ20131004344
公開日2013年6月12日 申請(qǐng)日期2013年2月4日 優(yōu)先權(quán)日2013年2月4日
發(fā)明者吳健, 陳克寒, 吉利川, 尹建偉, 李瑩, 鄧水光, 吳朝暉 申請(qǐng)人:浙江大學(xué)