亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于相似度的語義Web服務(wù)聚類標(biāo)注方法_2

文檔序號:9646552閱讀:來源:國知局
方法為:將相似度矩陣Sim轉(zhuǎn)變?yōu)榫嚯x矩陣S。假設(shè)共有待聚類的服務(wù)η個,則相似 度矩陣可表示為,
[0042] 其中sim(i,j)表示語義Web服務(wù)i與語義Web服務(wù)j之間的相似度,由步驟1) 所述技術(shù)方法計算得到。
[0043] 通過公式S=Sim-1,得到基于語義Web服務(wù)相似度的距離矩陣S。其中,距離矩 陣S中的元素s(i,j)e[-1,0]。
[0044] 上述s(i,k),當(dāng)i=k時,s(k,k)表示的是距離矩陣S的對角線元素,在初始狀 態(tài)下的取值被稱為參考值(preference)。
[0045] 步驟2. 3所述參考值的取值,一般來說有兩種可取的值,一是參考值 =median(S),參考值取各語義Web服務(wù)數(shù)據(jù)點之間距離值的中值;二是參考值= average(S),參考值取各語義Web服務(wù)數(shù)據(jù)點之間距離值的平均值。通過實驗論證,當(dāng)參考 值=median(S)時,對服務(wù)發(fā)現(xiàn)系統(tǒng)的效率提高最大,聚類效果最佳。
[0046] 步驟2. 3所述阻尼系數(shù),是為了抑制出現(xiàn)數(shù)值振動的情況而設(shè)的。通過實驗論證, 當(dāng)lam= 0. 5時,數(shù)值波動較小,該算法收斂速度適中。
[0047] 步驟2. 4所述的在語義Web服務(wù)所構(gòu)成的數(shù)據(jù)點之間傳遞的兩類消息,吸引度 (responsibility)和歸屬度(availability)。吸引度用responsibility(i,k)表示,指的 是從語義Web服務(wù)數(shù)據(jù)點i出發(fā),服務(wù)數(shù)據(jù)點k作為點i聚類中心的適合程度,一般簡寫為 r(i,k)。歸屬度用availability(i,k)表示,指的是從服務(wù)數(shù)據(jù)點k出發(fā),服務(wù)數(shù)據(jù)點i會 選擇點k作為聚類中心的可能程度,一般簡寫為a(i,k)。
[0048]r(i,k)的計算規(guī)則為:r(i,k) -s(i,k)_maxk, s.t:k, ^k{a(i,k' )+s(i,k' )}
[0049] 其中,s(i,k)表示在語義Web服務(wù)的距離矩陣中,服務(wù)i與服務(wù)k之間的距離。所 有服務(wù)之間的avalability值初始狀態(tài)下為0。
[0050]a(i,k)的計算規(guī)則為:
[0051]r(i,k)與&",1〇的值越大,對服務(wù)點k作為聚類中心的吸引度度就越大,并且月艮 務(wù)點i隸屬于以服務(wù)點k為服務(wù)集中心的聚類的歸屬度也越大。算法通過不斷的迭代更 新每一個服務(wù)點與其他服務(wù)之間的吸引度和歸屬度值,最終在某一時刻停止迭代,并產(chǎn)生m個高質(zhì)量的聚類中心服務(wù)點(exemplar),同時將其余的服務(wù)歸類到相應(yīng)的服務(wù)集中。
[0052] 為了抑制出現(xiàn)數(shù)值振動的情況,需要加入阻尼系數(shù)1am,SP:
[0053]ri+1 (i,k)^lamr{ (i,k) + (1-lam)ri+1 (i,k),lame(〇,1),
[0054] ai+1 (i, k) - lam a; (i, k) + (1-lam) ai+1 (i, k), lam e (〇, 1)
[0055] 其中,r1+1(i,k)表示第i+1次迭代所計算得到的k對于i的吸引度值,ri(i,k)表 示第i次迭代所計算得到的k對于i的吸引度值。Lam為步驟2. 3所述的阻尼系數(shù)。由此 可看出,每次更新吸引度值和歸屬度值,都需要用上一次迭代的結(jié)果乘以lam,加上本次迭 代的結(jié)果乘以1-lam,來減少數(shù)值的振動,加快算法收斂速度。
[0056] 步驟2. 4所述的確定哪些數(shù)據(jù)點是中心點,技術(shù)方案如下:
[0057] 步驟2.4.1創(chuàng)建矩陣E=R+A。R表示記錄r(i,k)值的N*N矩陣,且 ie[0,N),ke[0,N)。A是記錄a(i,k)值的N*N矩陣,且ie[0,N),ke[0,N)。
[0058] 步驟2. 4. 2逐個判斷矩陣E對角線上的值是否大于0。若大于0,則將該對角線元 素所對應(yīng)的語義Web服務(wù)作為聚類的中心點。
[0059] 步驟2. 5所述的將其他數(shù)據(jù)點歸類至中心數(shù)據(jù)點所代表的服務(wù)集中,指的是根據(jù) 步驟2. 4. 2所選出來的作為聚類中心點的語義Web服務(wù),為其他非聚類中心點的語義Web 服務(wù)選出在E矩陣中與之關(guān)聯(lián)的元素值最大的中心點作為自己的類簇。
[0060]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點和技術(shù)效果:本發(fā)明通過計算得到的服務(wù) 間相似度數(shù)值,基于相似度對語義Web服務(wù)進行聚類,將功能相似的服務(wù)聚為一類。并在聚 類的過程中提取出各聚類服務(wù)集的中心服務(wù)來標(biāo)注這一類的功能。本發(fā)明能提高相似度計 算的準(zhǔn)確度,并進一步提升服務(wù)發(fā)現(xiàn)系統(tǒng)的性能。
【附圖說明】
[0061] 圖1為語義服務(wù)S1的輸入?yún)?shù)相似度計算示意圖;
[0062] 圖2為語義Web服務(wù)相似度計算流程圖;
[0063] 圖3為語義Web服務(wù)聚類標(biāo)注算法流程圖。
【具體實施方式】
[0064] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖,對本發(fā)明進 行進一步詳細說明,但本發(fā)明的實施和保護不限于此。
[0065] 圖2為語義Web服務(wù)相似度計算流程圖。語義Web服務(wù)相似度的計算包括功能參 數(shù)匹配和關(guān)鍵字匹配兩部分。圖2所述的流程為:
[0066] 步驟1,輸入兩個待計算相似度的服務(wù),默認(rèn)它們的相似度為0 ;
[0067] 步驟2,判斷是否存在服務(wù)的I/O參數(shù)為空的情況,若是,則返回默認(rèn)相似度,結(jié)束 流程,若否,則繼續(xù)步驟3;
[0068] 步驟3,分別進行語義Web服務(wù)的Input參數(shù)和Output參數(shù)相似度的計算,并綜合 兩者的計算值,進行服務(wù)之間功能參數(shù)相似度的計算,得出功能參數(shù)相似度數(shù)值。
[0069]步驟3所述語義Web服務(wù)Input參數(shù)相似度的計算,所采用的公式為
Sim^CloC^)表示語義ffeb月艮務(wù)S1的單個輸入?yún)?shù)與語義ffeb月艮 務(wù)S2的單個輸入或輸出參數(shù)C2,之間的相似度,具體的計算公式為
[0070] sim(X,Y)的含義是Y對于X的相似程度。α是一個調(diào)節(jié)權(quán)重的參數(shù),ae[0,1]。 D={x}表示對象空間,而X、Y是D中的模糊集,sim:UXU- [0, 1]是積空間UXU上的模 糊相似關(guān)系。應(yīng)用該公式計算能夠得到兩個概念之間的相似度。
[0071] 步驟4,根據(jù)語義Web服務(wù)profile標(biāo)簽下的內(nèi)容以及服務(wù)的名稱,提取出服務(wù)的 關(guān)鍵字集合。
[0072] 步驟4所述的提取出服務(wù)的關(guān)鍵字集合,包括四個步驟:
[0073] 步驟4. 1,將語義Web服務(wù)描述文件profi1e標(biāo)簽下的內(nèi)容,進行詞匯分割,得到多 個文本英文詞匯組成的集合;
[0074] 步驟4. 2,將服務(wù)的名稱進行分詞處理,得到多個文本英文單詞組成的集合;
[0075] 步驟4. 3,將步驟4. 1與步驟4. 2得到的集合進行交集運算,得到新的詞匯集合;
[0076] 步驟4. 4,計算步驟4. 3得到的詞匯集合中,每一個詞匯在相應(yīng)語義Web服務(wù)描述 文件中的TF-IDF加權(quán)值。
表示的是關(guān)鍵字1^的 TF-IDF加權(quán)值。其中,IDFi表示關(guān)鍵字i的在相應(yīng)語義Web服務(wù)描述文件中的普遍程度,
表示關(guān)鍵字i在文檔d中的出現(xiàn)頻率。在這里,IDF1= 1。
[0077] 步驟5,根據(jù)語義Web服務(wù)的關(guān)鍵字集合,應(yīng)用Google距離,計算得出關(guān)鍵字相似 度數(shù)值。
SimWOTd(Sl,S2)為對于語義 Web服務(wù)S1,它與語義Web服務(wù)S2之間的關(guān)鍵字相似度;
[0078]
TGdJ表示的是關(guān)鍵字kl^TF-IDF加權(quán)值,表示語義Web服務(wù)S1的某個 關(guān)鍵字kh與語義Web服務(wù)S2的一個關(guān)鍵字k2名間的相似度。
[0079]步驟 5 所述的Sin^Gdi,k2j),采用NormalizedGoogleDsitance來計算關(guān)鍵字之 間的相似度,計算公式為=l-NGDG^,!^)。其中,NGDG^,!^)表示兩個關(guān) 鍵字之間的NormalizedGoogleDistance。
[0080] 步驟6,綜合功能參數(shù)相似度數(shù)值和服務(wù)描述關(guān)鍵字相似度值,得出語義Web服 務(wù)之間的相似度。
Sim(Sl,S2)表示語 義Web服務(wù)S1與S2之間的相似度數(shù)值,Sim_Func(Sl,S2)表示語功能參數(shù)相似度,Sim_Key(Sl,S2)表示關(guān)鍵字相似度。
[0081] 基于計算得到的語義Web服務(wù)相似度,對語義Web服務(wù)進行聚類和中心服務(wù)提取。
[0082] 圖3為語義Web服務(wù)聚類標(biāo)注算法流程圖。算法的流程主要分為四個階段。第 一個階段是計算語義Web服務(wù)的相似度;第二個階段是初始化聚類算法所需要的參數(shù);第 三個階段是通過迭代在服務(wù)之間不斷計算和相互傳遞吸引度(responsibility)和歸屬度 (availability)的值,選出聚類的中心數(shù)據(jù)點;第四個階段是根據(jù)其他數(shù)據(jù)點和中心數(shù)據(jù) 點之間的吸引度和歸屬度,將它們進行類別劃分。于是,便完成了對語義Web服務(wù)的聚類。 同時,將聚類過程中所選出來的中心數(shù)據(jù)點映射回語義Web服務(wù),將這些服務(wù)分別作為各 服務(wù)集的中心服務(wù),用來標(biāo)注相應(yīng)服務(wù)集所描述的典型功能。具體步驟如下:
[0083] 步驟1,運用上述的語義Web服務(wù)相似度計算方法,計算服務(wù)庫中各語義Web服務(wù) 之間的相似度。
[0084] 步驟2,根據(jù)語義Web服務(wù)之間的相似度構(gòu)造相似度矩陣Sim。該矩陣的行和列為 按相同順序排列的語義Web服務(wù)。
[0085] 步驟3,運用第二步構(gòu)造的相似
當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1