本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的方法及裝置。
背景技術(shù):
當(dāng)前對(duì)HTTP(HyperText Transfer Protocol,超文本傳輸協(xié)議)通信流對(duì)應(yīng)的服務(wù)類型的識(shí)別都偏重于對(duì)公網(wǎng)流量的識(shí)別,而內(nèi)網(wǎng)中HTTP通信流因差異性大,目前在無(wú)人工參與情況下一般只能做基礎(chǔ)應(yīng)用協(xié)議的服務(wù)類型識(shí)別,例如將內(nèi)網(wǎng)中HTTP通信流識(shí)別為HTTP上傳協(xié)議類型的服務(wù),或者是將內(nèi)網(wǎng)中HTTP通信流識(shí)別為HTTP下載協(xié)議類型的服務(wù)。
如果想要獲取內(nèi)網(wǎng)中HTTP通信流對(duì)應(yīng)的服務(wù)類型的精確信息,一般可以選擇預(yù)先建立好HTTP通信流與服務(wù)類型之間的識(shí)別規(guī)則,但由于實(shí)際應(yīng)用中HTTP通信流的類型的總數(shù)量較大,如果對(duì)每種HTTP通信流都建立一個(gè)HTTP通信流與服務(wù)類型之間的識(shí)別規(guī)則,則將會(huì)造成應(yīng)用識(shí)別規(guī)則列表中識(shí)別規(guī)則數(shù)量較大,因而一般還需要人工參與,去除其中的一些無(wú)效服務(wù),造成現(xiàn)有技術(shù)在無(wú)人工參與情況下對(duì)內(nèi)網(wǎng)中服務(wù)的管控力度較差。
綜上所述,現(xiàn)有技術(shù)下在無(wú)人工參與情況下無(wú)法有效管控內(nèi)部網(wǎng)絡(luò)中的HTTP通信流,對(duì)內(nèi)網(wǎng)HTTP通信流對(duì)應(yīng)服務(wù)類型的識(shí)別比較困難。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種確定HTTP通信流識(shí)別方法及裝置,用以解決現(xiàn)有技術(shù)中存在的在無(wú)人工參與情況下無(wú)法有效管控內(nèi)部網(wǎng)絡(luò)中的HTTP通信流,對(duì)內(nèi)網(wǎng)HTTP通信流對(duì)應(yīng)服務(wù)類型的識(shí)別比較困難的技術(shù)問(wèn)題。
一方面,本發(fā)明實(shí)施例提供一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的方法,包括:
解析獲取的HTTP通信流,得到所述HTTP通信流的URL;
判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同,所述最有效服務(wù)通信流列表為根據(jù)歷史HTTP通信流中訪問(wèn)量排名最高的前N個(gè)URL得到的;
若確定所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL相同,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;
若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值不小于所述更新時(shí)間閾值,則將所述最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流;
針對(duì)所述目標(biāo)通信流列表中的任一個(gè)目標(biāo)通信流,解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,所述服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表用于為待識(shí)別的HTTP通信流確定所述待識(shí)別的HTTP通信流的服務(wù)類型。
可選地,所述得到所述HTTP通信流的URL之后,還包括:
確定有效服務(wù)通信流列表包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),并將所述有效服務(wù)通信流列表中所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量加一,所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量。
可選地,所述得到所述HTTP通信流的URL之后,還包括:
確定有效服務(wù)通信流列表不包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),且確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)是有效服務(wù),并將所述HTTP通信流的URL及所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)添加至所述有效服務(wù)通信流列表,所述有效服務(wù)是指對(duì)服務(wù)的不同的訪問(wèn)者的數(shù)量大于預(yù)設(shè)訪問(wèn)者閾值的服務(wù),所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量。
可選地,所述確定所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL相同之后,還包括:
若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值小于所述更新時(shí)間閾值,則獲取所述有效服務(wù)通信流列表中訪問(wèn)量排名最高的前N個(gè)URL作為目標(biāo)URL;
若獲取的所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL不完全相同,則根據(jù)所述目標(biāo)URL,更新所述最有效服務(wù)通信流列表,以及根據(jù)所述當(dāng)前時(shí)間更新所述最有效服務(wù)通信流列表的更新時(shí)間。
可選地,判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同之前,還包括:
確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)不是噪聲服務(wù)。
可選地,若滿足下列部分或全部條件,則將所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù):
所述HTTP通信流的首個(gè)請(qǐng)求報(bào)文中包含請(qǐng)求參數(shù)、所述HTTP通信流的URL中包含預(yù)設(shè)的異常字符、所述HTTP通信流的URL中包含圖片類型關(guān)鍵詞。
可選地,所述解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表之后,還包括:
獲取第一待識(shí)別HTTP通信流;
解析出所述第一待識(shí)別HTTP通信流中的服務(wù)標(biāo)識(shí)信息;
根據(jù)所述服務(wù)標(biāo)識(shí)信息與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,確定所述第一待識(shí)別HTTP通信流所對(duì)應(yīng)的服務(wù)類型。
可選地,所述解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則,包括:
解析所述目標(biāo)通信流,得到所述目標(biāo)通信流中的回應(yīng)報(bào)文及服務(wù)標(biāo)識(shí)信息;
解析所述回應(yīng)報(bào)文,得到所述目標(biāo)通信流的服務(wù)類型;
根據(jù)所述目標(biāo)通信流的服務(wù)類型及所述服務(wù)標(biāo)識(shí)信息,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則。
另一方面,本發(fā)明實(shí)施例提供一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的裝置,包括:
解析單元,用于解析獲取的HTTP通信流,得到所述HTTP通信流的URL;
判斷單元,用于判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同,所述最有效服務(wù)通信流列表為根據(jù)歷史HTTP通信流中訪問(wèn)量排名最高的前N個(gè)URL得到的;若確定所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL相同,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;
目標(biāo)通信流確定單元,用于若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值不小于所述更新時(shí)間閾值,則將所述最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流;
識(shí)別規(guī)則設(shè)置單元,用于針對(duì)所述目標(biāo)通信流列表中的任一個(gè)目標(biāo)通信流,解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,所述服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表用于為待識(shí)別的HTTP通信流確定所述待識(shí)別的HTTP通信流的服務(wù)類型。
可選地,所述裝置還包括訪問(wèn)量設(shè)置單元,用于:
確定有效服務(wù)通信流列表包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),并將所述有效服務(wù)通信流列表中所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量加一,所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量。
可選地,所述裝置還包括有效服務(wù)確定單元,用于:
確定有效服務(wù)通信流列表不包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),且確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)是有效服務(wù),并將所述HTTP通信流的URL及所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)添加至所述有效服務(wù)通信流列表,所述有效服務(wù)是指對(duì)服務(wù)的不同的訪問(wèn)者的數(shù)量大于預(yù)設(shè)訪問(wèn)者閾值的服務(wù),所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量。
可選地,所述裝置還包括更新單元,用于:
若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值小于所述更新時(shí)間閾值,則獲取所述有效服務(wù)通信流列表中訪問(wèn)量排名最高的前N個(gè)URL作為目標(biāo)URL;
若獲取的所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL不完全相同,則根據(jù)所述目標(biāo)URL,更新所述最有效服務(wù)通信流列表,以及根據(jù)所述當(dāng)前時(shí)間更新所述最有效服務(wù)通信流列表的更新時(shí)間。
可選地,所述裝置還包括噪聲服務(wù)確定單元,用于在判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同之前,確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)不是噪聲服務(wù)。
可選地,若滿足下列部分或全部條件,則將所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù):
所述HTTP通信流的首個(gè)請(qǐng)求報(bào)文中包含請(qǐng)求參數(shù)、所述HTTP通信流的URL中包含預(yù)設(shè)的異常字符、所述HTTP通信流的URL中包含圖片類型關(guān)鍵詞。
可選地,所述裝置還包括服務(wù)類型識(shí)別單元,用于:
獲取第一待識(shí)別HTTP通信流;
解析出所述第一待識(shí)別HTTP通信流中的服務(wù)標(biāo)識(shí)信息;
根據(jù)所述服務(wù)標(biāo)識(shí)信息與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,確定所述第一待識(shí)別HTTP通信流所對(duì)應(yīng)的服務(wù)類型。
可選地,所述識(shí)別規(guī)則設(shè)置單元,具體用于:
解析所述目標(biāo)通信流,得到所述目標(biāo)通信流中的回應(yīng)報(bào)文及服務(wù)標(biāo)識(shí)信息;
解析所述回應(yīng)報(bào)文,得到所述目標(biāo)通信流的服務(wù)類型;
根據(jù)所述目標(biāo)通信流的服務(wù)類型及所述服務(wù)標(biāo)識(shí)信息,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則。
本發(fā)明實(shí)施例,解析獲取的HTTP通信流,得到所述HTTP通信流的URL,通過(guò)判斷HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同來(lái)確定是否滿足觸發(fā)條件,若滿足觸發(fā)條件,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;若不小于,則表明最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流趨于穩(wěn)定,然后將最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流,并解析出其服務(wù)類型和服務(wù)標(biāo)志信息,以及建立服務(wù)標(biāo)志信息和服務(wù)類型的識(shí)別規(guī)則。本發(fā)明實(shí)施例,從大量通信流中篩選出部分最有效服務(wù)通信流來(lái)建立識(shí)別規(guī)則,從而實(shí)現(xiàn)了自動(dòng)化的對(duì)內(nèi)部網(wǎng)絡(luò)中HTTP通信流中的有效服務(wù)完成識(shí)別,在無(wú)人工參與情況下可以有效管控內(nèi)部網(wǎng)絡(luò)中的HTTP通信流。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)要介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的方法流程圖;
圖2為本發(fā)明實(shí)施例提供的一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的方法詳細(xì)流程圖;
圖3為本發(fā)明實(shí)施例提供的一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的裝置示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
下面結(jié)合說(shuō)明書(shū)附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步詳細(xì)描述。
內(nèi)部網(wǎng)絡(luò)中,HTTP通信流指的是以HTTP協(xié)議訪問(wèn)方式產(chǎn)生的客戶端與服務(wù)器之間的通信,舉例來(lái)說(shuō),客戶端想要向服務(wù)器請(qǐng)求某種服務(wù)(如請(qǐng)求財(cái)務(wù)報(bào)表服務(wù)等),則客戶端向服務(wù)器發(fā)送一個(gè)HTTP請(qǐng)求,用于向服務(wù)器請(qǐng)求服務(wù),服務(wù)器收到該HTTP請(qǐng)求后,會(huì)回應(yīng)所請(qǐng)求的服務(wù)對(duì)應(yīng)的內(nèi)容。
一個(gè)HTTP通信流一般包含以下信息:
目的IP(Internet Protocol,網(wǎng)絡(luò)之間互連的協(xié)議):表示提供服務(wù)的服務(wù)器的IP信息;
源IP:表示訪問(wèn)者的客戶端的IP信息;
URL(Uniform Resoure Locator,統(tǒng)一資源定位器):表示要請(qǐng)求的服務(wù)的地址信息,可從HTTP通信流中解析得到;
為了確定一個(gè)HTTP通信流中的URL所對(duì)應(yīng)的服務(wù)的類型(也可以稱為HTTP通信流所對(duì)應(yīng)的服務(wù)類型),例如HTTP通信流A對(duì)應(yīng)的服務(wù)類型為財(cái)務(wù)報(bào)表服務(wù),HTTP通信流B對(duì)應(yīng)的服務(wù)類型為工資報(bào)表服務(wù),等等。
具體地,可以使用下列方式來(lái)得到一個(gè)HTTP通信流中的URL所對(duì)應(yīng)的服務(wù)類型:
通過(guò)分析發(fā)現(xiàn),大部分服務(wù)對(duì)應(yīng)的前臺(tái)頁(yè)面的源碼中都包含<title>信息,該信息可以有效描述服務(wù)頁(yè)面所提供的服務(wù)信息,可以進(jìn)行服務(wù)類型的判定。而在HTTP通信流中,<title>信息一般都包含回應(yīng)報(bào)文中,所以本發(fā)明實(shí)施例選擇通過(guò)解析HTTP通信流中的回應(yīng)報(bào)文,進(jìn)而獲取<title>信息完成服務(wù)類型的判定。
例如,通過(guò)解析HTTP通信流C中的回應(yīng)報(bào)文,得到其服務(wù)類型為業(yè)績(jī)報(bào)表服務(wù)。
因此,如果想得到一個(gè)HTTP通信流對(duì)應(yīng)的服務(wù)類型,可以通過(guò)解析其中的回應(yīng)報(bào)文來(lái)得到,但實(shí)際應(yīng)用中,由于實(shí)時(shí)解析HTTP通信流得到其對(duì)應(yīng)的服務(wù)類型效率低下,且無(wú)法做應(yīng)用管控,所以可以選擇實(shí)現(xiàn)建立HTTP流與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表。。
即通過(guò)解析HTTP通信流,得到HTTP通信流中的回應(yīng)報(bào)文及服務(wù)標(biāo)識(shí)信息;解析所述回應(yīng)報(bào)文,得到HTTP通信流的服務(wù)類型;根據(jù)HTTP通信流的服務(wù)類型及服務(wù)標(biāo)識(shí)信息,得到HTTP通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則。
其中,建立HTTP通信流與服務(wù)類型之間的識(shí)別規(guī)則,一般可以選擇對(duì)每一個(gè)HTTP通信流,都建立一個(gè)HTTP通信流與服務(wù)類型之間的識(shí)別規(guī)則,舉例來(lái)說(shuō),內(nèi)網(wǎng)中一共有1萬(wàn)種HTTP通信流(即這1萬(wàn)種HTTP通信流對(duì)應(yīng)的URL和服務(wù)類型各不相同),則需要建立1萬(wàn)個(gè)HTTP通信流與服務(wù)類型的識(shí)別規(guī)則,很顯然,這種方法比較耗費(fèi)資源,尤其是有些HTTP通信流與服務(wù)類型的識(shí)別規(guī)則很少被用到的情況下,建立大量的識(shí)別規(guī)則會(huì)導(dǎo)致占用過(guò)多的系統(tǒng)資源,并且如果收集的服務(wù)過(guò)多,會(huì)導(dǎo)致有效服務(wù)被湮沒(méi)在大量無(wú)效服務(wù)里,導(dǎo)致用戶很難使用這個(gè)功能。
下面結(jié)合附圖1,給出一中確定HTTP通信流對(duì)應(yīng)的服務(wù)類型的方法,如圖1所示,為本發(fā)明實(shí)施例提供的確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的方法,包括:
步驟101、解析獲取的HTTP通信流,得到所述HTTP通信流的URL;
步驟102、判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同,所述最有效服務(wù)通信流列表為根據(jù)歷史HTTP通信流中訪問(wèn)量排名最高的前N個(gè)URL得到的;
步驟103、若確定所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL相同,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;
步驟104、若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值不小于所述更新時(shí)間閾值,則將所述最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流;
步驟105、針對(duì)所述目標(biāo)通信流列表中的任一個(gè)目標(biāo)通信流,解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,所述服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表用于為待識(shí)別的HTTP通信流確定所述待識(shí)別的HTTP通信流的服務(wù)類型。
上述步驟101中,首先解析獲取的HTTP通信流,得到所述HTTP通信流的URL。
一般情況下,可以從HTTP通信流的首個(gè)請(qǐng)求報(bào)文中解析得到URL,且一個(gè)URL用于表示要請(qǐng)求的服務(wù)的地址,即一個(gè)URL與一個(gè)服務(wù)之間存在一一對(duì)應(yīng)的關(guān)系。
在內(nèi)網(wǎng)中存在非常多的HTTP通信流,在這里,本發(fā)明實(shí)施例預(yù)先設(shè)定一個(gè)最有效服務(wù)通信流列表,所述最有效服務(wù)通信流列表為根據(jù)歷史HTTP通信流中訪問(wèn)量排名最高的前N個(gè)URL得到的,即最有效服務(wù)通信流列表存儲(chǔ)的是訪問(wèn)量排名最高的的前N個(gè)URL。
舉例來(lái)說(shuō),假設(shè)內(nèi)網(wǎng)中一共有1萬(wàn)個(gè)HTTP通信流,N取值為20,且將HTTP通信流的URL對(duì)應(yīng)的服務(wù)訪問(wèn)量排名前20的HTTP通信流對(duì)應(yīng)的URL存儲(chǔ)至所述最有效服務(wù)通信流列表。
可選地,可以再建立一個(gè)有效服務(wù)通信流列表,所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量,從而在上述步驟101中,得到所述HTTP通信流的URL之后,若確定有效服務(wù)通信流列表不包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),且確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)是有效服務(wù),則將所述HTTP通信流的URL及所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)添加至所述有效服務(wù)通信流列表。
其中,所述有效服務(wù)是指對(duì)服務(wù)的不同的訪問(wèn)者的數(shù)量大于預(yù)設(shè)訪問(wèn)者閾值的服務(wù)。例如一個(gè)HTTP通信流的URL對(duì)應(yīng)的服務(wù)一共有100個(gè)不同的訪問(wèn)者(可以用訪問(wèn)IP來(lái)區(qū)分不同的訪問(wèn)者),且訪問(wèn)者閾值為80,則可以認(rèn)定該HTTP通信流的URL對(duì)應(yīng)的服務(wù)為有效服務(wù),則在當(dāng)前有效服務(wù)通信流列表中不包含該HTTP通信流的URL對(duì)應(yīng)的服務(wù)時(shí),將HTTP通信流的URL及HTTP通信流的URL對(duì)應(yīng)的服務(wù)加入到有效服務(wù)通信流列表中。
當(dāng)然,如果確定有效服務(wù)通信流列表包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),則將所述有效服務(wù)通信流列表中所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量加一。
從而,本發(fā)明實(shí)施例中存在著兩個(gè)通信流列表,一個(gè)是有效服務(wù)通信流列表,用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及URL對(duì)應(yīng)的服務(wù),一個(gè)是最有效服務(wù)通信流列表,用于存儲(chǔ)有效服務(wù)通信流列表中對(duì)應(yīng)的服務(wù)訪問(wèn)量排名前N的HTTP通信流的URL。
從而,本發(fā)明實(shí)施例中,最終是要對(duì)最有效服務(wù)通信流列表中的N個(gè)URL對(duì)應(yīng)的HTTP通信流建立HTTP通信流與服務(wù)類型之間的識(shí)別規(guī)則,從而可以減少識(shí)別規(guī)則的建立數(shù)量,并且可以獲取最有效服務(wù),避免最有效服務(wù)被湮沒(méi)在大量用戶不關(guān)注的服務(wù)中。。
上述有效服務(wù)通信流列表存儲(chǔ)的是內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量,其中,有效服務(wù)指的是非噪聲服務(wù),對(duì)于噪聲服務(wù),可以有多種定義方式,可根據(jù)實(shí)際需要來(lái)定義。下面給出一種判斷一個(gè)服務(wù)是有效服務(wù)還是噪聲服務(wù)的方式:
可選地,若滿足下列部分或全部條件,則將所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù):所述HTTP通信流的首個(gè)請(qǐng)求報(bào)文中包含請(qǐng)求參數(shù)、所述HTTP通信流的URL中包含預(yù)設(shè)的異常字符、所述HTTP通信流的URL中包含圖片等預(yù)設(shè)類型關(guān)鍵詞。
在內(nèi)部網(wǎng)絡(luò)中存在眾多的HTTP通信流對(duì)應(yīng)的可能只是服務(wù)下圖片的獲取和頁(yè)面的刷新等操作,對(duì)這些HTTP通信流的分析不僅無(wú)法增益內(nèi)網(wǎng)服務(wù)信息的獲取,反而會(huì)加大對(duì)服務(wù)信息的處理難度,所以認(rèn)定這些HTTP流解析得到的URL對(duì)應(yīng)的是噪聲服務(wù)。為了過(guò)濾這些HTTP流,因此將滿足以下條件的服務(wù)判定位噪聲服務(wù):
1)、一個(gè)HTTP流中可能存在多個(gè)請(qǐng)求以得到同一服務(wù)下的多個(gè)資源,而首個(gè)請(qǐng)求報(bào)文中通常包含了這一服務(wù)下這些請(qǐng)求資源的通用信息,所以設(shè)定URL從HTTP流的首個(gè)請(qǐng)求報(bào)文中解析得到,若HTTP流首個(gè)請(qǐng)求報(bào)文中包含請(qǐng)求參數(shù),則認(rèn)定該請(qǐng)求對(duì)應(yīng)的資源不是服務(wù)鏈接的信息,將此類HTTP通信流對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù)。
2)、若HTTP通信流的URL中包含圖片類型關(guān)鍵字,如“.jpg”等,則說(shuō)明HTTP流是進(jìn)行服務(wù)下圖片資源的獲取,則所以將此類HTTP通信流對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù)。
3)、若HTTP通信流的URL中包含異常字符,如“%”等,則說(shuō)明解析得到的URL無(wú)法有效對(duì)應(yīng)一個(gè)服務(wù),則所以將此類HTTP通信流對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù)。
自此,本發(fā)明實(shí)施例中,在獲取一個(gè)HTTP通信流時(shí),若確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)不是噪聲服務(wù),則將所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量加一。
然后,在上述步驟102中,將所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL進(jìn)行比較,判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同,如果相同,則觸發(fā)內(nèi)網(wǎng)最有效服務(wù)通信流列表的收斂性判斷,最有效服務(wù)通信流列表的收斂指的是最有效服務(wù)通信流列表在一段時(shí)間內(nèi)保持不變,則認(rèn)為最有效服務(wù)通信流列表中的URL對(duì)應(yīng)的服務(wù)是最有效的服務(wù),即是訪問(wèn)量最高的服務(wù)。
上述步驟103中,若確定所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL相同,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值。
之所以判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值,是基于一種前提,即認(rèn)為如果最有效服務(wù)通信流列表在超過(guò)一定時(shí)長(zhǎng)(即更新時(shí)間閾值)內(nèi)未發(fā)生更新,則認(rèn)為最有效服務(wù)通信流列表趨于穩(wěn)定,則在上步驟104中,將所述最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流;然后在步驟105中,針對(duì)所述目標(biāo)通信流列表中的任一個(gè)目標(biāo)通信流,解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,所述服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表用于為待識(shí)別的HTTP通信流確定所述待識(shí)別的HTTP通信流的服務(wù)類型。
當(dāng)然,如果當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值小于更新時(shí)間閾值,則需要進(jìn)一步判斷最有效服務(wù)通信流列表是否可以更新,具體地,獲取所述有效服務(wù)通信流列表中訪問(wèn)量排名最高的前N個(gè)URL作為目標(biāo)URL;若獲取的所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL不完全相同,則根據(jù)所述目標(biāo)URL,更新所述最有效服務(wù)通信流列表,以及根據(jù)所述當(dāng)前時(shí)間更新所述最有效服務(wù)通信流列表的更新時(shí)間。
下面結(jié)合一個(gè)具體的例子來(lái)說(shuō)明上述步驟101~步驟105的實(shí)施方法。假設(shè)內(nèi)網(wǎng)中一共有1萬(wàn)個(gè)歷史HTTP通信流,一共對(duì)應(yīng)1萬(wàn)個(gè)服務(wù),其中,有效服務(wù)通信流列表存儲(chǔ)了這1萬(wàn)個(gè)歷史HTTP通信以及每個(gè)HTTP通信流對(duì)應(yīng)的服務(wù)的訪問(wèn)量,最有效服務(wù)通信流列表中存儲(chǔ)的對(duì)應(yīng)的服務(wù)訪問(wèn)量排名前20的HTTP通信流的URL,對(duì)于這1萬(wàn)個(gè)HTTP通信流中的任一個(gè),若確定該HTTP通信流對(duì)應(yīng)的服務(wù)不是噪聲服務(wù),則判斷該HTTP通信流的URL與最有效服務(wù)通信流列表預(yù)設(shè)位置(例如第5個(gè)位置)中的URL是否相同,如果相同,則觸發(fā)以下收斂性判斷(即判斷最有效服務(wù)通信流列表是否趨于穩(wěn)定):
收斂性判斷:判斷當(dāng)前時(shí)間與最有效服務(wù)通信流列表的更新時(shí)間的差值與更新時(shí)間閾值之間的大小關(guān)系:
情形一、當(dāng)前時(shí)間與最有效服務(wù)通信流列表的更新時(shí)間的差值大于或等于更新時(shí)間閾值
則表明最有效服務(wù)通信流列表在更新時(shí)間閾值內(nèi),例如更新時(shí)間閾值設(shè)置為1小時(shí),則表明在一個(gè)小時(shí)時(shí)間內(nèi),最有效服務(wù)通信流列表沒(méi)有得到更新,此時(shí)認(rèn)為最有效服務(wù)通信流列表趨于收斂,則將最有效服務(wù)通信流列表中的URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流,進(jìn)而解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表。
即本發(fā)明實(shí)施例中,首先篩選出一定數(shù)量的最有效服務(wù)對(duì)應(yīng)的HTTP通信流,然后對(duì)這些HTTP通信流進(jìn)行解析,得到服務(wù)類型和服務(wù)標(biāo)識(shí)信息,并建立服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則。其中,服務(wù)標(biāo)識(shí)信息可以用URL來(lái)表示,當(dāng)然也還可以是使用其它方式來(lái)表示,例如使用HTTP通信流的URL、請(qǐng)求方式等信息作為一個(gè)整體來(lái)表示服務(wù)標(biāo)識(shí)信息。具體形式不限。
情形二、當(dāng)前時(shí)間與最有效服務(wù)通信流列表的更新時(shí)間的差值小于更新時(shí)間閾值
表明最有效服務(wù)通信流列表還未趨于穩(wěn)定收斂,因此,需要進(jìn)一步判斷是否可以對(duì)最有效服務(wù)通信流列表進(jìn)行更新,具體地,可以獲取有效服務(wù)通信流列表中訪問(wèn)量排名最高的前N個(gè)URL作為目標(biāo)URL,若確定所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL不完全相同,則根據(jù)所述目標(biāo)URL,更新所述最有效服務(wù)通信流列表,以及根據(jù)所述當(dāng)前時(shí)間更新所述最有效服務(wù)通信流列表的更新時(shí)間。
若確定所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL完全相同,則不做任何操作,即不更新所述最有效服務(wù)通信流列表,也不更新所述最有效服務(wù)通信流列表的更新時(shí)間。
從而,通過(guò)上述方法,從內(nèi)網(wǎng)中大量的HTTP通信流中篩選出一部分最有效服務(wù)對(duì)應(yīng)的HTTP通信流,然后建立這些HTTP通信流與服務(wù)類型之間的識(shí)別規(guī)則,并且,在得到服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表之后,即可以使用該規(guī)則列表來(lái)判斷一個(gè)新獲取的第一待識(shí)別HTTP通信流的類別,具體地:
獲取第一待識(shí)別HTTP通信流;解析出所述第一待識(shí)別HTTP通信流中的服務(wù)標(biāo)識(shí)信息;根據(jù)所述服務(wù)標(biāo)識(shí)信息與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,確定所述第一待識(shí)別HTTP通信流所對(duì)應(yīng)的服務(wù)類型。
其中,第一待識(shí)別HTTP通信流指的是任意一個(gè)內(nèi)網(wǎng)HTTP通信流,在獲取到該HTTP通信流后,根據(jù)建立好的服務(wù)標(biāo)識(shí)信息與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表來(lái)確定所述第一待識(shí)別HTTP通信流所對(duì)應(yīng)的服務(wù)類型。
當(dāng)然,由于服務(wù)標(biāo)識(shí)信息與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表中只存儲(chǔ)了部分服務(wù)標(biāo)識(shí)信息與服務(wù)類型的識(shí)別規(guī)則,因此也存在無(wú)法識(shí)別第一待識(shí)別HTTP通信流對(duì)應(yīng)的服務(wù)類型的情況,但是這種概率是相對(duì)比較低的,因此本發(fā)明實(shí)施例中,以建立較少的HTTP通信流與服務(wù)類型的識(shí)別規(guī)則的基礎(chǔ)上,保證以較大概率確定一個(gè)待識(shí)別HTTP通信流對(duì)應(yīng)的服務(wù)類型,具有較好的實(shí)際應(yīng)用性能。
本發(fā)明實(shí)施例,解析獲取的HTTP通信流,得到所述HTTP通信流的URL,通過(guò)判斷HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同來(lái)確定是否滿足觸發(fā)條件,若滿足觸發(fā)條件,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;若不小于,則表明最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流趨于穩(wěn)定,然后將最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流,并解析出其服務(wù)類型和服務(wù)標(biāo)志信息,以及建立服務(wù)標(biāo)志信息和服務(wù)類型的識(shí)別規(guī)則。本發(fā)明實(shí)施例,從大量通信流中篩選出部分最有效服務(wù)通信流來(lái)建立識(shí)別規(guī)則,從而實(shí)現(xiàn)了自動(dòng)化的對(duì)內(nèi)部網(wǎng)絡(luò)中HTTP通信流中的有效服務(wù)完成識(shí)別,在無(wú)人工參與情況下可以有效管控內(nèi)部網(wǎng)絡(luò)中的HTTP通信流。
下面對(duì)本發(fā)明實(shí)施例提供的確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的方法做詳細(xì)描述,如圖2所示,包括:
步驟201、解析獲取的HTTP通信流,得到所述HTTP通信流的URL;
步驟202、將有效服務(wù)通信流列表中所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量加一,所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量;
步驟203、判斷URL對(duì)應(yīng)的服務(wù)是否為噪聲服務(wù),若是,則結(jié)束流程,若否,則轉(zhuǎn)到步驟204;
步驟204、判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同,若相同,則轉(zhuǎn)到步驟205,若否,則結(jié)束流程;
步驟205、判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值,若是,則轉(zhuǎn)到步驟206,若否則轉(zhuǎn)到步驟208;
步驟206、所述最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流;
步驟207、針對(duì)所述目標(biāo)通信流列表中的任一個(gè)目標(biāo)通信流,解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,所述服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表用于為待識(shí)別的HTTP通信流確定所述待識(shí)別的HTTP通信流的服務(wù)類型;
步驟208、獲取所述有效服務(wù)通信流列表中訪問(wèn)量排名最高的前N個(gè)URL作為目標(biāo)URL;
步驟209、判斷獲取的所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL是否不完全相同,若不完全相同,則轉(zhuǎn)到步驟210,若完全相同,則結(jié)束流程;
步驟210、根據(jù)所述目標(biāo)URL,更新所述最有效服務(wù)通信流列表,以及根據(jù)所述當(dāng)前時(shí)間更新所述最有效服務(wù)通信流列表的更新時(shí)間。
本發(fā)明實(shí)施例,解析獲取的HTTP通信流,得到所述HTTP通信流的URL,通過(guò)判斷HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同來(lái)確定是否滿足觸發(fā)條件,若滿足觸發(fā)條件,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;若不小于,則表明最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流趨于穩(wěn)定,然后將最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流,并解析出其服務(wù)類型和服務(wù)標(biāo)志信息,以及建立服務(wù)標(biāo)志信息和服務(wù)類型的識(shí)別規(guī)則。本發(fā)明實(shí)施例,從大量通信流中篩選出部分最有效服務(wù)通信流來(lái)建立識(shí)別規(guī)則,從而實(shí)現(xiàn)了自動(dòng)化的對(duì)內(nèi)部網(wǎng)絡(luò)中HTTP通信流中的有效服務(wù)完成識(shí)別,在無(wú)人工參與情況下可以有效管控內(nèi)部網(wǎng)絡(luò)中的HTTP通信流。
基于相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供一種確定內(nèi)網(wǎng)HTTP通信流服務(wù)類型的裝置,如圖3所示,包括:
解析單元301,用于解析獲取的HTTP通信流,得到所述HTTP通信流的URL;
判斷單元302,用于判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同,所述最有效服務(wù)通信流列表為根據(jù)歷史HTTP通信流中訪問(wèn)量排名最高的前N個(gè)URL得到的;若確定所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL相同,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;
目標(biāo)通信流確定單元303,用于若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值不小于所述更新時(shí)間閾值,則將所述最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流;
識(shí)別規(guī)則設(shè)置單元304,用于針對(duì)所述目標(biāo)通信流列表中的任一個(gè)目標(biāo)通信流,解析所述目標(biāo)通信流,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則并添加至服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,所述服務(wù)標(biāo)識(shí)信息和服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表用于為待識(shí)別的HTTP通信流確定所述待識(shí)別的HTTP通信流的服務(wù)類型。
可選地,所述裝置還包括訪問(wèn)量設(shè)置單元305,用于:
確定有效服務(wù)通信流列表包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),并將所述有效服務(wù)通信流列表中所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量加一,所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量。
可選地,所述裝置還包括有效服務(wù)確定單元306,用于:
確定有效服務(wù)通信流列表不包含所述HTTP通信流的URL對(duì)應(yīng)的服務(wù),且確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)是有效服務(wù),并將所述HTTP通信流的URL及所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)添加至所述有效服務(wù)通信流列表,所述有效服務(wù)是指對(duì)服務(wù)的不同的訪問(wèn)者的數(shù)量大于預(yù)設(shè)訪問(wèn)者閾值的服務(wù),所述有效服務(wù)通信流列表用于存儲(chǔ)內(nèi)網(wǎng)中所有有效服務(wù)通信流的URL及所有有效服務(wù)通信流的URL對(duì)應(yīng)的服務(wù)的訪問(wèn)量。
可選地,所述裝置還包括更新單元307,用于:
若確定所述當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值小于所述更新時(shí)間閾值,則獲取所述有效服務(wù)通信流列表中訪問(wèn)量排名最高的前N個(gè)URL作為目標(biāo)URL;
若獲取的所述目標(biāo)URL與所述最有效服務(wù)通信流列表中的HTTP通信流的URL不完全相同,則根據(jù)所述目標(biāo)URL,更新所述最有效服務(wù)通信流列表,以及根據(jù)所述當(dāng)前時(shí)間更新所述最有效服務(wù)通信流列表的更新時(shí)間。
可選地,所述裝置還包括噪聲服務(wù)確定單元308,用于在判斷所述HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同之前,確定所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)不是噪聲服務(wù)。
可選地,若滿足下列部分或全部條件,則將所述HTTP通信流的URL對(duì)應(yīng)的服務(wù)確定為噪聲服務(wù):
所述HTTP通信流的首個(gè)請(qǐng)求報(bào)文中包含請(qǐng)求參數(shù)、所述HTTP通信流的URL中包含預(yù)設(shè)的異常字符、所述HTTP通信流的URL中包含圖片類型關(guān)鍵詞。
可選地,所述裝置還包括服務(wù)類型識(shí)別單元309,用于:
獲取第一待識(shí)別HTTP通信流;
解析出所述第一待識(shí)別HTTP通信流中的服務(wù)標(biāo)識(shí)信息;
根據(jù)所述服務(wù)標(biāo)識(shí)信息與服務(wù)類型的應(yīng)用識(shí)別規(guī)則列表,確定所述第一待識(shí)別HTTP通信流所對(duì)應(yīng)的服務(wù)類型。
可選地,所述識(shí)別規(guī)則設(shè)置單元304,具體用于:
解析所述目標(biāo)通信流,得到所述目標(biāo)通信流中的回應(yīng)報(bào)文及服務(wù)標(biāo)識(shí)信息;
解析所述回應(yīng)報(bào)文,得到所述目標(biāo)通信流的服務(wù)類型;
根據(jù)所述目標(biāo)通信流的服務(wù)類型及所述服務(wù)標(biāo)識(shí)信息,得到所述目標(biāo)通信流的服務(wù)類型和服務(wù)標(biāo)識(shí)信息的識(shí)別規(guī)則。
本發(fā)明實(shí)施例,解析獲取的HTTP通信流,得到所述HTTP通信流的URL,通過(guò)判斷HTTP通信流的URL與最有效服務(wù)通信流列表中預(yù)設(shè)位置存儲(chǔ)的URL是否相同來(lái)確定是否滿足觸發(fā)條件,若滿足觸發(fā)條件,則判斷當(dāng)前時(shí)間與所述最有效服務(wù)通信流列表的更新時(shí)間的差值是否不小于更新時(shí)間閾值;若不小于,則表明最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流趨于穩(wěn)定,然后將最有效服務(wù)通信流列表中URL對(duì)應(yīng)的HTTP通信流作為目標(biāo)通信流列表中的目標(biāo)通信流,并解析出其服務(wù)類型和服務(wù)標(biāo)志信息,以及建立服務(wù)標(biāo)志信息和服務(wù)類型的識(shí)別規(guī)則。本發(fā)明實(shí)施例,從大量通信流中篩選出部分最有效服務(wù)通信流來(lái)建立識(shí)別規(guī)則,從而實(shí)現(xiàn)了自動(dòng)化的對(duì)內(nèi)部網(wǎng)絡(luò)中HTTP通信流中的有效服務(wù)完成識(shí)別,在無(wú)人工參與情況下可以有效管控內(nèi)部網(wǎng)絡(luò)中的HTTP通信流。
本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。