一種檢測(cè)方法及服務(wù)器的制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種檢測(cè)方法及服務(wù)器,包括:獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源的被占用率;將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率;當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。采用本發(fā)明,不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
【專利說(shuō)明】—種檢測(cè)方法及服務(wù)器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電子【技術(shù)領(lǐng)域】,尤其涉及一種檢測(cè)方法及服務(wù)器。
【背景技術(shù)】
[0002]隨著電子技術(shù)的發(fā)展,服務(wù)器的功能越來(lái)越強(qiáng)大,可以連接的應(yīng)用程序數(shù)量逐步增加,可以負(fù)載的業(yè)務(wù)也越來(lái)越多樣化,但是服務(wù)器所能接收的負(fù)載是有限的。因?yàn)榉?wù)器內(nèi)的資源被占有率只能在指定范圍內(nèi),例如服務(wù)器的內(nèi)存與CPU的被占用率超過(guò)指定范圍時(shí),服務(wù)器反映很慢,嚴(yán)重者會(huì)發(fā)生故障,所以服務(wù)器等的資源被占用率成為一個(gè)重要的研究方向。通常,現(xiàn)有的監(jiān)控服務(wù)器的資源被占用率的方法為,在某段時(shí)間內(nèi),利用監(jiān)控軟件監(jiān)控服務(wù)器的資源被占用率,當(dāng)服務(wù)器的資源被占用率超過(guò)某個(gè)閥值時(shí),則會(huì)產(chǎn)生報(bào)警。但在實(shí)際應(yīng)用中,資源被占用率的變化,可能預(yù)示著服務(wù)器已經(jīng)存在某些故障。比如說(shuō),如果某個(gè)服務(wù)器存在內(nèi)存泄漏,則會(huì)不斷消耗更多的內(nèi)存,如果不及時(shí)處理,物理內(nèi)存最終會(huì)被其全部消耗,從而導(dǎo)致系統(tǒng)崩潰,用戶服務(wù)突然中斷。現(xiàn)有的通過(guò)監(jiān)控軟件監(jiān)控服務(wù)器資源被占用率的方法,只能檢測(cè)當(dāng)前資源被占用率過(guò)大,負(fù)載過(guò)重,并不能分析出當(dāng)前服務(wù)器的運(yùn)行狀況,不能檢測(cè)出服務(wù)器是否出現(xiàn)故障等。所以現(xiàn)有的監(jiān)控服務(wù)器資源被占用率的方法實(shí)用性不強(qiáng)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明實(shí)施例提供一種檢測(cè)方法及服務(wù)器,不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
[0004]本發(fā)明實(shí)施例提供了一種檢測(cè)方法,包括:
[0005]獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源被占用率;
[0006]將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率;
[0007]當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。
[0008]相應(yīng)地,本發(fā)明實(shí)施例還提供了一種服務(wù)器,包括:
[0009]第一獲取模塊,用于獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源的被占用率;
[0010]比較模塊,用于將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率;
[0011]第一確定模塊,用于當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。
[0012]本發(fā)明實(shí)施例中,根據(jù)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段資源的被占用率與歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率的比較結(jié)果確定本端服務(wù)器是否存在故障,這種檢測(cè)方法不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
【專利附圖】
【附圖說(shuō)明】
[0013]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0014]圖1是本發(fā)明實(shí)施例提供的一種檢測(cè)方法的流程示意圖;
[0015]圖2是本發(fā)明實(shí)施例提供的另一種檢測(cè)方法的流程示意圖;
[0016]圖3是本發(fā)明實(shí)施例提供的又一種檢測(cè)方法的流程示意圖;
[0017]圖4是本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖;
[0018]圖5是本發(fā)明實(shí)施例提供的另一種服務(wù)器的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0019]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0020]本發(fā)明實(shí)施例所述的資源可以是服務(wù)器的內(nèi)存,可以是服務(wù)器的CPU,也可以是服務(wù)器的內(nèi)存和CPU,被占用值可以指資源的使用率,例如若資源為服務(wù)器的內(nèi)存,則被占用值指服務(wù)器的內(nèi)存使用率,若資源為服務(wù)器的CPU,則被占用值指服務(wù)器的CPU使用率,若資源為服務(wù)器的內(nèi)存和CPU,則被占用值指服務(wù)器的內(nèi)存和CPU的使用率。
[0021]請(qǐng)參照?qǐng)D1,是本發(fā)明實(shí)施例提供的一種檢測(cè)方法的流程示意圖;如圖1所述,本實(shí)施例所述的一種檢測(cè)方法包括步驟:
[0022]S100,獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源被占用率;
[0023]具體實(shí)施例中,時(shí)間周期可以為一天、半天或者兩天,在時(shí)間周期內(nèi),由于本端服務(wù)器連接的應(yīng)用程序的不同,可以分為高峰期和空閑期,在高峰期連接的應(yīng)用程序多,則資源被占用率比較高,在空閑期,連接的應(yīng)用程序比較少,則資源被占用率比較低,時(shí)間周期內(nèi)的特定時(shí)間段可以為高峰期中的一個(gè)時(shí)間段,也可以為空閑期中的一個(gè)時(shí)間段,這里以每天早上10點(diǎn)到12點(diǎn)為高峰期進(jìn)行舉例說(shuō)明,時(shí)間周期為一天,則在當(dāng)前一天早上10點(diǎn)到12點(diǎn)時(shí)間段內(nèi)獲取第一被占用值,第一被占用值為資源被占用率,資源被占用率可以為內(nèi)存使用率,可以為CPU使用率,也可以為內(nèi)存和CPU使用率,需要說(shuō)明的是,第一被占用值可以為在當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的平均值,也可以為在當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的峰值。
[0024]S101,將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率;
[0025]具體實(shí)施例中,時(shí)間周期可以為一天、半天或者兩天,在時(shí)間周期內(nèi),由于本端服務(wù)器連接的應(yīng)用程序的不同,可以分為高峰期和空閑期,在高峰期連接的應(yīng)用程序多,則資源被占用率比較高,在空閑期,連接的應(yīng)用程序比較少,則資源被占用率比較低,時(shí)間周期內(nèi)的特定時(shí)間段可以為高峰期中的一個(gè)時(shí)間段,也可以為空閑期中的一個(gè)時(shí)間段,歷史時(shí)間周期為當(dāng)前時(shí)間周期之前的時(shí)間周期,需要說(shuō)明的是,這里的歷史時(shí)間周期的時(shí)長(zhǎng)需要與當(dāng)前時(shí)間周期的時(shí)長(zhǎng)相同,且歷史時(shí)間周期內(nèi)的特定時(shí)間段與當(dāng)前時(shí)間周期內(nèi)的特定時(shí)間段相同,例如當(dāng)前時(shí)間周期特定時(shí)間段為當(dāng)前一天早上10點(diǎn)到12點(diǎn)高峰期,則歷史時(shí)間周期內(nèi)特定時(shí)間段可以為當(dāng)前一天之前的每天早上10點(diǎn)到12點(diǎn)高峰期,預(yù)先獲取的歷史時(shí)間周期內(nèi)特定時(shí)間段的第二被占用值可以為多個(gè)歷史時(shí)間周期內(nèi)的第二被占用值,第二被占用值可以為在歷史時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的平均值,也可以為在歷史時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的峰值,但是第二被占用值需要與第一被占用值統(tǒng)一,若為平均值則都為平均值,若為峰值則都為峰值。
[0026]S102,當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。
[0027]具體實(shí)施例中,將所獲取的第一被占用值與第二被占用值作差,并將所得到的差值與第一預(yù)設(shè)閾值進(jìn)行比較,根據(jù)比較結(jié)果確定本端是否存在故障,需要說(shuō)明的是,若所獲取的第二被占用值為一個(gè)歷史時(shí)間周期內(nèi)的特定時(shí)間段的資源被占用率,則直接將第一被占用值與第二占用值進(jìn)行作差,并將差值與第一預(yù)設(shè)閾值進(jìn)行比較,如果差值超過(guò)第一預(yù)設(shè)閾值則表明本端服務(wù)器存在故障,可能是內(nèi)存泄露,不斷消耗更多的內(nèi)存,需要及時(shí)處理。若所獲取的第二被占用值為多個(gè)歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率,則需要將當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段內(nèi)的第一被占用值與所有歷史時(shí)間周期內(nèi)特定時(shí)間段的第二被占用值進(jìn)行作差,當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值與多個(gè)歷史時(shí)間周期內(nèi)的第一被占用值的差值都超過(guò)第一預(yù)設(shè)閾值,則表明本端出現(xiàn)故障,進(jìn)一步的,對(duì)所存在的故障進(jìn)行修復(fù)。
[0028]本發(fā)明實(shí)施例中,根據(jù)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段資源的被占用率與歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率的比較結(jié)果確定本端服務(wù)器是否存在故障,這種檢測(cè)方法不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
[0029]請(qǐng)參照?qǐng)D2,是本發(fā)明實(shí)施例提供的另一種檢測(cè)方法的流程示意圖;如圖2所述,本實(shí)施例所述的一種檢測(cè)方法包括步驟:
[0030]S200,獲取所述本端至少一個(gè)歷史時(shí)間周期的第二被占用值,所述歷史時(shí)間周期的第二被占用值為該歷史時(shí)間周期內(nèi)所述特定時(shí)間段的至少一個(gè)被占用值的平均值;
[0031]具體實(shí)施例中,被占用值為所采集的時(shí)間點(diǎn)對(duì)應(yīng)的資源被占用率,資源可以是服務(wù)器的內(nèi)存,可以是服務(wù)器的CPU,也可以是服務(wù)器的內(nèi)存和CPU,被占用值可以指資源的使用率,例如若資源為服務(wù)器的內(nèi)存,則被占用值指服務(wù)器的內(nèi)存使用率,若資源為服務(wù)器的CPU,則被占用值指服務(wù)器的CPU使用率,若資源為服務(wù)器的內(nèi)存和CPU,則被占用值指服務(wù)器的內(nèi)存和CPU的使用率。獲取至少一個(gè)歷史時(shí)間周期的第二被占用值,一個(gè)歷史時(shí)間周期對(duì)應(yīng)一個(gè)第二被占用值,具體的,獲取一個(gè)歷史時(shí)間周期內(nèi)的第二被占用值的方法為,首先獲取一個(gè)歷史時(shí)間周期內(nèi)多個(gè)被占用值,進(jìn)一步的,獲取一個(gè)歷史時(shí)間周期內(nèi)多個(gè)被占用值的方法可以是按照一定的預(yù)設(shè)周期采集一個(gè)歷史時(shí)間周期內(nèi)服務(wù)器的資源被占用率,例如可以以5分鐘為周期采集10點(diǎn)到12點(diǎn)內(nèi)的被占用值,一個(gè)采集時(shí)間點(diǎn)對(duì)應(yīng)一個(gè)被占用值,然后計(jì)算第二被占用值,第二被占用值為一個(gè)歷史時(shí)間周期內(nèi)特定時(shí)間段所采集的多個(gè)被占用值的平均值,獲取多個(gè)歷史時(shí)間周期的第二被占用值中,每一個(gè)歷史時(shí)間周期的第二被占用值的獲取方法相同,需要說(shuō)明的是,每一個(gè)歷史時(shí)間周期的特定時(shí)間段相同。
[0032]S201,獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的至少一個(gè)被占用值;
[0033]具體實(shí)施例中,被占用值為所采集的時(shí)間點(diǎn)對(duì)應(yīng)的資源被占用率,資源可以是服務(wù)器的內(nèi)存,可以是服務(wù)器的CPU,也可以是服務(wù)器的內(nèi)存和CPU,被占用值可以指資源的使用率,例如若資源為服務(wù)器的內(nèi)存,則被占用值指服務(wù)器的內(nèi)存使用率,若資源為服務(wù)器的CPU,則被占用值指服務(wù)器的CPU使用率,若資源為服務(wù)器的內(nèi)存和CPU,則被占用值指服務(wù)器的內(nèi)存和CPU的使用率。具體的獲取當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的多個(gè)被占用值的方法為,按照一定的預(yù)設(shè)周期采集當(dāng)前時(shí)間周期內(nèi)服務(wù)器的資源被占用率,需要說(shuō)明的是,該預(yù)設(shè)周期需要與歷史時(shí)間周期內(nèi)采集被占用值的預(yù)設(shè)周期相同,且當(dāng)前時(shí)間周期的特定時(shí)間段也與歷史時(shí)間周期的特定時(shí)間段相同,例如可以以5分鐘為周期采集當(dāng)天10點(diǎn)到12點(diǎn)內(nèi)的被占用值,一個(gè)采集時(shí)間點(diǎn)對(duì)應(yīng)一個(gè)被占用值。
[0034]S202,計(jì)算所述至少一個(gè)被占用值的平均值,并將所述平均值作為當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值。
[0035]具體實(shí)施例中,將所采集獲取的一個(gè)當(dāng)前時(shí)間周期內(nèi)的多個(gè)被占用值進(jìn)行平均計(jì)算,具體的計(jì)算方法為,例如,當(dāng)前時(shí)間周期內(nèi)所采集的多個(gè)被占用值分別為R1,R2,R3,R4,R5,R6,則將所獲取的多個(gè)被占用值進(jìn)行平均計(jì)算為R= (Rl+R2+R3+R4+R5+R6)/6,則R即為當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值。
[0036]S203,將所述第一被占用值與所述至少一個(gè)歷史時(shí)間周期的第二被占用值進(jìn)行比較;
[0037]將當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值與每一個(gè)歷史時(shí)間周期的特定時(shí)間段的第二被占用值進(jìn)行比較,需要說(shuō)明的是,一個(gè)歷史時(shí)間周期對(duì)應(yīng)一個(gè)第二被占用值,所以當(dāng)有多個(gè)歷史時(shí)間周期時(shí),則有多個(gè)第二被占用值,比較的次數(shù)與歷史周期的數(shù)量相同。
[0038]S204,根據(jù)比較結(jié)果確定異常第二被占用值的數(shù)量,所述異常第二被占用值為所述至少一個(gè)歷史時(shí)間周期的第二被占用值中與所述第一被占用值的差值超過(guò)第一預(yù)設(shè)閾值的第二被占用值;
[0039]具體實(shí)施例中,異常第二被占用值的確定方式為,當(dāng)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值與歷史時(shí)間周期內(nèi)特定時(shí)間段的第二被占用值的比較差值大于第一預(yù)設(shè)閾值時(shí),則將相應(yīng)的第二被占用值確定為異常第二被占用值,最后統(tǒng)計(jì)確定為異常第二被占用值的數(shù)量,需要說(shuō)明的是,第一預(yù)設(shè)閾值可以由用戶確定。
[0040]S205,當(dāng)所述異常第二被占用值的數(shù)量大于或者等于第二預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障。
[0041]具體實(shí)施例中,統(tǒng)計(jì)異常第二被占用值的數(shù)量,當(dāng)異常第二被占用值的數(shù)量大于或者等于第二預(yù)設(shè)閾值時(shí),則確定本端出現(xiàn)故障,需要說(shuō)明的是,這種確定本端出現(xiàn)故障的方法比較精確,只有當(dāng)達(dá)到一定數(shù)量的第二被占用值比第一被占用值差值大時(shí),才確定本端出現(xiàn)故障,當(dāng)出現(xiàn)故障時(shí),則第一被占用值會(huì)比大多數(shù)的第二被占用值大,出現(xiàn)了異常波動(dòng),則確定本端出現(xiàn)故障,若只是比很少的一部分第二被占用值大,則可能是第二被占用值為不正常數(shù)據(jù),第一被占用值是屬于正常數(shù)據(jù)。
[0042]本發(fā)明實(shí)施例中,根據(jù)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段資源的被占用率與歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率的比較結(jié)果確定本端服務(wù)器是否存在故障,這種檢測(cè)方法不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
[0043]請(qǐng)參照?qǐng)D3,是本發(fā)明實(shí)施例提供的又一種檢測(cè)方法的流程示意圖;如圖3所述,本實(shí)施例所述的一種檢測(cè)方法包括步驟:
[0044]S300,獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源的被占用率;
[0045]具體實(shí)施例中,本發(fā)明實(shí)施例步驟S300,請(qǐng)參照?qǐng)D1所示的實(shí)施例步驟S100,在此不進(jìn)行贅述。
[0046]S301,將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率;
[0047]具體實(shí)施例中,本發(fā)明實(shí)施例步驟S301,請(qǐng)參照?qǐng)D1所示的實(shí)施例步驟S101,在此不進(jìn)行贅述。
[0048]S302,當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障。
[0049]具體實(shí)施例中,本發(fā)明實(shí)施例步驟S302,請(qǐng)參照?qǐng)D1所示的實(shí)施例步驟S102,在此不進(jìn)行贅述。
[0050]S303,獲取當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段所述本端所運(yùn)行的服務(wù)的至少一個(gè)占用信息,所述占用信息包括所述服務(wù)占用所述資源的占用率和所述服務(wù)連接的應(yīng)用程序的數(shù)量;
[0051]具體實(shí)施例中,當(dāng)確定本端服務(wù)器存在故障時(shí),則需要進(jìn)一步分析本端服務(wù)器所運(yùn)行的服務(wù)中具體是哪一個(gè)服務(wù)出現(xiàn)了故障,具體的確定服務(wù)器中哪一個(gè)服務(wù)存在故障的方法為,獲取所運(yùn)行的服務(wù)的占用信息,需要說(shuō)明的是,本端服務(wù)器所運(yùn)行的服務(wù)可以為多個(gè)服務(wù),所以當(dāng)獲取服務(wù)的占用信息時(shí),需要獲取每一個(gè)服務(wù)的占用信息,且每一個(gè)服務(wù)占用信息的獲取方法相同,對(duì)于一個(gè)服務(wù)來(lái)說(shuō),按照一定的預(yù)設(shè)時(shí)間周期采集當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的占用信息,例如可以以2分鐘為預(yù)設(shè)時(shí)間周期獲取當(dāng)前一天10點(diǎn)到12點(diǎn)的服務(wù)占用信息,需要說(shuō)明的是,這里的預(yù)設(shè)時(shí)間周期與獲取第一占用信息時(shí)的時(shí)間周期可以不同,也可以相同。進(jìn)一步的,占用信息包括所采集的時(shí)間點(diǎn)所對(duì)應(yīng)的資源的占用率和服務(wù)連接的應(yīng)用程序的數(shù)量。
[0052]S304,若所述至少一個(gè)占用信息滿足預(yù)設(shè)告警規(guī)則,則確定所述服務(wù)存在故障,并將存在故障的所述服務(wù)確定為本端所出現(xiàn)的故障。。
[0053]具體實(shí)施例中,若所采集獲取的某個(gè)服務(wù)的多個(gè)占用信息滿足預(yù)設(shè)的告警規(guī)則時(shí),則確定該服務(wù)存在故障,并將存在故障的服務(wù)確定為本端所出現(xiàn)的故障,即是將本端所出現(xiàn)的故障進(jìn)行進(jìn)一步的具體到本端所運(yùn)行的服務(wù)。需要說(shuō)明的是,預(yù)設(shè)的告警規(guī)則為以下規(guī)則中的至少一種,規(guī)則1,當(dāng),至少一個(gè)占用信息中的服務(wù)連接的應(yīng)用程序的數(shù)量相同時(shí),至少一個(gè)占用信息中的服務(wù)占用資源的占用率遞增;規(guī)則2,當(dāng),至少一個(gè)占用信息中的服務(wù)連接的應(yīng)用程序的數(shù)量增加,至少一個(gè)占用信息中的服務(wù)占用資源的占用率以大于第三預(yù)設(shè)閾值遞增,第三閾值與所述增加的應(yīng)用程序的數(shù)量對(duì)應(yīng);例如增加的應(yīng)用程序數(shù)量為5,第三預(yù)設(shè)閾值與5個(gè)應(yīng)用程序數(shù)量對(duì)應(yīng)為內(nèi)存增加5%,若增加的占有率大于5%則確定該服務(wù)出現(xiàn)故障。規(guī)則3,當(dāng),至少一個(gè)占用信息中的服務(wù)連接的應(yīng)用程序的數(shù)量減少,至少一個(gè)占用信息中的服務(wù)占用資源的占用率以小于第四預(yù)設(shè)閾值遞減,第四閾值與減少的應(yīng)用程序的數(shù)量對(duì)應(yīng),例如,減少的應(yīng)用程序數(shù)量為5,第四預(yù)設(shè)閾值與5個(gè)應(yīng)用程序數(shù)量對(duì)應(yīng)為內(nèi)存減少5%,若減少的內(nèi)存占有率小于5%,則確定該服務(wù)出現(xiàn)故障。當(dāng)所采集的至少一個(gè)占用信息中服務(wù)連接的客戶數(shù)量不是一直遞增或者遞減,則可以從至少一個(gè)占用信息中提取出有該變化規(guī)律的占用信息,然后將提取的占用信息進(jìn)行比較。
[0054]S305,通知負(fù)載均衡服務(wù)器備份所述本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度至本端;
[0055]具體實(shí)施例中,進(jìn)一步的,需要對(duì)本端所出現(xiàn)的故障進(jìn)行修復(fù),具體的修復(fù)過(guò)程可以是,從出現(xiàn)故障的服務(wù)占用信息中,確定出現(xiàn)故障的異常等級(jí),并根據(jù)異常等級(jí)進(jìn)行修復(fù),如果為嚴(yán)重故障,通知負(fù)載均衡服務(wù)器備份本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度到此服務(wù)器;提高此服務(wù)器的監(jiān)控等級(jí)(加大獲取數(shù)據(jù)的頻率、增加獲取的信息量)。如果為一般故障,則查詢負(fù)載均衡服務(wù)器此時(shí)是否為使用高峰期,如果是,標(biāo)示服務(wù)器狀態(tài)為警告狀態(tài),提高此服務(wù)器的監(jiān)控等級(jí)(加大獲取數(shù)據(jù)的頻率、增加獲取的信息量);通知負(fù)載均衡服務(wù)器,只有其它服務(wù)器都滿負(fù)載時(shí),才調(diào)度會(huì)話到此服務(wù)器,等到空閑期時(shí),通知負(fù)載均衡服務(wù)器備份所述本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度至本端。如果負(fù)載均衡器此時(shí)不是高峰期,則通知負(fù)載均衡服務(wù)器備份會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度到此服務(wù)器;提高此服務(wù)器的監(jiān)控等級(jí)(加大獲取數(shù)據(jù)的頻率、增加獲取的信息量)。
[0056]S306,待本端處理完當(dāng)前會(huì)話數(shù)據(jù)后,執(zhí)行本端所出現(xiàn)的故障對(duì)應(yīng)的自動(dòng)修復(fù)程序?qū)Ρ径怂霈F(xiàn)的故障進(jìn)行修復(fù);
[0057]具體實(shí)施例中,當(dāng)本端處理完當(dāng)前會(huì)話數(shù)據(jù)(負(fù)載均衡服務(wù)器中顯示連接到此服務(wù)器的連接減為0),則獲取本端所出現(xiàn)故障對(duì)應(yīng)的自動(dòng)修復(fù)程序?qū)Ρ径怂霈F(xiàn)的故障進(jìn)行修復(fù),具體的修復(fù)方法中,內(nèi)存方面,修復(fù)主要指內(nèi)存整理,主要用來(lái)清理內(nèi)存碎片,而其它的自動(dòng)修復(fù)方法包括執(zhí)行服務(wù)自帶的修復(fù)補(bǔ)丁、重啟程序、重啟服務(wù)器等;CPU方面,修復(fù)方法主要是執(zhí)行服務(wù)自帶的修復(fù)補(bǔ)丁、重啟程序、重啟服務(wù)器等。需要說(shuō)明的是,如果測(cè)試到服務(wù)器在沒(méi)有處理完當(dāng)前會(huì)話數(shù)據(jù)就宕機(jī),則通知負(fù)載均衡服務(wù)器將備份的會(huì)話數(shù)據(jù)切換至正常運(yùn)行的服務(wù)器,執(zhí)行自動(dòng)修復(fù)程序?qū)收戏?wù)器進(jìn)行修復(fù);如果修復(fù)不成功,則通知管理員手動(dòng)修復(fù)。
[0058]S307,并在本端修復(fù)成功后,通知負(fù)載均衡服務(wù)器本端恢復(fù)正常,可將會(huì)話調(diào)度至本端。
[0059]具體實(shí)施例中,本端修復(fù)完成后,通知負(fù)載均衡服務(wù)器此服務(wù)器恢復(fù)正常,可調(diào)度會(huì)話至此服務(wù)器。
[0060]本發(fā)明實(shí)施例中,根據(jù)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段資源的被占用率與歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率的比較結(jié)果確定本端服務(wù)器是否存在故障,這種檢測(cè)方法不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
[0061]下面闡述本發(fā)明實(shí)施例提供的一種服務(wù)器的具體實(shí)現(xiàn)。
[0062]請(qǐng)參照?qǐng)D4,為本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖。如圖4所示,本實(shí)施例所述的一種服務(wù)器包括:第一獲取模塊100、比較模塊101和第一確定模塊102。
[0063]第一獲取模塊100,用于獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源的被占用率;
[0064]具體實(shí)施例中,時(shí)間周期可以為一天、半天或者兩天,在時(shí)間周期內(nèi),由于本端服務(wù)器連接的應(yīng)用程序的不同,可以分為高峰期和空閑期,在高峰期連接的應(yīng)用程序多,則資源被占用率比較高,在空閑期,連接的應(yīng)用程序比較少,則資源被占用率比較低,時(shí)間周期內(nèi)的特定時(shí)間段可以為高峰期中的一個(gè)時(shí)間段,也可以為空閑期中的一個(gè)時(shí)間段,這里以每天早上10點(diǎn)到12點(diǎn)為高峰期進(jìn)行舉例說(shuō)明,時(shí)間周期為一天,則第一獲取模塊100在當(dāng)前一天早上10點(diǎn)到12點(diǎn)時(shí)間段內(nèi)獲取第一被占用值,第一被占用值為資源被占用率,資源被占用率可以為內(nèi)存使用率,可以為CPU使用率,也可以為內(nèi)存和CPU使用率,需要說(shuō)明的是,第一被占用值可以為在當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的平均值,也可以為在當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的峰值。
[0065]比較模塊101,用于將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率;
[0066]具體實(shí)施例中,時(shí)間周期可以為一天、半天或者兩天,在時(shí)間周期內(nèi),由于本端服務(wù)器連接的應(yīng)用程序的不同,可以分為高峰期和空閑期,在高峰期連接的應(yīng)用程序多,則資源被占用率比較高,在空閑期,連接的應(yīng)用程序比較少,則資源被占用率比較低,時(shí)間周期內(nèi)的特定時(shí)間段可以為高峰期中的一個(gè)時(shí)間段,也可以為空閑期中的一個(gè)時(shí)間段,歷史時(shí)間周期為當(dāng)前時(shí)間周期之前的時(shí)間周期,需要說(shuō)明的是,這里的歷史時(shí)間周期的時(shí)長(zhǎng)需要與當(dāng)前時(shí)間周期的時(shí)長(zhǎng)相同,且歷史時(shí)間周期內(nèi)的特定時(shí)間段與當(dāng)前時(shí)間周期內(nèi)的特定時(shí)間段相同,例如當(dāng)前時(shí)間周期特定時(shí)間段為當(dāng)前一天早上10點(diǎn)到12點(diǎn)高峰期,則歷史時(shí)間周期內(nèi)特定時(shí)間段可以為當(dāng)前一天之前的每天早上10點(diǎn)到12點(diǎn)高峰期,預(yù)先獲取的歷史時(shí)間周期內(nèi)特定時(shí)間段的第二被占用值可以為多個(gè)歷史時(shí)間周期內(nèi)的第二被占用值,第二被占用值可以為在歷史時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的平均值,也可以為在歷史時(shí)間周期內(nèi)特定時(shí)間段內(nèi)所采集的資源被占用率的峰值,但是第二被占用值需要與第一被占用值統(tǒng)一,若為平均值則都為平均值,若為峰值則都為峰值。比較模塊101將第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較。
[0067]第一確定模塊102,用于當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。
[0068]具體實(shí)施例中,第一確定模塊102將所獲取的第一被占用值與第二被占用值作差,并將所得到的差值與第一預(yù)設(shè)閾值進(jìn)行比較,根據(jù)比較結(jié)果確定本端是否存在故障,需要說(shuō)明的是,若所獲取的第二被占用值為一個(gè)歷史時(shí)間周期內(nèi)的特定時(shí)間段的資源被占用率,則直接將第一被占用值與第二占用值進(jìn)行作差,并將差值與第一預(yù)設(shè)閾值進(jìn)行比較,如果差值超過(guò)第一預(yù)設(shè)閾值則表明本端服務(wù)器存在故障,可能是內(nèi)存泄露,不斷消耗更多的內(nèi)存,需要及時(shí)處理。若所獲取的第二被占用值為多個(gè)歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率,則需要將當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段內(nèi)的第一被占用值與所有歷史時(shí)間周期內(nèi)特定時(shí)間段的第二被占用值進(jìn)行作差,當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值與多個(gè)歷史時(shí)間周期內(nèi)的第一被占用值的差值都超過(guò)第一預(yù)設(shè)閾值,則表明本端出現(xiàn)故障,進(jìn)一步的,第一確定模塊102對(duì)所存在的故障進(jìn)行修復(fù)。
[0069]本發(fā)明實(shí)施例中,根據(jù)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段資源的被占用率與歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率的比較結(jié)果確定本端服務(wù)器是否存在故障,這種檢測(cè)方法不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
[0070]請(qǐng)參照?qǐng)D5,為本發(fā)明實(shí)施例提供的另一種服務(wù)器的結(jié)構(gòu)示意圖。如圖5所示,本實(shí)施例所述的另一種服務(wù)器包括:第一獲取模塊100、比較模塊101、第一確定模塊102、第二獲取模塊103、第三獲取模塊104和第二確定模塊105 ;進(jìn)一步的,第一獲取模塊100包括獲取單元1000和計(jì)算單元1001,第一確定模塊包括第一確定單元1020、第二確定單元1021和修復(fù)單元1022。其中,第一獲取模塊100、比較模塊101和第一確定模塊102請(qǐng)參照?qǐng)D4的描述,在此不再贅述。
[0071]獲取單元1000,用于獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的至少一個(gè)被占用值;
[0072]具體實(shí)施例中,被占用值為所采集的時(shí)間點(diǎn)對(duì)應(yīng)的資源被占用率,資源可以是服務(wù)器的內(nèi)存,可以是服務(wù)器的CPU,也可以是服務(wù)器的內(nèi)存和CPU,被占用值可以指資源的使用率,例如若資源為服務(wù)器的內(nèi)存,則被占用值指服務(wù)器的內(nèi)存使用率,若資源為服務(wù)器的CPU,則被占用值指服務(wù)器的CPU使用率,若資源為服務(wù)器的內(nèi)存和CPU,則被占用值指服務(wù)器的內(nèi)存和CPU的使用率。具體的獲取單元1000獲取當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的多個(gè)被占用值的方法為,按照一定的預(yù)設(shè)周期采集當(dāng)前時(shí)間周期內(nèi)服務(wù)器的資源被占用率,需要說(shuō)明的是,該預(yù)設(shè)周期需要與歷史時(shí)間周期內(nèi)采集被占用值的預(yù)設(shè)周期相同,且當(dāng)前時(shí)間周期的特定時(shí)間段也與歷史時(shí)間周期的特定時(shí)間段相同,例如獲取單元1000可以以5分鐘為周期采集當(dāng)天10點(diǎn)到12點(diǎn)內(nèi)的被占用值,一個(gè)采集時(shí)間點(diǎn)對(duì)應(yīng)一個(gè)被占用值。
[0073]計(jì)算單元1001,用于計(jì)算所述至少一個(gè)被占用值的平均值,并將所述平均值作為當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值。
[0074]具體實(shí)施例中,計(jì)算單元1001將所采集獲取的一個(gè)當(dāng)前時(shí)間周期內(nèi)的多個(gè)被占用值進(jìn)行平均計(jì)算,具體的計(jì)算方法為,例如,當(dāng)前時(shí)間周期內(nèi)所采集的多個(gè)被占用值分別為Rl,R2,R3,R4,R5,R6,則將所獲取的多個(gè)被占用值進(jìn)行平均計(jì)算為R=(R1+R2+R3+R4+R5+R6) /6,則R即為當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值。
[0075]第二獲取模塊103,用于獲取所述本端至少一個(gè)歷史時(shí)間周期的第二被占用值,所述歷史時(shí)間周期的第二被占用值為該歷史時(shí)間周期內(nèi)所述特定時(shí)間段的至少一個(gè)被占用值的平均值;
[0076]具體實(shí)施例中,被占用值為所采集的時(shí)間點(diǎn)對(duì)應(yīng)的資源被占用率,資源可以是服務(wù)器的內(nèi)存,可以是服務(wù)器的CPU,也可以是服務(wù)器的內(nèi)存和CPU,被占用值可以指資源的使用率,例如若資源為服務(wù)器的內(nèi)存,則被占用值指服務(wù)器的內(nèi)存使用率,若資源為服務(wù)器的CPU,則被占用值指服務(wù)器的CPU使用率,若資源為服務(wù)器的內(nèi)存和CPU,則被占用值指服務(wù)器的內(nèi)存和CPU的使用率。第二獲取模塊103獲取至少一個(gè)歷史時(shí)間周期的第二被占用值,一個(gè)歷史時(shí)間周期對(duì)應(yīng)一個(gè)第二被占用值,具體的,第二獲取模塊103獲取一個(gè)歷史時(shí)間周期內(nèi)的第二被占用值的方法為,首先獲取一個(gè)歷史時(shí)間周期內(nèi)多個(gè)被占用值,進(jìn)一步的,獲取一個(gè)歷史時(shí)間周期內(nèi)多個(gè)被占用值的方法可以是按照一定的預(yù)設(shè)周期采集一個(gè)歷史時(shí)間周期內(nèi)服務(wù)器的資源被占用率,例如可以以5分鐘為周期采集10點(diǎn)到12點(diǎn)內(nèi)的被占用值,一個(gè)采集時(shí)間點(diǎn)對(duì)應(yīng)一個(gè)被占用值,然后計(jì)算第二被占用值,第二被占用值為一個(gè)歷史時(shí)間周期內(nèi)特定時(shí)間段所采集的多個(gè)被占用值的平均值,第二獲取模塊103獲取多個(gè)歷史時(shí)間周期的第二被占用值中,每一個(gè)歷史時(shí)間周期的第二被占用值的獲取方法相同,需要說(shuō)明的是,每一個(gè)歷史時(shí)間周期的特定時(shí)間段相同。
[0077]比較模塊101將計(jì)算單元1001所計(jì)算出的第一被占用值與第二獲取模塊103所獲取的第二被占用值進(jìn)行比較。具體的比較方法,請(qǐng)參照?qǐng)D4中比較模塊101的描述。然后將比較結(jié)果輸入至第一確定模塊102。
[0078]本發(fā)明實(shí)施例提供的一種第一確定模塊102包括第一確定單元1020、第二確定單元1021和修復(fù)單元1022。
[0079]第一確定單元1020,用于根據(jù)比較結(jié)果確定異常第二被占用值的數(shù)量,所述異常第二被占用值為所述至少一個(gè)歷史時(shí)間周期的第二被占用值中與所述第一被占用值的差值超過(guò)第一預(yù)設(shè)閾值的第二被占用值;
[0080]具體實(shí)施例中,異常第二被占用值的確定方式為,當(dāng)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值與歷史時(shí)間周期內(nèi)特定時(shí)間段的第二被占用值的比較差值大于第一預(yù)設(shè)閾值時(shí),第一確定單兀1020則將相應(yīng)的第二被占用值確定為異常第二被占用值,第一確定單元1020最后統(tǒng)計(jì)確定為異常第二被占用值的數(shù)量,需要說(shuō)明的是,第一預(yù)設(shè)閾值可以由用戶確定。
[0081]第二確定單元1021,用于當(dāng)所述異常第二被占用值的數(shù)量大于或者等于第二預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障。
[0082]具體實(shí)施例中,第二確定單元1021統(tǒng)計(jì)異常第二被占用值的數(shù)量,當(dāng)異常第二被占用值的數(shù)量大于或者等于第二預(yù)設(shè)閾值時(shí),則確定本端出現(xiàn)故障,需要說(shuō)明的是,這種確定本端出現(xiàn)故障的方法比較精確,只有當(dāng)達(dá)到一定數(shù)量的第二被占用值比第一被占用值差值大時(shí),才確定本端出現(xiàn)故障,當(dāng)出現(xiàn)故障時(shí),則第一被占用值會(huì)比大多數(shù)的第二被占用值大,出現(xiàn)了異常波動(dòng),則確定本端出現(xiàn)故障,若只是比很少的一部分第二被占用值大,則可能是第二被占用值為不正常數(shù)據(jù),第一被占用值是屬于正常數(shù)據(jù)。
[0083]進(jìn)一步的,為了確定本端出現(xiàn)故障的具體服務(wù),可以由第三獲取模塊104和第二確定模塊105進(jìn)行具體判斷。
[0084]第三獲取模塊104,用于獲取當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段所述本端所運(yùn)行的服務(wù)的至少一個(gè)占用信息,所述占用信息包括所述服務(wù)占用所述資源的占用率和所述服務(wù)連接的應(yīng)用程序的數(shù)量;
[0085]具體實(shí)施例中,當(dāng)確定本端服務(wù)器存在故障時(shí),則需要進(jìn)一步分析本端服務(wù)器所運(yùn)行的服務(wù)中具體是哪一個(gè)服務(wù)出現(xiàn)了故障,具體的確定服務(wù)器中哪一個(gè)服務(wù)存在故障的方法為,第三獲取模塊104獲取所運(yùn)行的服務(wù)的占用信息,需要說(shuō)明的是,本端服務(wù)器所運(yùn)行的服務(wù)可以為多個(gè)服務(wù),所以當(dāng)獲取服務(wù)的占用信息時(shí),第三獲取模塊104需要獲取每一個(gè)服務(wù)的占用信息,且每一個(gè)服務(wù)占用信息的獲取方法相同,對(duì)于一個(gè)服務(wù)來(lái)說(shuō),按照一定的預(yù)設(shè)時(shí)間周期采集當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的占用信息,例如可以以2分鐘為預(yù)設(shè)時(shí)間周期獲取當(dāng)前一天10點(diǎn)到12點(diǎn)的服務(wù)占用信息,需要說(shuō)明的是,這里的預(yù)設(shè)時(shí)間周期與獲取第一占用信息時(shí)的時(shí)間周期可以不同,也可以相同。進(jìn)一步的,占用信息包括所采集的時(shí)間點(diǎn)所對(duì)應(yīng)的資源的占用率和服務(wù)連接的應(yīng)用程序的數(shù)量。
[0086]第二確定模塊105,用于若所述至少一個(gè)占用信息滿足預(yù)設(shè)告警規(guī)則,則確定所述服務(wù)存在故障,并將存在故障的所述服務(wù)確定為本端所出現(xiàn)的故障。
[0087]具體實(shí)施例中,若所采集獲取的某個(gè)服務(wù)的多個(gè)占用信息滿足預(yù)設(shè)的告警規(guī)則時(shí),則第二確定模塊105確定該服務(wù)存在故障,并將存在故障的服務(wù)確定為本端所出現(xiàn)的故障,即是將本端所出現(xiàn)的故障進(jìn)行進(jìn)一步的具體到本端所運(yùn)行的服務(wù)。需要說(shuō)明的是,預(yù)設(shè)的告警規(guī)則為以下規(guī)則中的至少一種,規(guī)則1,當(dāng),至少一個(gè)占用信息中的服務(wù)連接的應(yīng)用程序的數(shù)量相同時(shí),至少一個(gè)占用信息中的服務(wù)占用資源的占用率遞增;規(guī)則2,當(dāng),至少一個(gè)占用信息中的服務(wù)連接的應(yīng)用程序的數(shù)量增加,至少一個(gè)占用信息中的服務(wù)占用資源的占用率以大于第三預(yù)設(shè)閾值遞增,第三閾值與所述增加的應(yīng)用程序的數(shù)量對(duì)應(yīng);例如增加的應(yīng)用程序數(shù)量為5,第三預(yù)設(shè)閾值與5個(gè)應(yīng)用程序數(shù)量對(duì)應(yīng)為內(nèi)存增加5%,若增加的占有率大于5%則確定該服務(wù)出現(xiàn)故障。規(guī)則3,當(dāng),至少一個(gè)占用信息中的服務(wù)連接的應(yīng)用程序的數(shù)量減少,至少一個(gè)占用信息中的服務(wù)占用資源的占用率以小于第四預(yù)設(shè)閾值遞減,第四閾值與減少的應(yīng)用程序的數(shù)量對(duì)應(yīng),例如,減少的應(yīng)用程序數(shù)量為5,第四預(yù)設(shè)閾值與5個(gè)應(yīng)用程序數(shù)量對(duì)應(yīng)為內(nèi)存減少5%,若減少的內(nèi)存占有率小于5%,則確定該服務(wù)出現(xiàn)故障。當(dāng)所采集的至少一個(gè)占用信息中服務(wù)連接的客戶數(shù)量不是一直遞增或者遞減,則可以從至少一個(gè)占用信息中提取出有該變化規(guī)律的占用信息,然后將提取的占用信息進(jìn)行比較。
[0088]進(jìn)一步的,第一確定模塊102需要對(duì)本端所出現(xiàn)的故障進(jìn)行修復(fù),具體的修復(fù)過(guò)程可以是由修復(fù)單元1022完成。修復(fù)單元1022,具體用于通知負(fù)載均衡服務(wù)器備份所述本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度至本端;
[0089]待本端處理完當(dāng)前會(huì)話數(shù)據(jù)后,執(zhí)行本端所出現(xiàn)的故障對(duì)應(yīng)的自動(dòng)修復(fù)程序?qū)Ρ径怂霈F(xiàn)的故障進(jìn)行修復(fù);
[0090]并在本端修復(fù)成功后,通知負(fù)載均衡服務(wù)器本端恢復(fù)正常,可將會(huì)話調(diào)度至本端。
[0091]具體實(shí)施例中,需要對(duì)本端所出現(xiàn)的故障進(jìn)行修復(fù),具體的修復(fù)過(guò)程可以是,修復(fù)單元1022從出現(xiàn)故障的服務(wù)占用信息中,確定出現(xiàn)故障的異常等級(jí),并根據(jù)異常等級(jí)進(jìn)行修復(fù),如果為嚴(yán)重故障,通知負(fù)載均衡服務(wù)器備份本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度到此服務(wù)器;提高此服務(wù)器的監(jiān)控等級(jí)(加大獲取數(shù)據(jù)的頻率、增加獲取的信息量)。如果為一般故障,則查詢負(fù)載均衡服務(wù)器此時(shí)是否為使用高峰期,如果是,標(biāo)示服務(wù)器狀態(tài)為警告狀態(tài),提高此服務(wù)器的監(jiān)控等級(jí)(加大獲取數(shù)據(jù)的頻率、增加獲取的信息量);通知負(fù)載均衡服務(wù)器,只有其它服務(wù)器都滿負(fù)載時(shí),才調(diào)度會(huì)話到此服務(wù)器,等到空閑期時(shí),通知負(fù)載均衡服務(wù)器備份所述本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度至本端。如果負(fù)載均衡器此時(shí)不是高峰期,則通知負(fù)載均衡服務(wù)器備份會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度到此服務(wù)器;提高此服務(wù)器的監(jiān)控等級(jí)(加大獲取數(shù)據(jù)的頻率、增加獲取的信息量)。當(dāng)本端處理完當(dāng)前會(huì)話數(shù)據(jù)(負(fù)載均衡服務(wù)器中顯示連接到此服務(wù)器的連接減為0),則獲取本端所出現(xiàn)故障對(duì)應(yīng)的自動(dòng)修復(fù)程序?qū)Ρ径怂霈F(xiàn)的故障進(jìn)行修復(fù),具體的修復(fù)方法中,內(nèi)存方面,修復(fù)主要指內(nèi)存整理,主要用來(lái)清理內(nèi)存碎片,而其它的自動(dòng)修復(fù)方法包括執(zhí)行服務(wù)自帶的修復(fù)補(bǔ)丁、重啟程序、重啟服務(wù)器等;(PU方面,修復(fù)方法主要是執(zhí)行服務(wù)自帶的修復(fù)補(bǔ)丁、重啟程序、重啟服務(wù)器等。需要說(shuō)明的是,如果測(cè)試到服務(wù)器在沒(méi)有處理完當(dāng)前會(huì)話數(shù)據(jù)就宕機(jī),則通知負(fù)載均衡服務(wù)器將備份的會(huì)話數(shù)據(jù)切換至正常運(yùn)行的服務(wù)器,執(zhí)行自動(dòng)修復(fù)程序?qū)收戏?wù)器進(jìn)行修復(fù);如果修復(fù)不成功,則通知管理員手動(dòng)修復(fù)。
[0092]本端修復(fù)完成后,修復(fù)單元1022通知負(fù)載均衡服務(wù)器此服務(wù)器恢復(fù)正常,可調(diào)度會(huì)話至此服務(wù)器。
[0093]本發(fā)明實(shí)施例中,根據(jù)當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段資源的被占用率與歷史時(shí)間周期內(nèi)特定時(shí)間段的資源被占用率的比較結(jié)果確定本端服務(wù)器是否存在故障,這種檢測(cè)方法不僅可以檢測(cè)出服務(wù)器當(dāng)前的負(fù)載情況,還可以檢測(cè)出服務(wù)器是否存在故障,檢測(cè)方法實(shí)用性強(qiáng)。
[0094]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(Read-Only Memory, ROM)或隨機(jī)存儲(chǔ)記憶體(Random AccessMemory, RAM)等。
[0095]本發(fā)明實(shí)施例方法中的步驟可以根據(jù)實(shí)際需要進(jìn)行順序調(diào)整、合并和刪減。
[0096]本發(fā)明實(shí)施例終端中的模塊或單元可以根據(jù)實(shí)際需要進(jìn)行合并、劃分和刪減。
[0097]本發(fā)明實(shí)施例的微控制器等部件,可以以通用集成電路(如中央處理器CPU),或以專用集成電路(ASIC)來(lái)實(shí)現(xiàn)。
[0098]以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來(lái)限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
【權(quán)利要求】
1.一種檢測(cè)方法,其特征在于,所述方法包括: 獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源被占用率; 將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)所述特定時(shí)間段的資源被占用率; 當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值包括: 獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的至少一個(gè)被占用值; 計(jì)算所述至少一個(gè)被占用值的平均值,并將所述平均值作為當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值。
3.如權(quán)利要求2所述的方法,其特征在于,所述獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值之前,還包括: 獲取所述本端至少一個(gè)歷史時(shí)間周期的第二被占用值,所述歷史時(shí)間周期的第二被占用值為該歷史時(shí)間周期內(nèi)所述特定時(shí)間段的至少一個(gè)被占用值的平均值; 所述將所述第一被占用 值與預(yù)先獲取的第二被占用值進(jìn)行比較,包括: 將所述第一被占用值與所述至少一個(gè)歷史時(shí)間周期的第二被占用值進(jìn)行比較; 所述當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,包括: 根據(jù)比較結(jié)果確定異常第二被占用值的數(shù)量,所述異常第二被占用值為所述至少一個(gè)歷史時(shí)間周期的第二被占用值中與所述第一被占用值的差值超過(guò)第一預(yù)設(shè)閾值的第二被占用值; 當(dāng)所述異常第二被占用值的數(shù)量大于或者等于第二預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障。
4.如權(quán)利要求1-3中任一項(xiàng)所述的方法,其特征在于,當(dāng)確定所述本端出現(xiàn)故障之后,所述對(duì)所述故障進(jìn)行修復(fù)之前,所述方法還包括: 獲取當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段所述本端所運(yùn)行的服務(wù)的至少一個(gè)占用信息,所述占用信息包括所述服務(wù)占用所述資源的占用率和所述服務(wù)連接的應(yīng)用程序的數(shù)量; 若所述至少一個(gè)占用信息滿足預(yù)設(shè)告警規(guī)則,則確定所述服務(wù)存在故障,并將存在故障的所述服務(wù)確定為本端所出現(xiàn)的故障。
5.如權(quán)利要求4所述的方法,其特征在于,所述預(yù)設(shè)告警規(guī)則包括以下規(guī)則中的至少一種: 當(dāng)所述至少一個(gè)占用信息中的所述服務(wù)連接的應(yīng)用程序的數(shù)量相同時(shí),所述至少一個(gè)占用信息中的所述服務(wù)占用所述資源的占用率遞增; 當(dāng)所述至少一個(gè)占用信息中的所述服務(wù)連接的應(yīng)用程序的數(shù)量增加,所述至少一個(gè)占用信息中的所述服務(wù)占用所述資源的占用率以大于第三預(yù)設(shè)閾值遞增,所述第三閾值與所述增加的應(yīng)用程序的數(shù)量對(duì)應(yīng); 當(dāng)所述至少一個(gè)占用信息中的所述服務(wù)連接的應(yīng)用程序的數(shù)量減少,所述至少一個(gè)占用信息中的所述服務(wù)占用所述資源的占用率以小于第四預(yù)設(shè)閾值遞減,所述第四閾值與所述減少的應(yīng)用程序的數(shù)量對(duì)應(yīng)。
6.如權(quán)利要求4所述的方法,其特征在于,所述對(duì)所述故障進(jìn)行修復(fù),包括: 通知負(fù)載均衡服務(wù)器備份所述本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度至本端; 待本端處理完當(dāng)前會(huì)話數(shù)據(jù)后,執(zhí)行本端所出現(xiàn)的故障對(duì)應(yīng)的自動(dòng)修復(fù)程序?qū)Ρ径怂霈F(xiàn)的故障進(jìn)行修復(fù); 并在本端修復(fù)成功后,通知負(fù)載均衡服務(wù)器本端恢復(fù)正常,可將會(huì)話調(diào)度至本端。
7.一種服務(wù)器,其特征在于,所述服務(wù)器包括: 第一獲取模塊,用于獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值,所述第一被占用值表示資源的被占用率; 比較模塊,用于將所述第一被占用值與預(yù)先獲取的第二被占用值進(jìn)行比較,所述第二被占用值為歷史時(shí)間周期內(nèi)的所述特定時(shí)間段的資源被占用率; 第一確定模塊,用于當(dāng)所述第一被占用值與所述第二被占用值的差值超過(guò)第一預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障,并對(duì)所述故障進(jìn)行修復(fù)。
8.如權(quán)利要求7所述的服務(wù)器,其特征在于,所述第一獲取模塊包括: 獲取單元,用于獲取本端當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的至少一個(gè)被占用值; 計(jì)算單元,用于計(jì)算所述至少一個(gè)被占用值的平均值,并將所述平均值作為當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段的第一被占用值。
9.如權(quán)利要求8所述的服務(wù)器,其特征在于,所述服務(wù)器還包括: 第二獲取模塊,用于獲取所述本端至少一個(gè)歷史時(shí)間周期的第二被占用值,所述歷史時(shí)間周期的第二被占用值為該歷史時(shí)間周期內(nèi)所述特定時(shí)間段的至少一個(gè)被占用值的平均值; 所述比較模塊具體用于將所述第一被占用值與所述至少一個(gè)歷史時(shí)間周期的第二被占用值進(jìn)行比較; 所述第一確定模塊包括: 第一確定單元,用于根據(jù)比較結(jié)果確定異常第二被占用值的數(shù)量,所述異常第二被占用值為所述至少一個(gè)歷史時(shí)間周期的第二被占用值中與所述第一被占用值的差值超過(guò)第一預(yù)設(shè)閾值的第二被占用值; 第二確定單元,用于當(dāng)所述異常第二被占用值的數(shù)量大于或者等于第二預(yù)設(shè)閾值時(shí),則確定所述本端出現(xiàn)故障; 修復(fù)單元,用于對(duì)所述故障進(jìn)行修復(fù)。
10.如權(quán)利要求7至9任一項(xiàng)所述服務(wù)器,其特征在于,所述服務(wù)器還包括: 第三獲取模塊,用于獲取當(dāng)前時(shí)間周期內(nèi)特定時(shí)間段所述本端所運(yùn)行的服務(wù)的至少一個(gè)占用信息,所述占用信息包括所述服務(wù)占用所述資源的占用率和所述服務(wù)連接的應(yīng)用程序的數(shù)量; 第二確定模塊,用于若所述至少一個(gè)占用信息滿足預(yù)設(shè)告警規(guī)則,則確定所述服務(wù)存在故障,并將存在故障的所述服務(wù)確定為本端所出現(xiàn)的故障。
11.如權(quán)利要求10所述的服務(wù)器,其特征在于,所述預(yù)設(shè)告警規(guī)則包括以下規(guī)則中的至少一種:當(dāng)所述至少一個(gè)占用信息中的所述服務(wù)連接的應(yīng)用程序的數(shù)量相同時(shí),所述至少一個(gè)占用信息中的所述服務(wù)占用所述資源的占用率遞增; 當(dāng)所述至少一個(gè)占用信息中的所述服務(wù)連接的應(yīng)用程序的數(shù)量增加,所述至少一個(gè)占用信息中的所述服務(wù)占用所述資源的占用率以大于第三預(yù)設(shè)閾值遞增,所述第三閾值與所述增加的應(yīng)用程序的數(shù)量對(duì)應(yīng); 當(dāng)所述至少一個(gè)占用信息中的所述服務(wù)連接的應(yīng)用程序的數(shù)量減少,所述至少一個(gè)占用信息中的所述服務(wù)占用所述資源的占用率以小于第四預(yù)設(shè)閾值遞減,所述第四閾值與所述減少的應(yīng)用程序的數(shù)量對(duì)應(yīng)。
12.如權(quán)利要求10所述的服務(wù)器,其特征在于,所述修復(fù)單元具體用于, 通知負(fù)載均衡服務(wù)器備份所述本端的會(huì)話數(shù)據(jù),并不再將會(huì)話調(diào)度至本端; 待本端處理完當(dāng)前會(huì)話數(shù)據(jù)后,執(zhí)行本端所出現(xiàn)的故障對(duì)應(yīng)的自動(dòng)修復(fù)程序?qū)Ρ径怂霈F(xiàn)的故障進(jìn)行修復(fù); 并在本端修復(fù)成功后,通知負(fù)載均 衡服務(wù)器本端恢復(fù)正常,可將會(huì)話調(diào)度至本端。
【文檔編號(hào)】G06F11/34GK103902437SQ201410087840
【公開日】2014年7月2日 申請(qǐng)日期:2014年3月11日 優(yōu)先權(quán)日:2014年3月11日
【發(fā)明者】夏浪 申請(qǐng)人:深圳市同洲電子股份有限公司