專利名稱::實(shí)現(xiàn)wlanap宕機(jī)后快速恢復(fù)的方法
技術(shù)領(lǐng)域:
:本發(fā)明創(chuàng)造的應(yīng)用領(lǐng)域在無線局域網(wǎng)(WLAN)的覆蓋與優(yōu)化方面,屬于一種WLAN網(wǎng)絡(luò)優(yōu)化技術(shù),更精確地說是一種WLANAP故障應(yīng)對(duì)方法,可以避免WLAN用戶的投訴。也能應(yīng)用在類似需要使網(wǎng)絡(luò)設(shè)備快速恢復(fù)的場(chǎng)合。
背景技術(shù):
:(一)、目前還沒檢索到有關(guān)WLANAP宕機(jī)恢復(fù)的文獻(xiàn),所以沒有直接的引證對(duì)比。但比較接近的就是WLAN優(yōu)化降低無線干擾的文獻(xiàn),因?yàn)殄礄C(jī)主要就是干擾引起。目前比較流行的做法是增強(qiáng)AP的抗干擾性。主要構(gòu)成是2個(gè)方面AP動(dòng)態(tài)頻率選擇(DFS)、AP功率自動(dòng)調(diào)節(jié)(TPC)。1、"自動(dòng)頻率優(yōu)化也稱動(dòng)態(tài)頻率選擇DFC(Dynamicfrequencyselection)是指在通過測(cè)量得到網(wǎng)絡(luò)狀況的信息的條件下,動(dòng)態(tài)實(shí)時(shí)地給AP分配頻段來減小AP間干擾的機(jī)制"(--出自《無線局域網(wǎng)的智能網(wǎng)絡(luò)優(yōu)化技術(shù)》,中國(guó)IT實(shí)驗(yàn)室,ChinaITLab,下同)。"從頻率優(yōu)化的信息獲得上,可以將自動(dòng)頻率優(yōu)化分成兩類"。"第一類是基于用戶端測(cè)量信息進(jìn)行頻段分配的方案……好處在于,頻段的分配方案可以隨著用戶的數(shù)目和位置進(jìn)行實(shí)時(shí)的調(diào)整。但是這種實(shí)時(shí)調(diào)整的代價(jià)是用戶端向AP周期性的提交干擾報(bào)告;AP在頻段間切換時(shí)引起的用戶與AP重新連接的開銷。這兩點(diǎn)隨著接入AP的用戶數(shù)目增多,而同比例增大……"簡(jiǎn)而言之,第一類方法需要在AP和用戶終端間周期性的交互信息,所以會(huì)使WLAN負(fù)擔(dān)了額外的開銷,隨著AP及用戶的增多,反而會(huì)使WLAN整體性能迅速下降。"第二類,基于AP測(cè)量信息的頻段分配方案?!鼉H僅是基于AP點(diǎn)的頻段測(cè)量,來調(diào)整AP之間的頻段分配……在用戶數(shù)目比較少的時(shí)候,優(yōu)化的結(jié)果不如第一類好……根據(jù)調(diào)整步驟可以分成兩種。一種是分布式調(diào)整,即AP之間獨(dú)自判斷,獨(dú)自調(diào)整,AP間沒有信息的交互。另一種是AP將各自的測(cè)量信息提交給一個(gè)接入控制器AC(AccessControler),由AC控制AP進(jìn)行調(diào)整。前一種由于AP之間沒有信息的交互,因此可能出現(xiàn)幾個(gè)AP在幾個(gè)頻段間出現(xiàn)振蕩的調(diào)整,因此達(dá)到穩(wěn)定的收斂速度比較慢……第二種,需要投資額外支持該協(xié)議的AC(AccessController,接入控制器),配置、維護(hù)麻煩,兼容性差,也增加了WLAN流量等負(fù)擔(dān)……"簡(jiǎn)而言之,DFS就是通過讓AP自動(dòng)在規(guī)定頻率范圍內(nèi)找出沒有干擾的頻率或干擾最小的頻率來降低干擾和被干擾。2、"自動(dòng)功率優(yōu)化主要包括用戶端發(fā)射信號(hào)的功率控制TPC(TransmitPowerControl)和AP端發(fā)射信號(hào)的功率控制。(1)"用戶端功率控制是保證用戶當(dāng)前通信質(zhì)量的基礎(chǔ)上,盡量減小用戶的發(fā)射功率。當(dāng)用戶離AP比較近的時(shí)候,由于信號(hào)的衰減比較小,因此用戶的發(fā)射功率也可以比較小。這樣做的好處在于在不影響此用戶的通信質(zhì)量的前提下,減小了對(duì)于同頻段其他用戶和AP的干擾;減小終端的耗電量,延長(zhǎng)待機(jī)時(shí)間。"(2)"AP端發(fā)射功率的控制和AP的覆蓋范圍有關(guān),因此在一般情況下,AP為了盡可能覆蓋較大的局域,均以允許的最大功率發(fā)射,一般是20dBm(lOOmW)左右。但是當(dāng)AP的數(shù)目比較多時(shí),覆蓋己經(jīng)不是問題而AP間的相互干擾成為了主要問題。比如API附近集中了大量的用戶終端,而在AP2附近用戶終端相對(duì)稀少。當(dāng)接入API的用戶由于爭(zhēng)搶頻道十分激烈而導(dǎo)致總信道的容量降低時(shí),較好的辦法是將一部分離AP2較近的用戶分給AP2,這樣API和AP2的用戶數(shù)目趨于平衡,這種方法也稱為負(fù)載平衡(LoadBalance)。一開始API和AP2的發(fā)射功率相等,因此在它們交界處的屬于AP2的4個(gè)終端接受到的API的信號(hào)等于甚至大于AP2的信號(hào),這對(duì)于通信來說是很不利的。當(dāng)API進(jìn)行了功率優(yōu)化后,它的覆蓋范圍縮小,此時(shí)屬于AP2的4個(gè)用戶收到的干擾明顯減少,這就是配合負(fù)載平衡的AP端發(fā)射功率控制的作用。"簡(jiǎn)而言之,TPC就是通過讓AP和用戶終端自動(dòng)調(diào)節(jié)發(fā)送功率來達(dá)到即最小化干擾其他AP又最大化服務(wù)用戶。但是同DFS第一類一樣,因?yàn)橐尦掷m(xù)測(cè)試功率、計(jì)算、調(diào)整,也會(huì)給整體WLAN帶來額外開銷,形成負(fù)擔(dān)。小結(jié)可見DFS和TPC出發(fā)點(diǎn)是傳統(tǒng)的從增強(qiáng)AP設(shè)備本身性能角度考慮,來降低干擾的影響,進(jìn)而降低AP宕機(jī)的可能性,但不是說就是避免宕機(jī)。以目前主流AP的性能來看,只要存在干擾,AP必然有宕機(jī)可能。這是DFS、TPC所不能解決的問題。(二)、為什么說DFS和TPC只是降低干擾、降低宕機(jī)可能性,而不是解決干擾、避免宕機(jī)?因?yàn)樵赪LAN的無線環(huán)境中,無線干擾是不可避免的,這是由WLAN的標(biāo)準(zhǔn)決定的。而AP宕機(jī)主要是干擾引起,所以特別像用戶多、密集、流量大、AP也密集的WLAN中,AP的宕機(jī)根本無法避免,就算是一個(gè)AP—個(gè)用戶,因?yàn)闇貪穸鹊拳h(huán)境、用戶使用習(xí)慣等,時(shí)間長(zhǎng)了AP總要宕機(jī)。簡(jiǎn)單回顧一下WLAN的發(fā)展歷史。"……WLAN是無線局域網(wǎng)的英文縮寫,是近年來發(fā)展迅猛的無線數(shù)據(jù)通信技術(shù)。它的發(fā)展從1997年6月制訂第一個(gè)WLAN標(biāo)準(zhǔn)IEEE802.il開始,到1999年8月,正EE推出了新的高速標(biāo)準(zhǔn)802.1lb和802.1la進(jìn)入快速發(fā)展,2001年11月,IEEE試驗(yàn)性地批準(zhǔn)了802.llg。IEEE802.11b和802.1lg在2.4GHz頻段工作,前者提供最高11Mbps的速率,后者提供54Mbps的速率;IEEE802.11a則在5.8GHz頻段提供54Mbps的數(shù)據(jù)傳輸速率。802.1lb和802.11g能夠兼容,但都不能和802.1la兼容……""……下面我們以現(xiàn)在應(yīng)用最為廣泛的802.11b標(biāo)準(zhǔn)為例,說明為什么在多個(gè)AP之間會(huì)存在相互干擾。如圖1所示,圖1為802.11b無線局域網(wǎng)頻率分配圖。從圖中可以看到頻段1和頻段25之間都有部分頻譜重疊,頻譜重疊就意味著這兩個(gè)頻段之間相互有干擾存在。干擾的大小取決于兩個(gè)頻段重疊的多少,以及發(fā)射信號(hào)的頻譜特性??傊l段序號(hào)之間的差大于等于5的頻段之間沒有干擾,小于5的頻段之間存在干擾……"以目前國(guó)際通用的標(biāo)準(zhǔn)的頻率分配方案來說,主要是選取l、6、ll頻段組,2、7、12頻段組,3、8、13頻段組,而最多的還是l、6、ll頻段組,因?yàn)橛行┙K端并不支持ll以上的頻率??上攵绻泻芏郃P,而只能分配3個(gè)頻率,那么其中勢(shì)必有些AP分配的是相同的頻率,AP越多越嚴(yán)重,結(jié)果是肯定會(huì)發(fā)生同頻干擾,干擾一多,AP宕機(jī)就增加,用戶投訴當(dāng)然也會(huì)隨之升級(jí)。
發(fā)明內(nèi)容針對(duì)現(xiàn)有技術(shù)中存在的問題,既然干擾無法解決,所以AP宕機(jī)就無法避免;既然無法避免宕機(jī),就沒有必要在避免宕機(jī)上浪費(fèi)時(shí)間,一個(gè)巧妙的辦法就是能不能在AP宕機(jī)后想辦法使其在盡可能短的時(shí)間內(nèi)恢復(fù),使用戶基本覺察不到,這樣是不是就不會(huì)引起投訴了呢?根據(jù)對(duì)以往投訴的分析及回訪,超過70%的用戶一般在等待超過30分鐘后因無法忍受才投訴。從以往維護(hù)經(jīng)驗(yàn)看,一旦有AP宕機(jī),必須到現(xiàn)場(chǎng)人工實(shí)施重啟,受時(shí)間、場(chǎng)所等條件限制,常常無法立刻給AP重啟,從發(fā)現(xiàn)AP吊死到趕赴現(xiàn)場(chǎng)人工重啟,所有時(shí)間加起來,至少需要半小時(shí)。目前AP宕機(jī)后,必須要斷電重啟才能恢復(fù),所以考慮如能很好地控制AP的通斷電就能解決這一問題,而且要盡量自動(dòng)化,無須人工干預(yù);同時(shí)考慮到成本控制、施工作業(yè)等實(shí)際情況,要求越簡(jiǎn)單越好,允許留有進(jìn)一步提高的余地,只要能達(dá)到目標(biāo)即可。為了實(shí)現(xiàn)上述的發(fā)明目的,本發(fā)明創(chuàng)造的技術(shù)方案是一種實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于步驟一、電源控制器的安裝將AP的電源線接入電源控制器的每一路輸出,電源控制器本身輸入接市電,其每一路輸出提供AP用電;步驟二、電源控制器自動(dòng)對(duì)AP進(jìn)行全天候的狀態(tài)監(jiān)控;步驟二-1,用網(wǎng)線將電源控制器與二層交換機(jī)相連;步驟二-2,配以跟交換機(jī)下AP同網(wǎng)段同VLAN的IP地址;步驟二-3,利用電源控制器內(nèi)部命令集中PING命令PING目標(biāo)AP,每隔一段時(shí)間PING—回AP;步驟二-4,利用電源控制器內(nèi)部命令集MRIP命令對(duì)每一路輸出口號(hào)碼和PING目標(biāo)AP的IP地址綁定。步驟三、自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī)以PING的結(jié)果來判斷AP是否宕機(jī),因是間隔一段時(shí)間來PING的,設(shè)MRRetry為每回PING的包數(shù),確定了MRRetry最適當(dāng)?shù)闹岛?,在每回PING中,連續(xù)PING不通MRRetry個(gè)包后,即判定目標(biāo)AP發(fā)生了宕機(jī)。步驟四、自動(dòng)快速恢復(fù)AP。當(dāng)AP宕機(jī)被正確判斷后,立刻實(shí)施給目標(biāo)AP斷電重啟,實(shí)現(xiàn)AP快速恢復(fù)。步驟四-1,PING不通,AP宕機(jī)被正確判斷;步驟四-2,網(wǎng)絡(luò)模塊通知電源控制模塊;步驟四-3,電源控制模塊反饋動(dòng)作結(jié)果,以記錄在日志或顯示在人機(jī)界面中;步驟四-4,電源控制根據(jù)IP與輸出的綁定關(guān)系,找出正確的輸出,實(shí)施斷電再上電的動(dòng)作。本發(fā)明的有益效果采用本發(fā)明創(chuàng)造的WLANAP宕機(jī)后快速恢復(fù)的方法,可以計(jì)算出完成一次對(duì)宕機(jī)AP的從自動(dòng)監(jiān)控、及時(shí)發(fā)現(xiàn)和判斷宕機(jī)、自動(dòng)快速恢復(fù)的整個(gè)過程約需要的時(shí)間,然后跟人工的平均30分鐘的時(shí)間,相比。設(shè)TimeLen為整個(gè)耗時(shí),則有TimeLen=MRLap+PingReply*(MRRetry-1)+PingReply*MRRetry+HoldTime艮卩TimeLen=MRLap+PingReplyX(2XMRRetry-l)十HoldTime;其中,PingReply—般為固定值,HoldTime—般也無需變動(dòng),所以一個(gè)AP宕機(jī)恢復(fù)的時(shí)長(zhǎng)就主要取決與MRLap和MRRetry,即取決于兩回PING間隔時(shí)間的長(zhǎng)短和PING包數(shù)量的多少,前者是監(jiān)控連續(xù)性的粒度,后者是判斷正確性的精度。如果MRLap取值300秒,而MRRetry取值20次,得出的時(shí)長(zhǎng)僅約6分鐘,遠(yuǎn)遠(yuǎn)低于人工時(shí)間,幾乎就解決該類問題,相對(duì)來說近乎"零宕機(jī)"。圖1為本發(fā)明現(xiàn)有技術(shù)中802.11b無線局域網(wǎng)頻率分配圖。圖2為本發(fā)明實(shí)施例中電源控制器安裝邏輯結(jié)構(gòu)圖。圖3為本發(fā)明實(shí)施例中系統(tǒng)物理結(jié)構(gòu)圖。圖4為本發(fā)明實(shí)施例中方法流程簡(jiǎn)圖。圖5為本發(fā)明實(shí)施例中IP配置和VLAN配置邏輯結(jié)構(gòu)圖。圖6為本發(fā)明實(shí)施例中系統(tǒng)物理結(jié)構(gòu)圖。圖7為本發(fā)明實(shí)施例中定時(shí)器周期性重啟統(tǒng)計(jì)每日各時(shí)段用戶數(shù)。具體實(shí)施例方式下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步描述。本發(fā)明是一種方法發(fā)明,說明如下。(1)、既然要控制AP通斷電,很自然地且最簡(jiǎn)單的就是用電源控制器件來控制AP電源,而目前可利用的電源控制器很多,選擇帶命令集的、可配置的電源控制器。既然要做到無須人工干預(yù),那么必然需要解決以下幾個(gè)問題自動(dòng)全天候?qū)崟r(shí)監(jiān)控AP狀態(tài)、自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī)、自動(dòng)快速恢復(fù)AP。都直接實(shí)現(xiàn)在電源控制器上最為方便。下面將這三個(gè)問題分別說明。①、自動(dòng)全天候?qū)崟r(shí)監(jiān)控AP狀態(tài)-首先是電源控制器的安裝將AP的電源線接入電源控制器的每一路輸出,電源控制器本身輸入接市電,其每一路輸出提供AP用電。如圖2所示。其次是讓電源控制器能監(jiān)控AP:*因?yàn)锳P宕機(jī)表現(xiàn)為PING不通,所以在電源控制器上用PING來監(jiān)控;*用網(wǎng)線將電源控制器與二層交換機(jī)相連;可以是和AP連接不同的交換機(jī);*配以跟交換機(jī)下AP同網(wǎng)段同VLAN的IP地址,以便電源控制器在網(wǎng)絡(luò)層面上講能連通AP,從IP角度看等同于一個(gè)AP;*利用電源控制器內(nèi)部命令集中PING命令PING目標(biāo)AP;*因?yàn)橐獙?duì)每一路輸出下的AP進(jìn)行獨(dú)立地電源控制,所以要將每一路輸出與PING的目標(biāo)AP—一對(duì)應(yīng)的綁定,否則可能錯(cuò)把其他正常的AP斷電;*利用電源控制器內(nèi)部命令集MRIP命令對(duì)每一路輸出口號(hào)碼和PING目標(biāo)AP的IP地址綁定,格式為MRIP*完全可以不間斷的PING,但是在大規(guī)模的WLAN中不間斷地PING,會(huì)增加不必要的流量負(fù)擔(dān),所有我們采取的措施是每隔一段時(shí)間PING—回AP。*這里有個(gè)參數(shù)需要根據(jù)情況來設(shè)置每?jī)苫豍ING的間隔時(shí)間,設(shè)為MRLap,單位為秒。這樣就實(shí)現(xiàn)了電源控制器自動(dòng)對(duì)AP進(jìn)行全天候的狀態(tài)監(jiān)控。當(dāng)然,這個(gè)狀態(tài)監(jiān)控只是監(jiān)控其PING得通否,而不是說能監(jiān)控到AP在做些什么事的程度,也沒有這個(gè)必要。②、自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī)*因?yàn)槭且訮ING的結(jié)果來判斷AP是否宕機(jī),而且是間隔一段時(shí)間來PING的,所以就需要測(cè)試大概PING多少包不通后就可以認(rèn)為是宕機(jī),以避免在PING間歇發(fā)生的AP宕機(jī)被遺漏;設(shè)MRRetry為每回PING的包數(shù),要確定其值。*為此需要針對(duì)各種可能引起PING不通AP的情況進(jìn)行測(cè)試記錄,看每種情況的連續(xù)PING不通的包數(shù),然后區(qū)分出AP宕機(jī)的連續(xù)PING不通的包數(shù)的特征。一般有以下幾種情況情況網(wǎng)絡(luò)擁堵傳輸故障AP宕機(jī)AP忙*每種情況測(cè)試100次,每次PING10000個(gè)包;*主要是AP宕機(jī)的模擬;*需要規(guī)定判斷的正確率;要求模擬測(cè)試情況下為100%正確,實(shí)際環(huán)境下大于95%;實(shí)際環(huán)境中,傳輸故障幾率遠(yuǎn)小于AP宕機(jī)幾率,所以這點(diǎn)誤判沒有必要去修正,可以允許進(jìn)一步提高,因?yàn)榫退闶墙?jīng)驗(yàn)豐富的人力也不能100%正確地判斷是否是傳輸故障還是AP宕機(jī)。確定了MRRetry最適當(dāng)?shù)闹岛?,在每回PING中,連續(xù)PING不通MRRetry個(gè)包后,就可以認(rèn)為目標(biāo)AP發(fā)生了宕機(jī)。③、自動(dòng)快速恢復(fù)AP:*只有當(dāng)AP宕機(jī)被正確判斷后,才立刻實(shí)施給目標(biāo)AP斷電重起;因?yàn)樵趯?shí)現(xiàn)監(jiān)控的步驟里,已實(shí)現(xiàn)了在電源控制器上將輸出與AP—一對(duì)應(yīng)綁定,所以這里就無須考慮目標(biāo)AP是否正確的問題;*可以在電源控制器上為在每一路輸出都配置如"act1poweroffpoweron"這樣的命令顯式地控制各路輸出獨(dú)立工作;*如果AP很多,這樣配置勢(shì)必費(fèi)時(shí)費(fèi)力還容易出錯(cuò);*既然都判斷出是宕機(jī)了,那么勢(shì)必是要進(jìn)行斷電重起,沒有必要再顯式輸入命令;所以在電源控制器上改進(jìn)為為無需顯式輸入命令,默認(rèn)就是實(shí)施斷電重起,由其內(nèi)部芯片自動(dòng)控制,無須干預(yù)。*其內(nèi)部整個(gè)過程簡(jiǎn)單示意如圖3所示。從判斷出宕機(jī)到開始控制斷電,完全是硬件完成,花費(fèi)的時(shí)間極短,完全可以忽略不計(jì)。為了保護(hù)開關(guān)電氣性能,電源控制器默認(rèn)在斷電15秒后才再上電,實(shí)際整個(gè)動(dòng)作不超過20秒,設(shè)這個(gè)時(shí)間為HoldTime,單位為秒。(2)、另外需要說明的是,對(duì)于每個(gè)AP,電源控制器都有獨(dú)立的進(jìn)程來控制,不會(huì)因?yàn)閷?duì)某一個(gè)AP的重起而使得對(duì)其他AP的PING被迫等待。這些都是有電源控制器硬件芯片實(shí)現(xiàn)的。而對(duì)于某一個(gè)AP而言,以上三個(gè)過程有前后關(guān)系A(chǔ)P正常情況下,只有PING在運(yùn)行;在AP宕機(jī)情況下,假如當(dāng)前這一回PING正好發(fā)現(xiàn)宕機(jī),然后約6分鐘后重起,如果是獨(dú)占的話,那么在這6分鐘的時(shí)間里,下面第二回PING必須延后至重起完成時(shí)開始,否則可能因?yàn)镻ING的時(shí)候正在重起而PING不通又誤認(rèn)為是宕機(jī)而又進(jìn)行重起,于是一直循環(huán)重起個(gè)不停,顯然這是不對(duì)的。同樣這些也是由電源控制器硬件芯片實(shí)現(xiàn)控制的。以本地WLAN在某樓道機(jī)房實(shí)施的一個(gè)電源控制器控制5個(gè)AP的情況為例。1、自動(dòng)全天候?qū)崟r(shí)監(jiān)控AP狀態(tài)主要實(shí)際上是安裝、IP配置和VLAN配置、輸出與IP綁定、MRLap值的確定。(1)、電源控制器的安裝首先將5個(gè)AP的電源線接入電源控制器的每一路輸出,電源控制器本身輸入接市電,其每一路輸出提供AP用電。如圖2所示。(2)、IP配置和VLAN配置用網(wǎng)線將電源控制器與二層交換機(jī)相連;是和AP連接相同的交換機(jī);5個(gè)AP分別配置172.17.0.1到172.17.0.5的IP地址,掩碼和網(wǎng)關(guān)都相同,分別為255.255.255.0、172.17.0.254;5個(gè)AP分別劃分到5個(gè)不同的VLAN以實(shí)現(xiàn)二層廣播的隔離和安全,分別為VLAN1到VL緒5,一一對(duì)應(yīng);將電源控制器配置IP為172.17.0.6的地址,掩碼和網(wǎng)關(guān)同AP,劃分到VLAN6的VLAN中;在上層路由器設(shè)備中制作VLAN路由數(shù)據(jù),使得電源控制器能訪問任何一個(gè)AP,而任何2個(gè)AP之間不能互訪。VLAN路由的數(shù)據(jù)這里不多描述,請(qǐng)參考相關(guān)資料。配置如圖5所示。(3)、輸出與IP綁定對(duì)每一路輸出與PING的目標(biāo)AP—一對(duì)應(yīng)的綁定利用電源控制器內(nèi)部命令集MRIP命令對(duì)每一路輸出口號(hào)碼和PING目標(biāo)AP的IP地址綁定,格式為mrip既/W欣一/W71船f/尸,(4)、MRL即值的確定我們采取的措施是每隔5分鐘PING—回AP,MRLap值為300秒。(5)、在電源控制器上的數(shù)據(jù)配置如下<table>tableseeoriginaldocumentpage10</column></row><table>〃兩輪自動(dòng)PING間隔值,秒這樣就實(shí)現(xiàn)了這一個(gè)電源控制器自動(dòng)對(duì)5個(gè)AP進(jìn)行互相獨(dú)立的狀態(tài)監(jiān)控。2、自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī)實(shí)際上主要是根據(jù)模擬測(cè)試確定MRRetry的值,并投入實(shí)際運(yùn)行看其對(duì)判斷AP宕機(jī)的正確率是否符合要求。(1)、針對(duì)各種可能引起PING不通AP的情況進(jìn)行了測(cè)試記錄,如下<table>tableseeoriginaldocumentpage10</column></row><table>(2)、模擬測(cè)試方法說明如下*每種情況測(cè)試100次,每次PING10000個(gè)包;其中AP宕機(jī)的模擬方法為-今電源控制器上不斷PINGAP,安排50個(gè)終端通過該AP上網(wǎng),進(jìn)行大流量的下載,50個(gè)終端的數(shù)量已遠(yuǎn)大于AP—般20個(gè)的接入能力,這樣使AP宕機(jī)更容易發(fā)生,且更貼近實(shí)際;今同時(shí)用3個(gè)配置相同頻率的AP進(jìn)行定向干擾,但不接入網(wǎng)絡(luò),也不廣播SSID,所以終端不能與其關(guān)聯(lián);今當(dāng)電源控制器上第一個(gè)PING不通開始到所有終端都不能關(guān)聯(lián)AP時(shí),記錄連續(xù)丟包數(shù)目;今將這幾個(gè)AP輪流測(cè)試,測(cè)試記錄數(shù)值取平均值。*根據(jù)以上測(cè)試,設(shè)置為每隔5分鐘(MRLap)進(jìn)行一回PING,每回對(duì)每個(gè)APPING20個(gè)包(MRRetry),設(shè)PING每個(gè)包要花費(fèi)的時(shí)間為PingR印ly:令設(shè)PingR印ly為1秒,20個(gè)包就是20秒;假設(shè)上一回PING第二個(gè)包開始AP事實(shí)上發(fā)生宕機(jī),今剩余19個(gè)包不通并不會(huì)判斷為AP宕機(jī),直到5分鐘后開始新一輪PING,將連續(xù)20個(gè)包都PING不通,今所以從AP宕機(jī)到電源控制器判斷發(fā)現(xiàn)為止最長(zhǎng)耗時(shí)僅5分40秒;今電源控制器上對(duì)MRRetry的數(shù)據(jù)配置如下setmrlap300〃兩輪自動(dòng)PING間隔值,秒setmrretry20〃每次PING的次數(shù),即PING包數(shù)經(jīng)模擬宕機(jī)和其他情況各100次測(cè)試,正確判斷宕機(jī)100次,達(dá)100%的正確率;投入實(shí)際環(huán)境再測(cè)試,正確率達(dá)97%,其中3%的錯(cuò)誤率是傳輸故障誤判宕機(jī),而真正宕機(jī)實(shí)際上都正確判斷出來了。另外經(jīng)過多次測(cè)試,這里有個(gè)經(jīng)驗(yàn)值:MRLap取值300,單位為秒;MRRetry取值20,單位為次。3、自動(dòng)快速恢復(fù)AP:*只有當(dāng)AP宕機(jī)被正確判斷后,才立刻實(shí)施給目標(biāo)AP斷電重起;*因?yàn)樵趯?shí)現(xiàn)監(jiān)控的步驟里,已實(shí)現(xiàn)了在電源控制器上將輸出與AP—一對(duì)應(yīng)綁定,所以這里就無須考慮目標(biāo)AP是否正確的問題;*再次模擬AP宕機(jī),測(cè)試其成功率和正確率。其內(nèi)部整個(gè)過程簡(jiǎn)單示意如圖6所示。從判斷出宕機(jī)到開始控制斷電,完全是硬件完成,花費(fèi)的時(shí)間極短,完全可以忽略不計(jì)。為了保護(hù)開關(guān)電氣性能,電源控制器默認(rèn)在斷電15秒后才再上電,實(shí)際整個(gè)動(dòng)作不超過20秒,設(shè)這個(gè)時(shí)間為HoldTime;經(jīng)10個(gè)AP各100次測(cè)試,斷電重起正確率為100%,成功率為100%,實(shí)現(xiàn)了對(duì)AP電源的無人干預(yù)的控制。將上述三步結(jié)合,可以計(jì)算出完成一次對(duì)宕機(jī)AP的從自動(dòng)監(jiān)控、及時(shí)發(fā)現(xiàn)和判斷宕機(jī)、自動(dòng)快速恢復(fù)的過程約需要6分鐘的時(shí)間,遠(yuǎn)遠(yuǎn)小于人工的平均30分鐘的時(shí)間。當(dāng)然可以根據(jù)實(shí)際無線環(huán)境設(shè)置等式TimeLe『MRLap+PingR印lyX(2XMRRetry-l)+HoldTime中各個(gè)參數(shù)的值,做到完全可以使時(shí)長(zhǎng)更短,使得用戶基本感覺不出,即便有所感知,也因?yàn)榭焖俚幕謴?fù)使得時(shí)長(zhǎng)還在其容忍范圍之內(nèi)。4、替?zhèn)涫侄谓Y(jié)合電源控制器的功能,研究實(shí)現(xiàn)了人工遠(yuǎn)程登錄重啟和定時(shí)器自動(dòng)重啟兩個(gè)方案。同樣省去了人工現(xiàn)場(chǎng)重啟和交通等耗時(shí),時(shí)長(zhǎng)取決于打字速度。(1)、人工遠(yuǎn)程登錄重啟*遠(yuǎn)程登錄到電源控制器,通過人機(jī)命令,手工進(jìn)行給AP斷電重啟。*安全考慮,必須要對(duì)允許登錄的主機(jī)進(jìn)行限制;經(jīng)過測(cè)試,目前僅能設(shè)置登錄密碼、修改登錄端口號(hào)等比較方便地實(shí)現(xiàn);*利用電源控制器內(nèi)部命令中controlpoweroff和controlpoweron命令;*電源控制器上數(shù)據(jù)制作如下將設(shè)置進(jìn)入只讀權(quán)限模式的密碼setpeisswd氺**氺氺*氺氺抑進(jìn)入完全權(quán)限模式的密碼setsuper參參爭(zhēng)拳9參參參湘設(shè)置允許登錄進(jìn)來的主機(jī)范圍和端口號(hào)settelip0.0.0.0settelmask0.0.0.0settelport22023抑將第5路輸出下的AP斷電controlpoweroff5抑將第5路輸出下的AP通電controlpoweron5人工登錄操作斷電重啟成功率100%,正確率100%。(2)、定時(shí)器周期性重啟*不管AP有沒有宕機(jī),每隔固定一段時(shí)間將所有AP逐個(gè)斷電重起,這樣宕機(jī)AP總會(huì)被重起;正常的AP都會(huì)被重起,用戶感知明顯;*使用高峰肯定有AP宕機(jī),經(jīng)過調(diào)査,和反復(fù)測(cè)試,將定時(shí)器設(shè)置在如圖7中圓點(diǎn)處既能最大限度照顧用戶感知、又能最大限度保證AP及時(shí)宕機(jī)重起。*電源控制器上數(shù)據(jù)制作如下1抑分別在7點(diǎn)30、13點(diǎn)30、18點(diǎn)30、21點(diǎn)30添加個(gè)定時(shí)器抑最后數(shù)字3代表先斷電再通電動(dòng)作timeractadd07303timeractadd13303timeractadd18303timeractadd21303因?yàn)椴贿M(jìn)行判斷,不管是否宕機(jī),定時(shí)一到就重起,所以不能定義判斷正確率。投入實(shí)際環(huán)境測(cè)試,到點(diǎn)準(zhǔn)時(shí)動(dòng)作正確率100%,成功率100%。綜上,該實(shí)施例在投入運(yùn)行的一年時(shí)間里,因AP宕機(jī)而引起的投訴沒有發(fā)生一起,而往年同期卻有近100起;另外WLAN整體運(yùn)行性能穩(wěn)定,沒有發(fā)生一次部分或整體的業(yè)務(wù)阻斷,而往年同期僅更換AP就有IO次。權(quán)利要求1、一種實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于步驟一、電源控制器的安裝將AP的電源線接入電源控制器的每一路輸出,電源控制器本身輸入接市電,其每一路輸出提供AP用電;步驟二、電源控制器自動(dòng)對(duì)AP進(jìn)行全天候的狀態(tài)監(jiān)控;步驟三、自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī)步驟四、自動(dòng)快速恢復(fù)AP。2、根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于步驟二中,所述電源控制器自動(dòng)對(duì)AP進(jìn)行全天候的狀態(tài)監(jiān)控,具體步驟是,步驟二-1,用網(wǎng)線將電源控制器與二層交換機(jī)相連;步驟二-2,配以跟交換機(jī)下AP同網(wǎng)段同VLAN的IP地址;步驟二-3,利用電源控制器內(nèi)部命令集中PING命令PING目標(biāo)AP,每隔一段時(shí)間PING—回AP;步驟二-4,利用電源控制器內(nèi)部命令集MRIP命令對(duì)每一路輸出口號(hào)碼和PING目標(biāo)AP的IP地址綁定。3、根據(jù)權(quán)利要求2所述的實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于步驟三中,所述自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī),具體是指,以PING的結(jié)果來判斷AP是否宕機(jī),因是間隔一段時(shí)間來PING的,設(shè)MRRetry為每回PING的包數(shù),確定了MRRetry最適當(dāng)?shù)闹岛?,在每回PING中,連續(xù)PING不通MRRetry個(gè)包后,即判定目標(biāo)AP發(fā)生了宕機(jī)。4、根據(jù)權(quán)利要求3所述的實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于步驟四中,所述自動(dòng)快速恢復(fù)AP,具體是指,當(dāng)AP宕機(jī)被正確判斷后,立刻實(shí)施給目標(biāo)AP斷電重啟,實(shí)現(xiàn)AP快速恢復(fù)。5、根據(jù)權(quán)利要求4所述的實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于步驟四中,所述自動(dòng)快速恢復(fù)AP,具體步驟是,步驟四-1,PING不通,AP宕機(jī)被正確判斷;步驟四-2,網(wǎng)絡(luò)模塊通知電源控制模塊;步驟四-3,電源控制模塊反饋動(dòng)作結(jié)果,以記錄在日志或顯示在人機(jī)界面中;步驟四-4,電源控制根據(jù)IP與輸出的綁定關(guān)系,找出正確的輸出,實(shí)施斷電再上電的動(dòng)作。全文摘要本發(fā)明的一種實(shí)現(xiàn)WLANAP宕機(jī)后快速恢復(fù)的方法,其特征在于電源控制器的安裝將AP的電源線接入電源控制器的每一路輸出,電源控制器本身輸入接市電,其每一路輸出提供AP用電;電源控制器自動(dòng)對(duì)AP進(jìn)行全天候的狀態(tài)監(jiān)控;自動(dòng)及時(shí)發(fā)現(xiàn)和判斷AP宕機(jī)以PING的結(jié)果來判斷AP是否宕機(jī);自動(dòng)快速恢復(fù)AP,當(dāng)AP宕機(jī)被正確判斷后,立刻實(shí)施給目標(biāo)AP斷電重啟,實(shí)現(xiàn)AP快速恢復(fù)。本發(fā)明完成一次對(duì)宕機(jī)AP的從自動(dòng)監(jiān)控、及時(shí)發(fā)現(xiàn)和判斷宕機(jī)、自動(dòng)快速恢復(fù)的整個(gè)過程時(shí)長(zhǎng)僅約6分鐘,遠(yuǎn)遠(yuǎn)低于人工時(shí)間,幾乎就解決該類問題,相對(duì)來說近乎“零宕機(jī)”。文檔編號(hào)H04L12/10GK101299680SQ20081012418公開日2008年11月5日申請(qǐng)日期2008年6月17日優(yōu)先權(quán)日2008年6月17日發(fā)明者鳴倪,戴軍毅申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)江蘇有限公司