亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多核處理器置位的方法和裝置制造方法

文檔序號:6624326閱讀:174來源:國知局
多核處理器置位的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種多核處理器置位的方法,包括:檢測到任一VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系;當(dāng)判斷軟件置位次數(shù)大于或等于軟件置位次數(shù)閾值時,設(shè)置VCPU處于隔離狀態(tài);根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對多核處理器進(jìn)行硬件置位處理。本發(fā)明提出的實(shí)施例中,多核處理器承載數(shù)據(jù)業(yè)務(wù)后,在VCPU發(fā)生隱性故障時,采用軟件置位和硬件置位相結(jié)合的方法,可避免單純硬件置位多核處理器而導(dǎo)致的終端掉線,小區(qū)退服、用戶感知下降等問題。同時,通過隔離故障VCPU以避免數(shù)據(jù)業(yè)務(wù)承載在故障VCPU上,并選擇合適時機(jī)硬件置位整個多核處理器來解除故障。
【專利說明】多核處理器置位的方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及置位【技術(shù)領(lǐng)域】,具體而言,本發(fā)明涉及多核處理器置位方法及裝置。

【背景技術(shù)】
[0002]多核處理器是指在單個處理器中集成多個完整的計(jì)算引擎,即執(zhí)行內(nèi)核。多核處理器是單枚芯片,其能夠直接插入單一的處理器單板插槽中,操作系統(tǒng)會利用所有相關(guān)的資源,將每個執(zhí)行內(nèi)核作為分立的邏輯處理器。通過在多個執(zhí)行內(nèi)核之間劃分任務(wù),多核處理器可在特定的時鐘周期內(nèi)執(zhí)行更多任務(wù),由于其能夠在高集成化并占用較小空間的基礎(chǔ)上提供更多的功能,相比傳統(tǒng)的單核系統(tǒng)而言性能更好。VCPU (Virtual CentralProcessing Unit,虛擬中央處理器)技術(shù)是CPU的虛擬化技術(shù),單CPU模擬多CPU并行,允許一個平臺同時運(yùn)行多個操作系統(tǒng),并且應(yīng)用程序可以在相互獨(dú)立的空間內(nèi)運(yùn)行而互不影響,從而顯著提高計(jì)算機(jī)的工作效率。當(dāng)前,高效能的多核處理器得到了廣泛應(yīng)用,以XLR732為例,其包括8個內(nèi)核,每個內(nèi)核又包含4個獨(dú)立的VCPU。每個VCPU可以運(yùn)行LINUX、VXffORKS等操作系統(tǒng),也可以直接運(yùn)行于RM1S操作系統(tǒng)。
[0003]目前RNC(Rad1 Network Controller,無線網(wǎng)絡(luò)控制器)數(shù)據(jù)處理功能主要由多核處理器,如XLR732,所承載,可在單個內(nèi)核上設(shè)置多個VCPU來承載用戶面數(shù)據(jù)以執(zhí)行相應(yīng)處理,來實(shí)現(xiàn)小區(qū)建立,終端接入等功能。用戶面數(shù)據(jù)處理軟件部署在多核處理器上后,VCPU主要完成數(shù)據(jù)在無線UU接口和IU 口之間的相互轉(zhuǎn)發(fā)、調(diào)度等操作流程。由于數(shù)據(jù)報(bào)文轉(zhuǎn)發(fā)系統(tǒng)的關(guān)鍵性能指標(biāo),如數(shù)據(jù)包轉(zhuǎn)發(fā)、時延、吞吐量等,要求較高的處理效率,但與此伴隨的是易于產(chǎn)生處理器運(yùn)行異常,例如定時器異常,內(nèi)存改寫等。當(dāng)此類異常發(fā)生時,VCPU處于正常狀態(tài),不影響其與主控CPU之間的心跳信號,但其所承載的業(yè)務(wù)無法正常處理,因此定義此類故障為隱性故障。目前RNC設(shè)備有隱性故障檢測手段,可以及時發(fā)現(xiàn)此類故障,但在處理此類故障時,現(xiàn)有的一種解決方案是采取硬件置位單板或者CPU的方式。硬件置位指單板或者CPU上電重新啟動,即掉電重啟。軟件置位指單板保持正常運(yùn)行,應(yīng)用程序釋放掉所有相關(guān)資源后執(zhí)行軟件重新初始化過程,即特定軟件模塊重新運(yùn)行。采取硬件置位多核處理器方法存在的問題是,由于多核處理器上分布多個VCPU且多個VCPU共用代碼段,一個VCPU發(fā)生隱形故障即硬件置位多核處理器,會引起其他非故障VCPU上小區(qū)退服及在線終端掉線等問題,嚴(yán)重影響用戶感知和通信性能指標(biāo)?,F(xiàn)有的另一種解決方案是在單個VCPU發(fā)生隱形故障時,對其執(zhí)行軟件置位處理,但由于VCPU的隱性故障可能是由于多個執(zhí)行內(nèi)核之間共享的內(nèi)存資源引起,或是在多核處理器出現(xiàn)硬件故障時,軟件置位單個VCPU均不能有效地解決問題。


【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的旨在至少解決上述技術(shù)缺陷之一,特別是硬件置位多核處理器而引起的非故障VCPU無法正常運(yùn)行問題。
[0005]本發(fā)明提供了一種多核處理器置位的方法,包括:
[0006]檢測到任一 VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)所述VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系;
[0007]當(dāng)判斷所述軟件置位次數(shù)大于或等于所述軟件置位次數(shù)閾值時,設(shè)置所述VCPU處于隔離狀態(tài);
[0008]根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對所述多核處理器進(jìn)行硬件置位處理。
[0009]本發(fā)明還提供了一種多核處理器置位的裝置,其特征在于,包括判斷模塊,第一設(shè)置模塊和置位模塊:
[0010]所述判斷模塊,用于檢測到任一 VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)所述VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系;
[0011]所述第一設(shè)置模塊,用于當(dāng)判斷所述軟件置位次數(shù)大于或等于所述軟件置位次數(shù)閾值時,設(shè)置所述VCPU處于隔離狀態(tài);
[0012]所述置位模塊,用于根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對所述多核處理器進(jìn)行硬件置位處理。
[0013]本發(fā)明提出的實(shí)施例中,多核處理器承載數(shù)據(jù)業(yè)務(wù)后,在VCPU發(fā)生預(yù)定故障事件時,采用軟件置位和硬件置位相結(jié)合的方法,可避免單純硬件置位多核處理器而導(dǎo)致的終端掉線,小區(qū)退服、用戶感知下降等問題。同時,通過隔離故障VCPU可避免數(shù)據(jù)業(yè)務(wù)承載在故障VCPU上,并選擇合適時機(jī)硬件置位整個多核處理器來解除故障。本發(fā)明提出的上述方案,對現(xiàn)有系統(tǒng)的改動很小,不會影響系統(tǒng)的兼容性,而且實(shí)現(xiàn)簡單、高效。
[0014]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。

【專利附圖】

【附圖說明】
[0015]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
[0016]圖1為根據(jù)本發(fā)明實(shí)施例的多核處理器置位的方法流程圖;
[0017]圖2為根據(jù)本發(fā)明一個具體實(shí)施例的多核處理器置位流程圖;
[0018]圖3為根據(jù)本發(fā)明實(shí)施例的多核處理器置位的設(shè)備功能示意圖。

【具體實(shí)施方式】
[0019]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。
[0020]圖1為根據(jù)本發(fā)明實(shí)施例的多核處理器置位的方法流程圖。
[0021]在步驟SllO中,檢測到任一 VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系。
[0022]具體地,任一 VCPU通過自檢,或通過主控VCPU實(shí)時監(jiān)測檢測到該VCPU出現(xiàn)預(yù)定故障事件時,向多核處理器發(fā)送該VCPU故障檢測通知消息;其中,所述預(yù)定故障事件包括但不限于可通過VCPU自檢得到的關(guān)鍵資源如內(nèi)存、定時器連續(xù)無法分配、內(nèi)存改寫、數(shù)據(jù)隊(duì)列內(nèi)容錯誤、協(xié)議處理連續(xù)錯誤等問題,及可通過主控VCPU監(jiān)測到該VCPU上承載的數(shù)據(jù)業(yè)務(wù)連續(xù)多次無法正常連接等問題;接收到該VCPU故障檢測通知消息后,觸發(fā)多核處理器讀取在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)的數(shù)據(jù)記錄,接著,判斷軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系。
[0023]在步驟S120中,當(dāng)判斷軟件置位次數(shù)大于或等于軟件置位次數(shù)閾值時,設(shè)置VCPU處于隔離狀態(tài)。
[0024]具體地,多核處理器判斷在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)不小于軟件置位次數(shù)閾值時,如判斷在2小時內(nèi),該VCPU的軟件置位次數(shù)為7,大于軟件置位次數(shù)閾值5時,確定該VCPU異常,通過給該VCPU標(biāo)注標(biāo)簽等方式,設(shè)置該VCPU處于隔離狀態(tài),且不再將新的數(shù)據(jù)業(yè)務(wù)承載在該VCPU上。
[0025]在步驟S130中,根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對多核處理器進(jìn)行硬件置位處理。
[0026]其中,根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對多核處理器進(jìn)行硬件置位處理的方式,包括:
[0027]I)當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量不小于第一預(yù)定隔離閾值時,硬件置位多核處理器。
[0028]具體地,多核處理器判斷處于隔離狀態(tài)的VCPU數(shù)量不小于第一預(yù)定隔離閾值時,如判斷處于隔離狀態(tài)的VCPU為18個,大于第一預(yù)定隔離閾值16時,則立刻硬件置位多核處理器。
[0029]2)步驟S130(參照圖1)包括步驟S131 (圖未示)和步驟S132 (圖未示),在步驟S131中,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,對多核處理器進(jìn)行閑時檢測,其中,第二預(yù)定隔離閾值小于第一預(yù)定隔離閾值;在步驟S132中,當(dāng)確定多核處理器處于閑時,硬件置位多核處理器。
[0030]具體地,多核處理器判斷隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,如判斷處于隔離狀態(tài)的VCPU為10個,小于第一預(yù)定隔離閾值16,且大于第二預(yù)定隔離閾值6時,則對多核處理器進(jìn)行閑時檢測;接著,當(dāng)確定多核處理器處于閑時,則硬件置位多核處理器。
[0031]其中,對多核處理器進(jìn)行閑時檢測的方式包括:基于預(yù)定閑時檢測周期檢測多核處理器當(dāng)前指標(biāo)信息;當(dāng)當(dāng)前指標(biāo)信息小于閑時指標(biāo)閾值時,確定多核處理器處于閑時。當(dāng)前指標(biāo)信息,包括:數(shù)據(jù)流量;終端接入數(shù)量。
[0032]具體地,當(dāng)前指標(biāo)信息以在預(yù)定閑時檢測周期內(nèi),如最近15分鐘時間內(nèi),多核處理器上數(shù)據(jù)流量和/或終端接入數(shù)量為依據(jù),判斷多核處理器當(dāng)前是否處于閑時;其中,閑時指標(biāo)閾值指預(yù)定時間中在預(yù)定時間粒度下最低值的平均值,例如,連續(xù)N天中在每日24小時內(nèi)的每15分鐘粒度下,多核處理器上數(shù)據(jù)流量和/或終端接入數(shù)量的最低值的平均值,N為可配置時間周期,優(yōu)選為7天,且當(dāng)實(shí)際運(yùn)行天數(shù)小于N時,將實(shí)際運(yùn)行天數(shù)作為時間周期。優(yōu)選地,可設(shè)置接入終端數(shù)目優(yōu)先級高于流量統(tǒng)計(jì)作為置位條件。
[0033]多核處理器承載數(shù)據(jù)業(yè)務(wù)后,在VCPU發(fā)生預(yù)定故障時,采用軟件置位和硬件置位相結(jié)合的方法,可避免單純硬件置位多核處理器而導(dǎo)致的終端掉線,小區(qū)退服、用戶感知下降等問題。同時,通過隔離故障VCPU可避免數(shù)據(jù)業(yè)務(wù)承載在故障VCPU上,隨后選擇合適時機(jī)硬件置位整個多核處理器來解除故障。
[0034]在一優(yōu)選實(shí)施例中,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,多核處理器置位的方法(參照圖1)還包括步驟S140(圖未示);在步驟S140中,當(dāng)確定多核處理器不處于閑時,且當(dāng)前時間處于預(yù)定時間段,硬件置位多核處理器。
[0035]具體地,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,當(dāng)通過閑時檢測確定多核處理器不處于閑時,且當(dāng)前時間處于預(yù)定時間段,如凌晨3點(diǎn)至5點(diǎn)時,則立即硬件置位多核處理器。
[0036]為防止重大事件、節(jié)假日導(dǎo)致數(shù)據(jù)流量及終端接入數(shù)量一段時間內(nèi)始終高于第二預(yù)定隔離閾值不能及時執(zhí)行硬件置位,通過統(tǒng)計(jì)分析確定數(shù)據(jù)流量及終端接入數(shù)量在如凌晨3點(diǎn)至5點(diǎn)之間處于低谷且主要以PS數(shù)據(jù)業(yè)務(wù)為主,執(zhí)行硬件置位對用戶感知影響較輕。因此,閑時檢測確定多核處理器不處于閑時且當(dāng)前時間處于預(yù)定時間段時,執(zhí)行硬件置位多核處理器。
[0037]在另一優(yōu)選實(shí)施例中,多核處理器置位的方法(參照圖1)還包括步驟S150(圖未示),步驟S150中,當(dāng)判斷軟件置位次數(shù)小于軟件置位次數(shù)閾值時,設(shè)置VCPU處于故障狀態(tài);遷移VCPU上的當(dāng)前業(yè)務(wù),軟件置位VCPU。
[0038]具體地,步驟S150中,當(dāng)判斷軟件置位次數(shù)小于軟件置位次數(shù)閾值時,多核處理器的故障處理程序設(shè)置VCPU處于故障狀態(tài),即暫時不在該VCPU上承載數(shù)據(jù)業(yè)務(wù);隨后,將已接入該VCPU上的小區(qū)和終端的執(zhí)行數(shù)據(jù)遷移到其他正常VCPU上,軟件置位該VCPU ;遷移的方式包括:重選一個正常VCPU,采用相同參數(shù)配置重建數(shù)據(jù)業(yè)務(wù);接著,執(zhí)行軟件置位該VCPU ;其中,軟件置位的方式:通知各個協(xié)議層,如rocp、IUUP、RLC、MAC、FP等,的程序進(jìn)行資源釋放,包括內(nèi)存、定時器、終端、小區(qū)實(shí)例等釋放,隨后初始化全局變量,清除緩存數(shù)據(jù)。
[0039]在VCPU出現(xiàn)故障時,可優(yōu)先執(zhí)行軟件置位嘗試VCPU自愈,使得一些通過軟件置位即可解決的故障快速解除,而不會產(chǎn)生終端掉線,小區(qū)退服、用戶感知下降等問題。
[0040]優(yōu)選地,多核處理器置位的方法(參照圖1)還包括步驟S160(圖未示),在步驟S160中,當(dāng)檢測到VCPU軟件置位失敗時,設(shè)置該VCPU處于隔離狀態(tài)。具體地,當(dāng)多核處理器檢測到VCPU軟件置位失敗時,給該VCPU標(biāo)記處于隔離狀態(tài)的標(biāo)簽。
[0041]在又一優(yōu)選實(shí)施例中,多核處理器置位的方法(參照圖1)還包括步驟S170(圖未示),在步驟S170中,檢測每一 VCPU的當(dāng)前承載終端數(shù)量;根據(jù)當(dāng)前承載終端數(shù)量與承載閾值的關(guān)系,確定多核處理器的終端承載方式。其中,終端承載方式,包括:負(fù)載均衡承載方式或輪詢承載方式。
[0042]具體地,多核處理器檢測每一 VCPU的當(dāng)前承載終端數(shù)量;若任一 VCPU的當(dāng)前承載終端數(shù)量低于承載閾值時,確定多核處理器上所有VCPU的終端承載方式為輪詢承載方式,即終端接入時采用多核處理器上所有VCPU輪詢分配策略;例如,多核處理器中一個VCPU的當(dāng)前承載終端12個,小于承載閾值20個,則當(dāng)有新終端需要接入時,采用輪詢分配策略將該終端至分配至多核處理器上VCPU ;若每一 VCPU的當(dāng)前承載終端數(shù)量均高于承載閾值時,確定該VCPU的終端承載方式為負(fù)載均衡承載方式,即將終端分配至當(dāng)前承載終端數(shù)量最少的VCPU,以保證多核處理器每一 VCPU上數(shù)據(jù)業(yè)務(wù)均衡。
[0043]由于在成功完成軟件置位VCPU后,設(shè)置VCPU狀態(tài)為正常,后續(xù)數(shù)據(jù)業(yè)務(wù)可以繼續(xù)在該VCPU上承載,若采用負(fù)載均衡承載方式,新接入終端會優(yōu)先承載在軟件置位后的VCPU上。為了避免潛在的VCPU軟件置位后可能并未解除故障而導(dǎo)致的數(shù)據(jù)業(yè)務(wù)連續(xù)接入失敗,設(shè)置承載閾值來避免這個問題的發(fā)生,當(dāng)多核處理器上每一 VCPU的當(dāng)前承載終端數(shù)量均大于承載閾值時,可以確定每一 VCPU都處于正常狀態(tài),保證數(shù)據(jù)業(yè)務(wù)正常接入的成功率。
[0044]圖2為根據(jù)本發(fā)明一個具體實(shí)施例的多核處理器置位流程圖。
[0045]首先,檢測到任一 VCPU的預(yù)定故障事件后,收到VCPU故障檢測通知消息;接著,判斷在預(yù)定時間Tl內(nèi)該VCPU軟件置位次數(shù)是否大于等于軟件置位次數(shù)閾值M1,若小于M1,則設(shè)置該VCPU為故障狀態(tài);遷移CELL和UE至其他正常VCPU上;隨后對該VCPU執(zhí)行軟件置位;當(dāng)收到軟件置位響應(yīng)結(jié)果為該VCPU軟件置位成功,設(shè)置該VCPU為正常狀態(tài),可向該VCPU分配新業(yè)務(wù),結(jié)果整個流程;當(dāng)收到軟件置位響應(yīng)結(jié)果為該VCPU軟件置位失敗,則將該VCPU隔離,并更新隔離數(shù)據(jù)記錄;當(dāng)斷在預(yù)定時間Tl內(nèi)該VCPU軟件置位次數(shù)大于等于第二預(yù)定隔離閾值Ml時,該VCPU隔離,并更新隔離數(shù)據(jù)記錄;隨后,判斷處于隔離狀態(tài)的VCPU數(shù)量是否大于等于第一預(yù)定隔離閾值M3,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量大于等于M3時,立刻硬件置位該多核處理器;當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于M3時,繼續(xù)判斷處于隔離狀態(tài)的VCPU數(shù)量是否大于等于第二預(yù)定隔離閾值M2,若大于M2,則啟動閑時檢測,若小于M2,則結(jié)果整個流程。
[0046]圖3為根據(jù)本發(fā)明實(shí)施例的多核處理器置位的設(shè)備功能示意圖。如無特別說明,本文中多核處理器與多核處理器置位的裝置100等同使用。
[0047]裝置100包括判斷模塊110,第一設(shè)置模塊120和置位模塊130 ;首先,判斷模塊110檢測到任一 VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系。
[0048]具體地,任一 VCPU通過自檢,或通過主控VCPU實(shí)時監(jiān)測檢測到該VCPU出現(xiàn)預(yù)定故障事件時,向多核處理器發(fā)送該VCPU故障檢測通知消息;其中,所述預(yù)定故障事件包括但不限于可通過VCPU自檢得到的關(guān)鍵資源如內(nèi)存、定時器連續(xù)無法分配、內(nèi)存改寫、數(shù)據(jù)隊(duì)列內(nèi)容錯誤、協(xié)議處理連續(xù)錯誤等問題,及可通過主控VCPU監(jiān)測到該VCPU上承載的數(shù)據(jù)業(yè)務(wù)連續(xù)多次無法正常連接等問題;接收到該VCPU故障檢測通知消息后,觸發(fā)多核處理器讀取在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)的數(shù)據(jù)記錄,接著,判斷模塊110判斷軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系。
[0049]接著,第一設(shè)置模塊120當(dāng)判斷軟件置位次數(shù)大于或等于軟件置位次數(shù)閾值時,設(shè)置VCPU處于隔離狀態(tài)。
[0050]具體地,多核處理器判斷在預(yù)定時間內(nèi)該VCPU的軟件置位次數(shù)不小于軟件置位次數(shù)閾值時,如判斷在2小時內(nèi),該VCPU的軟件置位次數(shù)為7,大于軟件置位次數(shù)閾值5時,確定該VCPU異常,通過給該VCPU標(biāo)注標(biāo)簽的方式,設(shè)置該VCPU處于隔離狀態(tài),且不再將新的數(shù)據(jù)業(yè)務(wù)承載在該VCPU上。
[0051]隨后,置位模塊130根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對多核處理器進(jìn)行硬件置位處理。
[0052]其中,根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對多核處理器進(jìn)行硬件置位處理的方式,包括:
[0053]I)當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量不小于第一預(yù)定隔離閾值時,硬件置位多核處理器。
[0054]具體地,多核處理器判斷處于隔離狀態(tài)的VCPU數(shù)量不小于第一預(yù)定隔離閾值時,如判斷處于隔離狀態(tài)的VCPU為18個,大于第一預(yù)定隔離閾值16時,則第一置位模塊130立刻硬件置位多核處理器。
[0055]2)置位模塊130當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,對多核處理器進(jìn)行閑時檢測,第二預(yù)定隔離閾值小于第一預(yù)定隔離閾值;當(dāng)確定多核處理器處于閑時,硬件置位多核處理器。
[0056]具體地,多核處理器判斷隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,如判斷處于隔離狀態(tài)的VCPU為10個,小于第一預(yù)定隔離閾值16,且大于第二預(yù)定隔離閾值6時,則對多核處理器進(jìn)行閑時檢測;接著,當(dāng)確定多核處理器處于閑時,則硬件置位多核處理器。
[0057]其中,對多核處理器進(jìn)行閑時檢測的方式包括:閑時檢測模塊基于預(yù)定閑時檢測周期檢測多核處理器當(dāng)前指標(biāo)信息;當(dāng)當(dāng)前指標(biāo)信息小于閑時指標(biāo)閾值時,確定多核處理器處于閑時。當(dāng)前指標(biāo)信息,包括:數(shù)據(jù)流量;終端接入數(shù)量。
[0058]具體地,當(dāng)前指標(biāo)信息以在預(yù)定檢測周期內(nèi),如最近15分鐘時間內(nèi),多核處理器上數(shù)據(jù)流量和/或終端接入數(shù)量為依據(jù),判斷多核處理器當(dāng)前是否處于閑時;其中,閑時指標(biāo)閾值指預(yù)定時間中在預(yù)定時間粒度下最低值的平均值,例如,連續(xù)N天中在每日24小時內(nèi)的每15分鐘粒度下,多核處理器上數(shù)據(jù)流量和/或終端接入數(shù)量的最低值的平均值,N為可配置時間周期,優(yōu)選為7天,且當(dāng)實(shí)際運(yùn)行天數(shù)小于N時,將實(shí)際運(yùn)行天數(shù)作為時間周期。優(yōu)選地,可設(shè)置接入終端數(shù)目優(yōu)先級高于流量統(tǒng)計(jì)作為置位條件。
[0059]多核處理器承載數(shù)據(jù)業(yè)務(wù)后,在VCPU發(fā)生預(yù)定故障時,采用軟件置位和硬件置位相結(jié)合的方法,可避免單純硬件置位多核處理器而導(dǎo)致的終端掉線,小區(qū)退服、用戶感知下降等問題。同時,通過隔離故障VCPU以避免數(shù)據(jù)業(yè)務(wù)承載在故障VCPU上,并選擇合適時機(jī)硬件置位整個多核處理器來解除故障。
[0060]在一優(yōu)選實(shí)施例中,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,當(dāng)確定多核處理器不處于閑時,且當(dāng)前時間處于預(yù)定時間段,置位模塊130硬件置位多核處理器。
[0061]具體地,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,當(dāng)通過閑時檢測確定多核處理器不處于閑時,且當(dāng)前時間處于預(yù)定時間段,如凌晨3點(diǎn)至5點(diǎn)時,則立即硬件置位多核處理器。
[0062]為防止重大事件、節(jié)假日導(dǎo)致數(shù)據(jù)流量及終端接入數(shù)量一段時間內(nèi)始終高于第二預(yù)定隔離閾值不能及時執(zhí)行硬件置位,統(tǒng)計(jì)分析確定數(shù)據(jù)流量及終端接入數(shù)量在如凌晨3點(diǎn)至5點(diǎn)之間處于低谷且主要以PS數(shù)據(jù)業(yè)務(wù)為主,執(zhí)行硬件置位對用戶感知影響較輕。因此,閑時檢測確定多核處理器不處于閑時且當(dāng)前時間處于預(yù)定時間段時,執(zhí)行硬件置位多核處理器。
[0063]在另一優(yōu)選實(shí)施例中,裝置100(參照圖3)還包括第二設(shè)置模塊(圖未示)和遷移模塊(圖未示),當(dāng)判斷軟件置位次數(shù)小于軟件置位次數(shù)閾值時,第二設(shè)置模塊設(shè)置VCPU處于故障狀態(tài);遷移模塊遷移VCPU上的當(dāng)前業(yè)務(wù),軟件置位VCPU。
[0064]具體地,當(dāng)判斷軟件置位次數(shù)小于軟件置位次數(shù)閾值時,多核處理器的故障處理程序設(shè)置VCPU處于故障狀態(tài),即暫時不在該VCPU上承載數(shù)據(jù)業(yè)務(wù);隨后,將已接入該VCPU上的小區(qū)和終端到的執(zhí)行數(shù)據(jù)遷移到其他正常VCPU上,軟件置位該VCPU ;遷移的方式包括:重選一個正常VCPU,采用相同參數(shù)配置重建數(shù)據(jù)業(yè)務(wù);接著,執(zhí)行軟件置位該VCPU ;其中,軟件置位的方式:通知各個協(xié)議層,如rocp、I UUP, RLC, MAC、FP等,的程序進(jìn)行資源釋放,包括內(nèi)存、定時器、終端、小區(qū)實(shí)例等釋放,隨后初始化全局變量,清除緩存數(shù)據(jù)。
[0065]在VCPU出現(xiàn)故障時,可優(yōu)先執(zhí)行軟件置位嘗試VCPU自愈,使得一些通過軟件置位即可解決的故障快速解除,而不會產(chǎn)生終端掉線,小區(qū)退服、用戶感知下降等問題。
[0066]優(yōu)選地,裝置100 (參照圖3)還包括第三設(shè)置模塊(圖未示),當(dāng)檢測到VCPU軟件置位失敗時,第三設(shè)置模塊設(shè)置該VCPU處于隔離狀態(tài)。具體地,當(dāng)多核處理器檢測到VCPU軟件置位失敗時,給該VCPU標(biāo)記處于隔離狀態(tài)的標(biāo)簽。
[0067]在又一優(yōu)選實(shí)施例中,裝置100 (參照圖3)還包括檢測模塊(圖未示)和確定模塊(圖未示),檢測模塊檢測每一 VCPU的當(dāng)前承載終端數(shù)量;確定模塊根據(jù)當(dāng)前承載終端數(shù)量與承載閾值的關(guān)系,確定多核處理器的終端承載方式。其中,終端承載方式,包括:負(fù)載均衡承載方式或輪詢承載方式。
[0068]具體地,多核處理器檢測每一 VCPU的當(dāng)前承載終端數(shù)量;若任一 VCPU的當(dāng)前承載終端數(shù)量低于承載閾值時,確定多核處理器上所有VCPU的終端承載方式為輪詢承載方式,即終端接入時采用多核處理器上所有VCPU輪詢分配策略;例如,多核處理器中一個VCPU的當(dāng)前承載終端12個,小于承載閾值20個,則當(dāng)有新終端需要接入時,采用輪詢分配策略將該終端至分配至多核處理器上VCPU ;若每一 VCPU的當(dāng)前承載終端數(shù)量均高于承載閾值時,確定該VCPU的終端承載方式為負(fù)載均衡承載方式,即將終端分配至當(dāng)前承載終端數(shù)量最少的VCPU,以保證多核處理器每一 VCPU上數(shù)據(jù)業(yè)務(wù)均衡。
[0069]由于在成功完成軟件置位VCPU后,設(shè)置VCPU狀態(tài)為正常,后續(xù)數(shù)據(jù)業(yè)務(wù)可以繼續(xù)在該VCPU上承載,若采用負(fù)載均衡承載方式,新接入終端會優(yōu)先承載在軟件置位后的VCPU上。為了避免潛在的VCPU軟件置位后可能并未解除故障而導(dǎo)致的數(shù)據(jù)業(yè)務(wù)連續(xù)接入失敗,設(shè)置承載閾值來避免這個問題的發(fā)生,當(dāng)多核處理器上每一 VCPU的當(dāng)前承載終端數(shù)量均大于承載閾值時,可以確定每一 VCPU都處于正常狀態(tài),保證數(shù)據(jù)業(yè)務(wù)正常接入的成功率。
[0070]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實(shí)施例的步驟之一或其組合。
[0071 ] 此外,在本發(fā)明各個實(shí)施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,也可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中。
[0072]上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0073]以上所述僅是本發(fā)明的部分實(shí)施方式,應(yīng)當(dāng)指出,對于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種多核處理器置位的方法,其特征在于,包括: 檢測到任一 VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)所述VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系; 當(dāng)判斷所述軟件置位次數(shù)大于或等于所述軟件置位次數(shù)閾值時,設(shè)置所述VCPU處于隔離狀態(tài); 根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對所述多核處理器進(jìn)行硬件置位處理。
2.根據(jù)權(quán)利要求1所述的多核處理器置位的方法,其特征在于,根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對所述多核處理器進(jìn)行硬件置位處理,包括: 當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量不小于第一預(yù)定隔離閾值時,硬件置位所述多核處理器; 當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,對所述多核處理器進(jìn)行閑時檢測,所述第二預(yù)定隔離閾值小于第一預(yù)定隔離閾值;當(dāng)確定所述多核處理器處于閑時,硬件置位所述多核處理器。
3.根據(jù)權(quán)利要求2所述的多核處理器置位的方法,其特征在于,對所述多核處理器進(jìn)行閑時檢測,包括: 基于預(yù)定閑時檢測周期檢測所述多核處理器當(dāng)前指標(biāo)信息; 當(dāng)所述當(dāng)前指標(biāo)信息小于閑時指標(biāo)閾值時,確定所述多核處理器處于閑時。
4.根據(jù)權(quán)利要求3所述的多核處理器置位的方法,其特征在于,當(dāng)前指標(biāo)信息,包括以下至少任一項(xiàng): 數(shù)據(jù)流量;終端接入數(shù)量。
5.根據(jù)權(quán)利要求2所述的多核處理器置位的方法,其特征在于,當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,還包括: 當(dāng)確定所述多核處理器不處于閑時,且當(dāng)前時間處于預(yù)定時間段,硬件置位所述多核處理器。
6.根據(jù)權(quán)利要求1所述的多核處理器置位的方法,其特征在于,還包括: 當(dāng)判斷所述軟件置位次數(shù)小于所述軟件置位次數(shù)閾值時,設(shè)置所述VCPU處于故障狀態(tài); 遷移所述VCPU上的當(dāng)前業(yè)務(wù),軟件置位所述VCPU。
7.根據(jù)權(quán)利要求6所述的多核處理器置位的方法,其特征在于,還包括: 當(dāng)檢測到所述VCPU軟件置位失敗時,設(shè)置所述VCPU處于隔離狀態(tài)。
8.根據(jù)權(quán)利要求1所述的多核處理器置位的方法,其特征在于,還包括: 檢測每一 VCPU的當(dāng)前承載終端數(shù)量; 根據(jù)所述每一 VCPU的當(dāng)前承載終端數(shù)量與承載閾值的關(guān)系,確定所述多核處理器的終端承載方式。
9.根據(jù)權(quán)利要求8所述的多核處理器置位的方法,其特征在于,終端承載方式,包括: 負(fù)載均衡承載方式或輪詢承載方式。
10.一種多核處理器置位的裝置,其特征在于,包括判斷模塊,第一設(shè)置模塊和置位模塊: 所述判斷模塊,用于檢測到任一 VCPU的預(yù)定故障事件時,判斷在預(yù)定時間內(nèi)所述VCPU的軟件置位次數(shù)與軟件置位次數(shù)閾值的大小關(guān)系; 所述第一設(shè)置模塊,用于當(dāng)判斷所述軟件置位次數(shù)大于或等于所述軟件置位次數(shù)閾值時,設(shè)置所述VCPU處于隔離狀態(tài); 所述置位模塊,用于根據(jù)處于隔離狀態(tài)的VCPU數(shù)量,對所述多核處理器進(jìn)行硬件置位處理。
11.根據(jù)權(quán)利要求10所述的多核處理器置位的裝置,其特征在于,所述置位模塊用于當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量不小于第一預(yù)定隔離閾值時,硬件置位所述多核處理器; 當(dāng)判斷處于隔離狀態(tài)的VCPU數(shù)量小于第一預(yù)定隔離閾值且不小于第二預(yù)定隔離閾值時,對所述多核處理器進(jìn)行閑時檢測,所述第二預(yù)定隔離閾值小于第一預(yù)定隔離閾值;當(dāng)確定所述多核處理器處于閑時,硬件置位所述多核處理器。
12.根據(jù)權(quán)利要求11所述的多核處理器置位的裝置,其特征在于,所述置位模塊用于基于預(yù)定閑時檢測周期檢測所述多核處理器當(dāng)前指標(biāo)信息;當(dāng)所述當(dāng)前指標(biāo)信息小于閑時指標(biāo)閾值時,確定所述多核處理器處于閑時。
13.根據(jù)權(quán)利要求12所述的多核處理器置位的裝置,其特征在于,當(dāng)前指標(biāo)信息,包括以下至少任一項(xiàng): 數(shù)據(jù)流量;用戶設(shè)備接入數(shù)量。
14.根據(jù)權(quán)利要求11所述的多核處理器置位的裝置,其特征在于,所述置位模塊還用于當(dāng)確定所述多核處理器不處于閑時,且當(dāng)前時間處于預(yù)定時間段,硬件置位所述多核處理器。
15.根據(jù)權(quán)利要求10所述的多核處理器置位的裝置,其特征在于,還包括第二設(shè)置模塊和遷移模塊: 所述第二設(shè)置模塊,用于判斷在所述預(yù)定時間內(nèi)所述VCPU的軟件置位次數(shù)小于軟件置位次數(shù)閾值時,設(shè)置所述VCPU處于故障狀態(tài); 所述遷移模塊,用于遷移所述VCPU上的當(dāng)前業(yè)務(wù),軟件置位所述VCPUo
16.根據(jù)權(quán)利要求15所述的多核處理器置位的裝置,其特征在于,還包括第三設(shè)置模塊: 所述第三設(shè)置模塊,用于當(dāng)檢測到軟件置位所述VCPU失敗時,設(shè)置所述VCPU處于隔離狀態(tài)。
17.根據(jù)權(quán)利要求11所述的多核處理器置位的裝置,其特征在于,還包括檢測模塊和確定模塊: 所述檢測模塊,用于檢測每一 VCPU的當(dāng)前承載終端數(shù)量; 所述確定模塊,用于根據(jù)所述每一 VCPU的當(dāng)前承載終端數(shù)量與承載閾值的關(guān)系,確定所述多核處理器的終端承載方式。
18.根據(jù)權(quán)利要求17所述的多核處理器置位的裝置,其特征在于,終端承載方式,包括: 負(fù)載均衡承載方式或輪詢承載方式。
【文檔編號】G06F11/36GK104199768SQ201410416188
【公開日】2014年12月10日 申請日期:2014年8月21日 優(yōu)先權(quán)日:2014年8月21日
【發(fā)明者】程岳 申請人:大唐移動通信設(shè)備有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1