本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體涉及一種回歸模型的生成方法以及裝置,一種指標(biāo)的預(yù)測(cè)方法以及裝置。
背景技術(shù):
在提供一種新業(yè)務(wù)服務(wù)之前,需要對(duì)新業(yè)務(wù)的指標(biāo)進(jìn)行預(yù)測(cè)和評(píng)估,從而在提供新業(yè)務(wù)之前,提前發(fā)現(xiàn)系統(tǒng)問題,實(shí)施系統(tǒng)優(yōu)化,使得在新業(yè)務(wù)上市之初就提供良好的服務(wù)質(zhì)量。目前,新業(yè)務(wù)的指標(biāo)的評(píng)估只能采用在少數(shù)系統(tǒng)試驗(yàn)的方式,這種方式存在一定的局限性,即少量系統(tǒng)不能客觀的衡量系統(tǒng)的新業(yè)務(wù)整體的服務(wù)質(zhì)量?;蛘撸ㄟ^其它業(yè)務(wù)的歷史指標(biāo)、其它業(yè)務(wù)的近期的指標(biāo)以及新業(yè)務(wù)的當(dāng)前指標(biāo)預(yù)測(cè)新業(yè)務(wù)的未來的指標(biāo),該方案只能在提供新業(yè)務(wù)后,通過一定量的歷史指標(biāo)數(shù)據(jù),預(yù)測(cè)新業(yè)務(wù)的指標(biāo),不能在提供該新業(yè)務(wù)服務(wù)前預(yù)測(cè)其指標(biāo)。
因此,如何在提供新業(yè)務(wù)之前,預(yù)測(cè)提供該業(yè)務(wù)的指標(biāo),進(jìn)而開展系統(tǒng)優(yōu)化是一個(gè)開放問題,需要采用新的技術(shù)手段。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種回歸模型的生成方法以及裝置,一種指標(biāo)的預(yù)測(cè)方法以及裝置,能夠在提供新業(yè)務(wù)之前,預(yù)測(cè)提供該新業(yè)務(wù)的指標(biāo)。
上述目標(biāo)和其它目標(biāo)將通過獨(dú)立權(quán)利要求中的特征來達(dá)成。進(jìn)一步的實(shí)現(xiàn)方式在從屬權(quán)利要求、說明書和附圖中體現(xiàn)。
第一方面,提供一種回歸模型的生成方法,所述方法包括:
獲取待擬合系統(tǒng)的待擬合系統(tǒng)特征的值;
獲取所述待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值;
將所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型以建立所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值之間的數(shù)據(jù)關(guān)系。通過獲取能回歸擬合所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值之間的數(shù)據(jù)關(guān)系的目標(biāo)回歸模型,可以實(shí)現(xiàn)根據(jù)其它系統(tǒng)的系統(tǒng)特征的值來預(yù)測(cè)該其它系統(tǒng)的與所述待擬合指標(biāo)相同的指標(biāo)的值,可以在使用該其它系統(tǒng)提供待擬合業(yè)務(wù)之前,預(yù)測(cè)該其它系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值。
其中,系統(tǒng)為運(yùn)行業(yè)務(wù)的系統(tǒng),例如可以是分布式系統(tǒng)、服務(wù)器系統(tǒng)、云系統(tǒng)或通信系統(tǒng)。
其中,在系統(tǒng)為通信系統(tǒng)時(shí),該指標(biāo)可以是關(guān)鍵性能指標(biāo)kpi,該指標(biāo)也可以是關(guān)鍵質(zhì)量指標(biāo)kqi。
其中,該目標(biāo)回歸模型可以是一元回歸模型,也可以是多元回歸模型,可以是線性回歸模型,也可以是非線性回歸模型。
其中,在所述待擬合系統(tǒng)不存在待擬合業(yè)務(wù)時(shí),所述待擬合系統(tǒng)特征的值可以在所述待擬合系統(tǒng)不運(yùn)行待擬合業(yè)務(wù)的情況下獲得。
其中,在待擬合系統(tǒng)的個(gè)數(shù)為至少兩個(gè)時(shí),且待擬合系統(tǒng)為通信系統(tǒng)時(shí),所述待擬合系統(tǒng)各自覆蓋的地區(qū)之間可以不完全重合。
其中,擬合是指通過調(diào)整回歸模型中的參數(shù),使得所述待擬合系統(tǒng)特征的值作為回歸模型的輸入而獲得的回歸模型的輸出,與所述待擬合指標(biāo)的差值在一個(gè)預(yù)設(shè)范圍內(nèi)。
其中,在待擬合系統(tǒng)的個(gè)數(shù)為至少兩個(gè)時(shí),所述待擬合系統(tǒng)各自所屬的系統(tǒng)類型相同,例如,所述待擬合系統(tǒng)所屬的通信系統(tǒng)類型都屬于長(zhǎng)期演進(jìn)(longtermevolution,lte)系統(tǒng),其中,通信系統(tǒng)類型并不會(huì)區(qū)分lte系統(tǒng)是頻分雙工fdd模式還是時(shí)分雙工td模式。所述待擬合業(yè)務(wù)的業(yè)務(wù)類型相同,例如,所述待擬合業(yè)務(wù)的業(yè)務(wù)類型都屬于lte系統(tǒng)語音業(yè)務(wù)(volte,voiceoverlte)業(yè)務(wù)。
根據(jù)第一方面,在所述方法的第一種可能的實(shí)現(xiàn)方式中,所述獲取待擬合系統(tǒng)的待擬合系統(tǒng)特征的值包括:獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)特征的值;根據(jù)所述至少兩個(gè)系統(tǒng)特征的值,以及所述待擬合指標(biāo)的值,計(jì)算所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值;根據(jù)所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值,從所述至少兩個(gè)系統(tǒng)特征中確定出所述待擬合系統(tǒng)特征,從而確定出待擬合系統(tǒng)特征的值。
其中,相關(guān)系數(shù)可以包括線性相關(guān)系數(shù)以及非線性相關(guān)系數(shù)。通過相關(guān)系數(shù)篩選出的待擬合系統(tǒng)特征,根據(jù)待擬合系統(tǒng)特征生成的目標(biāo)回歸模型,在待擬合指標(biāo)的預(yù)測(cè)中,可以更好的排除與待擬合指標(biāo)無關(guān)的特征帶來的干擾,所以使得預(yù)測(cè)得到待擬合指標(biāo)的值更加精確。
根據(jù)第一方面第一種實(shí)現(xiàn)方式,在所述方法第二種可能的實(shí)現(xiàn)方式中,所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù)的值大于m,或者前n個(gè)相關(guān) 系數(shù)包括所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù),所述前n個(gè)相關(guān)系數(shù)為所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)中值最大的n個(gè)相關(guān)系數(shù),m為非負(fù)常數(shù),n為正常數(shù)且n小于或等于所述至少兩個(gè)系統(tǒng)特征中系統(tǒng)特征的個(gè)數(shù)。
其中,m可以為正整數(shù),n可以為所述至少兩個(gè)系統(tǒng)特征中系統(tǒng)特征數(shù)量的一半。
根據(jù)第一方面或以上第一方面的任意一種實(shí)現(xiàn)方式,在所述方法第三種可能的實(shí)現(xiàn)方式中,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述將所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型包括:將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;將最大預(yù)測(cè)精度對(duì)應(yīng)的回歸模型確定為所述目標(biāo)回歸模型,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度。
其中,通過使用使得對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度更高的系統(tǒng)特征子集生成的目標(biāo)回歸模型,會(huì)使得目標(biāo)回歸模型對(duì)待擬合指標(biāo)的值的預(yù)測(cè)更加精確。
其中,對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試包括使用待擬合指標(biāo)已知的系統(tǒng)的系統(tǒng)特征作為回歸模型的輸入,將回歸模型的輸出與待擬合指標(biāo)已知的系統(tǒng)的待擬合指標(biāo)進(jìn)行比較,從而獲得回歸模型的預(yù)測(cè)精度。
根據(jù)第一方面、第一方面第一種實(shí)現(xiàn)方式或第一方面第二種實(shí)現(xiàn)方式,在所述方法第四種可能的實(shí)現(xiàn)方式中,
所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述待擬合系統(tǒng)的系統(tǒng)數(shù)量為至少兩個(gè),所述將所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型包括:
將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;
對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所 述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;
將最大預(yù)測(cè)精度對(duì)應(yīng)的網(wǎng)路特征子集作為目標(biāo)系統(tǒng)特征子集,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度;
根據(jù)所述待擬合系統(tǒng)特征的值,對(duì)所述待擬合系統(tǒng)進(jìn)行聚類,從而獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)子集;
將所述至少兩個(gè)系統(tǒng)子集中分別位于所述目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征的值,與所述待擬合指標(biāo)中的所述至少兩個(gè)系統(tǒng)子集中的指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)子集各自對(duì)應(yīng)的回歸模型。
其中,目標(biāo)回歸模型包括所述至少兩個(gè)系統(tǒng)子集各自對(duì)應(yīng)的回歸模型。
其中,由于系統(tǒng)特征的值的不同會(huì)反映出系統(tǒng)的差異,因此根據(jù)網(wǎng)路特征的值對(duì)系統(tǒng)進(jìn)行聚類,并進(jìn)一步根據(jù)不同類別的網(wǎng)路特征的值生成不同的回歸模型,每個(gè)回歸模型的獲得都減少了系統(tǒng)的差異帶來的干擾,因此使得回歸模型對(duì)待擬合指標(biāo)的值的預(yù)測(cè)更加精確。
根據(jù)第一方面,或以上第一方面的任意一種實(shí)現(xiàn)方式,在所述方法第五種可能的實(shí)現(xiàn)方式中,在所述待擬合系統(tǒng)所屬的通信系統(tǒng)類型屬于lte系統(tǒng)時(shí),所述待擬合系統(tǒng)特征包括所覆蓋的地區(qū)的基站間距、頻段、全帶寬信道質(zhì)量指示的值的分布、平均用戶數(shù)、平均下行邊緣用戶數(shù)、平均上行邊緣用戶數(shù)、參考信號(hào)接收功率的分布、信號(hào)與干擾加噪聲比的分布、呼叫接入成功率、掉話率、切換成功率、上下行吞吐率、物理下行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布、物理上行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布、物理下行共享信道的物理資源塊使用的平均個(gè)數(shù)以及物理上行共享通道的物理資源塊使用的平均個(gè)數(shù)中的至少一種。
其中,全寬帶信道質(zhì)量指示的值的分布可以是全寬帶執(zhí)行指示的值分別為0至15中的數(shù)值的次數(shù),也可以是全寬帶執(zhí)行指示的值為0至15的次數(shù)。
其中,物理下行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布可以是物理下行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值分別為0至31的次數(shù),物理下行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布也可以是物理下行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值為0至31中任一值的次數(shù);物理上行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布可以是物理上行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值分別為0至31的次數(shù),物理上行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的 分布也可以是物理上行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值為0至31中任一值的次數(shù)。
上述系統(tǒng)特征可以反應(yīng)系統(tǒng)的性能,因此可以用于估計(jì)待擬合指標(biāo)的值。
根據(jù)第一方面,或以上第一方面的任意一種實(shí)現(xiàn)方式,在所述方法第六種可能的實(shí)現(xiàn)方式中,在所述待擬合系統(tǒng)所屬的通信系統(tǒng)類型屬于lte系統(tǒng),以及所述待擬合業(yè)務(wù)的業(yè)務(wù)類型屬于語音業(yè)務(wù)(lte系統(tǒng)上運(yùn)行的語音業(yè)務(wù)為lte語音(volte,voiceoverlte)業(yè)務(wù))時(shí),所述待擬合指標(biāo)包括用戶數(shù)、呼叫次數(shù)、呼叫接入成功率、掉話率或語音質(zhì)量。
第二方面,提供一種指標(biāo)的預(yù)測(cè)方法,所述方法包括:
獲取目標(biāo)系統(tǒng)的系統(tǒng)特征的值,所述目標(biāo)系統(tǒng)用于運(yùn)行待預(yù)測(cè)業(yè)務(wù);
獲取目標(biāo)回歸模型,所述目標(biāo)回歸模型包括已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值與運(yùn)行在所述已訓(xùn)練系統(tǒng)上的已訓(xùn)練業(yè)務(wù)的指標(biāo)的值之間的數(shù)據(jù)關(guān)系,所述待預(yù)測(cè)業(yè)務(wù)與所述已訓(xùn)練業(yè)務(wù)為相同類型的業(yè)務(wù),所述目標(biāo)系統(tǒng)的系統(tǒng)特征與所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征相同,所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)與所述已訓(xùn)練業(yè)務(wù)的指標(biāo)相同;
將所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值作為所述目標(biāo)回歸模型的輸入,以使得根據(jù)所述數(shù)據(jù)關(guān)系獲得所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)的預(yù)測(cè)值。
其中,所述目標(biāo)系統(tǒng)與所述已訓(xùn)練系統(tǒng)所屬的系統(tǒng)類型可以相同。其中,在目標(biāo)系統(tǒng)與已訓(xùn)練系統(tǒng)為通信系統(tǒng)時(shí),所述目標(biāo)系統(tǒng)與所述已訓(xùn)練系統(tǒng)中的系統(tǒng)覆蓋的地區(qū)可以不同,即是說,覆蓋的地區(qū)不完全重合。
其中,獲取目標(biāo)回歸模型的方式可以根據(jù)第一方面所述的方法生成,也可以從生成該回歸模型的設(shè)備獲取,其實(shí),可以是在需要使用的時(shí)候獲取,也可以提前獲取存儲(chǔ)在自身的存儲(chǔ)器中,在需要使用的時(shí)候從存儲(chǔ)器中讀取。
通過其它系統(tǒng)的系統(tǒng)特征的值與其它系統(tǒng)的待預(yù)測(cè)指標(biāo)的值之間的關(guān)系,以及當(dāng)前系統(tǒng)的系統(tǒng)特征的值,來估計(jì)當(dāng)前系統(tǒng)的待預(yù)測(cè)業(yè)務(wù)的待預(yù)測(cè)指標(biāo)的值,可以實(shí)現(xiàn)在使用目標(biāo)系統(tǒng)提供待預(yù)測(cè)業(yè)務(wù)之前,預(yù)測(cè)目標(biāo)系統(tǒng)的待預(yù)測(cè)業(yè)務(wù)的待預(yù)測(cè)指標(biāo)的值。
其中,第二方面的待預(yù)測(cè)業(yè)務(wù)與第一方面的待擬合業(yè)務(wù)的業(yè)務(wù)類型可以相同。
根據(jù)第二方面,在所述方法的第一種可能的實(shí)現(xiàn)方式中,所述獲取目標(biāo)回歸模型包括:根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo),獲取所述目標(biāo)回歸模型。
通過獲取待預(yù)測(cè)指標(biāo)對(duì)應(yīng)的回歸模型,相比于可以預(yù)測(cè)任意種類的指標(biāo)的回歸模型,預(yù)測(cè)的效果更優(yōu)。
根據(jù)第二方面,在所述方法的第二種可能的實(shí)現(xiàn)方式中,所述獲取目標(biāo)系統(tǒng)的系統(tǒng)特征的值包括:獲取指標(biāo)與系統(tǒng)特征之間的對(duì)應(yīng)關(guān)系;根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)以及所述對(duì)應(yīng)關(guān)系,獲取與所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,作為所述目標(biāo)系統(tǒng)的系統(tǒng)特征;獲取所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征的值;相應(yīng)地,
所述獲取目標(biāo)回歸模型包括:根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,獲取所述目標(biāo)回歸模型。
其中,該對(duì)應(yīng)關(guān)系可以在執(zhí)行第一方面的方法中生成,該對(duì)應(yīng)關(guān)系可以是第一方面中的待擬合指標(biāo)與至少兩個(gè)系統(tǒng)特征、待擬合系統(tǒng)特征或目標(biāo)網(wǎng)路特征子集的對(duì)應(yīng)關(guān)系,獲取指標(biāo)與系統(tǒng)特征之間的對(duì)應(yīng)關(guān)系的方式可以是從生成該對(duì)應(yīng)關(guān)系的設(shè)備獲取,或是在執(zhí)行第一方面的方法獲取目標(biāo)回歸模型的過程中生成。
通過分析系統(tǒng)的特征的值,確定系統(tǒng)特征的值對(duì)應(yīng)的回歸模型,相比于可以不考慮系統(tǒng)特征的值的回歸模型,可以排除系統(tǒng)類型不同帶來的干擾,所以預(yù)測(cè)的效果更優(yōu)。
根據(jù)第二方面第二種實(shí)現(xiàn)方式,在所述方法第三種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,獲取所述目標(biāo)回歸模型包括:根據(jù)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值,使用與所述指標(biāo)對(duì)應(yīng)的分類器對(duì)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值進(jìn)行分類;將與所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值的類別對(duì)應(yīng)的回歸模型作為所述目標(biāo)回歸模型。
根據(jù)第二方面第三種實(shí)現(xiàn)方式,在所述方法第四種可能的實(shí)現(xiàn)方式中,所述分類器根據(jù)所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別訓(xùn)練得到,所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別通過將所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的進(jìn)行聚類得到。
其中,所述分類器根據(jù)所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別訓(xùn)練得到具體為所述分類器根據(jù)所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別以及所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值訓(xùn)練得到。
其中,使用系統(tǒng)集合自身的數(shù)據(jù)來訓(xùn)練分類器,使得該分類器相比于根據(jù)其它系統(tǒng)集合的數(shù)據(jù)得到的分類器,或是人為設(shè)置的分類器,輸出的系統(tǒng)類型 與系統(tǒng)類型對(duì)應(yīng)回歸模型更加匹配,使得預(yù)測(cè)的效果更優(yōu)。
第三方面,提供一種回歸模型的生成裝置,所述裝置包括:
特征獲取模塊,用于獲取待擬合系統(tǒng)的待擬合系統(tǒng)特征的值;指標(biāo)獲取模塊,用于獲取所述待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值;擬合模塊,用于將所述特征獲取模塊獲取的所述待擬合系統(tǒng)特征的值與所述指標(biāo)獲取模塊獲取的所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型以建立所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值之間的數(shù)據(jù)關(guān)系。
根據(jù)第三方面,在所述裝置的第一種可能的實(shí)現(xiàn)方式中,所述特征獲取模塊用于:獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)特征的值;根據(jù)所述至少兩個(gè)系統(tǒng)特征的值,以及所述待擬合指標(biāo)的值,計(jì)算所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值;根據(jù)所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值,從所述至少兩個(gè)系統(tǒng)特征中確定出所述待擬合系統(tǒng)特征,從而確定出待擬合系統(tǒng)特征的值。
根據(jù)第三方面第一種實(shí)現(xiàn)方式,在所述裝置第二種可能的實(shí)現(xiàn)方式中,所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù)的值大于m,或者前n個(gè)相關(guān)系數(shù)包括所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù),所述前n個(gè)相關(guān)系數(shù)為所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)中值最大的n個(gè)相關(guān)系數(shù),m為非負(fù)常數(shù),n為正常數(shù)且n小于或等于所述至少兩個(gè)系統(tǒng)中系統(tǒng)特征的個(gè)數(shù)。
根據(jù)第三方面或以上第三方面任意一種實(shí)現(xiàn)方式,在所述裝置第三種可能的實(shí)現(xiàn)方式中,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述擬合模塊用于:將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;
對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;
將最大預(yù)測(cè)精度對(duì)應(yīng)的回歸模型確定為所述目標(biāo)回歸模型,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度。
根據(jù)第三方面、第三方面第一種實(shí)現(xiàn)方式或第三方面第二種實(shí)現(xiàn)方式,在所述裝置第四種可能的實(shí)現(xiàn)方式中,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為 至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述待擬合系統(tǒng)的系統(tǒng)數(shù)量為至少兩個(gè),所述擬合模塊用于:
將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;將最大預(yù)測(cè)精度對(duì)應(yīng)的網(wǎng)路特征子集作為目標(biāo)系統(tǒng)特征子集,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度;根據(jù)所述待擬合系統(tǒng)特征的值,對(duì)所述待擬合系統(tǒng)進(jìn)行聚類,從而獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)子集;將所述至少兩個(gè)系統(tǒng)子集中分別位于所述目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征的值,與所述待擬合指標(biāo)中的所述至少兩個(gè)系統(tǒng)子集中的指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)子集各自對(duì)應(yīng)的回歸模型。
第四方面,提供一種指標(biāo)的預(yù)測(cè)裝置,所述裝置包括:
特征獲取模塊,用于獲取目標(biāo)系統(tǒng)的系統(tǒng)特征的值,所述目標(biāo)系統(tǒng)用于運(yùn)行待預(yù)測(cè)業(yè)務(wù);
模型獲取模塊,用于獲取目標(biāo)回歸模型,所述目標(biāo)回歸模型包括已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值與運(yùn)行在所述已訓(xùn)練系統(tǒng)上的已訓(xùn)練業(yè)務(wù)的指標(biāo)的值之間的數(shù)據(jù)關(guān)系,所述待預(yù)測(cè)業(yè)務(wù)與所述已訓(xùn)練業(yè)務(wù)為相同類型的業(yè)務(wù),所述目標(biāo)系統(tǒng)的系統(tǒng)特征與所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征相同,所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)與所述已訓(xùn)練業(yè)務(wù)的指標(biāo)相同;
預(yù)測(cè)模塊,用于將所述特征獲取模塊獲取的所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值作為模型獲取模塊獲取的所述目標(biāo)回歸模型的輸入,以使得根據(jù)所述數(shù)據(jù)關(guān)系獲得所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)的預(yù)測(cè)值。
根據(jù)第四方面,在所述裝置的第一種可能的實(shí)現(xiàn)方式中,所述模型獲取模塊用于:根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo),獲取所述目標(biāo)回歸模型。
根據(jù)第四方面,在所述裝置的第二種可能的實(shí)現(xiàn)方式中,所述特征獲取模塊用于:獲取指標(biāo)與系統(tǒng)特征之間的對(duì)應(yīng)關(guān)系;根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)以及所述對(duì)應(yīng)關(guān)系,獲取與所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,作為所述目標(biāo)系統(tǒng)的系統(tǒng)特征;獲取所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征的值;相應(yīng)地,
所述模型獲取模塊用于:根據(jù)所述特征獲取模塊獲取得到的所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,獲取所述目標(biāo)回歸模型。
根據(jù)第四方面第二種實(shí)現(xiàn)方式,在所述裝置第三種可能的實(shí)現(xiàn)方式中,所述模型獲取模塊用于:根據(jù)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值,使用與所述指標(biāo)對(duì)應(yīng)的分類器對(duì)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值進(jìn)行分類;將與所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值的類別對(duì)應(yīng)的回歸模型作為所述目標(biāo)回歸模型。
根據(jù)第四方面第三種實(shí)現(xiàn)方式,在所述裝置第四種可能的實(shí)現(xiàn)方式中,所述分類器根據(jù)所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別訓(xùn)練得到,所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別通過將所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的進(jìn)行聚類得到。
第五方面,提供一種用于預(yù)測(cè)指標(biāo)的回歸模型的生成裝置,該裝置包括處理器和存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)代碼;所述處理器通過讀取所述存儲(chǔ)器中存儲(chǔ)的所述代碼,以用于執(zhí)行第一方面提供的方法。
第六方面,提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存用于第五方面的處理器執(zhí)行的計(jì)算機(jī)軟件指令,以用于執(zhí)行第一方面提供的方法。
第七方面,提供一種指標(biāo)的預(yù)測(cè)裝置,該裝置包括處理器和存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)代碼;所述處理器通過讀取所述存儲(chǔ)器中存儲(chǔ)的所述代碼,以用于執(zhí)行第二方面提供的方法。
第八方面,提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存用于第七方面的處理器執(zhí)行的計(jì)算機(jī)軟件指令,以用于執(zhí)行第二方面提供的方法。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例的一種系統(tǒng)的結(jié)構(gòu)示意圖;
圖2為本發(fā)明實(shí)施例的一種通信系統(tǒng)的示意圖;
圖3為本發(fā)明實(shí)施例提供的一種回歸模型的生成方法的流程示意圖;
圖4為本發(fā)明實(shí)施例提供的一種指標(biāo)的預(yù)測(cè)方法的流程示意圖;
圖5發(fā)明實(shí)施例提供的一種回歸模型的生成裝置的邏輯結(jié)構(gòu)示意圖;
圖6本發(fā)明實(shí)施例提供的一種預(yù)測(cè)指標(biāo)的裝置的邏輯結(jié)構(gòu)示意圖;
圖7本發(fā)明實(shí)施例提供的一種計(jì)算機(jī)設(shè)備的硬件結(jié)構(gòu)示意圖。
圖8本發(fā)明實(shí)施例提供的另一種計(jì)算機(jī)設(shè)備的硬件結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖,對(duì)本發(fā)明的實(shí)施例進(jìn)行描述。
請(qǐng)參閱圖1,為本發(fā)明實(shí)施例的一種系統(tǒng)的結(jié)構(gòu)示意圖,如圖1所示,本發(fā)明實(shí)施例的通信系統(tǒng)包括:數(shù)據(jù)采集設(shè)備10和管理服務(wù)器20,其中:
數(shù)據(jù)采集設(shè)備10用于獲取待擬合系統(tǒng)的待擬合系統(tǒng)特征的值;獲取所述待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值。
管理服務(wù)器20用于將所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型以建立所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值之間的數(shù)據(jù)關(guān)系。
進(jìn)一步的,管理服務(wù)器20還用于獲取目標(biāo)系統(tǒng)的系統(tǒng)特征的值,所述目標(biāo)系統(tǒng)用于運(yùn)行待預(yù)測(cè)業(yè)務(wù),所述目標(biāo)系統(tǒng)的系統(tǒng)特征與所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征相同,所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)與所述已訓(xùn)練業(yè)務(wù)的指標(biāo)相同;將所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值作為所述目標(biāo)回歸模型的輸入,以使得根據(jù)所述數(shù)據(jù)關(guān)系獲得所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)的預(yù)測(cè)值。
已訓(xùn)練系統(tǒng)可以是待擬合系統(tǒng),已訓(xùn)練系統(tǒng)的系統(tǒng)特征可以是待擬合網(wǎng)路特征,已訓(xùn)練業(yè)務(wù)可以是待擬合業(yè)務(wù),已訓(xùn)練業(yè)務(wù)的指標(biāo)可以是待擬合指標(biāo)。
如圖2所示為一種通信系統(tǒng)的示意圖,本發(fā)明實(shí)施例涉及的通信系統(tǒng)可以是網(wǎng)絡(luò)全網(wǎng),也可以是某個(gè)地區(qū)/地理位置(比如小區(qū))的網(wǎng)絡(luò),或某個(gè)cell的網(wǎng)絡(luò),或多個(gè)cell的網(wǎng)絡(luò)等的通信系統(tǒng)。
本發(fā)明實(shí)施例可以應(yīng)用于2g,3g,4g等各種通信系統(tǒng),請(qǐng)參閱圖2,為本發(fā)明實(shí)施例的一種系統(tǒng)的示意圖。如圖2所示,包括:用戶終端51、用戶終端52、用戶終端53、用戶終端54、用戶終端55、基站61、基站62、基站63、基站控制器(圖中未示意)、網(wǎng)管設(shè)備71、網(wǎng)管設(shè)備72以及管理服務(wù)器81,其中,圖2中的管設(shè)備用于基站的激活,基站的去激活,基站的參數(shù)修改,告警信息收集或信息的收集等,因此,網(wǎng)管設(shè)備可以作為圖1中的數(shù)據(jù)采集設(shè)備10,同時(shí)由于網(wǎng)管設(shè)備獲得的信息一般來自基站,因此基站也可以直接作為圖1中的數(shù)據(jù)采集設(shè)備10,,用于從圖2所示的系統(tǒng)中采集系統(tǒng)特征的值;圖2中的管理服務(wù)器81執(zhí)行的功能可以對(duì)應(yīng)于圖1中的管理服務(wù)器20,用于生成目標(biāo)回歸模型,或是用于利用目標(biāo)回歸模型預(yù)測(cè)指標(biāo)的值。
本申請(qǐng)的技術(shù)方案中的系統(tǒng)可以為各種通信系統(tǒng),系統(tǒng)類型例如但不限于,全球移動(dòng)通信系統(tǒng)(globalsystemformobilecommunications,gsm)、通用分 組無線業(yè)務(wù)(generalpacketradioservice,gprs)系統(tǒng)、碼分多址(codedivisionmultipleaccess,cdma)系統(tǒng)、cdma2000系統(tǒng)、寬帶碼分多址(widebandcodedivisionmultipleaccess,wcdma)系統(tǒng)、長(zhǎng)期演進(jìn)(longtermevolution,lte)系統(tǒng)、全球微波接入互操作性(worldinteroperabilityformicrowaveaccess,wimax)系統(tǒng)、umts(universalmobiletelecommunicationsystem,通用移動(dòng)通信系統(tǒng))、td-scdma(timedivision-synchronouscodedivisionmultipleaccess,時(shí)分同步碼分多址接入)系統(tǒng)、gprs/edge(generalpacketradioservice,通用分組無線服務(wù)/enhanceddataratesforgsmevolution,gsm演進(jìn)的增強(qiáng)型數(shù)據(jù)速率)系統(tǒng)、gsm(globalsystemformobilecommunication,全球移動(dòng)通信系統(tǒng))。
本申請(qǐng)的技術(shù)方案中的業(yè)務(wù)的業(yè)務(wù)類型例如但不限于:語音業(yè)務(wù)、視頻業(yè)務(wù)、郵件業(yè)務(wù)、上網(wǎng)業(yè)務(wù)。
其中,在所述待擬合系統(tǒng)所屬的通信系統(tǒng)類型屬于lte系統(tǒng)時(shí),在所述待擬合系統(tǒng)特征包括所覆蓋的地區(qū)的基站間距時(shí),該系統(tǒng)特征可通過基站的坐標(biāo)計(jì)算得到。
在所述待擬合系統(tǒng)特征包括頻段、全帶寬信道質(zhì)量指示的值的分布、平均用戶數(shù)、平均下行邊緣用戶數(shù)、平均上行邊緣用戶數(shù)、參考信號(hào)接收功率的分布、信號(hào)與干擾加噪聲比的分布、呼叫接入成功率、掉話率、切換成功率、上下行吞吐率、物理下行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布、物理上行共享信道調(diào)度時(shí)選擇調(diào)制編碼方案的值的分布、物理下行共享信道的物理資源塊使用的平均個(gè)數(shù)以及物理上行共享通道的物理資源塊使用的平均個(gè)數(shù)中的至少一種時(shí),該系統(tǒng)特征可以由基站直接獲得,也可以由網(wǎng)管設(shè)備直接獲得,也可以由基站獲得數(shù)據(jù)后經(jīng)過計(jì)算獲得,也可以由網(wǎng)管設(shè)備獲得數(shù)據(jù)后經(jīng)過計(jì)算獲得,也可以通過從基站或是網(wǎng)管設(shè)備獲得數(shù)據(jù)后經(jīng)過計(jì)算獲得。
其中,在所述待擬合系統(tǒng)所屬的通信系統(tǒng)類型屬于lte系統(tǒng),以及所述待擬合業(yè)務(wù)的業(yè)務(wù)類型屬于語音業(yè)務(wù)(lte系統(tǒng)上運(yùn)行的語音業(yè)務(wù)為lte語音(volte,voiceoverlte)業(yè)務(wù))時(shí),所述待擬合指標(biāo)包括用戶數(shù)、呼叫次數(shù)、呼叫接入成功率、掉話率或語音質(zhì)量時(shí),該指標(biāo)可以由基站直接獲得,也可以由網(wǎng)管設(shè)備直接獲得,也可以由基站獲得數(shù)據(jù)后經(jīng)過計(jì)算獲得,也可以由網(wǎng)管設(shè)備獲得數(shù)據(jù)后經(jīng)過計(jì)算獲得,也可以通過從基站或是網(wǎng)管設(shè)備獲得數(shù)據(jù)后經(jīng)過計(jì)算獲得。
應(yīng)當(dāng)理解的是,本發(fā)明實(shí)施例中提到的系統(tǒng)特征包括但不限于上述系統(tǒng)中的系統(tǒng)特征,并且本發(fā)明實(shí)施例中提到的系統(tǒng)特征為不需要運(yùn)行上述待擬合業(yè)務(wù)或是待預(yù)測(cè)業(yè)務(wù)就可得到的值的系統(tǒng)特征,例如但不限于通信系統(tǒng)所覆蓋的地區(qū)的特征、系統(tǒng)中在運(yùn)行不同業(yè)務(wù)時(shí),保持值不變的指標(biāo)以及系統(tǒng)中非待擬合業(yè)務(wù)以及非待預(yù)測(cè)業(yè)務(wù)(其中非待擬合業(yè)務(wù)以及非待預(yù)測(cè)業(yè)務(wù)可以是一個(gè),也可以是多個(gè))的指標(biāo)的值。以及本發(fā)明實(shí)施例中提到的待擬合業(yè)務(wù)或者待預(yù)測(cè)業(yè)務(wù)包括但不限于上述通信系統(tǒng)的系統(tǒng)中承載的業(yè)務(wù),例如可在lte系統(tǒng)運(yùn)行的語音業(yè)務(wù)(volte業(yè)務(wù))。本發(fā)明實(shí)施例中的待擬合指標(biāo)以及待預(yù)測(cè)指標(biāo)的為可以因運(yùn)行的業(yè)務(wù)不同而數(shù)值不同的指標(biāo)。
其中,所述基站可以是gsm系統(tǒng)、gprs系統(tǒng)或cdma系統(tǒng)中的基站(basetransceiverstation,bts),還可以是cdma2000系統(tǒng)或wcdma系統(tǒng)中的基站(nodeb),還可以是lte系統(tǒng)中的演進(jìn)型基站(evolvednodeb,enb),還可以是wimax系統(tǒng)中的接入服務(wù)系統(tǒng)的基站(accessservicenetworkbasestation,asnbs)等。
其中,所述用戶終端可以是指向用戶提供語音和/或數(shù)據(jù)連通性的設(shè)備,具有無線連接功能的手持式設(shè)備、或連接到無線調(diào)制解調(diào)器的其他處理設(shè)備。用戶終端可以經(jīng)無線接入網(wǎng)(radioaccessnetwork,ran)與一個(gè)或多個(gè)核心網(wǎng)進(jìn)行通信,用戶終端可以是移動(dòng)終端,如移動(dòng)電話(或稱為“蜂窩”電話)和具有移動(dòng)終端的計(jì)算機(jī),例如,可以是便攜式、袖珍式、手持式、計(jì)算機(jī)內(nèi)置的或者車載的移動(dòng)裝置,它們與無線接入網(wǎng)交換語言和/或數(shù)據(jù)。例如,個(gè)人通信業(yè)務(wù)(personalcommunicationservice,pcs)電話、無繩電話、會(huì)話發(fā)起協(xié)議(sessioninitiationprotocol,sip)話機(jī)、無線本地環(huán)路(wirelesslocalloop,wll)站、個(gè)人數(shù)字助理(personaldigitalassistant,pda)等設(shè)備。終端也可以稱為系統(tǒng)、訂戶單元(subscriberunit)、訂戶站(subscriberstation)、移動(dòng)站(mobilestation)、遠(yuǎn)程站(remotestation)、接入點(diǎn)(accesspoint)、遠(yuǎn)程終端(remoteterminal)、接入終端(accessterminal)、用戶終端(userterminal)、用戶代理(useragent)、用戶設(shè)備(userdevice)或用戶裝備(userequipment)。
應(yīng)理解,系統(tǒng)也可以是云系統(tǒng)、分布式系統(tǒng)、服務(wù)器系統(tǒng)等系統(tǒng)。
請(qǐng)參閱圖3,為本發(fā)明實(shí)施例提供一種回歸模型的生成方法的流程示意圖,該方法的執(zhí)行主體可以是如圖1或2所示的管理服務(wù)器,也可以是計(jì)算機(jī)設(shè)備,本發(fā)明實(shí)施例不限于此,如圖3所示,該方法可以包括如下步驟:
步驟301,獲取待擬合系統(tǒng)的待擬合系統(tǒng)特征的值;
步驟302,獲取所述待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值;
具體來說,在系統(tǒng)為通信系統(tǒng)時(shí),可以將獲取到的待擬合系統(tǒng)的待擬合系統(tǒng)特征的值以及待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值組成樣本集,樣本集可以以系統(tǒng)覆蓋的地區(qū)為索引,任一個(gè)樣本表示任一地區(qū)的待擬合系統(tǒng)的待擬合系統(tǒng)特征的值以及待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值樣本集還可以以系統(tǒng)覆蓋的地區(qū)為及系統(tǒng)特征的值獲取的時(shí)間為索引,任一個(gè)樣本表示任一地區(qū)的待擬合系統(tǒng)的任一時(shí)刻的待擬合系統(tǒng)特征的值以及待擬合系統(tǒng)的待擬合業(yè)務(wù)的該任一時(shí)刻的待擬合指標(biāo)的值。每一個(gè)樣本又進(jìn)一步分為兩部分,一部分是自變量,包括待擬合系統(tǒng)的待擬合系統(tǒng)特征的值,該自變量可用x表示,其中x可以是一個(gè)或多個(gè)系統(tǒng)特征的值;另一部分是因變量,包括待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值,該因變量可用y表示,其中y可以是一個(gè)或多個(gè)指標(biāo)的值,在后續(xù)的步驟中以y是一個(gè)指標(biāo)的值為例進(jìn)行說明,但可以理解的通過后續(xù)的說明,可以顯而易見的獲得以y是至少兩個(gè)指標(biāo)的值的技術(shù)方案。在后續(xù)的步驟中主要是利用大量的獲取到的樣本集中的變量的自變量與因變量值訓(xùn)練目標(biāo)回歸模型hθ,其中,y≈hθ(xop)(其中θ表示回歸模型的參數(shù),xop為x的子集),hθ用于預(yù)測(cè)未開通系統(tǒng)中的待擬合業(yè)務(wù)的系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值。
步驟303,將所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型以建立所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值之間的數(shù)據(jù)關(guān)系。其中,在獲取到的系統(tǒng)集合中的每個(gè)系統(tǒng)的系統(tǒng)特征中可能包含與待擬合指標(biāo)無關(guān)的或冗余的系統(tǒng)特征,需要進(jìn)行特征選取。特征選取可以提高模型的準(zhǔn)確性以及訓(xùn)練效率,因此,在一種實(shí)現(xiàn)方式下,步驟301可以為:
獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)特征的值;
根據(jù)所述至少兩個(gè)系統(tǒng)特征的值,以及所述待擬合指標(biāo)的值,計(jì)算所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值;
根據(jù)所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值,從所述至少兩個(gè)系統(tǒng)特征中確定出所述待擬合系統(tǒng)特征,從而確定出待擬合系統(tǒng)特征的值。
其中,所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù)的值大于m,或 者前n個(gè)相關(guān)系數(shù)包括所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù),所述前n個(gè)相關(guān)系數(shù)為所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)中值最大的n個(gè)相關(guān)系數(shù),m為非負(fù)常數(shù),n為正常數(shù)且n小于或等于所述至少兩個(gè)系統(tǒng)中系統(tǒng)特征的個(gè)數(shù)。
具體來說,可以通過計(jì)算pearson相關(guān)系數(shù)、spearman相關(guān)系數(shù)等線性相關(guān)系數(shù)來計(jì)算相關(guān)系數(shù),其中如下為pearson的計(jì)算方法,
其中xi表示至少兩個(gè)系統(tǒng)特征中任一待擬合系統(tǒng)特征x在樣本集中的第i個(gè)樣本中的值(或者稱為待擬合系統(tǒng)中第i個(gè)系統(tǒng)的該待擬合系統(tǒng)特征的值),yi表示待擬合指標(biāo)y的在第i個(gè)樣本中的值(或者稱為待擬合系統(tǒng)中第i個(gè)系統(tǒng)的該待擬合指標(biāo)的值),
除線性相關(guān)系數(shù),還可以計(jì)算信息增益、基尼指數(shù)等非線性相關(guān)系數(shù)來度量相關(guān)性,其中如下以信息增益為例給出非線性相關(guān)系數(shù)的計(jì)算方法:
g(y,x)=h(y)-h(y|x)
其中h(y)為樣本集中待擬合指標(biāo)y的值的熵,h(y│x)為樣本集中y關(guān)于至少兩個(gè)系統(tǒng)特征中任一系統(tǒng)特征x的條件熵。定義樣本集為d,在計(jì)算信息增益時(shí)需要首先將x和y離散化,假設(shè)y被離散化后有k個(gè)不同的取值(yk,k=1,2,...,k),那么y的取值等于k的樣本個(gè)數(shù)為|yk|且
具體來說,根據(jù)計(jì)算得到的相關(guān)系數(shù)將至少兩個(gè)系統(tǒng)特征進(jìn)行排序,選擇具有較高的相關(guān)系數(shù)(相關(guān)系數(shù)大于預(yù)設(shè)的閾值或是取相關(guān)性前p個(gè)最高)的系統(tǒng)特征作為待擬合系統(tǒng)特征。
其中,在使用上述至少兩種相關(guān)性的計(jì)算方法時(shí),可以依次使用不同的方法計(jì)算出數(shù)值不同的相關(guān)系數(shù),依次對(duì)第一系統(tǒng)特征集合中的系統(tǒng)特征進(jìn)行篩選,最終得到待擬合系統(tǒng)特征,也可以分別使用不同的相關(guān)系數(shù)計(jì)算方法,對(duì) 至少兩個(gè)系統(tǒng)特征中的特征進(jìn)行篩選,將篩選結(jié)果組合從而得到待擬合系統(tǒng)特征。
其中,在一種實(shí)現(xiàn)方式下,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,步驟303可以為:
將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;
對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;
將最大預(yù)測(cè)精度對(duì)應(yīng)的回歸模型確定為所述目標(biāo)回歸模型,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度。
具體來說,最優(yōu)子集的搜索過程如下:
首先,在待擬合系統(tǒng)特征中隨機(jī)選擇一個(gè)系統(tǒng)特征,構(gòu)成了包含該系統(tǒng)特征的用于訓(xùn)練回歸模型的系統(tǒng)特征集合,即待擬合系統(tǒng)特征的一個(gè)子集,根據(jù)該系統(tǒng)特征在樣本集中的值和待擬合指標(biāo)的在樣本集中的值訓(xùn)練回歸模型,然后對(duì)于每個(gè)沒有用于訓(xùn)練回歸模型的系統(tǒng)特征,執(zhí)行以下循環(huán)體:
將其中一個(gè)系統(tǒng)特征加入用于訓(xùn)練回歸模型的系統(tǒng)特征集合,從而構(gòu)成了新的子集,根據(jù)該新的子集中的系統(tǒng)特征在樣本集中的值和待擬合指標(biāo)的在樣本集中的值訓(xùn)練回歸模型
使用測(cè)試數(shù)據(jù)集獲得該新的子集對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度,該測(cè)試數(shù)據(jù)集包括測(cè)試系統(tǒng)位于所述每個(gè)子集中的系統(tǒng)特征的值,以及所述測(cè)試系統(tǒng)的與所述待擬合指標(biāo)相同的指標(biāo)的值,其中測(cè)試系統(tǒng)可以是一個(gè)或多個(gè)系統(tǒng);
在該選擇出的回歸模型的預(yù)測(cè)精度的值大于當(dāng)前回歸模型的預(yù)測(cè)精度的值時(shí),將該選擇出的回歸模型作為當(dāng)前回歸模型;在該選擇出的回歸模型的預(yù)測(cè)精度的值小于或等于當(dāng)前回歸模型的預(yù)測(cè)精度的值時(shí),繼續(xù)執(zhí)行該循環(huán)體。
直到待擬合系統(tǒng)特征中的系統(tǒng)特征都已用于訓(xùn)練回歸模型,結(jié)束該循環(huán)體,將當(dāng)前回歸模型對(duì)應(yīng)的子集作為目標(biāo)特征子集。
其中,在另一種實(shí)現(xiàn)方式下,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述待擬合系統(tǒng)的系統(tǒng)數(shù)量為至少兩個(gè),步驟303還可以為:
將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn) 行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;
對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;
將最大預(yù)測(cè)精度對(duì)應(yīng)的網(wǎng)路特征子集作為目標(biāo)系統(tǒng)特征子集,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度;根據(jù)所述待擬合系統(tǒng)特征的值,對(duì)所述待擬合系統(tǒng)進(jìn)行聚類,從而獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)子集;
將所述至少兩個(gè)系統(tǒng)子集中分別位于所述目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征的值,與所述待擬合指標(biāo)中的所述至少兩個(gè)系統(tǒng)子集中的指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)子集各自對(duì)應(yīng)的回歸模型。
具體來說,
聚類的具體方法如下:
首先,將目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征根據(jù)如下公式進(jìn)行歸一化:
其中x′和x分別表示原本的系統(tǒng)特征的值和歸一化后的系統(tǒng)特征值,mean(x′)和sd(x′)分別表示原本的萬羅特征x′在樣本集中的樣本上的均值和標(biāo)準(zhǔn)差。
隨機(jī)選擇待擬合系統(tǒng)中的一個(gè)系統(tǒng)(或者稱為樣本集中的一個(gè)樣本)作為聚類的第一個(gè)質(zhì)心,執(zhí)行以下循環(huán)體:在待擬合系統(tǒng)中選擇距離已選質(zhì)心最遠(yuǎn)的系統(tǒng)作為新的質(zhì)心,系統(tǒng)之間的距離可采用歐式距離:
其中x1,x2表示兩個(gè)系統(tǒng),dist(x1,x2)表示系統(tǒng)之間的距離,系統(tǒng)下標(biāo)i表示系統(tǒng)歸一化后的第i個(gè)系統(tǒng)特征,n表示目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征的個(gè)數(shù)。直到質(zhì)心的個(gè)數(shù)等于k,則停止上述循環(huán)體,k為正整數(shù)。
將待擬合系統(tǒng)中中剩余的系統(tǒng)指派到與該系統(tǒng)距離最近的質(zhì)心,從而形成k個(gè)簇,也就是將待擬合系統(tǒng)的k個(gè)子集。
進(jìn)一步的,還可以調(diào)整每個(gè)簇的質(zhì)心,使得誤差的平方和see最小,see的計(jì)算公式可以如下:
其中,ci表示第i個(gè)簇的質(zhì)心。
具體來說,回歸模型訓(xùn)練可采用回歸樹、多元線性回歸、非線性回歸以及支持向量機(jī)回歸等。下面以回歸樹為例說明模型訓(xùn)練的過程,其中待擬合系統(tǒng)為系統(tǒng)集合。
回歸樹學(xué)習(xí)是一個(gè)遞歸的將特征空間進(jìn)行分割的過程,該特征空間由樣本集中的樣本構(gòu)成,具體來說,該特征空間可以由系統(tǒng)集合中的系統(tǒng)的至少兩個(gè)系統(tǒng)特征的值構(gòu)成,該特征空間也可以由系統(tǒng)集合中的系統(tǒng)的待擬合系統(tǒng)特征的值構(gòu)成,該特征空間也可以由系統(tǒng)集合中的系統(tǒng)位于目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征的值構(gòu)成,該特征空間也可以由任一系統(tǒng)子集中的系統(tǒng)的至少兩個(gè)系統(tǒng)特征的值構(gòu)成,該特征空間也可以由任一系統(tǒng)子集中的系統(tǒng)的待擬合系統(tǒng)特征的值構(gòu)成,該特征空間也可以由任一系統(tǒng)子集中的系統(tǒng)位于目標(biāo)系統(tǒng)子集中的系統(tǒng)特征的值構(gòu)成。
假設(shè)已將特征空間劃分為m個(gè)子空間r1,r2,…,rm,每個(gè)子空間rm中變量的自變量(網(wǎng)路特征的值)作為回歸樹模型的輸入,都會(huì)輸出一個(gè)固定的目標(biāo)值cm,于是回歸樹模型可表示為:
其中i是指示函數(shù),當(dāng)xop∈rm時(shí)i=1,否則i=0,xop為特征空間中的一個(gè)自變量。
其中,用平方誤差se==∑xop∈rm(y-hθ(xop))2表示回歸樹的預(yù)測(cè)誤差,用平方誤差的準(zhǔn)則求解每個(gè)子空間的最優(yōu)輸出值。應(yīng)理解,rm上的cm最優(yōu)輸出值是rm上所有樣本對(duì)應(yīng)的因變量y(待擬合指標(biāo)的值)的均值。
在對(duì)特征空間進(jìn)行劃分時(shí),需要確定切分變量和切分點(diǎn)。當(dāng)選擇系統(tǒng)特征集合中的第j個(gè)系統(tǒng)特征xj作為切分變量和xj的某個(gè)取值s作為切分點(diǎn)劃分特征空間r時(shí),其生成的兩個(gè)子空間可表示為:
r1(j,s)={xop|xj≤s}
r2(j,s)={xop|xj≥s}
確定最優(yōu)的j和s使平方誤差se最小,即
選擇變量j和切分點(diǎn)s將特征空間劃分成兩個(gè)子空間,然后選擇新的最優(yōu)切 分變量和切分點(diǎn)將每個(gè)子空間劃分為更小的子空間,重復(fù)劃分過程,直到滿足停止條件(比如說se小于一個(gè)閾值),這樣就生成了一顆回歸樹。通常單棵回歸樹的預(yù)測(cè)準(zhǔn)確性不高,需要采用多棵回歸樹組合實(shí)現(xiàn)具有更高預(yù)測(cè)準(zhǔn)確性的預(yù)測(cè)模型,組合的方式可采用隨機(jī)森林或梯度提升等方式。
需要說明的是,這里的目標(biāo)回歸模型對(duì)所述系統(tǒng)集合中的系統(tǒng)特征與所述待擬合指標(biāo)的擬合度(例如se)用來評(píng)估回歸預(yù)測(cè)效果,除了se,在不同的應(yīng)用場(chǎng)景下,這里的目標(biāo)回歸模型對(duì)待擬合指標(biāo)的擬合度還可以用如下的一種或多種來表示:
mae(meanabsoluteerror):平均絕對(duì)誤差
mse(meansquarederror):均方誤差
rae(relativeabsoluteerror):平均預(yù)測(cè)誤差比例(預(yù)測(cè)誤差絕對(duì)值除以實(shí)際值的平均)
r平方(coefficientofdetermination):回歸方程的確定性系數(shù)(該系數(shù)范圍0~1,越大說明擬合效果越好)
請(qǐng)參閱圖4,為本發(fā)明實(shí)施例提供一種系統(tǒng)的指標(biāo)的預(yù)測(cè)方法的流程示意圖,該方法的執(zhí)行主體可以是如圖1或2所示的管理服務(wù)器,也可以是用于預(yù)測(cè)系統(tǒng)關(guān)鍵指標(biāo)的計(jì)算機(jī)設(shè)備,但本發(fā)明不限于此,如圖4所示,該方法可以包括如下步驟:
步驟401,獲取目標(biāo)系統(tǒng)的系統(tǒng)特征的值,所述目標(biāo)系統(tǒng)用于運(yùn)行待預(yù)測(cè)業(yè)務(wù);
步驟402,獲取目標(biāo)回歸模型,所述目標(biāo)回歸模型包括已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值與運(yùn)行在所述已訓(xùn)練系統(tǒng)上的已訓(xùn)練業(yè)務(wù)的指標(biāo)的值之間的數(shù)據(jù)關(guān)系,所述待預(yù)測(cè)業(yè)務(wù)與所述已訓(xùn)練業(yè)務(wù)為相同類型的業(yè)務(wù),所述目標(biāo)系統(tǒng)的系統(tǒng)特征與所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征相同,所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)與所述已訓(xùn)練業(yè)務(wù)的指標(biāo)相同;
步驟403,將所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值作為所述目標(biāo)回歸模型的輸入,以使得根據(jù)所述數(shù)據(jù)關(guān)系獲得所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)的預(yù)測(cè)值。
其中,在一種實(shí)現(xiàn)方式下,步驟402可以為:根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo),獲取所述目標(biāo)回歸模型。具體來說,可以根據(jù)上述方法中生成的目標(biāo)回歸模型,建立待擬合指標(biāo)與目標(biāo)回歸模型的對(duì)應(yīng)關(guān)系,因此來實(shí)現(xiàn)根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)以及該對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)回歸模型。
其中,在另一種實(shí)現(xiàn)方式下,步驟401可以為:獲取指標(biāo)與系統(tǒng)特征之間的對(duì)應(yīng)關(guān)系;根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)以及所述對(duì)應(yīng)關(guān)系,獲取與所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,作為所述目標(biāo)系統(tǒng)的系統(tǒng)特征;獲取所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征的值。
相應(yīng)地,步驟402可以為:根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,獲取所述目標(biāo)回歸模型。
具體來說,可以根據(jù)上述方法中生成的目標(biāo)回歸模型,建立待擬合系統(tǒng)特征與目標(biāo)回歸模型的對(duì)應(yīng)關(guān)系,因此來實(shí)現(xiàn)根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征以及該對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)回歸模型。
進(jìn)一步的,步驟402可以為:所述獲取所述待預(yù)測(cè)指標(biāo)對(duì)應(yīng)的回歸模型具體可以為:根據(jù)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值,使用與所述指標(biāo)對(duì)應(yīng)的分類器對(duì)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值進(jìn)行分類;將與所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值的類別對(duì)應(yīng)的回歸模型作為所述目標(biāo)回歸模型。
其中,在上述實(shí)現(xiàn)方式中,所述分類器根據(jù)所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別訓(xùn)練得到,所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別通過將所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的進(jìn)行聚類得到。。
應(yīng)當(dāng)理解的是,無論目標(biāo)回歸模型是線性的多元回歸模型還是非線性的多元回歸模型,本質(zhì)上都是函數(shù),通過將第二系統(tǒng)的系統(tǒng)特征的值代入函數(shù),就能得到目標(biāo)系統(tǒng)的待預(yù)測(cè)業(yè)務(wù)的待預(yù)測(cè)指標(biāo)的值。
參閱圖5所示,本發(fā)明實(shí)施例提供一種回歸模型的生成裝置500,該裝置包括特征獲取模塊501、指標(biāo)獲取模塊502以及擬合模塊503,其中
特征獲取模塊501,用于獲取待擬合系統(tǒng)的待擬合系統(tǒng)特征的值;
指標(biāo)獲取模塊502,用于獲取所述待擬合系統(tǒng)的待擬合業(yè)務(wù)的待擬合指標(biāo)的值;
擬合模塊503,用于將所述特征獲取模塊獲取的所述待擬合系統(tǒng)特征的值與所述指標(biāo)獲取模塊獲取的所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取目標(biāo)回歸模型以建立所述待擬合系統(tǒng)特征的值與所述待擬合指標(biāo)的值之間的數(shù)據(jù)關(guān)系。具體來說,特征獲取模塊501可以具體用于:根據(jù)所述至少兩個(gè)系統(tǒng)特征的值,以及所述待擬合指標(biāo)的值,計(jì)算所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值;根據(jù)所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)的值,從所述至少兩個(gè)系統(tǒng)特征中確定出所述待擬合系統(tǒng)特征,從而確定出 待擬合系統(tǒng)特征的值。
其中,所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù)的值大于m,或者前n個(gè)相關(guān)系數(shù)包括所述待擬合系統(tǒng)特征與所述待擬合指標(biāo)的相關(guān)系數(shù),所述前n個(gè)相關(guān)系數(shù)為所述至少兩個(gè)系統(tǒng)特征各自與所述待擬合指標(biāo)的相關(guān)系數(shù)中值最大的n個(gè)相關(guān)系數(shù),m為非負(fù)常數(shù),n為正常數(shù)且n小于或等于所述至少兩個(gè)系統(tǒng)中系統(tǒng)特征的個(gè)數(shù)。
具體來說,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述擬合模塊503可以用于:
將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;將最大預(yù)測(cè)精度對(duì)應(yīng)的回歸模型確定為所述目標(biāo)回歸模型,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度。具體來說,所述待擬合系統(tǒng)特征的系統(tǒng)特征的數(shù)量為至少兩個(gè),所述待擬合系統(tǒng)特征具有至少兩個(gè)系統(tǒng)特征子集,所述待擬合系統(tǒng)的系統(tǒng)數(shù)量為至少兩個(gè),所述擬合模塊503還可以用于:將所述至少兩個(gè)系統(tǒng)特征子集中的系統(tǒng)特征的值與所述待擬合指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型;對(duì)所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型進(jìn)行測(cè)試,從而獲取所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度的值;將最大預(yù)測(cè)精度對(duì)應(yīng)的網(wǎng)路特征子集作為目標(biāo)系統(tǒng)特征子集,所述最大預(yù)測(cè)精度為所述至少兩個(gè)系統(tǒng)特征子集各自對(duì)應(yīng)的回歸模型的預(yù)測(cè)精度中值最大的預(yù)測(cè)精度;根據(jù)所述待擬合系統(tǒng)特征的值,對(duì)所述待擬合系統(tǒng)進(jìn)行聚類,從而獲取所述待擬合系統(tǒng)的至少兩個(gè)系統(tǒng)子集;
將所述至少兩個(gè)系統(tǒng)子集中分別位于所述目標(biāo)系統(tǒng)特征子集中的系統(tǒng)特征的值,與所述待擬合指標(biāo)中的所述至少兩個(gè)系統(tǒng)子集中的指標(biāo)的值進(jìn)行擬合,從而獲取所述至少兩個(gè)系統(tǒng)子集各自對(duì)應(yīng)的回歸模型。
可以理解的是,本實(shí)施例的回歸模型的生成裝置500的各個(gè)模塊的功能可以根據(jù)上述方法實(shí)施例中的回歸模型的生成方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再贅述。
參閱圖6所示,本發(fā)明實(shí)施例提供一種系統(tǒng)關(guān)鍵指標(biāo)的預(yù)測(cè)裝置600,該裝 置包括特征獲取模塊601、模型獲取模塊602、和預(yù)測(cè)模塊603,其中,
特征獲取模塊601,用于獲取目標(biāo)系統(tǒng)的系統(tǒng)特征的值,所述目標(biāo)系統(tǒng)用于運(yùn)行待預(yù)測(cè)業(yè)務(wù);
模型獲取模塊602,用于獲取目標(biāo)回歸模型,所述目標(biāo)回歸模型包括已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值與運(yùn)行在所述已訓(xùn)練系統(tǒng)上的已訓(xùn)練業(yè)務(wù)的指標(biāo)的值之間的數(shù)據(jù)關(guān)系,所述待預(yù)測(cè)業(yè)務(wù)與所述已訓(xùn)練業(yè)務(wù)為相同類型的業(yè)務(wù),所述目標(biāo)系統(tǒng)的系統(tǒng)特征與所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征相同,所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)與所述已訓(xùn)練業(yè)務(wù)的指標(biāo)相同;
預(yù)測(cè)模塊603,用于將所述特征獲取模塊獲取的所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值作為模型獲取模塊獲取的所述目標(biāo)回歸模型的輸入,以使得根據(jù)所述數(shù)據(jù)關(guān)系獲得所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)的預(yù)測(cè)值。
具體來說,在一種實(shí)現(xiàn)方式中,模型獲取模塊602用于根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo),獲取所述目標(biāo)回歸模型。。
具體來說,在另一種實(shí)現(xiàn)方式中,特征獲取模塊601用于:獲取指標(biāo)與系統(tǒng)特征之間的對(duì)應(yīng)關(guān)系;根據(jù)所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)以及所述對(duì)應(yīng)關(guān)系,獲取與所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,作為所述目標(biāo)系統(tǒng)的系統(tǒng)特征;獲取所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征的值;相應(yīng)地,模型獲取模塊602用于:根據(jù)所述特征獲取模塊獲取得到的所述待預(yù)測(cè)業(yè)務(wù)的指標(biāo)對(duì)應(yīng)的系統(tǒng)特征,獲取所述目標(biāo)回歸模型。
其中,模型獲取模塊602進(jìn)一步可以用于:
根據(jù)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值,使用與所述指標(biāo)對(duì)應(yīng)的分類器對(duì)所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值進(jìn)行分類;將與所述目標(biāo)系統(tǒng)的系統(tǒng)特征的值的類別對(duì)應(yīng)的回歸模型作為所述目標(biāo)回歸模型。
其中,所述分類器根據(jù)所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別訓(xùn)練得到,所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的類別通過將所述已訓(xùn)練系統(tǒng)的系統(tǒng)特征的值的進(jìn)行聚類得到。
其中,該分類器的生成裝置可以是指標(biāo)的預(yù)測(cè)裝置600,也可以由回歸模型的生成裝置500生成,并由指標(biāo)的預(yù)測(cè)裝置600獲取得到。
可以理解的是,本實(shí)施例的指標(biāo)的預(yù)測(cè)裝置600的各個(gè)模塊的功能可以根據(jù)上述方法實(shí)施例中的指標(biāo)的預(yù)測(cè)方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再贅述。
圖7是本發(fā)明實(shí)施例提供的計(jì)算機(jī)設(shè)備700的硬件結(jié)構(gòu)示意圖。如圖7所示,計(jì)算機(jī)設(shè)備700可以作為用于預(yù)測(cè)指標(biāo)的回歸模型的生成裝置500的一種實(shí)現(xiàn)方式,計(jì)算機(jī)設(shè)備700包括處理器702、存儲(chǔ)器704、輸入/輸出接口706、通信接口708和總線710。其中,處理器702、存儲(chǔ)器704、輸入/輸出接口706和通信接口708通過總線710實(shí)現(xiàn)彼此之間的通信連接。
應(yīng)理解,具體來說,計(jì)算機(jī)設(shè)備700可以是計(jì)算機(jī)設(shè)備或者運(yùn)營商系統(tǒng)中的管理服務(wù)器或者nodeb(基站)、rnc(無線系統(tǒng)控制器)、網(wǎng)關(guān)等設(shè)備。
處理器702可以采用通用的中央處理器(centralprocessingunit,cpu),微處理器,應(yīng)用專用集成電路(applicationspecificintegratedcircuit,asic),或者一個(gè)或多個(gè)集成電路,用于執(zhí)行相關(guān)程序,以實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的用于預(yù)測(cè)指標(biāo)的回歸模型的生成裝置500中包括的模塊所需執(zhí)行的功能,或者執(zhí)行本發(fā)明方法實(shí)施例提供的用于預(yù)測(cè)指標(biāo)的回歸模型的生成方法。處理器702可能是一種集成電路芯片,具有信號(hào)的處理能力。在實(shí)現(xiàn)過程中,上述方法的各步驟可以通過處理器702中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器702可以是通用處理器、數(shù)字信號(hào)處理器(dsp)、專用集成電路(asic)、現(xiàn)成可編程門陣列(fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。可以實(shí)現(xiàn)或者執(zhí)行本發(fā)明實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。結(jié)合本發(fā)明實(shí)施例所公開的方法的步驟可以直接體現(xiàn)為硬件譯碼處理器執(zhí)行完成,或者用譯碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī)存儲(chǔ)器,閃存、只讀存儲(chǔ)器,可編程只讀存儲(chǔ)器或者電可擦寫可編程存儲(chǔ)器、寄存器等本領(lǐng)域成熟的存儲(chǔ)介質(zhì)中。該存儲(chǔ)介質(zhì)位于存儲(chǔ)器704,處理器702讀取存儲(chǔ)器704中的信息,結(jié)合其硬件完成上述方法的步驟。
存儲(chǔ)器704可以是只讀存儲(chǔ)器(readonlymemory,rom),靜態(tài)存儲(chǔ)設(shè)備,動(dòng)態(tài)存儲(chǔ)設(shè)備或者隨機(jī)存取存儲(chǔ)器(randomaccessmemory,ram)。存儲(chǔ)器704可以存儲(chǔ)操作系統(tǒng)以及其他應(yīng)用程序。在通過軟件或者固件來實(shí)現(xiàn)本發(fā)明實(shí)施例提供的用于預(yù)測(cè)指標(biāo)的回歸模型的生成裝置500中包括的模塊所需執(zhí)行的功能,或者執(zhí)行本發(fā)明方法實(shí)施例提供的用于預(yù)測(cè)指標(biāo)的回歸模型的生成方法時(shí),用于實(shí)現(xiàn)本發(fā)明實(shí)施例提供的技術(shù)方案的程序代碼保存在存儲(chǔ)器704中,并由處理器702來執(zhí)行回歸模型的生成裝置500中包括的模塊所需執(zhí)行的操作,或者執(zhí)行本發(fā)明方法實(shí)施例提供的用于預(yù)測(cè)指標(biāo)的回歸模型的生成方法。
輸入/輸出接口706用于接收輸入的數(shù)據(jù)和信息,輸出操作結(jié)果等數(shù)據(jù)。
通信接口708使用例如但不限于收發(fā)器一類的收發(fā)裝置,來實(shí)現(xiàn)計(jì)算機(jī)設(shè)備700與其他設(shè)備或通信網(wǎng)絡(luò)之間的通信。
總線710可包括在計(jì)算機(jī)設(shè)備700各個(gè)部件(例如處理器702、存儲(chǔ)器704、輸入/輸出接口706和通信接口708)之間傳送信息的通路。
應(yīng)注意,盡管圖7所示的計(jì)算機(jī)設(shè)備700僅僅示出了處理器702、存儲(chǔ)器704、輸入/輸出接口706、通信接口708以及總線710,但是在具體實(shí)現(xiàn)過程中,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,計(jì)算機(jī)設(shè)備700還包含實(shí)現(xiàn)正常運(yùn)行所必須的其他器件,例如顯示屏幕。同時(shí),根據(jù)具體需要,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,計(jì)算機(jī)設(shè)備700還可包含實(shí)現(xiàn)其他附加功能的硬件器件。此外,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,計(jì)算機(jī)設(shè)備700也可僅僅包含實(shí)現(xiàn)本發(fā)明實(shí)施例所必須的器件,而不必包含圖7中所示的全部器件。
圖8是本發(fā)明實(shí)施例提供的計(jì)算機(jī)設(shè)備800的硬件結(jié)構(gòu)示意圖。如圖8所示,計(jì)算機(jī)設(shè)備800可以作為指標(biāo)的預(yù)測(cè)裝置600的一種實(shí)現(xiàn)方式,計(jì)算機(jī)設(shè)備800包括處理器802、存儲(chǔ)器804、輸入/輸出接口806、通信接口808和總線810。其中,處理器802、存儲(chǔ)器804、輸入/輸出接口806和通信接口808通過總線810實(shí)現(xiàn)彼此之間的通信連接。應(yīng)理解,具體來說,計(jì)算機(jī)設(shè)備800可以是計(jì)算機(jī)設(shè)備或者運(yùn)營商網(wǎng)絡(luò)中的管理服務(wù)器或者nodeb(基站)、rnc(無線網(wǎng)絡(luò)控制器)、網(wǎng)關(guān)等設(shè)備。
處理器802可以采用通用的中央處理器(centralprocessingunit,cpu),微處理器,應(yīng)用專用集成電路(applicationspecificintegratedcircuit,asic),或者一個(gè)或多個(gè)集成電路,用于執(zhí)行相關(guān)程序,以實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的指標(biāo)的預(yù)測(cè)裝置600中包括的模塊所需執(zhí)行的功能,或者執(zhí)行本發(fā)明方法實(shí)施例提供的指標(biāo)的預(yù)測(cè)方法。處理器802可能是一種集成電路芯片,具有信號(hào)的處理能力。在實(shí)現(xiàn)過程中,上述方法的各步驟可以通過處理器802中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器802可以是通用處理器、數(shù)字信號(hào)處理器(dsp)、專用集成電路(asic)、現(xiàn)成可編程門陣列(fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件??梢詫?shí)現(xiàn)或者執(zhí)行本發(fā)明實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。結(jié)合本發(fā)明實(shí)施例所公開的方法的步驟可以直接體現(xiàn)為硬件譯碼處理器執(zhí)行完成,或者用譯碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī)存儲(chǔ)器,閃 存、只讀存儲(chǔ)器,可編程只讀存儲(chǔ)器或者電可擦寫可編程存儲(chǔ)器、寄存器等本領(lǐng)域成熟的存儲(chǔ)介質(zhì)中。該存儲(chǔ)介質(zhì)位于存儲(chǔ)器804,處理器802讀取存儲(chǔ)器804中的信息,結(jié)合其硬件完成上述方法的步驟。
存儲(chǔ)器804可以是只讀存儲(chǔ)器(readonlymemory,rom),靜態(tài)存儲(chǔ)設(shè)備,動(dòng)態(tài)存儲(chǔ)設(shè)備或者隨機(jī)存取存儲(chǔ)器(randomaccessmemory,ram)。存儲(chǔ)器804可以存儲(chǔ)操作系統(tǒng)以及其他應(yīng)用程序。在通過軟件或者固件來實(shí)現(xiàn)本發(fā)明實(shí)施例提供的指標(biāo)的預(yù)測(cè)裝置600中包括的模塊所需執(zhí)行的功能,或者執(zhí)行本發(fā)明方法實(shí)施例提供的指標(biāo)的預(yù)測(cè)方法時(shí),用于實(shí)現(xiàn)本發(fā)明實(shí)施例提供的技術(shù)方案的程序代碼保存在存儲(chǔ)器804中,并由處理器802來執(zhí)行指標(biāo)的預(yù)測(cè)裝置600中包括的模塊所需執(zhí)行的操作,或者執(zhí)行本發(fā)明方法實(shí)施例提供的指標(biāo)的預(yù)測(cè)方法。
輸入/輸出接口806用于接收輸入的數(shù)據(jù)和信息,輸出操作結(jié)果等數(shù)據(jù)。
通信接口808使用例如但不限于收發(fā)器一類的收發(fā)裝置,來實(shí)現(xiàn)計(jì)算機(jī)設(shè)備800與其他設(shè)備或通信網(wǎng)絡(luò)之間的通信。
總線810可包括在計(jì)算機(jī)設(shè)備800各個(gè)部件(例如處理器802、存儲(chǔ)器804、輸入/輸出接口806和通信接口808)之間傳送信息的通路。
應(yīng)注意,盡管圖8所示的計(jì)算機(jī)設(shè)備800僅僅示出了處理器802、存儲(chǔ)器804、輸入/輸出接口806、通信接口808以及總線810,但是在具體實(shí)現(xiàn)過程中,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,計(jì)算機(jī)設(shè)備800還包含實(shí)現(xiàn)正常運(yùn)行所必須的其他器件,例如顯示屏幕。同時(shí),根據(jù)具體需要,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,計(jì)算機(jī)設(shè)備800還可包含實(shí)現(xiàn)其他附加功能的硬件器件。此外,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,計(jì)算機(jī)設(shè)備800也可僅僅包含實(shí)現(xiàn)本發(fā)明實(shí)施例所必須的器件,而不必包含圖8中所示的全部器件。
需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,上述的程序可存儲(chǔ)于一種計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,上述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(rom:read-only memory)或隨機(jī)存儲(chǔ)記憶體(ram:randomaccessmemory)等。
盡管在此結(jié)合各實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,然而,在實(shí)施所要保護(hù)的本發(fā)明的過程中,本領(lǐng)域技術(shù)人員通過查看所述附圖、公開內(nèi)容、以及所附權(quán)利要求書,可理解并實(shí)現(xiàn)所述公開實(shí)施例的其它變化。在權(quán)利要求中,“包括”(comprising)一詞不排除其它組成部分或步驟,“一”或“一個(gè)”不排除多個(gè)的可能性。單個(gè)處理器或其它單元可以實(shí)現(xiàn)權(quán)利要求中列舉的若干項(xiàng)功能。互相不同的從屬權(quán)利要求中記載了某些措施,但這并不代表這些措施不能組合起來產(chǎn)生良好的效果。計(jì)算機(jī)程序可以存儲(chǔ)/分布在合適的介質(zhì)中,例如:光存儲(chǔ)介質(zhì)或固態(tài)介質(zhì),與其它硬件一起提供或作為硬件的一部分,也可以采用其它分布形式,如通過internet或其它有線或無線電信系統(tǒng)。
本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。