本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種事件發(fā)生概率預(yù)測(cè)方法及裝置。
背景技術(shù):
在很多業(yè)務(wù)場(chǎng)景中,經(jīng)常需要預(yù)測(cè)業(yè)務(wù)中各類事件的發(fā)生概率,以便根據(jù)預(yù)測(cè)的發(fā)生概率對(duì)相關(guān)業(yè)務(wù)進(jìn)行相應(yīng)的調(diào)整或者操作。例如:在第三方支付業(yè)務(wù)平臺(tái),預(yù)測(cè)用戶的賬號(hào)被盜事件的發(fā)生概率;或者,在融資業(yè)務(wù)平臺(tái),預(yù)測(cè)用戶對(duì)所貸金額還款事件的發(fā)生概率;或者,在保險(xiǎn)業(yè)務(wù)平臺(tái),預(yù)測(cè)用戶理賠事件的發(fā)生概率等等。
目前,根據(jù)業(yè)務(wù)場(chǎng)景應(yīng)用單一的預(yù)測(cè)模型預(yù)測(cè)業(yè)務(wù)中各類事件的發(fā)生概率,比如,在保險(xiǎn)業(yè)務(wù)平臺(tái),應(yīng)用邏輯回歸預(yù)測(cè)模型對(duì)相關(guān)事件的發(fā)生概率進(jìn)行預(yù)測(cè),在融資業(yè)務(wù)平臺(tái),應(yīng)用決策樹預(yù)測(cè)模型對(duì)相關(guān)事件的發(fā)生概率進(jìn)行預(yù)測(cè)。
然而,根據(jù)歷史數(shù)據(jù)記錄的業(yè)務(wù)事件的真實(shí)發(fā)生概率,分析之前的預(yù)測(cè)數(shù)據(jù),獲知目前預(yù)測(cè)方式的準(zhǔn)確性不能達(dá)到預(yù)設(shè)的標(biāo)準(zhǔn),降低了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問(wèn)題之一。
為此,本發(fā)明的第一個(gè)目的在于提出一種事件發(fā)生概率預(yù)測(cè)方法,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
本發(fā)明的第二個(gè)目的在于提出一種事件發(fā)生概率預(yù)測(cè)裝置。
為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法,包括:根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。
本發(fā)明實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法,首先根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);然后應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;進(jìn)而應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的 發(fā)生概率。由此,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
為了實(shí)現(xiàn)上述目的,本發(fā)明第二方面實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置,包括:第一獲取模塊,用于根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);第二獲取模塊,用于應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;處理模塊,用于應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。
本發(fā)明實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置,通過(guò)第一獲取模塊根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);通過(guò)第二獲取模塊應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;通過(guò)處理模塊應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。由此,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
附圖說(shuō)明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中,
圖1是本發(fā)明一個(gè)實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法的流程圖;
圖2是擬合系數(shù)訓(xùn)練過(guò)程的流程圖;
圖3是擬合系數(shù)訓(xùn)練過(guò)程的示意圖;
圖4是本發(fā)明一個(gè)實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置的結(jié)構(gòu)框圖;
圖5是本發(fā)明另一個(gè)實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性。在本發(fā)明的描述中,需要說(shuō)明的是,除非另有明確的規(guī)定和 限定,術(shù)語(yǔ)“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。此外,在本發(fā)明的描述中,除非另有說(shuō)明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。
流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
以下結(jié)合附圖描述根據(jù)本發(fā)明實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法及裝置。
圖1是本發(fā)明一個(gè)實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法的流程圖。
如圖1所示,該事件發(fā)生概率預(yù)測(cè)方法包括:
步驟101,根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo)。
具體地,本發(fā)明實(shí)施例提供的事件發(fā)生概率預(yù)測(cè)方法被配置在事件發(fā)生概率預(yù)測(cè)裝置中,其中,事件發(fā)生概率預(yù)測(cè)裝置可以集成部署在不同業(yè)務(wù)場(chǎng)景的業(yè)務(wù)平臺(tái)中,以便預(yù)測(cè)業(yè)務(wù)中各類事件的發(fā)生概率;或者,事件發(fā)生概率預(yù)測(cè)裝置可以單獨(dú)部署,與各個(gè)業(yè)務(wù)平臺(tái)之間通過(guò)預(yù)設(shè)的接口進(jìn)行數(shù)據(jù)交互,對(duì)業(yè)務(wù)平臺(tái)中傳輸?shù)拇A(yù)測(cè)業(yè)務(wù)的預(yù)測(cè)指標(biāo)進(jìn)行處理后,將預(yù)測(cè)結(jié)果通過(guò)接口發(fā)送給對(duì)應(yīng)的業(yè)務(wù)平臺(tái)。
事件發(fā)生概率預(yù)測(cè)裝置中預(yù)先設(shè)置有模型組,其中,模型組中包括至少兩種預(yù)測(cè)模型,預(yù)測(cè)模型的種類很多,可以根據(jù)實(shí)際應(yīng)用需要進(jìn)行選擇,本實(shí)施例對(duì)此不作限制,例如可以包括:邏輯回歸模型、C5.0決策樹模型、神經(jīng)網(wǎng)絡(luò)模型、prob回歸模型以及CART回歸樹模型。
由于業(yè)務(wù)場(chǎng)景多樣,相關(guān)的各種業(yè)務(wù)事件內(nèi)容也不同,因此,預(yù)測(cè)不同事件的發(fā)生概率所需要的預(yù)測(cè)指標(biāo)類型內(nèi)容不同。并且,針對(duì)同一件事件進(jìn)行預(yù)測(cè)時(shí),不同預(yù)測(cè)模型所需要的輸入預(yù)測(cè)指標(biāo)類型以及具體的算法也不同。因此,當(dāng)對(duì)具體業(yè)務(wù)事件的發(fā)生概率進(jìn)行預(yù)測(cè)時(shí),根據(jù)業(yè)務(wù)需要衍生出概率事件有關(guān)系的預(yù)測(cè)指標(biāo),并提取出包含歷史指標(biāo)樣本集和目標(biāo)變量(一般情況下,如果事件發(fā)生了目標(biāo)變量為1,沒(méi)有發(fā)生0)的歷史樣本。需要說(shuō)明的是,預(yù)測(cè)指標(biāo)的獲取方式很多,根據(jù)具體的應(yīng)用場(chǎng)景而定,例如:可以是預(yù)先存儲(chǔ)在事件發(fā)生概率預(yù)測(cè)裝置中的,也可以是通過(guò)與相關(guān)業(yè)務(wù)數(shù)據(jù)庫(kù)之間的接口從業(yè)務(wù)數(shù)據(jù)庫(kù)中實(shí)時(shí)獲取的。
為了更加清楚的說(shuō)明預(yù)測(cè)指標(biāo)的獲取過(guò)程,以模型組中包括:邏輯回歸模型和決策樹 模型兩種預(yù)測(cè)模型,針對(duì)支付寶平臺(tái),預(yù)測(cè)用戶的支付寶賬號(hào)被盜事件的發(fā)生概率為例,具體說(shuō)明如下:
應(yīng)用邏輯回歸模型進(jìn)行預(yù)測(cè)時(shí),需要使用包含預(yù)測(cè)變量的歷史樣本(記為歷史指標(biāo)樣本集A1)預(yù)測(cè)用戶的支付寶賬號(hào)被盜事件的發(fā)生概率pred_1,記模型為mode1;應(yīng)用決策樹模型進(jìn)行預(yù)測(cè)時(shí),需要根據(jù)歷史指標(biāo)樣本集A1擬合得到支付寶賬號(hào)被盜事件的發(fā)生概率pred_2,記模型為model2;假設(shè)決策樹模型和邏輯回歸模的輸入指標(biāo)總計(jì)有30個(gè),因此,根據(jù)決策樹模型和邏輯回歸模對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,從數(shù)據(jù)庫(kù)中獲取與30種輸入指標(biāo)對(duì)應(yīng)的預(yù)測(cè)指標(biāo)。其中,預(yù)測(cè)指標(biāo)類型包括很多,比如:用戶賬號(hào)、當(dāng)前余額、支付詳單、開(kāi)戶時(shí)間、不良記錄、信用評(píng)級(jí)、授信額度等等。
步驟102,應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率。
具體地,獲取與每種預(yù)測(cè)模型的指標(biāo)需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo)后,應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率。不同的預(yù)測(cè)模型應(yīng)用不同的算法處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),從而獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率。
步驟103,應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。
具體地,事件發(fā)生概率預(yù)測(cè)裝置中設(shè)置有預(yù)先訓(xùn)練好的與所述模型組對(duì)應(yīng)的擬合模型,其中,擬合模型是通過(guò)邏輯運(yùn)算符對(duì)擬合預(yù)測(cè)指標(biāo)類型和擬合系數(shù)組合生成,其中的擬合預(yù)測(cè)指標(biāo)類型就是模型組中每個(gè)預(yù)測(cè)模型的輸出概率,擬合系數(shù)是預(yù)先根據(jù)目標(biāo)函數(shù)對(duì)訓(xùn)練樣本集訓(xùn)練確定的,其中,所述擬合系數(shù),包括:與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的系數(shù),和/或;與所述擬合模型對(duì)應(yīng)的常系數(shù)。
需要注意的是,通過(guò)邏輯運(yùn)算符對(duì)擬合預(yù)測(cè)指標(biāo)類型和擬合系數(shù)組合方式很多,可以根據(jù)應(yīng)用需要進(jìn)行設(shè)置,本實(shí)施例對(duì)此不作限制。
獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率之后,應(yīng)用預(yù)先訓(xùn)練的與模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。
為了更加清楚的說(shuō)明對(duì)事件發(fā)生概率的預(yù)測(cè)過(guò)程,繼續(xù)以步驟101的例子舉例說(shuō)明:模型組中包括:邏輯回歸模型model1和決策樹模型model2兩種預(yù)測(cè)模型,利用model1和model2的預(yù)測(cè)結(jié)果和logit回歸算法擬合得到的最終模型model3為:
Pred=1/(1+exp(-Z)),其中,Z=a1*pred_1+a2*pred_2+a0;
其中,pred_1為與邏輯回歸模型model1對(duì)應(yīng)的輸出概率;pred_2為與決策樹模型model2對(duì)應(yīng)的輸出概率;a1、a2和a0為擬合系數(shù)。
應(yīng)用model3預(yù)測(cè)所述事件的發(fā)生概率:即利用model1和進(jìn)入模型的預(yù)測(cè)指標(biāo)獲得輸出 概率pred_1;利用model2和進(jìn)入模型的預(yù)測(cè)指標(biāo)獲得輸出概率pred_2;將pred_1和pred_2帶入model3的公式中即得到所述事件的發(fā)生概率。
本實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法,首先根據(jù)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的指標(biāo)需求,獲取與所述指標(biāo)需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);然后應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;進(jìn)而應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。由此,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
基于上述實(shí)施例,針對(duì)圖1所示的步驟103之前,需要對(duì)擬合模型中的擬合系數(shù)進(jìn)行訓(xùn)練,下面通過(guò)圖2和圖3說(shuō)明擬合系數(shù)的訓(xùn)練過(guò)程,具體如下:
圖2是擬合系數(shù)訓(xùn)練過(guò)程的流程圖,圖3是擬合系數(shù)訓(xùn)練過(guò)程的示意圖,
如圖2和圖3所示,擬合系數(shù)的具體的訓(xùn)練過(guò)程可以包括以下步驟:
步驟201,獲取用來(lái)訓(xùn)練所述模型組的歷史指標(biāo)樣本集,以及與所述預(yù)測(cè)事件對(duì)應(yīng)的歷史發(fā)生概率樣本集。
步驟202,根據(jù)所述歷史指標(biāo)樣本集獲取與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的歷史輸出概率樣本集。
步驟203,將所述歷史輸出概率樣本集作為所述擬合模型的輸入,以及將所述歷史發(fā)生概率樣本集作為所述擬合模型的輸出,確定所述擬合模型中的擬合系數(shù)。
具體地,事件發(fā)生概率預(yù)測(cè)裝置與訓(xùn)練樣本集數(shù)據(jù)庫(kù)之間設(shè)置接口,其中,訓(xùn)練樣本集數(shù)據(jù)庫(kù)可以是業(yè)務(wù)數(shù)據(jù)庫(kù),或者,存儲(chǔ)業(yè)務(wù)記錄的第三方平臺(tái)。通過(guò)接口與訓(xùn)練樣本集數(shù)據(jù)庫(kù)之間建立連接,從訓(xùn)練樣本集數(shù)據(jù)庫(kù)獲取用來(lái)訓(xùn)練模型組的歷史指標(biāo)樣本集A1,以及與預(yù)測(cè)事件對(duì)應(yīng)的歷史發(fā)生概率樣本集,根據(jù)歷史指標(biāo)樣本集A1獲取與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的歷史輸出概率樣本集A2,將歷史輸出概率樣本集A2作為與模型組對(duì)應(yīng)的擬合模型的輸入,以及將歷史發(fā)生概率樣本集作為擬合模型的輸出,訓(xùn)練歷史輸出概率樣本集A2和歷史發(fā)生概率樣本集保持一致,從而確定擬合模型中的擬合系數(shù)。
參見(jiàn)圖3,以及繼續(xù)參見(jiàn)步驟103中的例子,根據(jù)歷史指標(biāo)樣本集A1及模型組中多個(gè)預(yù)測(cè)模型獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的歷史輸出概率樣本集A2,利用logit回歸算法Pred=1/(1+exp(-Z)),其中,Z=a1*pred_1+a2*pred_2+a0,使用歷史輸出概率樣本集A2即pred_1,…pred_n作為擬合模型輸入的預(yù)測(cè)變量,使用歷史發(fā)生概率樣本集作為擬合模型的輸出,確定擬合系數(shù)a1、a2和a0,從而得到最終的擬合模型。
本實(shí)施例的事件發(fā)生概率預(yù)測(cè)方法,通過(guò)獲取用來(lái)訓(xùn)練所述模型組的歷史指標(biāo)樣本集,以及與所述預(yù)測(cè)事件對(duì)應(yīng)的歷史發(fā)生概率樣本集,根據(jù)所述歷史指標(biāo)樣本集獲取與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的歷史輸出概率樣本集,將所述歷史輸出概率樣本集作為所述擬 合模型的輸入,以及將所述歷史發(fā)生概率樣本集作為所述擬合模型的輸出,確定所述擬合模型中的擬合系數(shù)。由此,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明的實(shí)施例還提供一種事件發(fā)生概率預(yù)測(cè)裝置。
圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置的結(jié)構(gòu)框圖。
如圖4所示,該事件發(fā)生概率預(yù)測(cè)裝置包括:
第一獲取模塊11,用于根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);
第二獲取模塊12,用于應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;
處理模塊13,用于應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。
其中,所述模型組包括以下至少兩種預(yù)測(cè)模型:
邏輯回歸模型、決策樹模型、神經(jīng)網(wǎng)絡(luò)模型、prob回歸模型、以及CART回歸樹模型。
在一個(gè)實(shí)施例中,若所述模型組包括:邏輯回歸模型model 1和決策樹模型model2兩種預(yù)測(cè)模型,
所述處理模塊13具體用于:應(yīng)用預(yù)先通過(guò)邏輯回歸算法訓(xùn)練獲取的擬合模型model3處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率,其中,所述model3為:
Pred=1/(1+exp(-Z)),其中,Z=a1*pred_1+a2*pred_2+a0;
其中,pred_1為與邏輯回歸模型model 1對(duì)應(yīng)的輸出概率;pred_2為與決策樹模型model2對(duì)應(yīng)的輸出概率;Pred為所述事件的發(fā)生概率;a1、a2和a0為擬合系數(shù)。
其中,在一個(gè)實(shí)施例中,所述第一獲取模塊11,具體用于:
從與所述預(yù)測(cè)事件對(duì)應(yīng)的業(yè)務(wù)數(shù)據(jù)庫(kù)中獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo)。
需要說(shuō)明的是,前述對(duì)事件發(fā)生概率預(yù)測(cè)方法實(shí)施例的解釋說(shuō)明也適用于該實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置,此處不再贅述。
本發(fā)明實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置,首先根據(jù)預(yù)設(shè)模型組中每種預(yù)測(cè)模型對(duì)預(yù)測(cè)事件的預(yù)測(cè)指標(biāo)類型需求,獲取與所述預(yù)測(cè)指標(biāo)類型需求對(duì)應(yīng)的預(yù)測(cè)指標(biāo);然后應(yīng)用每種預(yù)測(cè)模型處理對(duì)應(yīng)的預(yù)測(cè)指標(biāo),獲取與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率;進(jìn)而應(yīng)用預(yù)先訓(xùn)練的與所述模型組對(duì)應(yīng)的擬合模型,處理與每種預(yù)測(cè)模型對(duì)應(yīng)的輸出概率,預(yù)測(cè)所述事件的發(fā)生概率。由此,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
圖5是本發(fā)明另一個(gè)實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置的結(jié)構(gòu)框圖。
如圖5所示,基于圖4實(shí)施例,還包括:
第三獲取模塊14,用于獲取用來(lái)訓(xùn)練所述模型組的歷史指標(biāo)樣本集,以及與所述預(yù)測(cè)事件對(duì)應(yīng)的歷史發(fā)生概率樣本集。
第二獲取模塊12,還用于根據(jù)所述歷史指標(biāo)樣本集獲取與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的歷史輸出概率樣本集
訓(xùn)練模塊15,用于將所述歷史輸出概率樣本集作為所述擬合模型的輸入,以及將所述歷史發(fā)生概率樣本集作為所述擬合模型的輸出,確定所述擬合模型中的擬合系數(shù)。
其中,所述擬合系數(shù),包括:
與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的系數(shù),和/或;
與所述擬合模型對(duì)應(yīng)的常系數(shù)。
需要說(shuō)明的是,前述對(duì)事件發(fā)生概率預(yù)測(cè)方法實(shí)施例的解釋說(shuō)明也適用于該實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置,此處不再贅述。
本發(fā)明實(shí)施例的事件發(fā)生概率預(yù)測(cè)裝置,通過(guò)獲取用來(lái)訓(xùn)練所述模型組的歷史指標(biāo)樣本集,以及與所述預(yù)測(cè)事件對(duì)應(yīng)的歷史發(fā)生概率樣本集,根據(jù)所述歷史指標(biāo)樣本集獲取與所述模型組中每種預(yù)測(cè)模型對(duì)應(yīng)的歷史輸出概率樣本集,將所述歷史輸出概率樣本集作為所述擬合模型的輸入,以及將所述歷史發(fā)生概率樣本集作為所述擬合模型的輸出,確定所述擬合模型中的擬合系數(shù)。由此,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確度,進(jìn)而提高了根據(jù)預(yù)測(cè)結(jié)果處理相關(guān)業(yè)務(wù)的有效性和可靠性。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。
在本說(shuō)明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不脫離 本發(fā)明的原理和宗旨的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同物限定。