亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種業(yè)務(wù)參數(shù)獲取方法及裝置與流程

文檔序號:11589814閱讀:225來源:國知局
一種業(yè)務(wù)參數(shù)獲取方法及裝置與流程

本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種業(yè)務(wù)參數(shù)獲取方法及裝置。



背景技術(shù):

當(dāng)前很多業(yè)務(wù)與業(yè)務(wù)參數(shù)都是直接相關(guān)的,業(yè)務(wù)參數(shù)直接影響到業(yè)務(wù)申請是否能夠成功。業(yè)務(wù)提供方在為用戶分配業(yè)務(wù)時(shí)會(huì)根據(jù)已有的業(yè)務(wù)參數(shù)來評估是否為該用戶分配業(yè)務(wù)。

但目前,在業(yè)務(wù)提供方有可以獲得大量的用戶業(yè)務(wù)參數(shù)記錄,需要從中獲取到所需要的目標(biāo)用戶的業(yè)務(wù)參數(shù),目前業(yè)務(wù)提供方無法準(zhǔn)確對所需要的目標(biāo)用戶的業(yè)務(wù)參數(shù)進(jìn)行準(zhǔn)確的評估,導(dǎo)致業(yè)務(wù)提供方目標(biāo)用戶提供業(yè)務(wù)存在一定風(fēng)險(xiǎn)。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明實(shí)施例提供了一種業(yè)務(wù)參數(shù)獲取方法及裝置。

本發(fā)明的一個(gè)目的是提供一種業(yè)務(wù)參數(shù)獲取方法,所述方法包括:

確定滿足預(yù)置規(guī)則的樣本用戶為目標(biāo)樣本用戶;

利用大量所述目標(biāo)樣本用戶的特征數(shù)據(jù)確定logistic回歸分析模型;

獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù);

將所述特征數(shù)據(jù)輸入到所述logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù);

當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第一閾值區(qū)間時(shí),確定所述樣本用戶具有所述第一業(yè)務(wù)參數(shù);

當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第二閾值區(qū)間時(shí),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù);

其中,所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到。

可選地,所述利用大量所述目標(biāo)樣本用戶的特征數(shù)據(jù)確定所述logistic回 歸分析模型具體包括:

對所述目標(biāo)樣本用戶的特征數(shù)據(jù)進(jìn)行衍生并提取具有趨勢性的第一參數(shù);

對所述第一參數(shù)進(jìn)行降維得到具有解釋性的第二參數(shù);

對所述第二參數(shù)依次進(jìn)行聚類分析、判別分析以及去重以得到第三參數(shù);

對所述第三參數(shù)進(jìn)行l(wèi)ogistic回歸分析以得到第四參數(shù);

對所述第四參數(shù)進(jìn)行重復(fù)迭代運(yùn)算以得到模型參數(shù),所述模型參數(shù)用于確定所述特征數(shù)據(jù)對應(yīng)的所述特征參數(shù)。

可選地,所述預(yù)置規(guī)則至少包括:所述目標(biāo)樣本用的所處位置位于目標(biāo)位置、與所述目標(biāo)樣本用戶的關(guān)聯(lián)程度達(dá)到預(yù)設(shè)關(guān)聯(lián)閾值的用戶、所述目標(biāo)樣本用戶的身份信息符合預(yù)置條件。

可選地,所述第一閾值區(qū)間位于0和0.5之間,所述第二閾值區(qū)間位于0.5和1之間。

本發(fā)明的另一個(gè)目的是提供一種業(yè)務(wù)參數(shù)獲取裝置,所述裝置包括:

獲取單元,用于獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù);

處理單元,用于確定滿足預(yù)置規(guī)則的樣本用戶為目標(biāo)樣本用戶;

利用大量所述目標(biāo)樣本用戶的特征數(shù)據(jù)確定所述logistic回歸分析模型;

將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù);

當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第一閾值區(qū)間時(shí),確定所述樣本用戶具有所述第一業(yè)務(wù)參數(shù);

當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第二閾值區(qū)間時(shí),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù),其中,所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到。

可選地,所述處理單元還用于:

對所述目標(biāo)樣本用戶的特征數(shù)據(jù)進(jìn)行衍生并提取具有趨勢性的第一參數(shù);

對所述第一參數(shù)進(jìn)行降維得到具有解釋性的第二參數(shù);

對所述第二參數(shù)依次進(jìn)行聚類分析、判別分析以及去重以得到第三參數(shù);

對所述第三參數(shù)進(jìn)行l(wèi)ogistic回歸分析以得到第四參數(shù);

對所述第四參數(shù)進(jìn)行重復(fù)迭代運(yùn)算以得到模型參數(shù),所述模型參數(shù)用于確定所述特征數(shù)據(jù)對應(yīng)的所述特征參數(shù)。

可選地,所述預(yù)置規(guī)則至少包括:所述目標(biāo)樣本用的所處位置位于目標(biāo)位置、與所述目標(biāo)樣本用戶的關(guān)聯(lián)程度達(dá)到預(yù)設(shè)關(guān)聯(lián)閾值的用戶、所述目標(biāo)樣本用戶的身份信息符合預(yù)置條件。

本發(fā)明的再一個(gè)目的是提供一種業(yè)務(wù)參數(shù)獲取設(shè)備,所述設(shè)備的結(jié)構(gòu)中包括處理器和存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)支持?jǐn)?shù)據(jù)處理的設(shè)備執(zhí)行上述方法的程序,所述處理器被配置為用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的程序。所述數(shù)據(jù)庫處理設(shè)備還可以包括通信接口,用于數(shù)據(jù)庫處理設(shè)備與其他設(shè)備或通信網(wǎng)絡(luò)通信。

本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),用于儲(chǔ)存為上述業(yè)務(wù)參數(shù)獲取裝置所用的計(jì)算機(jī)軟件指令,其包含用于執(zhí)行上述方面為業(yè)務(wù)參數(shù)獲取裝置所設(shè)計(jì)的程序。

本發(fā)明實(shí)施例公開了一種業(yè)務(wù)參數(shù)獲取方法及裝置,首先獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù),將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù),當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第一閾值區(qū)間時(shí),確定所述樣本用戶具有所述第一業(yè)務(wù)參數(shù),當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第二閾值區(qū)間時(shí),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù),其中所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到,因?yàn)閘ogistic回歸分析模型預(yù)先對大量的樣本用戶進(jìn)行分析后確定的特征參數(shù)對應(yīng)的數(shù)值,這樣對一個(gè)待測試業(yè)務(wù)參數(shù)的用戶進(jìn)行業(yè)務(wù)參數(shù)獲取時(shí)候結(jié)果比較準(zhǔn)確,能夠較為客觀對樣本用戶的違約進(jìn)行預(yù)估。

附圖說明

圖1是本發(fā)明實(shí)施例業(yè)務(wù)參數(shù)獲取方法的一種實(shí)施例的流程圖;

圖2是本發(fā)明實(shí)施例業(yè)務(wù)參數(shù)獲取方法的另一種實(shí)施例的流程圖;

圖3是本發(fā)明實(shí)施例業(yè)務(wù)參數(shù)獲取裝置的一種實(shí)施例的結(jié)構(gòu)圖;

圖4是本發(fā)明實(shí)施例業(yè)務(wù)參數(shù)獲取裝置的另一種實(shí)施例的結(jié)構(gòu)圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。

本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”、“第三”“第四”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的實(shí)施例能夠以除了在這里圖示或描述的內(nèi)容以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

在描述本發(fā)明實(shí)施例之前,先對本發(fā)明實(shí)施例中涉及到的名詞做初步的介紹:

logistic回歸分析模型是基于有監(jiān)督訓(xùn)練的機(jī)器學(xué)習(xí)模型。

有監(jiān)督學(xué)習(xí):一種訓(xùn)練方法,有訓(xùn)練樣本和訓(xùn)練標(biāo)簽。

在大學(xué)中經(jīng)常會(huì)提到國家助學(xué)貸款,用于幫助家庭經(jīng)濟(jì)條件不好的學(xué)生完成學(xué)習(xí),跟通常的貸款相類似的也是需要對在校生的違約進(jìn)行預(yù)判,通過多種方式管控風(fēng)險(xiǎn),例如延遲頒發(fā)畢業(yè)證或?qū)W位證等等,這些措施是在貸款之后對貸款人的風(fēng)險(xiǎn)管控措施,在進(jìn)行貸款之前對于在校生的貸款違約的預(yù)測并沒有做到很全面很準(zhǔn)確。需要說明的是,本發(fā)明實(shí)施例的方案不限于社交應(yīng)用,所有可以公開的用戶特征數(shù)據(jù)都可以用作本發(fā)明實(shí)施例。

隨著科技的發(fā)展,越來越多的社交應(yīng)用走入我們生活,在用戶授權(quán)的情況下,很多社交應(yīng)用都可以將用戶的所在位置和設(shè)備信息公布在社交圈,例如在朋友圈顯示當(dāng)前所在位置、在微博信息中標(biāo)注發(fā)送微博設(shè)備的品牌型號,這些信息都可以體現(xiàn)出用戶的特征數(shù)據(jù),可以通過這些特征數(shù)據(jù)進(jìn)行一些預(yù) 判。

本發(fā)明通過對用戶的特征數(shù)據(jù)確定對應(yīng)的業(yè)務(wù)參數(shù),實(shí)際上這些業(yè)務(wù)參數(shù)可以反映用戶在未來一段時(shí)間內(nèi)的誠信情況,即是否會(huì)出現(xiàn)違約情況,本發(fā)明能反映用戶是否能違約的業(yè)務(wù)參數(shù)可以是違約的概率,即在0到1之間,如果業(yè)務(wù)參數(shù)得到的違約概率更趨向于0則表明違約的可能性較小,例如違約概率為0.1,相反,若違約概率更趨向于1則表明違約的可能性較大,例如違約概率為0.9。本發(fā)明實(shí)施例中的違約預(yù)測和用戶違約概率只是表達(dá)方式不同,實(shí)際上原理是相同的。

結(jié)合圖1所示,針對以上傳統(tǒng)方法及其缺點(diǎn),本發(fā)明實(shí)施例提供了一種業(yè)務(wù)參數(shù)獲取方法,所述方法包括:

s101、獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù)。

s102、將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù),其中所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到。

logistic回歸分析模型中預(yù)先對大量的樣本用戶進(jìn)行分析后可以得出樣本用戶的比較常用的特征參數(shù),再對一個(gè)樣本用戶的業(yè)務(wù)參數(shù)繼續(xù)獲取時(shí)可以用logistic回歸分析模型中已存在每種特征參數(shù)所對應(yīng)的數(shù)值進(jìn)行確定,因?yàn)閷?yīng)樣本用戶可以有多種特征參數(shù),每一種特征參數(shù)對于樣本用戶所對應(yīng)的數(shù)值也不相同,例如,樣本用戶分別具有a特征參數(shù)、b特征參數(shù)及c特征參數(shù),對應(yīng)的數(shù)值可以分別為0.2、0.5及0.3,在確定該樣本用戶時(shí)候可以利用特征參數(shù)進(jìn)行確定業(yè)務(wù)參數(shù),這里的業(yè)務(wù)參數(shù)可以代表的樣本用戶的信用程度,特征參數(shù)在0、1之間,如果特征參數(shù)趨向于1則表明違約的可能性較大,即信用度較低,反之,當(dāng)特征參數(shù)趨向于0則表明違約的可能性較小,即信用度很高,通??梢赃x擇中間值進(jìn)行劃分,例如將0到0.5之間作為第一閾值區(qū)間,0.5到1之間確定為第二閾值區(qū)間,當(dāng)樣本用戶的特征參數(shù)處于第一閾值區(qū)間內(nèi)則可以確定樣本用戶具有第一業(yè)務(wù)參數(shù),當(dāng)樣本用戶的特征參數(shù)位于第二閾值區(qū)間內(nèi)則可以確定樣本用戶具有第二業(yè)務(wù)參數(shù),因?yàn)閘ogistic回歸分析模型預(yù)先對大量的樣本用戶進(jìn)行分析后確定的特征參數(shù)對應(yīng)的數(shù) 值,這樣對一個(gè)待測試業(yè)務(wù)參數(shù)的用戶進(jìn)行業(yè)務(wù)參數(shù)獲取時(shí)候結(jié)果比較準(zhǔn)確,能夠較為客觀對樣本用戶的違約進(jìn)行預(yù)估。

結(jié)合圖2所示,本發(fā)明實(shí)施例提供了一種業(yè)務(wù)參數(shù)獲取方法,所述方法包括:

s201、確定滿足預(yù)置規(guī)則的樣本用戶為目標(biāo)樣本用戶。

預(yù)置規(guī)則至少包括:所述目標(biāo)樣本用的所處位置位于目標(biāo)位置、與所述目標(biāo)樣本用戶的關(guān)聯(lián)程度達(dá)到預(yù)設(shè)關(guān)聯(lián)閾值的用戶、所述目標(biāo)樣本用戶的身份信息符合預(yù)置條件,例如在進(jìn)行在校生的違約預(yù)測時(shí),可以利用在校生的所處位置和全國各大高校的地理位置進(jìn)行匹配,對于在校生的所處位置可以使用設(shè)備的定位功能,對于在校生的所處位置應(yīng)該在用戶授權(quán)下獲得,還可以進(jìn)一步地利用年齡和/或網(wǎng)齡數(shù)據(jù)去除一部分不符合年齡的人群,因?yàn)樵谛I佑|新事物比較多,對于上網(wǎng)時(shí)間會(huì)更多,通過對其社交媒體的賬戶等級也可以判斷,對于確定為樣本用戶的在校生可以根據(jù)其關(guān)聯(lián)的朋友圈進(jìn)行衍生擴(kuò)展出更多符合在校生條件的樣本用戶,這樣在確定在校生的樣本時(shí)可以有大量的樣本供使用,提高logistic回歸分析模型的準(zhǔn)確性。。

s202、利用大量所述目標(biāo)樣本用戶的特征數(shù)據(jù)確定所述logistic回歸分析模型。

對于特征參數(shù)可以包括對樣本用戶位置遷移頻率、聯(lián)系方式更新頻率、社交應(yīng)用信息的推送頻率等進(jìn)行統(tǒng)計(jì)分析,這些可以通過統(tǒng)計(jì)得到,再通過不斷的重復(fù)迭代運(yùn)算確定準(zhǔn)確的特征參數(shù)以及這些參數(shù)對應(yīng)的數(shù)值,即權(quán)重值,例如對一個(gè)人的位置遷移頻率進(jìn)行統(tǒng)計(jì),出現(xiàn)的位置很多且不固定,可以認(rèn)為該用戶的工作或?qū)W習(xí)狀態(tài)不穩(wěn)定,向其分配業(yè)務(wù)時(shí)候,后期進(jìn)展可能不會(huì)順利,這樣的特征參數(shù)再分配權(quán)重時(shí)可以提高該特征參數(shù)的權(quán)重值,體現(xiàn)出重要性。例如,對該用戶進(jìn)行貸款時(shí),由于工作或?qū)W習(xí)不穩(wěn)定,會(huì)產(chǎn)生不能按期還款的情況,這樣的用戶違約風(fēng)險(xiǎn)會(huì)提高,那么在進(jìn)行貸款時(shí)進(jìn)行更多的審查。

s203、獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù)。

s204、將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù),其中,所述logistic回歸分 析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到。

s205、當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第一閾值區(qū)間時(shí),確定所述樣本用戶具有所述第一業(yè)務(wù)參數(shù),當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第二閾值區(qū)間時(shí),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù)。

logistic回歸分析模型根據(jù)特征數(shù)據(jù)輸出的特征參數(shù)可以是一個(gè)概率值,特征參數(shù)的范圍在0、1之間,將業(yè)務(wù)參數(shù)劃分為兩種類型包括第一業(yè)務(wù)參數(shù)和第二業(yè)務(wù)參數(shù),第一業(yè)務(wù)參數(shù)還可以設(shè)定為誠信用戶,第二業(yè)務(wù)參數(shù)可以設(shè)定為違約用戶,當(dāng)進(jìn)行信用預(yù)測時(shí)候,業(yè)務(wù)參數(shù)可以對應(yīng)用戶的違約可能性,這樣對應(yīng)下來可以為誠信用戶和違約用戶,例如特征參數(shù)在0到0.5之間,此時(shí)樣本用戶具有誠信用戶的特征更多,也可以說該樣本用戶違約的可能性較小,當(dāng)特征參數(shù)在0.5到1之間時(shí)候,此時(shí)該樣本用戶具有違約用戶的特征更多,可以說該樣本用戶違約的可能性較高,設(shè)置閾值區(qū)間時(shí)候可靈活選擇,當(dāng)需要判斷誠信用戶更嚴(yán)格,則可以將中間值的取值更靠近0,例如,第一閾值區(qū)間可以設(shè)定為0到0.2之間,而第二閾值區(qū)間對應(yīng)設(shè)定在0.2到1之間,對應(yīng)地,對誠信用戶的條件寬松,則可以將中間值的取值更靠近1,例如,0.7,第一閾值區(qū)間可以設(shè)定為0到0.7,第二閾值區(qū)間可以設(shè)定為0.7到1,總之,通過特征參數(shù)的值可以確定樣本用戶的業(yè)務(wù)參數(shù),可以對樣本用戶的違約情況進(jìn)行預(yù)判。

本發(fā)明實(shí)施例中建立logistic回歸分析模型的方法的一實(shí)施例包括

對所述目標(biāo)樣本用戶的特征數(shù)據(jù)進(jìn)行衍生并提取具有趨勢性的第一參數(shù);

對所述第一參數(shù)進(jìn)行降維得到具有解釋性的第二參數(shù);

對所述第二參數(shù)依次進(jìn)行聚類分析、判別分析以及去重以得到第三參數(shù);

對所述第三參數(shù)進(jìn)行l(wèi)ogistic回歸分析以得到第四參數(shù);

對所述第四參數(shù)進(jìn)行重復(fù)迭代運(yùn)算以得到模型參數(shù),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù)。

具體地說:根據(jù)logistic函數(shù)的定義

logit(p)=α+β·x=α+β1x1+β2x2+...+βnxn

y值為1時(shí)表示為違約客戶,0時(shí)為誠信客戶,p事件發(fā)生的概率,β=(β1,β2,...,βn)為參數(shù)方程的估計(jì)值,x=(x1,x2,...,xn)t為logistic回歸分析模型變量。

違約用戶的概率:

θ表示模型估計(jì)的參數(shù),即:α,β1,β2,...,βn

誠信用戶的概率:

因?yàn)閥為二值分類,0或1,根據(jù)p1,p0這兩個(gè)概率得出誠信用戶和違約用戶的概率分布情況。

p(y|x,θ)=(1-hθ(x))y·hθ(x)1-y

根據(jù)最大似然估計(jì)原理

通過對log(l(θ))求導(dǎo),求出極值,得出θ的迭代函數(shù),就是logistic回歸分析模型估計(jì)參數(shù),這里說的模型變量實(shí)際對應(yīng)估計(jì)參數(shù)可以作為每個(gè)特征參數(shù)的權(quán)重值,在對一個(gè)用戶進(jìn)行預(yù)測時(shí)候,將該用戶的特征數(shù)據(jù)進(jìn)行分類得到多個(gè)特征參數(shù),對多個(gè)特征參數(shù)配置權(quán)重值進(jìn)行計(jì)算可以得到該用戶的業(yè)務(wù)參數(shù),即預(yù)估的違約概率,根據(jù)違約概率的數(shù)值可以對該用戶的違約進(jìn)行預(yù)估,以便決定是否對其執(zhí)行相關(guān)業(yè)務(wù),例如發(fā)放貸款等。

需要說明的是,logistic回歸分析模型變量的選取的前提是衍生變量,通常作為分析的對象可以是用戶或者帳戶,所獲得的數(shù)據(jù)可以有用戶基本屬性數(shù)據(jù)、社交屬性數(shù)據(jù)、交易屬性數(shù)據(jù)、穩(wěn)定安全屬性變量等等,可以根據(jù)這些數(shù)據(jù)進(jìn)行衍生得到新的變量供使用,創(chuàng)建衍生變量的過程本領(lǐng)與普通技術(shù)人員應(yīng)當(dāng)了解,這里不進(jìn)行贅述。

本發(fā)明實(shí)施例公開了一種業(yè)務(wù)參數(shù)獲取方法,首先獲取待預(yù)測業(yè)務(wù)參數(shù) 的樣本用戶的特征數(shù)據(jù),將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù),其中,所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到,因?yàn)閘ogistic回歸分析模型預(yù)先對大量的樣本用戶進(jìn)行分析后確定的特征參數(shù)對應(yīng)的數(shù)值,這樣對一個(gè)待測試業(yè)務(wù)參數(shù)的用戶進(jìn)行業(yè)務(wù)參數(shù)獲取時(shí)候結(jié)果比較準(zhǔn)確,能夠較為客觀對樣本用戶的違約進(jìn)行預(yù)估。

結(jié)合圖3所示,前文中介紹了一種業(yè)務(wù)參數(shù)獲取方法,對應(yīng)地,本發(fā)明實(shí)施例中還提供一種業(yè)務(wù)參數(shù)獲取裝置,所述裝置包括:

獲取單元301,用于獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù);

分析單元302,用于利用logistic回歸分析模型對所述特征數(shù)據(jù)進(jìn)行歸類分析,得到所述特征數(shù)據(jù)的多個(gè)特征參數(shù);

獲取單元301,用于獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù);

處理單元302,用于將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù),其中所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到。

可選地,所述處理單元302還用于:

確定滿足預(yù)置規(guī)則的樣本用戶為目標(biāo)樣本用戶;

用于利用大量所述目標(biāo)樣本用戶的特征數(shù)據(jù)確定所述logistic回歸分析模型。

可選地,所述業(yè)務(wù)參數(shù)包括第一業(yè)務(wù)參數(shù)和第二業(yè)務(wù)參數(shù),所述處理單元302還用于:

當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第一閾值區(qū)間時(shí),確定所述樣本用戶具有所述第一業(yè)務(wù)參數(shù);

當(dāng)所述特征參數(shù)位于預(yù)設(shè)的第二閾值區(qū)間時(shí),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù)。

可選地,所述處理單元302還用于:

對所述目標(biāo)樣本用戶的特征數(shù)據(jù)進(jìn)行衍生并提取具有趨勢性的第一參數(shù);

對所述第一參數(shù)進(jìn)行降維得到具有解釋性的第二參數(shù);

對所述第二參數(shù)依次進(jìn)行聚類分析、判別分析以及去重以得到第三參數(shù);

對所述第三參數(shù)進(jìn)行l(wèi)ogistic回歸分析以得到第四參數(shù);

對所述第四參數(shù)進(jìn)行重復(fù)迭代運(yùn)算以得到模型參數(shù),確定所述樣本用戶具有所述第二業(yè)務(wù)參數(shù)。

可選地,所述預(yù)置規(guī)則至少包括:所述目標(biāo)樣本用的所處位置位于目標(biāo)位置、與所述目標(biāo)樣本用戶的關(guān)聯(lián)程度達(dá)到預(yù)設(shè)關(guān)聯(lián)閾值的用戶、所述目標(biāo)樣本用戶的身份信息符合預(yù)置條件。

本發(fā)明實(shí)施例公開了一種業(yè)務(wù)參數(shù)獲取裝置,首先獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù),利用logistic回歸分析模型對所述特征數(shù)據(jù)進(jìn)行歸類分析,得到所述特征數(shù)據(jù)的多個(gè)特征參數(shù),確定所述多個(gè)特征參數(shù)中的每一個(gè)特征參數(shù)的數(shù)值,所述數(shù)值用于確定所述業(yè)務(wù)參數(shù),其中所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到,因?yàn)閘ogistic回歸分析模型預(yù)先對大量的樣本用戶進(jìn)行分析后確定的特征參數(shù)對應(yīng)的數(shù)值,這樣對一個(gè)待測試業(yè)務(wù)參數(shù)的用戶進(jìn)行業(yè)務(wù)參數(shù)獲取時(shí)候結(jié)果比較準(zhǔn)確,能夠較為客觀對樣本用戶的違約進(jìn)行預(yù)估。

結(jié)合圖4所示,圖4是本發(fā)明實(shí)施例提供的業(yè)務(wù)參數(shù)獲取裝置40的結(jié)構(gòu)示意圖。所述業(yè)務(wù)參數(shù)獲取裝置40包括處理器410、存儲(chǔ)器450和輸入/輸出i/o設(shè)備430,存儲(chǔ)器450可以包括只讀存儲(chǔ)器和隨機(jī)存取存儲(chǔ)器,并向處理器410提供操作指令和數(shù)據(jù)。存儲(chǔ)器450的一部分還可以包括非易失性隨機(jī)存取存儲(chǔ)器(nvram)。

在一些實(shí)施方式中,存儲(chǔ)器450存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴(kuò)展集:

在本發(fā)明實(shí)施例中,通過調(diào)用存儲(chǔ)器450存儲(chǔ)的操作指令(該操作指令可存儲(chǔ)在操作系統(tǒng)中),

獲取待預(yù)測業(yè)務(wù)參數(shù)的樣本用戶的特征數(shù)據(jù)。

將所述特征數(shù)據(jù)輸入到logistic回歸分析模型得到所述特征數(shù)據(jù)的特征參數(shù),所述特征參數(shù)用于確定所述業(yè)務(wù)參數(shù),其中,所述logistic回歸分析模型是采用大量樣本用戶的特征數(shù)據(jù)進(jìn)行l(wèi)ogistic回歸分析并反復(fù)迭代訓(xùn)練得到。

處理器410控制業(yè)務(wù)參數(shù)獲取裝置40的操作,處理器410還可以稱為cpu(centralprocessingunit,中央處理單元)。存儲(chǔ)器450可以包括只讀存儲(chǔ)器和隨機(jī)存取存儲(chǔ)器,并向處理器410提供指令和數(shù)據(jù)。存儲(chǔ)器450的一部分還可以包括非易失性隨機(jī)存取存儲(chǔ)器(nvram)。的應(yīng)用中業(yè)務(wù)參數(shù)獲取裝置40的各個(gè)組件通過總線系統(tǒng)420耦合在一起,其中總線系統(tǒng)420除包括數(shù)據(jù)總線之外,還可以包括電源總線、控制總線和狀態(tài)信號總線等。但是為了清楚說明起見,在圖中將各種總線都標(biāo)為總線系統(tǒng)420。

上述本發(fā)明實(shí)施例揭示的方法可以應(yīng)用于處理器410中,或者由處理器410實(shí)現(xiàn)。處理器410可能是一種集成電路芯片,具有信號的處理能力。在實(shí)現(xiàn)過程中,上述方法的各步驟可以通過處理器410中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器410可以是通用處理器、數(shù)字信號處理器(dsp)、專用集成電路(asic)、現(xiàn)成可編程門陣列(fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件??梢詫?shí)現(xiàn)或者執(zhí)行本發(fā)明實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。結(jié)合本發(fā)明實(shí)施例所公開的方法的步驟可以直接體現(xiàn)為硬件譯碼處理器執(zhí)行完成,或者用譯碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī)存儲(chǔ)器,閃存、只讀存儲(chǔ)器,可編程只讀存儲(chǔ)器或者電可擦寫可編程存儲(chǔ)器、寄存器等本領(lǐng)域成熟的存儲(chǔ)介質(zhì)中。該存儲(chǔ)介質(zhì)位于存儲(chǔ)器450,處理器410讀取存儲(chǔ)器450中的信息,結(jié)合其硬件完成上述方法的步驟。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。

在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合 或通信連接,可以是電性,機(jī)械或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器(rom,readonlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁盤或光盤等。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。

以上對本發(fā)明所提供的一種業(yè)務(wù)參數(shù)獲取方法及裝置進(jìn)行了詳細(xì)介紹,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實(shí)施例的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1