本申請(qǐng)涉及風(fēng)險(xiǎn)管控領(lǐng)域,特別涉及一種基于聚類算法的信用額度優(yōu)化方法、系統(tǒng)、存儲(chǔ)介質(zhì)和設(shè)備。
背景技術(shù):
1、在信貸風(fēng)控領(lǐng)域,確定客戶的授信額度是信貸決策過(guò)程中的關(guān)鍵環(huán)節(jié)。
2、目前,確定客戶授信額度的方法主要包括基于規(guī)則的額度分配和基于機(jī)器學(xué)習(xí)的額度預(yù)測(cè)。基于規(guī)則的額度分配通過(guò)預(yù)設(shè)的一系列規(guī)則和條件,如客戶的信用評(píng)分、收入水平和職業(yè)類型等,來(lái)分配授信額度。例如,信用評(píng)分較高的客戶可以獲得更高的額度。然而基于規(guī)則的方法通常固定死板,難以根據(jù)客戶的個(gè)性化需求和市場(chǎng)變化進(jìn)行動(dòng)態(tài)調(diào)整。同時(shí)規(guī)則的方法在面對(duì)多維度數(shù)據(jù)和復(fù)雜的非線性關(guān)系時(shí)表現(xiàn)不佳,可能無(wú)法準(zhǔn)確反映客戶的信用風(fēng)險(xiǎn)?;跈C(jī)器學(xué)習(xí)的額度預(yù)測(cè)利用歷史數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型(如線性回歸、xgboost等),通過(guò)輸入客戶的信用數(shù)據(jù)來(lái)預(yù)測(cè)最適合的授信額度。然而機(jī)器學(xué)習(xí)模型需要準(zhǔn)確的額度標(biāo)簽進(jìn)行訓(xùn)練,但在實(shí)際業(yè)務(wù)中,通常缺乏精確的授信額度標(biāo)簽,這使得模型訓(xùn)練難以進(jìn)行。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)的目的是提供一種基于聚類算法的信用額度優(yōu)化方法、系統(tǒng)、存儲(chǔ)介質(zhì)和設(shè)備,通過(guò)聚類找到與目標(biāo)客戶最相似的鄰近客戶群體,并基于鄰近客戶的授信額度進(jìn)行額度優(yōu)化,無(wú)需依賴準(zhǔn)確的額度標(biāo)簽?。
2、為解決上述技術(shù)問(wèn)題,本申請(qǐng)?zhí)峁┮环N基于聚類算法的信用額度優(yōu)化方法,具體技術(shù)方案如下:
3、獲取客戶的客戶數(shù)據(jù)和動(dòng)支行為數(shù)據(jù);所述動(dòng)支行為數(shù)據(jù)包括所述客戶的授信額度、實(shí)際動(dòng)支情況和逾期記錄;
4、根據(jù)所述動(dòng)支行為數(shù)據(jù)篩選授信通過(guò)且存在動(dòng)支操作的樣本客戶;
5、計(jì)算變量與所述授信額度之間的相關(guān)性;所述變量為不同銀行對(duì)所述樣本客戶的歷史最大授信額度;
6、將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量,利用聚類算法對(duì)所述特征向量進(jìn)行聚類分析,確定與所述樣本客戶最相似的若干鄰近客戶;
7、根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化,得到所述樣本客戶的優(yōu)化信用額度。
8、可選的,所述計(jì)算變量與所述授信額度之間的相關(guān)性包括:
9、計(jì)算各所述變量與所述授信額度樣本協(xié)方差之間的樣本協(xié)方差和各自的樣本標(biāo)準(zhǔn)差;
10、根據(jù)所述樣本協(xié)方差和所述樣本標(biāo)準(zhǔn)差確定皮爾森區(qū)分相關(guān)性。
11、可選的,所述將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量之前,還包括:
12、移除相關(guān)性滿足所述關(guān)聯(lián)閾值,且不符合業(yè)務(wù)邏輯的變量。
13、可選的,將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量之后,還包括:
14、去除所述特征向量的異常值;
15、移除或者填充所述特征向量中的缺失值;
16、計(jì)算所述特征向量的統(tǒng)計(jì)量,根據(jù)所述統(tǒng)計(jì)量對(duì)所述特征向量進(jìn)行標(biāo)準(zhǔn)化處理;所述標(biāo)準(zhǔn)化處理包括中心化處理或縮放處理。
17、可選的,利用聚類算法對(duì)所述特征向量進(jìn)行聚類分析,確定與所述樣本客戶最相似的若干鄰近客戶包括:
18、交叉驗(yàn)證確定最優(yōu)近鄰數(shù)量k和距離度量方式;
19、利用knn分類器進(jìn)行聚類分析,確定與所述樣本客戶最相似的k個(gè)鄰近客戶。
20、可選的,所述根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化,得到所述樣本客戶的優(yōu)化信用額度包括:
21、對(duì)所述樣本客戶的若干鄰近客戶各自的授信額度進(jìn)行聚合,計(jì)算平均值或加權(quán)平均值,根據(jù)所述平均值或所述加權(quán)平均值得到所述樣本客戶的優(yōu)化信用額度。
22、可選的,根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化之后,還包括:
23、對(duì)所述樣本客戶的優(yōu)化信用額度利用驗(yàn)證數(shù)據(jù)集進(jìn)行驗(yàn)證,得到驗(yàn)證結(jié)果;
24、根據(jù)所述驗(yàn)證結(jié)果調(diào)整所述鄰近客戶的數(shù)量或鄰近客戶的特征選擇。
25、本申請(qǐng)還提供一種基于聚類算法的信用額度優(yōu)化系統(tǒng),包括:
26、數(shù)據(jù)獲取模塊,用于獲取客戶的客戶數(shù)據(jù)和動(dòng)支行為數(shù)據(jù);所述動(dòng)支行為數(shù)據(jù)包括所述客戶的授信額度、實(shí)際動(dòng)支情況和逾期記錄;
27、客戶篩選模塊,用于根據(jù)所述動(dòng)支行為數(shù)據(jù)篩選授信通過(guò)且存在動(dòng)支操作的樣本客戶;
28、變量計(jì)算模塊,用于計(jì)算變量與所述授信額度之間的相關(guān)性;所述變量為不同銀行對(duì)所述樣本客戶的歷史最大授信額度;
29、聚類模塊,用于將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量,利用聚類算法對(duì)所述特征向量進(jìn)行聚類分析,確定與所述樣本客戶最相似的若干鄰近客戶;
30、額度優(yōu)化模塊,用于根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化,得到所述樣本客戶的優(yōu)化信用額度。
31、本申請(qǐng)還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法的步驟。
32、本申請(qǐng)還提供一種電子設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存有計(jì)算機(jī)程序,所述處理器調(diào)用所述存儲(chǔ)器中的計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上所述的方法的步驟。
33、本申請(qǐng)?zhí)峁┮环N基于聚類算法的信用額度優(yōu)化方法,包括:獲取客戶的客戶數(shù)據(jù)和動(dòng)支行為數(shù)據(jù);所述動(dòng)支行為數(shù)據(jù)包括所述客戶的授信額度、實(shí)際動(dòng)支情況和逾期記錄;根據(jù)所述動(dòng)支行為數(shù)據(jù)篩選授信通過(guò)且存在動(dòng)支操作的樣本客戶;計(jì)算變量與所述授信額度之間的相關(guān)性;所述變量為不同銀行對(duì)所述樣本客戶的歷史最大授信額度;將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量,利用聚類算法對(duì)所述特征向量進(jìn)行聚類分析,確定與所述樣本客戶最相似的若干鄰近客戶;根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化,得到所述樣本客戶的優(yōu)化信用額度。
34、本申請(qǐng)基于已有的動(dòng)支行為數(shù)據(jù),通過(guò)聚類找到與樣本客戶最相似的客戶群體,并基于相似客戶的授信額度對(duì)樣本客戶進(jìn)行優(yōu)化,無(wú)需依賴準(zhǔn)確的額度標(biāo)簽,能夠有效優(yōu)化未動(dòng)支樣本的授信額度,提升其動(dòng)支率。同時(shí)根據(jù)相似客戶的動(dòng)態(tài)行為和額度情況等信息?,能夠靈活應(yīng)對(duì)個(gè)性化需求和市場(chǎng)變化。
35、本申請(qǐng)還提供一種基于聚類算法的信用額度優(yōu)化系統(tǒng)、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和電子設(shè)備,具有上述有益效果,此處不再贅述。
1.一種基于聚類算法的信用額度優(yōu)化方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于聚類算法的信用額度優(yōu)化方法,其特征在于,所述計(jì)算變量與所述授信額度之間的相關(guān)性包括:
3.根據(jù)權(quán)利要求2所述的基于聚類算法的信用額度優(yōu)化方法,其特征在于,所述將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量之前,還包括:
4.根據(jù)權(quán)利要求1所述的基于聚類算法的信用額度優(yōu)化方法,其特征在于,將相關(guān)性滿足關(guān)聯(lián)閾值的變量轉(zhuǎn)化為特征向量之后,還包括:
5.根據(jù)權(quán)利要求1所述的基于聚類算法的信用額度優(yōu)化方法,其特征在于,利用聚類算法對(duì)所述特征向量進(jìn)行聚類分析,確定與所述樣本客戶最相似的若干鄰近客戶包括:
6.根據(jù)權(quán)利要求1所述的基于聚類算法的信用額度優(yōu)化方法,其特征在于,所述根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化,得到所述樣本客戶的優(yōu)化信用額度包括:
7.根據(jù)權(quán)利要求1所述的基于聚類算法的信用額度優(yōu)化方法,其特征在于,根據(jù)所述鄰近客戶對(duì)所述樣本客戶的信用額度進(jìn)行優(yōu)化之后,還包括:
8.一種基于聚類算法的信用額度優(yōu)化系統(tǒng),其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的方法的步驟。
10.一種電子設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存有計(jì)算機(jī)程序,所述處理器調(diào)用所述存儲(chǔ)器中的計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的方法的步驟。